Тип работы:
Предмет:
Язык работы:


СТАТИСТИЧЕСКАЯ ДИНАМИКА ЛЕКСИЧЕСКИХ ЕДИНИЦ В ПОВСЕДНЕВНОЙ РЕЧИ (НА МАТЕРИАЛЕ КОРПУСА "ОДИН РЕЧЕВОЙ ДЕНЬ")

Работа №60709

Тип работы

Дипломные работы, ВКР

Предмет

лингвистика

Объем работы86
Год сдачи2016
Стоимость4235 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
300
Не подходит работа?

Узнай цену на написание


Введение 3
Глава I. Предпосылки создания частотного списка 6
русской повседневной речи
1.1. Статистическая лексикография как раздел лингвистики 6
1.1.1. Основные принципы и понятия статистической лексикографии 6
1.1.2. Типология, структура и функции частотных словарей 7
1.1.3. Частотные словари русского языка 9
1.2. Особенности повседневной разговорной речи 16
1.2.1. Разговорная речь в системе функциональных стилей 16
1.2.2. Инвентарь языковых средств повседневной речи 21
1.3. Звуковой корпус «Один речевой день» 24
1.3.1. История создания корпуса «Один речевой день» 24
1.3.2. Основные принципы сбора и обработки речевого материала 25
1.3.3. Сбалансированность материала в Корпусе «Один речевой день»29
1.3.4. Области применения корпуса повседневного общения 32
Выводы к Главе I 35
Глава II. Разработка и анализ Частотника ОРД 36
2.1. Особенности процесса построения Частотника ОРД 36
2.2. Статистические характеристики Частотника ОРД 44
2.2.1. Выбор статистических параметров оценки 44
2.2.2. Расчет статистических рядов 46
2.3. Динамика статистических рядов в Частотнике ОРД 54
Выводы к Главе II 68
Заключение 69
Список использованной литературы 71
Приложение 1 Частотный список неоднословных единиц 81
Приложение 2 Верхушка Частотника ОРД


Настоящее исследование посвящено изучению статистической динамики лексических единиц в повседневной речи.
Математико-статистические методы становятся все более востребованными, в том числе в областях гуманитарного знания. В лингвистике до недавнего времени им была отведена преимущественно область статистической лексикографии, а именно разработка частотных словарей. Качественно новый уровень развития компьютерных технологий повлек за собой изменения в методах создания и использования частотных словарей.
Сегодня наиболее востребованы словари, составленные на основе лингвистических корпусов, так как большие объемы материала позволяют сделать словарь максимально репрезентативным и по возможности полным.
Разговорная речь в лингвистических корпусах традиционно была представлена записями радио- и телепрограмм, публичных выступлений, постановочных диалогов и монологов, субтитров к кинофильмам и телесериалам. Тексты драматургических произведений также рассматриваются в качестве зафиксированной устной речи. В таком виде представлена в «Частотный словарь живой устной речи» под редакцией О, Н. Ляшевской и С. А. Шарова. Этот словарь был создан по материалам Устного подкорпуса Национального корпуса русского языка (далее - НКРЯ), крупнейшего корпуса русского языка на сегодняшний день.
Также разговорная речь представлена в «Частотном словаре словоформ русского языка» в виде подкорпуса драмы. Однако устная спонтанная речь по-прежнему остается сложным материалом для лексикографии.
Звуковой корпус «Один речевой день» (далее - Корпус ОРД) дал лингвистам уникальная возможность анализа спонтанной речи, в том числе и с количественной точки зрения.
Актуальность исследования определяется слабой изученностью живой повседневной речи, в особенности с точки зрения количественных данных.
Цель работы - описание динамики статистических показателей в лексике современной повседневной речи. Мы ставим перед собой следующие задачи:
1. Определить роль и место статистики в современной русской лексикографии;
2. Проанализировать особенности повседневной речи;
3. Охарактеризовать звуковой корпус «Один речевой день»;
4. Определить параметры для составления и статистического анализа частотного списка (далее - Частотник ОРД) повседневной речи.
5. Описать изменение статистических характеристик Частотника при изменении его объема.
Для решения поставленных задач применяются описательные и статистические методы (методы оценивания неизвестных параметров распределения и моделирования).
В качестве материала исследования были выбраны текстовые расшифровки звукозаписей 35 информантов в объеме 200 000 словоупотреблений из корпуса «Один речевой день». Текстовые примеры, приводимые в работе, также взяты из Корпуса ОРД.
Объект настоящего исследования - повседневная устная речь. Его предметом стало изменение количественных показателей лексических единиц в частотном словнике.
Научная новизна работы обусловлена тем, что устная спонтанная речь впервые становится материалом подобного статистического исследования.
Теоретическая и практическая значимость полученных результатов заключается в том, что они позволили выявить наиболее устойчивые статистические параметры для частотного словаря устной спонтанной речи, что дает возможность провести в дальнейшем сравнение с другими частотными словарями, а также сделать прогноз изменения показателей при увеличении объема словаря.
Апробация результатов работы: доклады по вопросам, рассматриваемым в выпускной квалификационной работе, были представлены на Международной научной конференции «Голоса города: языковая вариативность и коммуникативное разнообразие» и на 45 Международной филологической научной конференции.
Работа состоит из введения, двух глав, заключения и двух приложений. Первая глава посвящена теоретическим проблемам, связанным с определением места повседневной речи в современной лингвистике, возможностей и инструментов ее статистического описания. Во второй главе проводится анализ количественных изменений в повседневной лексике при изменении объема выборки. В заключении подводятся итоги исследования

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В первой главе мы проанализировали связь статистики с современной лексикографией. Отметили ее возрастающую роль в лингвистических исследованиях. Рассмотрели типы частотных словарей и оценили преимущества современных частотных словарей на примере крупнейших корпусных.
Говоря о повседневной речи, мы отметили растущий интерес к ее изучению. Проанализировали особенности, потенциально влияющие на состав частотных списков. Также отметили отсутствие четкого определения для этого лингвистического явления и неоднозначность подходов.
Рассмотрев возможности и преимущества Корпуса ОРД, мы выделили такие его особенности, определяющие выбор его в качестве материала: методика 24-часовой записи информантов; сбалансированность Корпуса по нескольким параметрам; развитая система аннотирования расшифровок звукозаписей.
Во второй главе мы описали процесс составления Частотника ОРД, особенности методики и вошедших в него единиц. Также отобрали девять статистических характеристик, по которым можно описать его динамику. Произвели расчеты, построение статистических рядов, как эмирических, так и сглаженных, и соответствующих им графиков. Мы отметили, что все параметры, кроме индекса разнообразия, имеют тенденцию к росту по мере увеличения объема выборки. Наибольшую нестабильность проявили коэффициент разнообразия, ранговое среднее и индекс Хирша. Также мы выяснили, что повседневная речь отличается эгоцентричностью и несколько беднее художественной.
Анализ выявил три устойчивых параметра, не зависящих от объемы выборки: частота самого частотного слова, медиана и золотое сечение. На основании этих параметров может быть проведено сравнение различных частотных словарей и прогноз дальнейшего изменения словаря.
Проделанная работа в дальнейшем может лечь в основу построения профилей частотных словарей на порядковых статистиках.



1. Алексеев П. М. Статистическая лексикография (типология, составление и применение частотных словарей) [Текст]: Учеб. пособие. Л.: ЛГПИ, 1975. 120 с.
2. Алексеев П. М. Частотные словари и приемы их составления // Статистика речи. Л.: Наука, 1968. С. 61-63.
3. АлексеевП. М. Частотные словари: Учебное пособие. СПб.: Изд-во С.- Петерб. ун-та, 2001. 156 с.
4. Анализ временных рядов // StatSoft, Inc. (2012). Электронный учебник по статистике. Москва, StatSoft [Электронный ресурс]. URL: http://www.statsoft.ru/home/textbook/default.htm(дата обращения: 16.06.2016).
5. Асиновский А. С., Богданова Н. В., РусаковаМ. В. и др. Звуковой корпус русского языка повседневного общения «Один речевой день»: концепция и состояние формирования // Компьютерная лингвистика и интеллектуальные технологии. Вып. 7 (14): По матер. межд. конф. «Диалог-2008». М., 2008. С. 488-494.
6. Баева Е. М. О способах социолингвистической балансировки устного корпуса (на примере «Одного речевого дня») // Вестник Пермского университета. Российская и зарубежная филология, Вып. 4 (28), 2014.
С. 48-57.
7. Байкулова А . Н . Неофициальное общение и его разновидности: критерии выделения и реальное функционирование. Саратов: Изд. центр «Наука», 2012. 196 с.
8. Байкулова А. Н. Устное неофициальное общение и его разновидности: повседневная речь горожан. Саратов: Изд. центр «Наука», 2014. 216 с.
9. Богданова Н. В. Живые фонетические процессы русской речи: Учеб.- метод. пособ. по современному русскому литературному языку. СПб.: Филологический факультет СПбГУ, 2001. 186 с.
10. Богданова Н. В., Степанова С. Б., Шерстинова Т. Ю. Звуковой корпус русского языка: новый подход к исследованию речи // Корпусная лингвистика - 2011: Тр. Междунар. конф. СПб., 2011. С. 98-103.
11. Богданова-Бегларян Н. В., Шерстинова Т. Ю., Блинова О. В. и др. Звуковой корпус русского языка как база для социолингвистических исследований //Компьютерная лингвистика и интеллектуальные технологии. Материалы конференции, 2015 [Электронный ресурс]. URL: http://www.dialog-21.ru/digests/dialog2015/materials/pdf/Bogdanova- BeglarianNVetal.pdf(дата доступа: 26.04.2016).
12. Васютинский Н.А. Золотая гармония. М.: Молодая гвардия, 1990. 238 с.
13. Введение // Частотный словарь словоформ русского языка [Электронный ресурс]. URL: http://www.narusco.ru/STAT004/(дата обращения: 11.04.2016).
14. Герчук Я. П. Графики в математико-статистическом анализе. М.: Статистика, 1972. 78 с.
15. ГерчукЯ. П. Графические методы в статистике. М.: Статистика, 1968. 212 с.
16. Грешилов А. А., Стакун В. А., Стакун А. А. Математические методы построения прогнозов. М.: Радио и связь, 1997. 112 с.
17. Гринбаум О.Н. Гармония строфического ритма в эстетико-формальном измерении (на материале «Онегинской строфы» и русского сонета). СПб.: Изд-во СПбГУ, 2000.160 с.
18. Ежов А. И. Выравнивание и вычисление рядов распределений. М.: Госстатиздат, 1961. 336 с.
19. Ермолова О. Б. «Один речевой день» говорящего с точки зрения прагматики // Вестник Пермского университета. Российская и зарубежная филология, Вып. 3 (27), 2014. С. 21-30.
20.Звуковой корпус как материал для анализа русской речи. Часть 2. Теоретические и практические аспекты анализа (Том 2. Звуковой корпус как материал для новых лексикографических проектов). Коллективная монография / Отв. ред. Н. В. Богданова-Бегларян. СПб.: Филологический факультет СПбГУ, 2015. 396 с.
21. Земская Е. А., Китайгородская М. В., Ширяев Е. Н. Русская разговорная речь. Общие вопросы. Словообразование. Синтаксис. М.: Наука, 1981. 276 с.
22.Зобнина Е. А. Перспективы использования звукового корпуса «один речевой день» в преподавании русского языка как иностранного [Текст] / Е. А. Зобнина // Мир русского слова. 2009, № 4. С. 99-109.
23. Инфантова Г. Г. Очерки по синтаксису современной русской разговорной речи. Ростов н/Д: Изд-во Рост. гос. пед. ин-та, 1973. 135 с.
24. Козырев В. А., Черняк В. Д. Лексикография русского языка: век нынешний и век минувший: монография. 2-е изд., испр. и доп. СПб.: Изд-во РГПУ им. А. И. Герцена, 2015. 631 с.
25. Лингвистический энциклопедический словарь [Электронный ресурс] / Гл. ред. В. Н. Ярцева. М.: Большая рос. энцикл., 2002. 707, [2] с. URL: http://tapemark.narod.ru/les/index.html(дата обращения: 11.05.2016 .)
26. Мартыненко Г. Я. Золотое сечение формулы изобретения [Текст]: [Автоматизация] // Научно-техническая информация. Сер. 2. Информационные процессы и системы. 2002. N10. С. 22-25.
27. Мартыненко Г. Я. Математика гармонии и статистика [Электронный ресурс]. URL: http://www.trinitas.ru/rus/doc/0232/009a/02321149.htm(дата доступа: 30.05.2016).
28. Мартыненко Г. Я. Основы стилеметрии. Л.: Изд-во Ленингр. ун-та, 1988. 176 с.
29. Мартыненко Г. Я., Мартинович Г А. Многопараметрический статистический анализ результатов ассоциативного эксперимента. СПб.: Изд-во С.-Петербургского ун-та, 2003. 28 с.
30. Мартыненко Г. Я., Фомин С. В. Ранговые моменты // Научно-техническая информация. Сер. 2 1989. № 5. С. 23-29.
31. Н ац и о н а л ь н ы й корпус русского языка [сайт].URL: http://www.ruscorpora.ru/.
32. Овсиенко Ю. Г. Частотно - семантический словарь русской разговорной
речи [Электронный ресурс] . URL:
http://www.euralex.org/ elx_proceedings/Euralex1992_1/017_J.%2
33. Панов М. В. О развитии русского языка в советском обществе // Вопр. языкознания. 1962, № 3.
34. Работа с программой ELAN [Электронный ресурс]. URL: http://www.mpi.nl/tools/elan/tp/how-to/ELAN_handout_Russian.pdf(дата доступа: 26.04.2016).
35. Русская авторская лексикография XIX-XX веков. Антология [Элекстронный ресурс]. URL: http://www.slovari.ru/default.aspx?p=5309(дата доступа: 5.04.2016).
36. Сиротинина О.Б. Современная разговорная речь и ее особенности. М.: Знание, 1974. 260 с.
37. Скребнев Ю. М. Введение в коллоквиалистику / под ред.Сиротининой О. Б. Саратов: Изд-во Сарат.ун-та, 1985. 210 с.
38. Социально-демографический портрет России: По итогам Всероссийской переписи населения 2010 года / Федер. служба гос. статистики. М.: ИИЦ «Статистика России», 2012. 183 с.
39. С п и с о к Cltot > 1 0 0 0 [сайт]. URL:
http://www.expertcorps.ru/science/whoiswho/ci86?sortby=h.
40. Статистика речи. Сб. / Отв. ред. Р Г. Пиотровский. Л.: Наука, 1968. 260 с.
41. Статистика: Курс лекций / Харченко Л. П., Долженкова В. Г., Ионин В. Г. и др.; под ред. канд. экон. наук В. Г. Ионина. Новосибирск: Изд-во НГАЭиУ; М.: ИНФРА-М, 2000. 310 с.
42. Харченко В. К. Современная повседневная речь. Изд-е 3-е. М.: Книжный дом «ЛИБРОКОМ», 2012.184 с.
43. Четвериков Н. С. Статистические и стохастические исследования. М.: Госстатиздат, 1963. 300 с.
44. Шайкевич А. Я. Дифференциальные частотные словари и изучение языка Достоевского (на примере романа «Идиот» // Слово Достоевского. Сб. ст. М.: ИРЯ РАН, 1996. С. 195-253.
45. Шерстинова Т. Ю. Коммуникативные макроэпизоды в корпусе повседневной русской речи «Один речевой день»: принципы аннотирования и результаты статистической обработки // Корпусная лингвистика - 2013: Тр. Междунар. конф. СПб., 2013. С. 449-456.
46. Шерстинова Т. Ю. Наиболее употребительные слова повседневной русской речи (в гендерном аспекте и в зависимости от условий коммуникации) // Компьютерная лингвистика и интеллектуальные технологии: По матер. ежегодн. межд. конф. «Диалог» (Москва, 1-4 июня 2016). Вып. 15 (22). М.: Изд-во РГГУ, 2016. С. 616-632.
47. Шерстинова Т. Ю., Степанова С. Б., Р ы к о А. И. Система аннотирования в звуковом корпусе русского языка «Один речевой день» // Мат- л ы XXXVIII международной конференции. Секция: «Формальные методы анализа русской речи». Март 2009. СПбГУ: СПб. С. 66-75.
48. Bogdanova-Beglarian N., Sherstinova T, Martynenko G. The “One Day of Speech” Corpus: Phonetic and Syntactic Studies of Everyday Spoken Russian, Proc. 18th Int. Conf “Speech and Computer” (SPECOM-2015), LNAI, vol. 9319, Springer, Switzerland, 2015. pp. 429-437.
49. Burnard L. (ed.). Reference guide for the British National Corpus (XML edition). Published for the British National Corpus Consortium by Oxford University Computing Services. URL: http://www.natcorp.ox.ac.uk/docs/URG/(дата обращения 15.06.2016).
50. Campbell N. Speech & Expression; the Value of a Longitudinal Corpus, LREC-04. Lisbon, 2004. pp. 183-186.
51. EysenckH. J. An Experimental Study of the Good Gestalt. In: Psychological Rewiew. 1942. № 49. Pp. 344-364.
52. Hircsh J. E. An index to quantify an individual's scientific research output
[Элекстронный ресурс] . URL:
ttp://www.pnas.org/content/102/46/16569.full(дата доступа: 15.06.2016).
Словари и справочники
1. Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе. Справочник. 2-е изд., перераб. и доп. М.: Статистика, 1979. 447 с.
2. Ефремова Т. Ф. Толковый словарь служебных частей речи русского языка [Текст] : ок. 15000 слов. статей. Ок. 22000 семантических единиц / Т. Ф. Ефремова. 2-е изд., испр.. М. : АСТ : Астрель, 2004. 815 с.
3. Караулов Ю.Н. Частотный словарь семантических множителей русского языка. М.: Наука, 1980. 207 с.
4. Корпусной словарь неоднословных лексических единиц (оборотов) [сайт]. URL: http://ruscorpora.ru/obgrams.html.
5. Кривенко Б. В . Частотный словарь языка массовой коммуникации. Воронеж : Изд-во Воронеж. ун-та, 1992. 218 с.
6. Леннгрен Л. Частотный словарь современного русского языка (Lonngren, Lennart. The Frequency Dictionary of Modern Russian). Acta Univ. Ups., Studia Slavica Upsaliensia Uppsala 32. Uppsala, 1993.
7. Ляшевская О. Н., Шаров С. А . Новый частотный словарь русской [Электронный ресурс]. URL: http://dict.ruslang.ru/freq.php(дата доступа: 20.05.2016).
8. Мартинович Г.А. Частотный тематический словарь «Городской общественный транспорт». СПб, Филологический факультет СПбГУ, 2005. 521
9. Рогожникова Р. П. Толковый словарь сочетаний, эквивалентных слову: Ок. 1500 устойчивых сочетаний рус. яз. / Р П. Рогожникова. М.: ООО «Издательство Астрель»: ООО «Издательство АСТ», 2003. 416 с.
10. Словарь русского языка: В 4-х т. / РАН, Ин-т лингвистич. исследований; Под ред. А. П. Евгеньевой; 4-е изд., стер. М.: Рус. яз.; Полиграфресурсы, 1999.
11.Частотный грамматико-семантический словарь языка художественных произведений А. П. Чехова [Электронный ресурс].URL: http://www.philol.msu.ru/~lex/chehov.html(дата доступа: 20.05.2016).
12.Частотный словарь рассказов А. И. Куприна / Автор-сост. А.О. Гребенников; под ред. Г. Я. Мартыненко. СПб.: Изд-во С.-Петерб. ун-та, 2012. 552 с.
13.Частотный словарь рассказов А. П. Чехова / Автор-сост. А.О. Гребенников; под ред. Г. Я. Мартыненко. СПб.: Изд-во С.-Петерб. ун-та, 1999. 172 с.
14.Частотный словарь рассказов И. А. Бунина / Автор-сост. А.О. Гребенников; под ред. Г. Я. Мартыненко. СПб.: Изд-во С.-Петерб. ун-та, 2012. 296 с.
15.Частотный словарь рассказов Л. Н. Андреева / Автор-сост. А.О. Гребенников; под ред. Г. Я. Мартыненко. СПб.: Изд-во С.-Петерб. ун-та, 2003. 398 с.
16.Частотный словарь русского языка [Электронный ресурс] / под ред. Л. Н. Засориной. М.: Изд-во «Русский язык», 1977.URL: http://project.phil.spbu.ru/lib/data/slovari/zasorina/zasorina.html(дата доступа: 20.05.2016).
17.Частотный словарь словоформ русского языка [Электронный ресурс]. URL: http://www.narusco.ru/STAT004/(дата обращения: 11.04.2016).
18. Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Статистический словарь языка русской газеты (1990-е годы). Т. 1. М.: Языки славянской культуры, 2008. 580 с.
19. Штейнфельдт Э. А. Частотный словарь современного русского литературного языка: справочник для преподавателей русского языка / под ред. В. А. Ицковича. М.: Прогресс, 1973. 228 с. [1-е изд. в 1963 г.].


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ