Тип работы:
Предмет:
Язык работы:


НАХОЖДЕНИЕ ТОЧНЫХ КОНСТАНТ В МАРКОВСКОЙ МОДЕЛИ ПОРОЖДЕНИЯ ЗАКОНА ЦИПФА В ЛИНГВИСТИКЕ

Работа №59581

Тип работы

Бакалаврская работа

Предмет

лингвистика

Объем работы25
Год сдачи2017
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
61
Не подходит работа?

Узнай цену на написание


Введение
Глава 1. Обзор предметной области 3
Глава 2. Формирование основного результата 6
Глава 3. Методы экспериментального доказательства 9
Глава 4. Обсуждение полученных результатов 16
Глава 5.
Литература 18
Приложение

В последние годы идея самоорганизующихся систем - сложных систем, в которых случайные значения организуются в некий порядок, приобретает все большее влияние. Эти случайные величины, могут быть распределены по - разному, но нас будет интересовать именно степенное распределение. Широкое применение степенных законов в real networks, биологии, бизнесе, экономике и лингвистике можно объяснить в рамках различных математических моделей.
Одним из примеров может служить закон Ципфа, который был популяризирован Джорджем Ципфом - лингвистом из Гарвардского университета. Закон Ципфа утверждает, что если упорядочить по частоте встречаемости список словоформ, то частота r-ой словоформы будет обратно пропорциональна её рангу и будет задаваться степенной функцией: /(r) = cr~a, где r - ранг словоформы. Напомним, что такие словоформы как «the», «of» и «and» используются чаще всего в английских текстах. Согласно закону Ципфа слово «the» встречается в два разе чаще, чем слово «of» и в три раза чаще, чем слово «and» [1]. По статистике каждое 16 слово в английском языке - это «the». Для русского языка тройку самых популярных слов составляют: «и», «в», «не» и для них тоже справедлив закон Ципфа.
Мир хаотичен, как нам кажется, и вещи в нем распределены рядами способов и не только степенной зависимостью, но удивительно, что язык, личное и осознанное нами, поддается такому простому, как казалось бы, правилу. Мы можем с уверенностью сказать, что любой язык в мире (даже мертвый язык) ципфичен.
В объяснении почему язык ципфичен нам может помочь еще одно степенное распределение - распределение Парето. А именно принцип Парето, который гласит, что 20% всех усилий, дают 80% результата. Также и в языке 20% самых используемых слов составляют 80% нашей речи. Достаточно 20% языка, чтобы ежедневно понимать друг друга. Наверное полиглоты знают этот секрет, поэтому выучить новый язык им не составляет труда. Сам Джордж Ципф полагал, что такое интересное распределение слов в языках можно было объяснить принципом наименьшего усилия - тенденции, заставляющие жизнь следовать по пути наименьшего сопротивления. Принцип наименьшего усилия играл большую роль в поведении человека. И когда язык развивался, рассказчики естественно предпочитали извлекать как можно меньше слов для описания своих мыслей. В свою очередь для более точного и лучшего понимания рассказчика слушатели предпочитали больший набор слов для большего разнообразия, чтобы им приходилось тратить меньше усилий на понимание того, что хотел донести до них рассказчик.
Другое объяснение закона Ципфа предложил Бенуа Мандельброт - французский и американский математик. Для нас является интересным, что в дальнейшем он предложил наиболее простое объяснение закона Ципфа, назвав ее моделью обезьяны. Он объяснил закон на основе простой вероятностной модели, где все символы в тексте (в том числе и пробел) набирает мартышка - машинистка, которая не знает алфавит и символы в тексте появляются независимо друг от друга с определенной вероятностью. И оказалось, что с ростом длины слов их количество возрастает экспоненциально. И слова располагались в частотном списке в зависимости от их длины.
Но стоит отметить, что буквы в реальных словах зависимы. И мы попробуем модифицировать и применить различные модели для исследования закона Ципфа для случая зависимых букв.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Электронный ресурс] : WordCount™ is an interactive presentation
of the 86,800 most frequently used English words. URL:
http://www.wordcount.org/main.php (дата обращения: 03.04.2017).
[2] Baayen R. H. Word frequency distributions. - Springer Science & Business Media, 2001. - Т. 18.
[3] Conrad B., Mitzenmacher M. Power laws for monkeys typing randomly: the case of unequal probabilities //IEEE Transactions on Information Theory. - 2004.
- Т. 50. - №. 7. - С. 1403.
[4] Бочкарев В. В., Лернер Э. Ю. Закон Ципфа для случайных текстов с неравными вероятностями букв и пирамидa Паскаля //Известия высших учебных заведений. Математика. - 2012. - №. 12. - С. 25.
[5] Bochkarev V. V., Lerner E. Y. Strong power and subexponential laws for an ordered list of trajectories of a Markov chain //Electronic Journal of Linear Algebra. - 2014. - Т. 27. - №. 1. - С. 534.
[6] Bochkarev V., Lerner E. Calculation of Precise Constants in a Probability Model of Zipfs Law Generation and Asymptotics of Sums of Multinomial Coefficients //International Journal of Mathematics and Mathematical Sciences.
- 2017. - Т. 2017. Article ID 9143747.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ