Введение 3
Глава 1. Фоносемантические гипотезы в работах XX – начала XXI вв. 8
1.1 Краткая история вопроса 8
1.2 Основные понятия фоносемантики и принцип непроизвольности знака 9
1.3 Звукосимволическая лексика и феномен синестезии 13
1.4 Использование компьютерных и математических методов при исследовании звукоизобразительной лексики 14
1.5 Исследования звукосимволической лексики 17
Выводы по главе I 22
Глава II. Разработка программного обеспечения и взаимодействие ПО с пользователем 24
2.1 Цели и ожидаемые результаты 24
2.2 Разработка алгоритма 25
2.2.1 Сбор материала 26
2.2.2 Обработка данных 30
2.2.3 Трактовка результатов и комментарии 35
2.3 Схема работы с программой и пользовательский интерфейс 36
Выводы по главе II 41
Глава III. Статистическая обработка и трактовка результатов 42
3.1 Расчет статистических критериев 42
3.1.1 Коэффициент корреляции Пирсона 42
3.1.2 Критерий Хи-квадрат (χ2) 44
3.2 Трактовка результатов 46
3.2.1 Большой/маленький (Big/small) 47
3.2.2 Тупой/острый (DULL/SHARP) 51
3.2.3 Округлый/прямой (ROUND/STRAIGHT) 53
3.2.4 Длинный/короткий (LONG/SHORT) 54
3.2.5 Горячий/холодный (HOT/COLD) 57
3.2.6 Черный/белый (BLACK/WHITE) 57
3.2.7 Мокрый/сухой (WET/DRY) 58
Выводы по главе III 58
Заключение 60
Список литературы 64
Электронные источники 69
Приложение 1. Схема работы с программой 70
Приложение 2. Пример содержания .xls файла с промежуточными результатами 71
Приложение 3. Пример содержания .xls файла c итоговыми результатами 76
Темой данной работы является использование программных методов для статистического обоснования фоносемантических гипотез.
Фоносемантические исследования представляют собой крайне своеобразный пласт лингвистических работ. С одной стороны, существует значительное число тонко подмеченных закономерностей, которые могут свидетельствовать о наличии связи между определенными звукотипами (или фонотипами) и лексической семантикой. С другой – ученое сообщество достаточно скептично относится к данному направлению в исследованиях, хотя и фонетика, и семантика, и лексикология, и психолингвистика, на стыке которых формируется фоносемантика, считаются перспективными для изучения и изобилуют вопросами, для ответа на которые требуются все новые и новые молодые специалисты.
Интересы фоносемантики при поиске ответов на вопросы, связанные с механизмом работы языка, полностью совпадают с интересами языкознания. Внимательное изучение звукоизобразительности и звукосимволизма позволяет открывать неизвестные ранее этимологии слов [Климова, 1986; Колева-Златева, 2008; Михалёв, 2010], способствует определению авторства художественных произведений [Голимбиовская, 2014; Живаева, 2001; Балаш, 1999], позволяет объяснить исключения из фонетических правил [Flaksman, 2013] воссоздавать утерянный смысл слов и даже текстов, известных из старинных источников [Flaxman, 2015], точнее понимать и переводить иноязычные произведения, в том числе произведений для детей, где отмечается наличие большого числа мотивированных лексических единиц [Ратушная, 2005; Голимбиовская, 2012; Егорова, 2008]. Обращаясь к фоносемантике, исследователи затрагивают также вопрос образования неологизмов [Флаксман, 2014], успешно обнаруживая их истоки в звукосимволизме и звукоподражании.
Особенный интерес всегда вызывало у исследователей происхождение языка - несмотря на отсутствие каких бы то ни было значимых успехов в данном направлении, что обусловлено чрезвычайной сложностью вопроса, существует множество фоносемантических работ на эту тему [Voronin, 2008; Топешко, 2000].
При этом в значительном числе работ, в особенности до 1980-ых годов, используются методы, связанные с ручной обработкой информации – такие методы в конце второго десятилетия XXI века видятся неактуальными ввиду неэффективного использования ресурсов. В связи с этим, в данной работе отбор материала вручную совмещается с его автоматической обработкой и оценкой результатов.
В рамках данной работы будут использоваться два понятия, определение которых видится необходимым дать во введении:
Фонотип – тип звука речи, содержащий фонетический признакотип, гомоморфный с мотивотипом [Воронин, 2004, с.10]. Другими словами, фонотип есть некий общий параметр для нескольких фонем, звукосимволически используемых при назывании класса объектов. Подробнее о понятии фонотипа см., например, работу Бродович [Brodovich, 2016].
Звукотип – это звуковой сегмент, которому соответствует одна целевая артикуляция и один слуховой образ. В отличие от звука, звукотип представляет собой не единицу речи, а единицу языкового сознания носителя языка [Князев, Пожарицкая, 2003, с.9].
Настоящая работа направлена на достижение двух целей, последовательно описанных ниже.
1. Разработать программное обеспечение (далее ПО), автоматизирующее процесс фоносемантического исследования.
Для достижения цели 1 поставлены следующие задачи:
- Разработать алгоритм, позволяющий максимально автоматизировать процесс проведения фоносемантического исследования;
- Реализовать алгоритм с помощью существующих средств разработки ПО.
В качестве объекта выступает программное обеспечение, направленное на автоматизацию фоносемантических исследований. Предметом является разработка и использование данного программного обеспечения.
Для реализации алгоритма обработки входных данных использовалась интегрированная среда разработки IntelliJ IDEA, язык программирования JAVA, база данных MySQL, табличный редактор Microsoft Excel. Материалом к разработке ПО послужили следующие плагины и подключаемые библиотеки: реализация спецификации JPA Hibernate 5, библиотека графического интерфейса Swing, библиотека Apache POI, сборщик проектов Apache Maven.
В качестве методов необходимо выделить анализ, сравнение, компиляцию, тестирование, оптимизацию.
2. Провести исследование связей звукотипов и фонотипов с различными семантическими значениями.
Для достижения цели 2 поставлены следующие задачи:
- Произвести сбор языкового материала, определить форму его хранения и осуществить разметку с учетом его дальнейшего использования программными средствами;
- Осуществить автоматическую обработку собранного материала;
- Произвести анализ результатов, оценить силу обнаруженных связей и определить, в какой мере они подтверждают существующие фоносемантические гипотезы.
В качестве объекта выступают фоносемантические гипотезы, предметом является обоснование фоносемантических гипотез.
При этом используются следующие методы: сравнение лексем и групп лексем, выделенных на основании общих признаков, элементы статистического анализа, количественный подсчет звукотипов и фонотипов.
Материалом к работе послужили списки Сводеша для 216 языков мира, вручную подготовленные для автоматической обработки. В качестве источников использовались проекты:
- Проект РГГУ и института Санта-Фе в Нью-Мексико (США) «The Global Lexicostatistical Database» [59];
- Проект Оклендского университета (Новая Зеландия) и Гавайского университета (США) «Austronesian Basic Vocabulary Database» [57];
- Проект Канадского института лингвистики «Compralex» [58];
- Свободное собрание списков Сводеша «Wiktionary.org» [60].
Новизна работы заключается в увеличении объема материала при проверке фоносемантических гипотез в сравнении существующими работами других авторов. Для проведения настоящего исследования были привлечены материалы 216 языков, принадлежащих практически ко всем существующим языковым семьям. Для эффективного осуществления данной задачи программными средствами реализуется алгоритм, позволяющий автоматически получать наглядные таблицы с результатами, по которым производится поиск закономерностей.
Структура работы включает в себя введение, 3 главы, заключение, список литературы, приложения.
Глава I посвящена краткому рассмотрению истории фоносемантики, её основных понятий, роли компьютерных методов в фоносемантических исследованиях последних десятилетий. Также в первой главе рассматриваются гипотезы, которые будут подвергнуты проверке в практической части настоящей работы.
Глава II посвящена описанию алгоритма программы, написанной для проведения данного исследования, и особенностей его реализации. Рассматриваются возможности автоматизации трех этапов работы – сбора материала, обработки данных и трактовки результатов – а также предлагается краткое руководство по использованию программы.
В главе III представлены примеры расчетов двух статистических критериев – корреляции Пирсона и критерия Хи-квадрат (χ2), описываются полученные в ходе исследования результаты и рассматривается их соответствие гипотезам, озвученным в первой главе.
В приложениях представлена схема работы программы, примеры файлов, генерируемых программой, содержащих промежуточные и итоговые результаты.
В настоящей работе была сделана попытка провести анализ существующих фоносемантических гипотез относительно наличия связи между различными фонотипами и семантическими полями.
Цель работы, заключающаяся в разработке программного обеспечения, была достигнута в полной мере - при использовании современных средств разработки, таких как среда разработки IntelliJ IDEA, реляционная СУБД MySQL, реализация спецификации JPA Hibernate 5 и др. было создана ПО, автоматизирующее процесс поиска связей между различными фонотипами (и звукотипами) и семантическими полями.
По итогам исследования с использованием разработанного ПО были получены результаты как подтверждающие существующие фоносемантические гипотезы, так и опровергающие их. Кроме того, были обнаружены связи различной силы – от слабой до заметной (по таблице Чеддока) – не выдвигавшиеся ранее.
Число и сила связей между различными фонотипами и семантическими полями варьируется в зависимости от выбранной семантической оппозиции: для таких пар как «большой-малый» (BIG/SMALL) и «тупой-острый» (DULL/SHARP) число значимых связей (при p=0,05) оказалось больше, чем для остальных пар. В некоторых случаях число обнаруженных связей не превышало 1-2 единицы или такие связи не были обнаружены вовсе (напр., для пар «черный-белый» (BLACK/WHITE), «горячий-холодный» (HOT/COLD)).
К подтвержденным гипотезам могут быль отнесены следующие (при p <=0,05):
- Гласные верхнего подъема чаще используются при обозначении «малого» и «острого», а нижнего – при обозначении «большого» и «тупого»;
- Глухие согласные чаще используются при обозначении «малого» нежели «большого»;
- Огубленные гласные и особенно звукотип «U» чаще используются при обозначении «округлого» и «тупого»;
- Билабиальные чаще используются при обозначении «тупого», а сибилянты – при обозначении «острого».
Также были обнаружены некоторые связи, не обнаруженные в существующей фоносемантической литературе:
- Наличие слабой связи с семантическим значением «округлый» продемонстрировал фонотип латеральных;
- Звонкие согласные продемонстрировали связь не только с семантическим полем «большой», но и «длинный», и «округлый»; в то время как глухие согласные – с семантическим полем «короткий»;
- Носовые сонанты чаще используются при обозначении «черного» (нежели «белого»);
- Велярные чаще используются при обозначении «сухого» (нежели «мокрого»).
Наконец, необходимо отметить одну неожиданную связь - не фонотипа с семантическим полем, но двух фонотипов: в ходе работы было выявлено, что одноударные и многоударные сонанты практически всегда имеют одинаковый знак критерия Пирсона. Это означает, что если один из двух фонотипов чаще используется при обозначении слов некоторого семантического поля, то и второй фонотип в этом случае используется чаще. Говорить о данной связи следует с осторожностью, поскольку она в основном фиксируется при p > 0,05, однако регулярность её появления требует обратить на нее внимание.
В целом, вторая цель настоящей работы, состоящая в подтверждении или опровержении существующих семантических гипотез, видится достигнутой.
Необходимо, однако, заметить, что большинство обнаруженных связей могут быть оценены как слабые, в то время как во многих фоносемантических работах они предполагалась более сильными. Дело в том, что многие фоносемантические гипотезы были выдвинуты исследователями, однако не подвергались последующей статистической обработке. Таким образом, полученные результаты могут говорить о некотором преувеличении связей фонотипов с семантическими полями.
Помимо этого, существует слабо исследованный вопрос: следует ли полагать все искомые в настоящей работе связи универсалиями или некоторые из них могут быть спроецированы лишь на определенные языковые семьи? Поскольку значительное число связей были оценены как слабые, а некоторые не были подтверждены вовсе, следующим шагом может стать проверка фоносемантических гипотез с учетом принадлежности языковых материалов к конкретным семьям и группам. Такой подход потребует коррекции существующего метода, однако может способствовать пониманию как рассмотренных в главе I гипотез, так и результатов, полученных в настоящей работе.
В завершение хотелось бы отметить важность дальнейших исследований в области фоносемантики: поиск ответа на вопросы о мотивированности лексических единиц, механизмах словообразования и демотивации слов в ходе фонетических и иных изменений, а также роли звукоизобразительных слов в языке способны дать значительный толчок к развитию современной лингвистики.
1. Балаш, М.А. Фоносемантическая структура текста как фактор его понимания (Экспериментальное исследование): дис. ... кандидата филологических наук: 10.02.19 /М.А. Балаш – Горно-Алтайск, 1999 – 159 с.
2. Балли, Ш. Общая лингвистика и вопросы французского языка / Ш. Балли – М.: Изд-во иностр. лит., 1955 – 416 с.
3. Бенвенист, Э. Общая лингвистика / Э. Бенвенист – М.: Прогресс, 1974 – 447 c.
4. Воронин, С.В. Английские ономатопы: фоносемантическая классификация / С. В. Воронин – СПб.: Изд-во Института иностранных языков, 2004 – 190 с.
5. Воронин, С. В. Основы фоносемантики / С. В. Воронин – М.: ЛЕНАНД, 2006 – 248 с.
6. Голимбиовская, Е.С. О возможности сохранения анафонии при переводе франкоязычной поэзии на русский язык // Гуманитарный вектор – Чита: Изд-во ЗабГГПУ им. Н.Г. Чернышевского, 2012. – № 4 (32) – с. 108-114.
7. Голимбиовская, Е.С. Структурные и функциональные особенности анафонических феноменов в стихотворной речи: дисс. …канд. филол. наук 10.02.19/ Е.С.Голимбиовская – Ульяновск, 2014 – 312 с.
8. Горелов, И.Н. О возможной примарной мотивированности языкового знака. // Материалы семинара по проблеме мотивированности языкового знака – Л.: Наука, 1969 – с. 17-21.
9. Егорова, А.А. Звукоизобразительность в традиционной английской детской поэзии (на материале Nursery Rhymes). Автореф. дис. … канд. филол. наук: 10.02.04 / ГОУ ВПО «Ивановский государственный Университет» – М., 2008 – 24 c.
10. Живаева, Л.Н. Идиостилевые аспекты анафонии в художественной прозе (на материале прозы Н.В.Гоголя, А.Белого и М.Горького)/ Л. Н. Живаева: дис... канд. филол. наук 10.02.01 – Пенза, 2001 – 161 с.
11. Журавлев, А.П. Звук и смысл / А. П. Журавлев – М.: Просвещение, 1991 – 160 с.
12. Иванова, М.В. Звукоизобразительная лексика в англоязычной детской сказке: Дис. канд. филол. наук – ЛГУ. Л., 1990.
13. Иллич-Свитыч, В.М. Опыт сравнения ностратических языков (семитохамитский, картвельский, индоевропейский, уральский, дравидийский, алтайский) – М.: Наука – Введение. Сравнительный словарь (b - K) – 1971 – 370 с.
14. Климова, С.В. Глаголы неясного происхождения в сокращенном Оксфордском словаре (элементы этимологической фоносемантики): дис. ... канд. филол. наук: 10.02.04 / Светлана Владимировна Климова — Л., 1986 — 221 с.
15. Князев, С.В., Пожарицкая, С.К., «Современный русский литературный язык: фонетика, графика, орфография, орфоэпия» – М., 2003 — 21 с.
16. Колева-Златева, Ж.С. Славянская лексика звукосимволического происхождения. Tractata Slavica Universitatis Debreceniensis – Vol. 1. Дебрецен, 2008 – 355 с.
17. Левицкий, В.В. Семантика и фонетика / В. В. Левицкий. – Черновцы: Изд-во Черновиц. ун-та, 1973 – 103 с.
18. Михалёв, А.Б. Звукоизобразительный фонд индоевропейских корней и их производные // Мир через языки, образование, культуру: Россия-Кавказ-Мировое сообщество. Материалы VI Международного конгресса. Симпозиум XI «Теоретические и прикладные аспекты исследования языков мира» – Пятигорск, 2010 – с.46-53.
19. Михалев, А.Б. Фоносемантика: от античности до современности / А. Б. Михалев // Вестн. Пятигорского гос. лингвист. ун-та, 2012 – №1 – с. 92-96.
... Всего источников –60