Введение 3
2. Имя действия в языке бамана 6
3. Методология исследования 11
Оценка объема жанровых подкорпусов 11
Файлы метаразметки и неработающий фильтр 12
Омонимия глаголов 13
Многозначность глаголов и лабильность 14
Формы множественного числа и словообразования 15
Обновление корпуса 16
4. Данные, анализ 17
Соотношение объемов подкорпусов 17
Статистическое сравнение данных по фольклорному и газетному подкорпусам корпуса языка бамана 17
Статистические данные по корпусу языка манинка 18
5. Заключение 20
6. Использованная литература и электронные ресурсы 21
7. Приложение
На основе данных корпусов языков бамана и манинка еще не проводилось исследований, посвященных особенностям текстов разных жанров. Такого рода исследования полезны не только для изучения самих языков, но и для проверки сбалансированность инструментария корпусов текстов на этих языках. Так, например, была выявлена проблема метаразметки текстов и поиска устаревших форм в подкорпусе текстов XIX века Национального корпуса русского языка [Дич 2005: 91-93], на основе данных корпуса были проведены работы, посвященные подкорпусам текстов XVIII века [Савчук, Сичинава 2009: 55] и первой половины XX века [Савчук 2009: 35-36]. В подобных работах анализируется жанровый состав изучаемых подкорпусов, что позволяет проследить изменение популярности тех или иных жанров от одного века к другому, появление новых жанров.
На языках бамана или манинка текстов, записанных более ста лет назад очень мало, поэтому одним из источников для изучения изменений в языке, произошедших за достаточно долгий период времени, является фольклор. Язык фольклора изменяется медленнее, чем разговорный язык, поэтому мы можем считать, что в фольклорных текстах зафиксирована более традиционная форма языка. Объект данного исследования - это лингвистические особенности фольклорных текстов на языках бамана и манинка. Фольклорные тексты сравнивались с современной новостной периодикой.
Было решено остановиться на анализе изменений в употреблении одного грамматического явления - суффиксальной номинализации глагола, то есть имени действия с суффиксом -liZ-шв фольклорных и современных газетных новостных текстах на основе данных корпусов языков бамана и манинка.
Рассматрение именно фольклорных и новостных газетных тексты (в том числе письма читателей в редакцию), избавляет исследователя от включения в анализ случаев авторского использования номинализационной конструкции, которые могли бы быть нехарактерны для естественного языка [Богатырев, Якобсон].
Основной целью исследования было проверить, имеют место ли изменения в употреблении имени действия с суффиксом -li/-ni в языке бамана и различия между жанрами по этому параметру. Смежными задачами были:
- изучение особенностей употребления имени действия с суффиксом -li/- ni, образованного от непереходных глаголов, и сравнение с подобным суффиксом-номинализатором в мандинка;
- проверка возможностей сайтов корпусов языков бамана и манинка для проведения исследований, посвященных особенностям текстов разных жанров;
- поиск и исправление ошибок на сайтах корпусов языков бамана и манинка.
Методы, использованные в исследовании:
- поиск примеров употребления имени действия с суффиксом -li/-ni по базе текстов корпусов языков бамана и манинка;
- перевод и анализ найденных примеров употребления имени действия с суффиксом -li/-ni;
- статистический анализ употребления имени действия с суффиксом -li/- ni в различных жанрах на основе данных метаразметки текстов корпуса.
Имя действия с суффиксом -li/-ni более характерно для современного городского языка, чем для традиционного бамана, что было высказано в работах по грамматике бамана [Dumestre 2003: 75;Vydrin: 125]. Может ли подобное наблюдение быть подтверждено статистическими данными?
Работа включает в себя: краткий обзор основных работ, посвященных имени действия с бамана и других языках манден, подробное описание методологии исследования, статистические данные и анализ, результат исследования и выводы.
Данное исследование - это первичный опыт работы на жанровыми подкорпусами Справочного корпуса бамана. В работу были подключены данные Справочного корпуса манинка. В ходе работы были найдены и исправлены некоторые ошибки в содержании корпуса, также был изучен опыт проведения исследования диахронических изменений в языке и характеристик жанровых подкорпусов. На основе вынесенного опыта, возможна корректировка некоторых особенностей архитектуры сайта корпуса для того, чтопозволит облегчить проведение подобных исследований в дальнейшем.
Статистические данные, собранные в ходе работы, подтверждают высказанное раннее гипотезы относительно употребительности формы имени действия с суффиксом -li/-ni в городском и традиционном языках. Были составлены глагольные списки, на основе которых в дальнейшем может быть проведено исследование особенностей употребления данной формы в разных жанрах текстов на языках бамана и манинка. Более архаичные случаи употребления данной формы, безусловно, представляют интересный предмет для дальнейшего изучения.