ВВЕДЕНИЕ 3
ГЛАВА 1. Теоретические основы корпусного изучения текстов. 6
1.1. Корпусная лингвистика как научная дисциплина. 6
1.2. Терминологический аппарат корпусной лингвистики. 8
1.3. Национальный корпус русского языка: история создания и применения 11
1.4. Корпусные методы исследования. 26
1.5. Корпусные методы в изучении художественной литературы 30
ГЛАВА 2. Корпусные методы в изучении древнерусской литературы 34
2.1. Специфика древнерусского текста и его изучения 34
2.2. Древнерусская литература в НКРЯ: состав, способ представления, разметка 44
2.3. Структура и семантика «Жития Феодосия Печерского» средствами НКРЯ 46
Заключение 58
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 59
Текст является одним из основных источников языкового материала. Он нужен для проведения филологических и лингвистических исследований. Сделать вывод о языковом явлении, которое интересует исследователя, позволяет сделать анализ большого количества текстов. Сегодня огромное количество текстов находятся в свободном электронном доступе благодаря техническому прогрессу. Для работы с большими объемами текстов во всем мире стали создаваться коллекции текстов. Эти коллекции являются специально отобранными, размеченными по различным лингвистическим параметрам и обеспеченными системой поиска. Они называются “лингвистическими корпусами”. Исследованиями в данной области занимается такой раздел прикладной лингвистики, который разрабатывает общие принципы построения и использования лингвистических корпусов, как корпусная лингвистика.
Актуальность исследования. Возможность пользоваться обширными электронными ресурсами значительно облегчила процесс сбора материала в лингвистических исследованиях. Безусловно, необходимость и возможность обработки множества текстов с целью извлечения из них литературоведческих, лингвистических и прочих данных привели к бурному росту электронных ресурсов. К таким ресурсам можно отнести лингвистически аннотированные корпуса текстов, что обуславливает актуальность изучения данной темы. Так, любое лингвистическое исследование в той или иной мере опирается на анализ языкового материала, языковых данных. Развитие современных интеллектуальных программных систем, которые предназначены для обработки текстов на естественном языке, также требует большой экспериментальной лингвистической базы. На сегодняшний день спрос на корпусные данные совпадает с современными техническими возможностями. В современной теоретической лингвистике корпус является как мощным инструментом исследования языка, так и новой идеологией, которая ориентирует исследователя на текст как главный объект теоретической рефлексии. Так, с помощью корпуса стало возможно быстрее и эффективнее решать известные науке задачи, а также ставить принципиально новые задачи, ранее практически невыполнимые из-за их трудоемкости...
Таким образом, в результате проведенного исследования можно сделать следующие выводы. Для организации работы с корпусными данными, организации эффективного поиска материала по заданным критериям, в корпусной лингвистике разрабатываются специфические методы исследования текстов, основанные на соединении квантитативных методов статистического анализа с организацией поиска материала на основе аннотирования текстов. Так, корпус - это определенная выборка, основанная на заданных критериях, связанных с конкретным аспектом лингвистических исследований; унифицированный, большой, а также структурированный массив языковых данных в электронном виде. Он непосредственно служит исследователям и пользователям для решения каких-либо лингвистических задач.
Созданию русскоязычных корпусов предшествовали разработки корпусов текстов в ряде европейских стран. Первым национальным корпусом, ставшим своего рода образцом для создания всех последующих корпусов текстов, стал Британский национальный корпус (BNC). Отечественная корпусная лингвистика возникает в 1980-е гг. и связывается с появлением работ А. П. Ершова и В. М. Андрющенко, посвященных машинному фонду русского языка.
В НКРЯ непосредственно представлены тексты самых разных сфер, жанров и функциональных стилей.
Структура НКРЯ регулярно корректируется, поскольку развитие корпусной лингвистики вызывает непрерывную исследовательскую рефлексию и продолжение разработки устройства языковых корпусов.
В связи с тем, что корпусная лингвистика является достаточно молодой дисциплиной, корпусные методы до сих пор остаются несистематизированными и не описанными в полной мере в научной литературе. Среди методов корпусной лингвистики выделяются следующие группы: филологические, теоретико-лингвистические, математические (статистические), а также методы информационных технологий...
1. Акимова, Э. Н. Древнерусский текст в лингвистических исследованиях ХХ-ХХ1 вв. [Текст] / Э. Н. Акимова. Саранск: Изд-во Мордов. ун-та, 2012. - С. 1-10.
2. Андрющенко В.М. Концепция и архитектура машинного фонда русского языка. M., 1989.
3. Балута А.А. Эволюция средств выражения ирреальной модальности в сложноподчиненном предложении русского языка (на материале первичных евангельских текстов), дис. ... канд. филол. наук, Москва, 2005.
4. Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие. — М.: Эдиториал УРСС, 2001. — 360 с.
5. Баталина К.Е. Абстрактные имена существительные и категории сакрального текста как средства экспликации концептов христианской картины мира в евангельских чтениях: На материале Апракоса Мстислава Великого 1115-1117 гг., дис. ... канд. филол. наук, Нижний Новгород, 2005. - С. 164.
6. Брукер Н.И. Конструкции цепного нанизывания с синтаксической частицей ЖЕ. [Текст] / Н.И. Брукер. [в:] Семантика и прагматика языковых единиц, Душанбе, 1990. - С. 163-174.
7. Ваулина С.С. Эволюция средств выражения модальности в русском языке (XI-XVII вв.). [Текст] / С.С. Ваулина. Ленинград: Издательство Ленинградского университета, 1988.
8. Вербицкая Л.А., Казанский Н.Н., Касевич В.Б. Некоторые проблемы создания национального корпуса русского языка // Научно-техническая информация. Сер. 2. 2003. № 6. C. 2-8; Шаров С.А. Представительный корпус русского языка в контексте мирового опыта // Там же. C. 9-18.
9. Виноградов В.В. Избранные труды: О языке художественной прозы. [Текст] / В.В. Виноградов. Москва: Наука, 1980. - С. 70.
10. Воейкова М. Д. Проблемы использования подкорпуса устной разговорной речи (на примере анализа русских диминутивов) // Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. СПб.: Нестор-История, 2009, 353—373.
11. Гришина Е. А. Устная речь в Национальном корпусе русского языка // Национальный корпус русского языка: 2003—2005. М.: Индрик, 2005, 94—110.
12. Гришина Е. А. О маркерах разговорной речи (предварительное исследование подкорпуса кино в Национальном корпусе русского языка) // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции «Диалог'2007» (Бекасово, 30 мая — 3 июня 2007 г.), 147—156.
13. Гришина Е. А., Плунгян В. А. Перспективы развития Национального корпуса русского языка // Национальный корпус русского языка: 2003—2005. М.: Индрик, 2005, 330—339.
14. Гришина Е. А., Савчук С. О. Корпус устных текстов в НКРЯ: состав и структура // Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. СПб.: Нестор-История, 2009, 129—149.
15. Дич Н. Л. О текстах XIX века в Национальном корпусе русского языка // Национальный корпус русского языка: 2003—2005. М.: Индрик, 2005, 89—93...75