Тема: СПЕЦИФИКА ИСПОЛЬЗОВАНИЯ ЛИНГВИСТИЧЕСКОГО КОРПУСА ДЛЯ ИЗУЧЕНИЯ ПОЛИСЕМИИ СЛОВА
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ГЛАВА 1. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ
ИССЛЕДОВАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ 6
1.1 Основные положения корпусной лингвистики 6
1.2 Традиционные и корпусные исследования 8
1.3 История создания лингвистических корпусов 10
1.4 Концептуальная классификация корпусов 13
ВЫВОДЫ ПО ГЛАВЕ 1 19
ГЛАВА 2. ЯЗЫКОВОЙ КОРПУС КАК БАЗА ДЛЯ ИССЛЕДОВАНИЯ
МНОГОЗНАЧНЫХ СЛОВ 21
2.1 Методы автоматического разрешения многозначности 21
2.2 Применение корпусных данных при анализе многозначных слов. Роль
контекста при выборе семантического варианта в многозначном слове 27
2.3 Концептуальное моделирование процесса разрешения полисемии с
использованием корпуса 39
ВЫВОДЫ ПО ГЛАВЕ 2 47
ЗАКЛЮЧЕНИЕ 49
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 51
СПИСОК ИСТОЧНИКОВ ФАКТИЧЕСКОГО МАТЕРИАЛА 53
📖 Введение
Мы живем в эпоху повсеместного становления информационного общества. Процессы информатизации значительно меняют и облегчают нашу жизнь. Наиболее важным ресурсом в современном обществе становится информация. Сохранение, преумножение и рациональное использование этого ресурса стало иметь огромное значение для общества. Всеми этими возможностями обладает лингвистический корпус. Кроме того, лингвистический корпус - это отличный источник поиска контекстуального употребления слов.
Актуальность данной работы обусловлена необходимостью изучения лексической многозначности слов в рамках одного из ведущих направлений языкознания - корпусной лингвистики. С развитием компьютерной лингвистики лексическая многозначность слова становится одной из главных проблем для систем автоматической обработки текстов. В данной работе затрагиваются актуальные вопросы выявления и описания лексической многозначности. Лексическая многозначность - неотъемлемая часть естественного языка. Слова и словосочетания могут нести различную смысловую нагрузку в зависимости от контекста, в котором они использовались.
Цель работы состоит в выявлении специфики использования лингвистического корпуса для изучения полисемии слова.
Поставленная цель диктует следующие задачи исследования:
1. Показать преимущества использования корпусов текстов для решения теоретических и прикладных задач в лингвистике.
2. Проанализировать особенности реализации автоматического разрешения многозначности.
3. Продемонстрировать результаты применения корпуса при изучении многозначных частотных слов в современном английском языке.
Объектом исследования является Британский национальный корпус (British National Corpus) и Корпус современного американского английского (Corpus of Contemporary American English).
Предметом исследования является семантические характеристики многозначного слова в современном английском языке.
Материалом исследования послужили примеры многозначных слов, почерпнутые из электронных текстов корпусов British National Corpus и Corpus of Contemporary American English.
Методологической основой исследования послужили научные положения, составляющие суть таких парадигм знания, как:
- компьютерная лингвистика, представленная трудами А.Н. Баранова, В.П Захаровой, В.В. Рыкова и других ученых;
- лексическая семантика, разрабатываемая трудами Т.И. Вендиной, У. Чейфом и другими.
Методы исследования. В процессе работы использовались следующие методы:
- метод анализа словарных дефиниций;
- метод контекстуального анализа;
- метод концептуального моделирования;
- метод корпусного анализа.
Апробация работы. Основные положения и результаты данного исследования представлены в докладах на следующих научных конференциях:
• «Проблемы, перспективы и направления инновационного развития науки», 24 ноября 2017 г., г. Омск, Российская Федерация.
• «Интеграционный процессы в науке в современных условиях», 20 марта 2018 г., г. Новосибирск, Российская Федерация.
• Студенческая научная конференция в секции «Концептуализация мира в языке. Компьютерная лингвистика», 18 апреля 2018 г., г. Белгород в рамках Недели Науки ИМКиМО.
Структура работы. Данная работа состоит из Введения, двух глав, Заключения, Списка используемой литературы и Списка источников фактического материала.
Во Введении обосновывается актуальность данного исследования, формулируются его цель, задачи, определяются методы исследования.
В первой главе представлена информация об основных положениях корпусной лингвистики, традиционных и корпусных исследованиях, излагается история создания лингвистических корпусов, а также приводится концептуальная классификация корпусов.
Во второй главе представлен анализ некоторых полисемантичных слов, значения которых были изучены с помощью Корпуса современного американского английского (Corpus of Contemporary American English, COCA) и Британского национального корпуса (British National Corpus, BNC).
В Заключении в обобщенной форме излагаются основные результаты исследования.
✅ Заключение
В первой главе данного исследования было изучено то, что принято понимать под корпусной лингвистикой, а также выявлены признаки уникальности корпусной лингвистики и ее основные отличия от традиционной лингвистики. Кроме того, подробно разобрана и изучена концептуальная классификация корпусов по различным признакам.
Таким образом, была создана теоретическая база для дальнейшего практического исследования во второй главе, где с помощью языковых корпусов, а именно с помощью Британского национального корпуса (British National Corpus) и Корпуса современного американского английского (Corpus of Contemporary American English) проанализированы некоторые многозначные лексические единицы. В ходе этого анализа был установлен ряд наиболее часто употребляющихся переводов данных слов в соответствии с контекстом.
В корпусах разрешение лексической многозначности осуществляется с опорой на сочетаемость компонентов. Большие объемы современных корпусов позволяют выполнять статистически значимые наблюдения о совместной встречаемости слов в разных значениях. Наилучшие результаты дают аннотированные корпуса, в которых у слов размечены значения. Примером такого корпуса является Британский национальный корпус.
В ходе данного исследования было выявлено несколько преимуществ использования корпуса текстов в лингвистических исследованиях:
1) удобство и простота его использования, которые достигаются за счет структурности корпуса;
2) большой объем языкового материала, который обеспечивает реальные статистические данные, на основе которых можно вывести новые закономерности в языке или проверить ту или иную гипотезу.
3) корпус имеет дело с языковыми данными (словоупотреблениями) в их реальном контексте;
4) язык описывается в том виде, как он проявляет себя в речи, представленной в специально подобранном корпусе текстов;
5) языковые данные большинства лингвистических корпусов, постоянно обновляются и расширяются, что позволяет оценить современное состояние языка, проследить изменение частот и контекстов в различные периоды времени и изучить динамику процессов изменения лексического состава языка.
Более того, представлена модель распознавания значения многозначного слова, которая носит гипотетический характер и выглядит следующим образом:
• предъявление слова, употребленного одном из своих смыслов;
• активизация набора когнитивных контекстов, ассоциированных со словом;
• идентификация соответствующего когнитивного контекста (или его элемента);
• идентификация соответствующего значения многозначного слова. Представляется, что результаты данной работы могут быть полезны для
лингвистов, которые сталкиваются при переводе с проблемами лексической многозначности.



