Тип работы:
Предмет:
Язык работы:


Выявление информации о конфликтных ситуациях в новостных текстах (на базе семантического описания RussNet)

Работа №135943

Тип работы

Магистерская диссертация

Предмет

филология

Объем работы69
Год сдачи2016
Стоимость5350 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
15
Не подходит работа?

Узнай цену на написание


Введение 3
Глава 1. Теоретические аспекты выявления конфликтных ситуаций 7
1.1 Семантическое поле и лексико-семантическая группа слов 7
1.1.1 Семантическое поле 7
1.1.2 Лексико-семантические группы слов 11
1.2 Понятие валентности в лингвистике 14
1.2.1 Структурно-семантическое описание валентностей 14
1.2.2 Структурно-семантические типы валентностей 17
1.2.3 Практическое применение теории валентностей семантических ролей 22
1.3 Фреймовый способ описания семантики 24
1.3.1 Понятие фрейма 24
1.3.2 Фрейм как способ представления знаний 31
1.4 Электронные тезаурусы как способ описания семантических отношений 33
1.4.1 WordNet 33
1.4.2 RussNet – электронный тезаурус русского языка 35
1.5 Выводы 37
Глава 2. Состав и структура фреймов конфликтных микро- и макроситуаций 39
2.1 Исследуемый материал 39
2.2 Лексика и рамки валентностей 40
2.3 Фреймовое описание конфликтных ситуаций 43
2.3.1 Структура фрейма микроситуации 44
2.3.2 Структура фрейма макроситуации 47
2.4 Выводы 51
Заключение 54
Список использованной литературы 56
Приложение 60

Представленная работа производится на базе описания Russnet – электронного тезауруса русского языка, перенявшего большую часть методологии построения лексико-семантической базы данных у WordNet-проектов, представляющими собой сеть, элементами которой являются синонимические ряды (синсеты) и слова, входящие в них. Аналогичный проект RussNet, начало создания которого приходится на 1999 год, поставил перед собой цель охватить всю базовую общеупотребительную лексику. Наполнение словаря ведется методом отбора и анализа лексико-семантических полей, в состав которых входят высокочастотные лексемы, которые предположительно формируют ядерную часть лексико-семантических полей.
Целью данной работы является выявление структуры лексико-семантического поля глаголов, описывающих конфликтные ситуации. Для этого были поставлены следующие задачи:
1. Выявить основные параметры лексико-семантического поля (в том числе при помощи описания теории валентностей и теории фреймов)
2. Собрать корпус с последующим выделением наиболее частотных лексем, относящихся к конфликтной ситуации, а также создать фрейм с целью обеспечить наиболее полное исчисление лексем, соответствующих структуре поля.
Корпус, на основе которого было проведено представленное исследование, собран на материале Википедии. В него вошло около 30 обширных статей, посвященных описанию вооруженных действий в 2000-2015 годах, например, таких, как: Афгано-пакистанский пограничный конфликт, конфликт в Южной Осетии, конфликт на Украине, гражданская война в Либерии, Ливии и другие. Общий объем корпуса составляет около 60 тысяч словоупотреблений. Несмотря на свой объем корпус репрезентативен как с точки зрения представленности в нем конфликтных ситуаций (в нем подробно описаны все виды боевых действий и связанные с ними элементы (место, время и т.д.), интересующие нас в данном исследовании), так и с точки зрения лексики.
При помощи Томита-парсера были отобраны наиболее часто встречающиеся глаголы, при этом частотными считались те глаголы, которые встретились в корпусе более 15 раз. Из них были отобраны глаголы, имеющие явное отношение с точки зрения семантики к военным действиям, а также подобные глагольные конструкции с глаголами «быть» и «стать». Полученные глаголы (20 единиц) были разделены на те, которые составляют «ядро» семантического поля и «периферию». Для глаголов, относящихся к ядру, были подстроены актантные модели и были отмечены особенности каждой из конструкций. Кроме того, эти глаголы были объединены в синсеты с указанием их рамок валентностей, значением слов и примерами употребления для дальнейшей интеграции в RussNet.
Основная мысль, заложенная во фреймовом описании конфликтной ситуации, заключается в существовании конфликтных макроситуаций и микроситуаций, которые можно описать при помощи фреймов.
В нашем случае конфликтной ситуацией считается ситуация, которая обладает тремя составляющими конфликта: биполярностью, наличием сторон конфликта, наличием действий.
Микроситуацией является мельчайшее действие, в нашем случае – конфликтного характера. Микроситуация опирается на текст, она вербоцентрична. Фрейм микроситуации состоит из слотов «действие», «субъект», «объект» и «место» с указанием их лексического выражения и грамматического значения.
Макроситуацией же считается сумма связанных между собой микроситуаций, описывающая конфликт в конкретном тексте. Как правило, при наличии нескольких микроситуаций связь между ними представляют собой логические операции (импликация или конъюнкция). Конфликтная ситуация также опирается как на текст, так и на контекст, поэтому структура фрейма конфликтной макроситуации более сложна. Она состоит из слотов «Общая характеристика», в которой прописывается точка зрения на конфликт, аспекты и участники конфликтной ситуации, «Микроситуации», слот, ссылающийся на фреймы микроситуаций, а также слот «Характеристика действия», в которой указывается связь между микроситуациями, характеристика локализации конфликта и особенности времени.
Таким образом, представленная работа состоит из трех частей:
1. В первой главе описаны теоретические аспекты выявления конфликтных ситуаций, а именно:
• описание теории семантического поля и лексико-семантических групп
• описание теории валентностей и семантических ролей
• описание теории фреймов
• описание структур WordNet-тезаурусов и RussNet’а в частности
2. Во второй главе произведено исследование состава и структуры фреймов конфликтных ситуаций, а именно:
• описан материал, на основе которого проведено представленное исследование
• произведено исследование лексики и рамок валентностей
• спроектированы фреймы конфликтных микро- и макроситуаций
3. В приложении представлены синсеты, включающие в себя глаголы, относящиеся к «ядру» исследуемого семантического поля, описанные в терминах RussNet, а также приведены примеры фреймов конфликтных микроситуаций с каждым из этих глаголов с примерами.
Методы, используемые в работе:
• Теория семантических полей (с целью описать лексико-семантического поле конфликтной ситуации)
• Теория валентностей и семантических ролей (с целью определить основные параметры конфликтной ситуации с их грамматическим значением).
• Теория фреймов (с целью построения фрейма конфликтной ситуации)
Новизна представленной работы заключается в построении фрейма, описывающего конфликтную ситуацию, так как подобных исследований в рамках методики RussNet еще не было.
Актуальность же исследования заключается в том, что в настоящее время получен грант РГНФ на интеграцию данных RussNet в YARN (Yet Another RussNet, проект Уральского Государственного Университета им. Горького, направленный на создание большого открытого тезауруса русского языка с использованием краудсорсинга), поэтому возникает задача проверить имеющиеся данные по областям RussNet, пополнить их максимально и поместить синсеты и семантические отношения в YARN.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В представленной работе был исследован способ выявления конфликтных ситуаций в новостных текстах посредством теории валентностей, семантических ролей и фреймового описания.
В ходе исследования были решены следующие задачи:
1. Были описаны основные параметры лексико-семантического поля конфликтной ситуации, указаны особенности рамок валентности и семантических ролей аргументов при глаголах, а также указаны принципы построения фреймов.
2. Был собран корпус, отобраны наиболее частотные лексемы и синтагмы, принадлежащие семантическому полю конфликтной ситуации, а также создан фрейм, описывающий конфликтную ситуацию.
Итогом работы можно считать полученные нами фреймы конфликтных микроситуаций и макроситуаций, а также синсеты отобранных нами слов, описанных в терминах RussNet.
При анализе материала при помощи Томита-парсера были отобраны наиболее частотные глаголы (встретившиеся в тексте более 15 раз) и классифицированы на семантические «ядро» и «периферию». В «ядро» вошли такие глаголы, как атаковать, захватить, пострадать, погибнуть и другие, а также такие глагольные сочетания, как нанести удар, быть убитым и быть уничтоженным. Основанием для подобного выделения служили частотность в корпусе с одной стороны и практически полное отсутствие полисемии с другой, что означает высокую используемость этих глаголов при описании интересующих нас вооруженных конфликтов.
После классификации была проделана работа по построению их актантных моделей с указанием семантических ролей и грамматических значений. Глаголы, объединенные в синсеты с указанием примеров употребления, рамки валентности и лексического значения, которые можно найти в приложении, были предоставлены RussNet.
Кроме того, была проведена работа по формированию прототипов микроситуаций и макроситуаций в терминах фреймового описания.
Микроситуацией считалось мельчайшее действие конфликтного характера. Микроситуация опирается на текст, она вербоцентрична. Пример: в предложении «Вооруженные боевики атаковали КПП йеменской армии в Лахдже и убили 12 солдат в засаде у Лодара» мы видим две микроситуации: 1) боевики атаковали КПП в Лахдже и 2) боевики убили 12 солдат в засаде у Лодара.
Макроситуацией же считалась сумма связанных между собой микроситуаций, описывающая конфликт в конкретном тексте. Как правило, при наличии нескольких микроситуаций связь между ними представляют собой логические операции (импликация или конъюнкция). Конфликтная ситуация также опирается как на текст, так и на контест. Пример: предложение «Вооруженные боевики атаковали КПП йеменской армии в Лахдже и убили 12 солдат в засаде у Лодара» описывает макроситуацию, в которой две микроситуации связаны между собой конъюнкцией, а сама конфликтная ситуация относится к афгано-пакистанскому пограничному конфликту.
В работе были подробно разобраны структуры фреймов, а также приведены примеры фреймового описания.
Фреймовое описание ситуаций в терминах RussNet представляется достаточно свежим направлением. В представленной работе было произведено описание ситуаций, носящих исключительно конфликтный характер, поэтому перспективность данного исследования видится в описании ситуаций других типов, а также, возможно, нахождение объединяющих их элементов с последующей классификацией.


1. Anders Johannsen. Any-language frame-semantic parsing. Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon, 2015. P. 2062-2066.
2. Benítez P. Framing Terminology: A Process-Oriented Approach. Meta: Translators' Journal, 2005. Vol. 50, №4. P. 40-64.
3. Braslavski P., Ustalov D., Mukhin M. A Spinning Wheel for YARN: User Interface for a Crowdsourced Thesaurus // Proceedings of the Demonstrations at the 14th Conference of the European Chapter of the Association for Computational Linguistics. Gothenburg, Sweden, 2014. P. 101-104.
4. Das D. Frame-Semantic Parsing. Computational Linguistics, 2014. Vol. 40, #1. P. 9-56.
5. Fillmore C. Frame semantics and the nature of language // Annals of the New York Academy of Sciences: Conference on the Origin and Development of Language and Speech, 1976. Vol. 280. P. 20-32.
6. M`arquez L., Carreras X. Semantic Role Labeling: An Introduction to the Special Issue. Computational Linguistics, 2008. Vol. 34, #2. P. 145-159.
7. O’Hara T. Exploiting Semantic Role Resources for Preposition Disambiguation. Computational Linguistics, 2008. Vol. 35, #2. P. 151-184.
8. Punyakanok V. The Importance of Syntactic Parsing and Inference in Semantic Role Labeling. Computational Linguistics, 2008. P. 257-287.
9. Азарова И.В. RussNet как база представления лексического блока в системах автоматизированного анализа текстов. СПб, 2015.
10. Азарова И.В. Выявление лексикализованных понятий в RussNet с использованием контекстной информации из корпуса текстов. http://project.phil.spbu.ru/RussNet/papers/azarova_facultet_2004.doc (Дата обращения: 15.05.2016)
11. Азарова И.В. Схемы управления в грамматике и рамки валентностей в RussNet. http://project.phil.spbu.ru/RussNet/papers/azarova_facultet_2005.doc (Дата обращения: 15.05.2016)
12. Азарова И.В., Митрофанова О.А., Синопальникова А.А. Разработка компьютерного тезауруса русского языка типа WordNet // Материалы конференции «Корпусная лингвистика и лингвистические базы данных» 5-7 марта 2002 г. СПб, 2002.
13. Азарова И.В., Синопальникова А.А., Смрж П. Представление устойчивых лексических сочетаний в компьютерном тезаурусе RussNet. http://project.phil.spbu.ru/RussNet/papers/azarova-sinopalnikova-smrz.doc (Дата обращения: 15.05.2016)
14. Азарова И.В., Синопальникова А.А., Яворская М.В. Принципы построения wordnet-тезауруса RussNet. // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции Диалог’2004 (Верхневолжский, 2–7 июня 2004 г.) М., 2004. С. 542–547.
15. Апресян Ю.Д. Идеи и методы современной структурной лингвистики (краткий очерк). М.:Просвещение, 1966.
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ