Тип работы:
Предмет:
Язык работы:


Семантический анализатор глагольно-предложных конструкций со значением математических действий на основе модельной базы данных

Работа №126484

Тип работы

Магистерская диссертация

Предмет

лингвистика

Объем работы90
Год сдачи2023
Стоимость5550 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
18
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 2
Введение 4
Глава 1. Глаголы со значением математических действий 9
1.1. Возможные значения глаголов, входящих в конструкции 9
1.2. Модельная база данных валентностей 13
Глава 2. Функция переводного словаря семантического анализатора 20
Глава 3. Создание семантического анализатора 23
3.1. Представление базы данных 23
3.2. Функции в составе анализатора 27
3.3. Вывод результатов 30
Глава 4. Результаты 32
4.1. Тестирование семантического анализатора 32
4.2. Оценка результатов 35
Заключение 37
Список литературы 39
Приложение А 41
Таблица со значениями глаголов, входящих в глагольно-предложные конструкции со значением математических действий 41
Приложение Б 59
Таблица модельной базы данных валентностей глаголов 59
Приложение В 80
Программный код для семантического анализатора глагольно-предложных конструкций со значением математических действий 80

В данной работе описывается структура, этапы создания и возможные сферы применения семантического анализатора глагольно-предложных конструкций со значением математических действий на основе модельной базы данных. В условиях стремительного развития искусственного интеллекта и расширения области его применения возникает необходимость в адаптации естественного языка для обрабатывающих его программ, так как программы нередко допускают грубые ошибки в интерпретации текстов, что в большинстве случаев объясняется омонимией, присутствующей в человеческой речи. Оптимальным способом борьбы с омонимией является создание семантических анализаторов, которые способны различать спектр значений токена в контексте, и внедрение их в программы. Рассматриваемый в этой работе семантический анализатор предназначен для борьбы с омонимией и неточностями в области глагольно-предложных конструкций, глаголы внутри которых могут иметь математическое значение.
Во всех сферах профессиональной лексики насчитывается большое количество устойчивых словосочетаний, имеющих чётко определённую семантику и служащих своеобразными сложносочинёнными терминами. Математическая профессиональная лексика - не исключение: существует множество специализированных математических выражений, которые помогают точно определить, какое именно математическое явление имеется в виду.
Отдельная группа в этой сфере профессиональной лексики - это глаголы со значением математических действий. Словосочетания, в состав которых входят такие глаголы, активно используются математиками как в устной речи, так и в письме, в том числе в научных статьях и исследованиях, например: “выколоть точку”, “ориентировать граф”, “разложить на множители”. Большинство из них широко известно из школьного курса математики.
Словосочетания, строящиеся на глаголах со значением математических действий, имеют одну особенность: глаголы, входящие в их состав, очень часто используются и в нематематическом значении. Пример: в словосочетании “транспонировать матрицу” глагол “транспонировать” имеет чётко выраженное математическое значение («заменить в матрице строки соответствующими столбцами»); при этом существует выражение “транспонировать мелодию” («перелагать какое-либо музыкальное сочинение из одной тональности в другую»), смысл которого хоть и обнаруживает отдалённое сходство с математическим, но всё же является полностью самостоятельным и придаёт глаголу совершенно иное значение. Также хорошим примером двойственности значения может послужить глагол “описать”: в математическом смысле можно описать окружность, а в бытовом, нематематическом - описать характер человека.
Таким образом, у глаголов математических действий в большинстве случаев наблюдается ярко выраженная омонимия - различаются их математический и нематематический смысл.
Какие же проблемы влечёт за собой омонимия глаголов со значением математических действий? Полисемия влечёт за собой определённые проблемы автоматической обработки [1], и если в русском языке один и тот же глагол может использоваться как в математическом, так и в бытовом смысле, то в других языках, например, в английском или французском, эти значения могут определяться совершенно различными глаголами. Приведём пример: в русском языке в словосочетаниях “касаться окружности” и “касаться плеча” употребляется один и тот же глагол, в то время как в английском эти словосочетания будут соответственно переводиться как ‘to be tangent to a circle’ и ‘to touch one’s shoulder’ - в них используются два различных глагола, ‘to be tangent’ и ‘to touch’ [2].
Особенно уязвимыми к описанной выше омонимии являются онлайн- переводчики: очень часто встречается сделанный ими неправильный перевод, при котором переводчик не определяет глагол как математический и приписывает ему перевод нематематического значения. Это объясняется тем, что математические глаголы принадлежат узкой профессиональной сфере и редко используются большинством пользователей; кроме того, в интернете существует сравнительно небольшое количество текстов с подобными вхождениями, на которых можно было бы обучать переводчики. Даже такие масштабные проекты, как Google Translate [3] и Яндекс Переводчик [4], не всегда справляются с задачей. Ниже представлена табл. 1, в которой приведены неверные переводы глаголов в их математическом значении.
Таблица 1 - Примеры неверного перевода глаголов
Словосочетание
Язык перевода
Перевод Google Translate
Перевод Яндекс Переводчика
Правильный перевод
Исходить из вершины
Английский
To come from the top
To start from a ver­tex
To emanate from a vertex
Привести подобные члены
Французский
Apporter des mem- bres similaires
Citer des membres similaires
Reduire les termes similaires
Прямые скрещиваются
Английский
Straight lines cross
Straight lines are crossed
Straight lines are skew
Вынести за скобки
Английский
To take out of brack­ets
To put out of brack­ets
To factor out
Выделить полный квадрат
Французский
Marquer le point
Piquer le point
Exclure le point
Конец таблицы 1.
На рис. 1 и 2 приведена наглядная демонстрация неправильного перевода.
Рисунок 1 - Пример неправильного перевода на французский (Google Translate)
Рисунок 2 - Пример неправильного перевода на французский (Яндекс Переводчик)
Очевидно, что неверные переводы получаются по причине того, что онлайн- переводчики не способны распознать математический смысл глагола.
Помимо проблем перевода существуют также проблемы [5], связанные с неверным спряжением глаголов внутри конструкций со значением математических действий, неверным определением их валентности и изменением при переводе в другую часть речи.
Решением обозначенной проблемы является создание семантического анализатора, способного определять, в каком значении - математическом или нематематическом - употреблён данный глагол, и на основании этого выбирать правильный вариант перевода или правильный вариант спряжения.
Актуальность темы исследования заключается в том, что при использовании семантического анализатора для обозначенных задач значительно повысится качество функционирования искусственного интеллекта в сфере интерпретации естественного языка. Данная работа посвящена созданию семантического анализатора глагольно-предложных конструкций со значением математических действий на основе модельной базы данных.
Научная новизна работа состоит в исследовании и реализации алгоритма для проблематики семантического анализа текстов с математической тематикой для русского языка. В работе будет описан первый образец подобной программы; использование семантического анализа является одной из ключевых составляющих уникальности анализатора, так как требует подробного исследования терминов и составления словаря валентностей [6]. Практическая ценность семантического анализатора, исключающего ошибки при переводе глаголов со значением математических действий, обусловлена тем, что его использование позволит осуществлять качественный автоматический анализ и перевод научных и учебных текстов.
Итак, целью данной работы является создание семантического анализатора, способного с высокой точностью распознать значение глагола с возможной математическо-бытовой омонимией и обеспечить правильность перевода глагола на английский и французский языки после определения его значения .
Основными задачами являются:
1. Определение списка глаголов со значением математических действий, подверженных омонимии и создание базы данных валентностей и базы данных семантических классов для этих глаголов;
2. Создание базы данных перевода на английский и французский язык для этих глаголов в их математическом значении в качестве вспомогательной функции семантического анализатора;
3. Создание семантического анализатора и написание программы, реализующей обработку глаголов;
4. Получение результатов работы семантического анализатора; тестирование, отладка и повторное тестирование программы с целью достижения наибольшей точности её функционирования.
При выполнении обозначенных выше задач наиболее целесообразным будет проведение исследования научных текстов в сфере математики для анализа содержащихся в них глагольно-предложных конструкций со значением математических действий. При тестировании программы, на этапе оценки результатов, необходимо участие двух экспертов - это обеспечит точность и независимость оценки.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Результаты функционирования семантического анализатора, описанные в Главе 4, демонстрируют высокую точность работы программы. Как определение значения глагола, так и осуществление перевода его на английский и французский языки программа выполняет с точностью более 80%, что можно считать благоприятным для дальнейшего развития исследования результатом.
Таким образом, все задачи и все цели данного исследования были выполнены. Семантический анализатор, созданный в рамках данной работы, представляет собой не только прикладную, но и научную ценность, так как входящие в его состав базы данных валентностей и семантических классов можно считать полноценным словарём валентностей для глагольно-предложных конструкций со значением математических действий. Выбор верного перевода на иностранный язык позволяет использовать анализатор для научно-исследовательской работы, а снижение количества ошибок при автоматическом переводе математических текстов является вкладом в развитие искусственного интеллекта. Высокая точность результатов позволяет использовать семантический анализатор для прикладных задач.
Конечно же, созданная программа имеет ряд уязвимостей, и для их устранения в будущем требуется регулярные отладка и совершенствование анализатора, состоящие в тестирование входящих в него модулей на математических текстах из разнообразных источников, а затем - дополнение баз данных и оптимизация программы.
В дальнейшей перспективе планируется расширение набора языков, поддерживаемых модулем перевода, с целью обеспечения универсальности программы. Интересной задачей представляется также создание аналогичного анализатора для других областей науки с высокой вероятностью омонимии терминов: например, медицины или геологии. Конечной целью является создание отдельной программы искусственного интеллекта на основе разработанного анализатора - это существенно расширило бы возможности межъязыковой коммуникации в научной среде.


1. Захаров В. П., Боярский К. К., Головина А. В., Козлова А. Д. Semantic Analy­sis of Russian Prepositional Constructions. - Recent Advances in Slavonic Natural Language Processing, 2020. - с. 103-112.
2. Учебный русско-английский математический словарь / Е.Н. Лапузина, А.И. Лобода, Ю.А. Романов, Е.А. Романова. - Харьков: НТУ «ХПИ», 2016. - 184 с.
3. Google Переводчик [Электронный ресурс]: сайт онлайн-переводчика. - Режим доступа: https://translate.google.com/.
4. Яндекс Переводчик [Электронный ресурс]: сайт онлайн-переводчика. - Режим доступа: https://translate.yandex.ru/.
5. Hanks, P. Lexical analysis. Norms and Exploitations. London, 2013.
6. Herbst, T. A Valency Dictionary of English: A Corpus-Based Analysis of the Com­plementation Patterns of English Verbs, Nouns and Adjectives. / Thomas Herbst, David Heath, Ian F. Roe, Dieter Gotz (eds.). Berlin, 2004.
7. Национальный Корпус Русского Языка [Электронный ресурс]: сайт проекта. - Режим доступа: https://ruscorpora.ru/.
8. Математический словарь / Ю. Я. Каазик. - Москва: Физматлит, 2007. - 334 с.
9. Математический энциклопедический словарь. / Гл. ред. Ю. В. Прохоров; Ред. кол.: С. И. Адян, Н. С. Бахвалов, В. И. Битюцков, А. П. Ершов, Л. Д. Кудрявцев, А. Л. Онищик, А. П. Юшкевич. - М.: Сов. Энциклопедия, 1988. - 847 с., ил.
10. Азарова И. В., Захаров В. П. Prepositional Grammar Component for Syntactical and Lexical Disambiguation in Russian Based on Corpus Statistics. - Nordsci Con­ference on Social Sciences, 2019. - с. 173-180.
11. Захаров В. П., Азарова И. В. Semantic Structure of Russian Prepositional Con­structions. Lecture Notes in Computer Science, 2019, 11697. - с. 224-235.
12. Москвина А. Д., Еникеева Е. В., Захаров В. П. Разработка базы данных по семантике русских предлогов. - Компьютерная лингвистика и вычислительные онтологии, 2019, 3. - с. 106-115
13. Золотова Г.А. Синтаксический словарь. М.: Едиториал УРСС, 2006. - 450 с.
14. Когут В. И. Dictionnaire des difficultes de la langue fran^aise: Orthographe, ex­plication, difficultes, emploi = Большой словарь трудностей французского языка: Правописание, объяснение, трудности, ловушки, употребление. - СПб.: Издательство «Антология», 2019. - 864 c.
15. Sketch Engine (Araneum Russicum Russicum Maius) [Электронный ресурс]: корпусный менеджер. - Режим доступа: https://app.sketchengine.eu/#dash- board?corpname=preloaded%2Fru_araneum_maius_ru.
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ