Аннотация 2
Abstract 3
Введение 4
Глава 1. Глаголы со значением математических действий 9
1.1. Возможные значения глаголов, входящих в конструкции 9
1.2. Модельная база данных валентностей 13
Глава 2. Функция переводного словаря семантического анализатора 20
Глава 3. Создание семантического анализатора 23
3.1. Представление базы данных 23
3.2. Функции в составе анализатора 27
3.3. Вывод результатов 30
Глава 4. Результаты 32
4.1. Тестирование семантического анализатора 32
4.2. Оценка результатов 35
Заключение 37
Список литературы 39
Приложение А 41
Таблица со значениями глаголов, входящих в глагольно-предложные конструкции со значением математических действий 41
Приложение Б 59
Таблица модельной базы данных валентностей глаголов 59
Приложение В 80
Программный код для семантического анализатора глагольно-предложных конструкций со значением математических действий 80
В данной работе описывается структура, этапы создания и возможные сферы применения семантического анализатора глагольно-предложных конструкций со значением математических действий на основе модельной базы данных. В условиях стремительного развития искусственного интеллекта и расширения области его применения возникает необходимость в адаптации естественного языка для обрабатывающих его программ, так как программы нередко допускают грубые ошибки в интерпретации текстов, что в большинстве случаев объясняется омонимией, присутствующей в человеческой речи. Оптимальным способом борьбы с омонимией является создание семантических анализаторов, которые способны различать спектр значений токена в контексте, и внедрение их в программы. Рассматриваемый в этой работе семантический анализатор предназначен для борьбы с омонимией и неточностями в области глагольнопредложных конструкций, глаголы внутри которых могут иметь математическое значение.
Во всех сферах профессиональной лексики насчитывается большое количество устойчивых словосочетаний, имеющих чётко определённую семантику и служащих своеобразными сложносочинёнными терминами. Математическая профессиональная лексика - не исключение: существует множество
специализированных математических выражений, которые помогают точно определить, какое именно математическое явление имеется в виду.
Отдельная группа в этой сфере профессиональной лексики - это глаголы со значением математических действий. Словосочетания, в состав которых входят такие глаголы, активно используются математиками как в устной речи, так и в письме, в том числе в научных статьях и исследованиях, например: “выколоть точку”, “ориентировать граф”, “разложить на множители”. Большинство из них широко известно из школьного курса математики.
Словосочетания, строящиеся на глаголах со значением математических действий, имеют одну особенность: глаголы, входящие в их состав, очень часто используются и в нематематическом значении. Пример: в словосочетании “транспонировать матрицу” глагол “транспонировать” имеет чётко выраженное математическое значение («заменить в матрице строки соответствующими столбцами»); при этом существует выражение “транспонировать мелодию” («перелагать какое-либо музыкальное сочинение из одной тональности в другую»), смысл которого хоть и обнаруживает отдалённое сходство с математическим, но всё же является полностью самостоятельным и придаёт глаголу совершенно иное значение...
Результаты функционирования семантического анализатора, описанные в Главе 4, демонстрируют высокую точность работы программы. Как определение значения глагола, так и осуществление перевода его на английский и французский языки программа выполняет с точностью более 80%, что можно считать благоприятным для дальнейшего развития исследования результатом.
Таким образом, все задачи и все цели данного исследования были выполнены. Семантический анализатор, созданный в рамках данной работы, представляет собой не только прикладную, но и научную ценность, так как входящие в его состав базы данных валентностей и семантических классов можно считать полноценным словарём валентностей для глагольно-предложных конструкций со значением математических действий. Выбор верного перевода на иностранный язык позволяет использовать анализатор для научноисследовательской работы, а снижение количества ошибок при автоматическом переводе математических текстов является вкладом в развитие искусственного интеллекта. Высокая точность результатов позволяет использовать семантический анализатор для прикладных задач.
Конечно же, созданная программа имеет ряд уязвимостей, и для их устранения в будущем требуется регулярные отладка и совершенствование анализатора, состоящие в тестирование входящих в него модулей на математических текстах из разнообразных источников, а затем - дополнение баз данных и оптимизация программы.
В дальнейшей перспективе планируется расширение набора языков, поддерживаемых модулем перевода, с целью обеспечения универсальности программы. Интересной задачей представляется также создание аналогичного анализатора для других областей науки с высокой вероятностью омонимии терминов: например, медицины или геологии. Конечной целью является создание отдельной программы искусственного интеллекта на основе разработанного анализатора - это существенно расширило бы возможности межъязыковой коммуникации в научной среде.
1. Захаров В. П., Боярский К. К., Головина А. В., Козлова А. Д. Semantic Analysis of Russian Prepositional Constructions. - Recent Advances in Slavonic Natural Language Processing, 2020. - с. 103-112.
2. Учебный русско-английский математический словарь / Е.Н. Лапузина, А.И. Лобода, Ю.А. Романов, Е.А. Романова. - Харьков: НТУ «ХПИ», 2016. - 184 с.
3. Google Переводчик [Электронный ресурс]: сайт онлайн-переводчика. - Режим доступа: https://translate.google.com/.
4. Яндекс Переводчик [Электронный ресурс]: сайт онлайн-переводчика. - Режим доступа: https://translate.yandex.ru/.
5. Hanks, P. Lexical analysis. Norms and Exploitations. London, 2013.
6. Herbst, T. A Valency Dictionary of English: A Corpus-Based Analysis of the Complementation Patterns of English Verbs, Nouns and Adjectives. / Thomas Herbst, David Heath, Ian F. Roe, Dieter Gotz (eds.). Berlin, 2004.
7. Национальный Корпус Русского Языка [Электронный ресурс]: сайт проекта.
- Режим доступа: https://ruscorpora.ru/.
8. Математический словарь / Ю. Я. Каазик. - Москва: Физматлит, 2007. - 334 с.
9. Математический энциклопедический словарь. / Гл. ред. Ю. В. Прохоров; Ред. кол.: С. И. Адян, Н. С. Бахвалов, В. И. Битюцков, А. П. Ершов, Л. Д. Кудрявцев, А. Л. Онищик, А. П. Юшкевич. - М.: Сов. Энциклопедия, 1988. - 847 с., ил.
10. Азарова И. В., Захаров В. П. Prepositional Grammar Component for Syntactical and Lexical Disambiguation in Russian Based on Corpus Statistics. - Nordsci Conference on Social Sciences, 2019. - с. 173-180.
11. Захаров В. П., Азарова И. В. Semantic Structure of Russian Prepositional Constructions. Lecture Notes in Computer Science, 2019, 11697. - с. 224-235.
12. Москвина А. Д., Еникеева Е. В., Захаров В. П. Разработка базы данных по семантике русских предлогов. - Компьютерная лингвистика и вычислительные онтологии, 2019, 3. - с. 106-115
13.Золотова Г.А. Синтаксический словарь. М.: Едиториал УРСС, 2006. - 450 с.
14. Когут В. И. Dictionnaire des difficultes de la langue fran^aise: Orthographe, explication, difficultes, emploi = Большой словарь трудностей французского языка: Правописание, объяснение, трудности, ловушки, употребление. - СПб.: Издательство «Антология», 2019. - 864 c.
15.Sketch Engine (Araneum Russicum Russicum Maius) [Электронный ресурс]: корпусный менеджер. - Режим доступа: https://app.sketchengine.eu/#dash- board?corpname=preloaded%2Fru_araneum_maius_ru.