Тема: Семантический анализатор глагольно-предложных конструкций со значением математических действий на основе модельной базы данных
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 4
Глава 1. Глаголы со значением математических действий 9
1.1. Возможные значения глаголов, входящих в конструкции 9
1.2. Модельная база данных валентностей 13
Глава 2. Функция переводного словаря семантического анализатора 20
Глава 3. Создание семантического анализатора 23
3.1. Представление базы данных 23
3.2. Функции в составе анализатора 27
3.3. Вывод результатов 30
Глава 4. Результаты 32
4.1. Тестирование семантического анализатора 32
4.2. Оценка результатов 35
Заключение 37
Список литературы 39
Приложение А 41
Таблица со значениями глаголов, входящих в глагольно-предложные конструкции со значением математических действий 41
Приложение Б 59
Таблица модельной базы данных валентностей глаголов 59
Приложение В 80
Программный код для семантического анализатора глагольно-предложных конструкций со значением математических действий 80
📖 Введение
Во всех сферах профессиональной лексики насчитывается большое количество устойчивых словосочетаний, имеющих чётко определённую семантику и служащих своеобразными сложносочинёнными терминами. Математическая профессиональная лексика - не исключение: существует множество специализированных математических выражений, которые помогают точно определить, какое именно математическое явление имеется в виду.
Отдельная группа в этой сфере профессиональной лексики - это глаголы со значением математических действий. Словосочетания, в состав которых входят такие глаголы, активно используются математиками как в устной речи, так и в письме, в том числе в научных статьях и исследованиях, например: “выколоть точку”, “ориентировать граф”, “разложить на множители”. Большинство из них широко известно из школьного курса математики.
Словосочетания, строящиеся на глаголах со значением математических действий, имеют одну особенность: глаголы, входящие в их состав, очень часто используются и в нематематическом значении. Пример: в словосочетании “транспонировать матрицу” глагол “транспонировать” имеет чётко выраженное математическое значение («заменить в матрице строки соответствующими столбцами»); при этом существует выражение “транспонировать мелодию” («перелагать какое-либо музыкальное сочинение из одной тональности в другую»), смысл которого хоть и обнаруживает отдалённое сходство с математическим, но всё же является полностью самостоятельным и придаёт глаголу совершенно иное значение. Также хорошим примером двойственности значения может послужить глагол “описать”: в математическом смысле можно описать окружность, а в бытовом, нематематическом - описать характер человека.
Таким образом, у глаголов математических действий в большинстве случаев наблюдается ярко выраженная омонимия - различаются их математический и нематематический смысл.
Какие же проблемы влечёт за собой омонимия глаголов со значением математических действий? Полисемия влечёт за собой определённые проблемы автоматической обработки [1], и если в русском языке один и тот же глагол может использоваться как в математическом, так и в бытовом смысле, то в других языках, например, в английском или французском, эти значения могут определяться совершенно различными глаголами. Приведём пример: в русском языке в словосочетаниях “касаться окружности” и “касаться плеча” употребляется один и тот же глагол, в то время как в английском эти словосочетания будут соответственно переводиться как ‘to be tangent to a circle’ и ‘to touch one’s shoulder’ - в них используются два различных глагола, ‘to be tangent’ и ‘to touch’ [2].
Особенно уязвимыми к описанной выше омонимии являются онлайн- переводчики: очень часто встречается сделанный ими неправильный перевод, при котором переводчик не определяет глагол как математический и приписывает ему перевод нематематического значения. Это объясняется тем, что математические глаголы принадлежат узкой профессиональной сфере и редко используются большинством пользователей; кроме того, в интернете существует сравнительно небольшое количество текстов с подобными вхождениями, на которых можно было бы обучать переводчики. Даже такие масштабные проекты, как Google Translate [3] и Яндекс Переводчик [4], не всегда справляются с задачей. Ниже представлена табл. 1, в которой приведены неверные переводы глаголов в их математическом значении.
Таблица 1 - Примеры неверного перевода глаголов
Словосочетание
Язык перевода
Перевод Google Translate
Перевод Яндекс Переводчика
Правильный перевод
Исходить из вершины
Английский
To come from the top
To start from a vertex
To emanate from a vertex
Привести подобные члены
Французский
Apporter des mem- bres similaires
Citer des membres similaires
Reduire les termes similaires
Прямые скрещиваются
Английский
Straight lines cross
Straight lines are crossed
Straight lines are skew
Вынести за скобки
Английский
To take out of brackets
To put out of brackets
To factor out
Выделить полный квадрат
Французский
Marquer le point
Piquer le point
Exclure le point
Конец таблицы 1.
На рис. 1 и 2 приведена наглядная демонстрация неправильного перевода.
Рисунок 1 - Пример неправильного перевода на французский (Google Translate)
Рисунок 2 - Пример неправильного перевода на французский (Яндекс Переводчик)
Очевидно, что неверные переводы получаются по причине того, что онлайн- переводчики не способны распознать математический смысл глагола.
Помимо проблем перевода существуют также проблемы [5], связанные с неверным спряжением глаголов внутри конструкций со значением математических действий, неверным определением их валентности и изменением при переводе в другую часть речи.
Решением обозначенной проблемы является создание семантического анализатора, способного определять, в каком значении - математическом или нематематическом - употреблён данный глагол, и на основании этого выбирать правильный вариант перевода или правильный вариант спряжения.
Актуальность темы исследования заключается в том, что при использовании семантического анализатора для обозначенных задач значительно повысится качество функционирования искусственного интеллекта в сфере интерпретации естественного языка. Данная работа посвящена созданию семантического анализатора глагольно-предложных конструкций со значением математических действий на основе модельной базы данных.
Научная новизна работа состоит в исследовании и реализации алгоритма для проблематики семантического анализа текстов с математической тематикой для русского языка. В работе будет описан первый образец подобной программы; использование семантического анализа является одной из ключевых составляющих уникальности анализатора, так как требует подробного исследования терминов и составления словаря валентностей [6]. Практическая ценность семантического анализатора, исключающего ошибки при переводе глаголов со значением математических действий, обусловлена тем, что его использование позволит осуществлять качественный автоматический анализ и перевод научных и учебных текстов.
Итак, целью данной работы является создание семантического анализатора, способного с высокой точностью распознать значение глагола с возможной математическо-бытовой омонимией и обеспечить правильность перевода глагола на английский и французский языки после определения его значения .
Основными задачами являются:
1. Определение списка глаголов со значением математических действий, подверженных омонимии и создание базы данных валентностей и базы данных семантических классов для этих глаголов;
2. Создание базы данных перевода на английский и французский язык для этих глаголов в их математическом значении в качестве вспомогательной функции семантического анализатора;
3. Создание семантического анализатора и написание программы, реализующей обработку глаголов;
4. Получение результатов работы семантического анализатора; тестирование, отладка и повторное тестирование программы с целью достижения наибольшей точности её функционирования.
При выполнении обозначенных выше задач наиболее целесообразным будет проведение исследования научных текстов в сфере математики для анализа содержащихся в них глагольно-предложных конструкций со значением математических действий. При тестировании программы, на этапе оценки результатов, необходимо участие двух экспертов - это обеспечит точность и независимость оценки.
✅ Заключение
Таким образом, все задачи и все цели данного исследования были выполнены. Семантический анализатор, созданный в рамках данной работы, представляет собой не только прикладную, но и научную ценность, так как входящие в его состав базы данных валентностей и семантических классов можно считать полноценным словарём валентностей для глагольно-предложных конструкций со значением математических действий. Выбор верного перевода на иностранный язык позволяет использовать анализатор для научно-исследовательской работы, а снижение количества ошибок при автоматическом переводе математических текстов является вкладом в развитие искусственного интеллекта. Высокая точность результатов позволяет использовать семантический анализатор для прикладных задач.
Конечно же, созданная программа имеет ряд уязвимостей, и для их устранения в будущем требуется регулярные отладка и совершенствование анализатора, состоящие в тестирование входящих в него модулей на математических текстах из разнообразных источников, а затем - дополнение баз данных и оптимизация программы.
В дальнейшей перспективе планируется расширение набора языков, поддерживаемых модулем перевода, с целью обеспечения универсальности программы. Интересной задачей представляется также создание аналогичного анализатора для других областей науки с высокой вероятностью омонимии терминов: например, медицины или геологии. Конечной целью является создание отдельной программы искусственного интеллекта на основе разработанного анализатора - это существенно расширило бы возможности межъязыковой коммуникации в научной среде.





