Тема: ПАРСИНГ ФОРМУЛИРОВОК ТЕОРЕМ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Основные понятия 7
Цель работы 8
Классификация формулировок теорем 9
Формулировки теорем в условной форме 11
Формулировки теорем в категорической форме 14
Определение антецедента 16
Определение части речи и грамматических характеристик 19
Выбор программных средств для реализации 22
Алгоритм работы программы 25
Формат вывода результата работы программы 30
Системные требования и инструкция 31
Примеры работы программы 32
Заключение 35
Список литературы 36
Листинг 37
📖 Введение
Разумеется, подобные справочные системы также совершенно необходимы в наукоемких видах деятельности.
В большинстве научных дисциплин, включая математику, веб-доступ к цифровым ресурсам, предоставляющим необходимую литературу, весьма развит и эффективен. Используя как открытые, так и запатентованные материалы и инструменты, математики могут найти немалое количество информации, используя различные атрибуты поиска, такие как предмет исследования, название работы, автора, дату и ключевые слова; они могут воссоздать историю исследований автора за прошедшие годы. Но, несмотря на то, что много информации содержится в отдельных элементах математической литературы, гораздо большее ее количество незримо связано как между собой, так и с другими областями. То есть эти логические цепочки могут быть представлены не только в виде прямых отсылок, но и в виде некоторой внутренней взаимосвязи понятий, идей и методик.
Это вдохновило группу единомышленников на создание Всемирной цифровой математической библиотеки (World Digital Mathematics Library). В течение последних нескольких лет математики прилагают совместные усилия по оцифровке прошлого математической литературы для того, чтобы сделать
его доступным в Интернете. Цель состоит в том, чтобы собрать как можно больше имеющейся литературы и организовать к ней доступ, храня оцифрованные версии всего свода математических исследований, как современных, так и гораздо более ранних, в распределенной системе взаимосвязанных хранилищ.
Более того, WDML будет представлять собой не просто коллекцию оцифрованных научных статей и книг, она также будет включать в себя возможности для поиска, добавления ссылок, аннотирования, индексации, классификации, нахождения источника, разного рода вычислений и т. д., то есть содержать все наиболее востребованные опции, которые, тем не менее, выходят за рамки нынешних возможностей таких систем, как Zentralblatt MATH, Google Scholar, Wolfram Alpha. Тем самым WDML намеревается поддержать новое поколение математических исследований.
Продумывая возможности всемирной цифровой математической библиотеки, создатели учли недостатки существующих справочных математических систем и выделили несколько главных характеристик. Библиотека должна быть:
• современной;
• хорошо организованной;
• общедоступной;
• исчерпывающей;
• надежной;
• простой в использовании для не математиков.
Современные средства позволяют разработать машиночитаемый репозиторий, в котором теоремы, леммы и определения формализованы и представляются в виде утверждений, выражений и логических высказываний, тесно связанных между собой.
Очевидно, что при этом все формулировки должны однозначно восприниматься машиной (примером может служить LaTeX). Кроме этого, такие технологии, как RDF и OWL7, являясь моделью семантического представления данных, могут быть полезны для машинной обработки теорем. Эти технологии являются достаточно гибкими, что позволит пользователям расширить онтологии. Языки разметки также могут быть полезными, поскольку они общеизвестны, и с помощью них можно закодировать многие важные теоремы.
Хранилище будет доступно внешним программам через некоторый интерфейс. Исследователи же, скорее всего, будут представлять свои наработки через веб-интерфейс, так как это поможет заранее создать «упоминание» о проведенном исследовании и получить неопровержимые доказательства о том, кто провел его первым. Ведь есть много известных случаев, когда теоремы были доказаны несколькими лицами независимо друг от друга, но с использованием различной терминологии.
Данное хранилище сможет обнаружить повторяющиеся термины и теоремы, чтобы исследователи могли сосредоточиться на новых результатах, а не доказывать то, что уже известно.
Другой вопрос, заслуживший рассмотрения в WDML, это список открытых математических проблем. При этом у каждой из проблем должен быть постоянно поддерживаемый статус и актуальные ссылки на подходящую литературу. Это хороший способ для стимулирования к новым научным открытиям.
Кроме этого, немалую важность при создании библиотеки будут представлять поиск и навигация.
Пользователи должны иметь возможность перемещаться и исследовать корпус доступных для них математических документов. Это отличается от стандартного поиска по ключевым словам, ведь возможность быстро найти релевантную информацию об объекте исследований может помочь математику решить, стоит ли рассматривать текущую статью.
Такая дополнительная информация об объекте может включать другие статьи, в которых обсуждается тот же, более общий или более конкретный вопрос; описание того, когда и где этот объект был впервые определен в литературе; перечень справочных ресурсов с информацией об объекте; различные представления объекта (например, фрагмент LaTeX или как Mathematica кода).
Для этого потребуются системы математических знаний и научные работы различных областей, а именно:
• анализ текста;
• представления математических знаний;
• компьютерная лингвистика и корпусы математических текстов;
• инструменты для мета-обработки данных в области математики;
• MathML, OpenMath, TeX и другие стандарты математического содержания;
• математическое сканирование и индексирование;
• письменные архивы;
• организация поиска в математических текстах.
Последнее вплотную касается темы данной дипломной работы, поскольку поиск в теоремах, леммах и аксиомах подразумевает большие возможности выбора параметров и критериев поиска. В частности, структурированный вид формулировок теорем позволяет искать информацию в определенной части теоремы: в условии или заключении. Данный способ поиска позволяет отталкиваться в исследованиях от имеющейся информации и находить наиболее подходящие исследованию варианты теорем.
✅ Заключение
Тем не менее, актуальность данной работы очевидна в связи с постепенным созданием всемирной цифровой математической библиотеки, где программа, написанная в процессе проведенного исследования, будет призвана помочь с организацией поиска по математическим статьям, а именно с определением структуры формулировок теорем на русском языке.
В процессе написания дипломного проекта было выполнено следующее:
• разработана классификация формулировок теорем;
• описаны варианты формулировок в условной форме на основании нескольких литературных математических источников;
• описан алгоритм нахождения антецедента для личных и притяжательных местоимений, встречающихся в теоремах;
• создан программный продукт, осуществляющий парсинг теорем (выделение условия и заключения либо аргумента и предиката);
• получены оценки числа правильно обрабатываемых формулировок теорем на множестве случайным образом выбранных теорем из различных разделов математики.
В результате дипломного проектирования были закреплены навыки, полученные за время обучения, а также получен исследовательский опыт.
Программа написана при помощи генераторов лексического и синтаксического анализаторов lex и yacc, описывающих программу на языке C.



