Тип работы:
Предмет:
Язык работы:


Разработка моделей и методов семантического аннотирования математических статей

Работа №77501

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы80
Год сдачи2016
Стоимость4855 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
240
Не подходит работа?

Узнай цену на написание


Аннотация 4
Глава 1. Введение 5
1.1. Актуальность 5
1.2. Цель исследования 9
1.3. Объект и предмет исследования 10
1.4. Теоретическая значимость и научная новизна 11
1.5. Постановка задачи 12
Глава 2. Обзор существующих решений 14
2.1. Структура и семантические связи математического текста 14
2.2. Фреймовая OWL-модель 17
2.3. Классификация главных результатов математических статей 20
2.4. Модели представления главных результатов 22
2.5. Тестирование NLP-инструментов 26
2.6. Методы поиска главных результатов в тесте статьи 27
Глава 3. Исследование и построение решения задачи 35
3.1. Сбор тестовой коллекции 35
3.2. Построение онтологической модели 36
3.3. Формальная модель представления главных результатов 38
3.4. NLP разметка 42
3.5. Разработка метода поиска главного результата 45
3.6. Связывание главных результатов с элементами статьи 48
3.7. Построение семантической аннотации статьи 52
3.8. Разработка синтаксического парсера для выделения текстовых зон
документа 54
Глава 4. Функционал разработанной программы 56
Глава 5. Эксперименты и результаты 62
Заключение 67
Список литературы 69
Приложение 71
Приложение 1. Блок схема 71
Приложение 2. Классы онтологии 73
Приложение 3. Синтаксический парсер 74

Отсутствует часть приложений

Активное развитие на современном этапе различных направлений языковедческой науки, в частности, прагматического направления, выразилось в усилении функционального подхода к языковым явлениям, в укрупнении единицы семантического анализа, а также привело к формированию целого ряда новых исследований, связанных с анализом речи и текстов на естественном языке, в частности, математических.
В настоящие время электронные ресурсы, а в особенности научные публикации, создаются для их использования людьми. Форматы описания научных публикаций не включают в себя описания формальных знаний, которые содержат данные документы. Формальное описание основного смысла электронного документа является основной задачей таких семантических технологий, как RDF, RDFS, OWL.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В данной работе исследованы известные методы для построения семантической аннотации математических статей. Также была построена система, позволяющая локализировать главной результат в теле статьи, которая использует для своей работы построенную онтологию, NLP инструменты, терминологическую разметку и меры сравнения текстовых строк.
В главе 1 описана актуальность поставленной задачи, ее новизна и теоретическая значимость.
В главе 2 приведен обзор существующих решений в области семантического аннотирования. Также в этой главе исследованы методы построения онтологий, выделения главных результатов и методы их классификаций.
В главе 3 проведена необходимая подготовительная работа для реализации системы аннотирования. Был произведен сбор тестовой коллекции статей, построена собственная онтологическая модель для определения статей к определенным классам, была разработана и описана формальная модель для представления главных результатов, описана применяющаяся NLP-разметка, описан разработанный метод связывания главного результата с элементом статьи, произведена разработка семантического парсера для перевода статьи в текстовый формат.
В главе 4 описан функционал разработанной системы (программы), примеры ее использования.
В главе 5 разработанная система была протестирована. Были поставлены эксперименты для определения эффективности построенного решения.
В данной работе был предложен новый метод построения семантической аннотации статьи, а именно - выделение локализации главного результата математических статей. Был представлен метод, основанный на
нанесении терминологической разметки и использовании двух мер сравнения текстовых строк: мер Левенштейна и Жаккара. Ряд экспериментов показал, что с помощью предложенного метода можно достичь приемлемой точности при работе со статьями, содержащими аннотации, которые написаны по определенным правилам.
Развитием полученных результатов могут стать исследования в следующих направлениях:
1) направление семантического связывания математических публикаций из различных источников;
2) развитие таких систем как «Анти плагиат» - для определения не только заимствования частей текста, но и основной идеи работы.



1. Валена Ф., Димауро Д. Современная практика программирования на VisualBasic и Visual С#. -М.: Русская редакция, 2006, 604 с.
2. Берсягин А.А., Куприянов М. С., Степаненко В. В. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP, 2-ое издание. СПб: БХВ-Петербург, 2007. 384 с.
3. Берсягян А.А., Куприянов М.С., Холод И.И. Анализ данных и процессов, 3-е издание. СПб.: БХВ-Петербург, 2009. 512 с.
4. Биряльцев Е. В., Галимов М.Р., Жильцов Н. Г. Подход к семантическому поиску математических выражений в научных текстах И Открытые семантические технологии проектирования интеллектуальных систем: материалы II Международной научно- технической конференции. Минск: БГУИР, 2012. С. 245-256
5. Биряльцев Е.В., Гусенков А.М., Жибрик О.Н. Некоторые подходы к разметке естественнонаучных текстов, содержащих математические выражения И Учен. зап. Казан, ун-та. Сер. Физ.-матем. Науки, 2014. С. 133-148.
6. Биряльцев Е.В., Елизаров А.М., Жильцов Н.Г. Модель семантического поиска в коллекциях математических документов на основе онтологий //Труды 12-й Всерос. научн. конф. Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Казань: Изд-во Казан, ун-та, 2010. С. 296-300.
7. Ватсон Б. C# 4.0 на примерах - СПб.: БХВ-Петербург, 2011. 608 с.
8. Велихов П.Е. Меры семантической близости статей Википедии и их применение к обработке текстов. //Информационные технологии и вычислительные системы. №1.2009. С. 23-37.
9. Избачков Ю.С., Петров В.Н., Васильев А.А. Информационные системы: учебник для вузов. СПб.: Питер, 2011. 539 с.
Ю.Лабор В.В. С#: Создание приложений для Windows. Мн.: Харвест, 2003. 384 с.
11 .Ле Хоай, Тузовский А. Ф. Семантическое аннотирование документов в электронных библиотеках. Т.: Известия Томского политехнического университета Т. 322, № 5, 2013. С. 157-164.
12. Невзорова О.А., Биряльцев Е.В., Жильцов Н.Г. Коллекции математических текстов: аннотирование и применение в поисковых
задачах. Журнал “Искусственный интеллект и принятие решений”. Номер 3.2012. С. 51-62
13. Невзорова О. А., Жильцов Н. Г., Заикин Д. А. Прототип программной платформы для публикации семантических данных из математических научных коллекций в облаке LOD. Казань: Изд-во Казанского ун-та, 2012. С. 216-232
14. Ничушкина Т. Н., Пугачев Е. К. Объектно-ориентированное программирование. М.: МГТУ им. Н. Э. Баумана, 2016.
15. Новиков Д.А., Орлов А.И. Математические методы классификации // Заводская лаборатория. Диагностика материалов. 2012. С.З.
16.Орлов А.И. О развитии математических методов теории классификации И Заводская лаборатория. Диагностика материалов. 2009. С. 51-63.
17. Пирогов В.Ю. MS SQL Server 2000: управление и программирование. СПб.: БХВ-Петербург, 2005. 608 с.
18. Сазонова Н.В.. Средства реализации категории связности в математическом тексте : диссертация. Ур. гос. ун-т им. А.М. Горького: Екатеринбург, 2008. 205 с.
19. Фаронов В. Искусство создания компонентов Delphi. СПб: Питер, 2015.
20. Фролов А.В., Фролов Г.В. Визуальное проектирование приложений С#. М.:КУДИЦ-ОБРАЗ, 2003. 512 с.
2LGabrilovich Е., Markovitch S. Computing Semantic Relatedness Using Wikipedia-based Explicit Semantic Analysis. 2007. C. 1606-1611.
22.Pascal Hitzler. OWL 2 Web Ontology Language Primer (Second Edition). URL: https://www.w3.org/TR/owl2-primer(дата обращения: 10.09.2016)
23.Schapire R. E. The boosting approach to machine learning: An overview //Nonlinear estimation and classification. Springer New York, 2003. C. 149- 171.
24.Solovyev V., Zhiltsov N. Logical Structure Analysis of Scientific Publications in Mathematics //Proceedings of the International Conference on Web Intelligence, Mining and Semantics Article No. 21, 2011.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ