Тип работы:
Предмет:
Язык работы:


ПОИСК НАУЧНЫХ СТАТЕЙ ПО НАЗВАНИЯМ ФОРМУЛ И ВКЛЮЧЕННЫМ В НИХ ПЕРЕМЕННЫХ

Работа №44007

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы53
Год сдачи2018
Стоимость5600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
306
Не подходит работа?

Узнай цену на написание


1. Введение 4
1.2 Цели и задачи 11
2. Основная часть 11
2.1 Преобразование LaTeX в XML 12
2.2 Терминологическая разметка XML-текстов 14
2.2 Resource Description Framework 16
2.4 Алгоритм связывания математических выражений 18
2.5 Очистка файлов от синтаксического мусора 18
2.6 Разработка методов, улучшающих репрезентативность
полученного набора именных групп 19
2.6.1 Разделение на F1 и F2 19
2.6.2 Комбинации именных групп 21
2.6.3 Выделение частотных моделей контекстов с
фиксированной семантикой 23
2.7 Проверка эффективности методов на наборе
подготовленных файлов 24
2.7.1 Проверка эффективности разделения на классы F1 и F2 .. 24
2.7.2 Проверка комбинаций именных групп 25
2.7.3 Проверка эффективности метода очистки именных групп27
2.8 Реализация эффективных методов на языке C# 27
2.9 Реализация веб-приложения на ASP.Net 29
2.9.1 Страница поиска
2.9.2 Страница файлов 32
2.9.3 Страница результатов 33
2.9.4 Страница «О проекте» 34
3. Заключение 35
Литература 36
Приложение

Linked Data – это концепция представления структурированных данных
в таком виде, чтобы они подходили для связывания и были удобны для
доступа через семантические запросы. Linked Data работает по стандартам
Web-технологий: URI, RDF, XML, и представляет данные в виде, удобном
для понимания компьютером.
URI - унифицированный (единообразный) идентификатор ресурса. Под
данным определением понимается символьная строка, с помощью которой
пользователи и компьютеры могут однозначно идентифицировать какойлибо конкретный ресурс для дальнейшей работы. URI можно присвоить
абсолютно любому объекту - документу, изображению, файлу, службе,
ящику электронной почты и т. д.
RDF (Resource Description Framework) - это принятый W3C формат
данных, используемый для представления отдельных сущностей,
представляющих собой самостоятельную единицу знаний. Сущности связаны
друг с другом с помощью предикатов по шаблону «субъект – предикат -
объект». Данные для открытых хранилищ в основном извлекаются из
реляционных баз данных или в частичном виде из веб-страниц и текстовых
документов. Ссылки между сущностями образуют глобальный граф данных,
используемый поисковыми роботами и браузерами для перемещения по
источникам данных.
XML (eXtensible Markup Language) – расширяемый язык разметки.
Данный стандарт используется для создания документов программами, и в то
же время удобный для чтения и создания человеком. Основной сферой
применения является интернет. Расширяемым язык называется, потому что
разработчик документа на XML не ограничен количеством тегов, которые
может использовать в своем документе, и волен создавать требуемое
количество новых тегов для своих нужд, при условии соблюдения
синтаксических правил языка.
Помимо описанных выше средств, Linked Data использует
специальную Linked Data Platform, которая позволяет RESTful HTTP
сервисам получать доступ, создавать, и удалять RDF-ресурсы.
Проект Linked Open Data является одной из самых крупных реализаций
принципов Linked Data. По состоянию на 2011 год в данном облаке
находился 31 миллиард RDF-триплетов, с 504 миллиардами RDF-связями.
Схематическое изображение основных наборов данных в LOD можно
увидеть на Рисунке.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе этой работы был произведен поиск следующих методов для
улучшения алгоритма связывания математических формул в математических
статьях с их определениями, основанного на выделении именных групп и
связывания близлежащих именных групп:
1. Разделение именных групп по принципу значимости на классы
F1 (значимые формулы) и F2 (не значимые формулы)
2. Выделение конструкций NP1(O1) + NP2(O2), где O1 и O2 – классы
онтологии OntoMathPro, для дальнейшего подтверждения связи
O1 и O2 в онтологии
3. Коррекция частотных конструкций, в именных группах которых
главными элементами становятся ошибочно включенные в
именную группу слова.
Анализ результатов доказал, что разработанные методы эффективны и
приводят в порядок достаточно разнообразные и не всегда необходимые
именные группы. Кроме того, в качестве побочного задания выполнена
работа по улучшению онтологии OntoMathPro с помощью выделения
частотных сочетаний математических понятий. Встраивание полученных
методов в веб-приложение при условии публикации на общедоступном
сервере позволит загрузить xml-файлы в базу данных системы для
дальнейшей публикации в облаке LOD.
Дальнейшее развитие данного проекта заключается в поисках связей
между формулой класса F1 и переменными, входящими в эту формулу, для
улучшения структуры документа в представлении RDF-графа.


Ле Хоай, Тузовский Анатолий Федорович «Семантическое
аннотирование документов в электронных библиотеках» // Известия ТПУ.
2013. №5. URL: https://cyberleninka.ru/article/n/semanticheskoe-annotirovaniedokumentov-v-elektronnyh-bibliotekah (дата обращения: 12.06.2018).
2. Шубкина, О. В. "Модели семантического аннотирования текстовых
документов с использованием искусственных нейронных сетей специального
вида." Системи обробки інформації 2 (2011): 221-225.
3. Nevzorova O. et al. (2013) Bringing Math to LOD: A Semantic Publishing
Platform Prototype for Scientific Collections in Mathematics. In: Alani H. et al.
(eds) The Semantic Web – ISWC 2013. ISWC 2013. Lecture Notes in Computer
Science, vol 8218. Springer, Berlin, Heidelberg.
4. М. Захаров, «Разработка приложения для поиска математических
формул в текстах научных статей», Казанский (Поволжский) федеральный
университет, 2017
5. O. Nevzorova, N. Zhiltsov, D. Zaikin, O. Zhibrik, A. Kirillovich, V.
Nevzorov, and E. Birialtsev, “Bringing Math to LOD: a semantic publishing
platform prototype for scientific collections in mathematics,” In: Alani H. et al
(eds) 12th Int. Semantic Web Con-ference, Sydney, NSW, Australia, October 21–
25, 2013, Proceedings, Part I. Lecture Notes in Computer Science, vol. 8218, pp.
379–394. Springer Berlin Heidelberg, 2013.
6. A.M. Elizarov, A.B. Kirillovich, E.K. Lipachev, A.B. Zhizhchenko, and
N.G. Zhiltsov, “Mathematical Knowledge Ontologies and Recommender Systems
for Collections of Documents in Physics and Mathematics,” Doklady Mathematics,
vol. 93, no. 2, pp. 231–233, 2016, doi:10.1134/S1064562416020174.
7. A. Elizarov, A. Kirillovich, E. Lipachev, and O. Nevzorova. “Digital
Ecosystem OntoMath: Mathematical Knowledge Analytics and Management,”37
Communications in Computer and Information Science, Springer, vol. 706, pp 33-
46, 2017, doi:10.1007/978-3- 319-57135-5_3.
8. A.M. Elizarov, E.K. Lipachev, M.A. Malakhaltsev, “Web Technologies for
Mathematicians: The Basics of MathML. A Practical Guide,”Fizmatlit, Moscow,
2010.
9. M. Kohlhase, B.A. Matican, CC. Prodescu. “MathWebSearch 0.5: Scaling
an Open Formula Search Engine,” In: Jeuring J. et al. (eds) Intelligent Computer
Mathematics. CICM 2012. Lecture Notes in Computer Science, vol 7362.
Springer, Berlin, Heidelberg, pp. 342-357, 2012, doi:10.1007/978-3- 642-31374-
5_23.
10. A. Kohlhase, M. Kohlhase and C. Lange “sTeX – a system for flexible
formalization of linked data,” Proceedings of the 6th International Conference on
Semantic Systems, ACM, pp. 57-60, 2010, doi:10.1145/2034691.2034703.
11. M. Kohlhase. “OMDoc-An Open Markup Format for Mathematical
Documents [version 1.2],” Lecture Notes in Computer Science, vol. 4180,
Springer, 428 p, 2006, doi:10.1007/11826095.
12. V. Solovyev, N. Zhiltsov, “Logical structure analysis of scientific
publications in mathematics,” In: Akerkar, R. (ed.) Proceedings of the International
Conference on Web Intelligence, Mining and Semantics (WIMS 2011), ACM DL,
vol. 21, pp. 1–9, 2011, doi:10.1145/1988688.1988713. 

13. T.W. Cole, I. Daubechies, K.M. Carley, J.L. Klavans, Y. LeCun, M. Lesk,
C.A. Lynch, P. Olver, J. Pitman, and Z.J. Xia. “Developing a21st century global
library for mathematics research. Washington, D.C.,” The National Academies
Press, Washington, D.C, 2014.
14. P.J. Olver, “The World Digital Mathematics Library: report of a panel
discussion,” Proceedings of the International Congress of Mathematicians, August
13–21, 2014, Seoul, Korea. Kyung Moon SA, vol. 1, pp. 773–785, 2014.38
15. R. Miller, and A. Youssef. “Augmenting Presentation MathML for Search.,”
In: Autexier S. et al. (Eds.): AISC/Calculemus/MKM 2008, LNAI 5144, pp. 536–
542, 2008.
16. R. Zanibbi, A. Orakwue. “Math Search for the Masses: Multimodal Search
Interfaces and Appearance-Based Retrieval,” In: Kerber M., Carette J., Kaliszyk
C., Rabe F., Sorge V. (eds) Intelligent Computer Mathematics. CICM 2015.
Lecture Notes in Computer Science, vol 9150. Springer, Cham, pp. 18–36, 2015,
doi:10.1007/978-3- 319-20615- 8_2.
17. G. Topić, G.Y. Kristianto, M.-Q. Nghiem, A. Aizawa. “The MCAT Math
Retrieval System for NTCIR-10 Math Track,” In: Proceedings of the 10th NTCIR
Conference, pp. 680-685, 2013.
18. G.Y. Kristianto, G. Topić, F. Ho, A. Aizawa. “The MCAT Math Retrieval
System for NTCIR-11 Math Track,” In: Proceedings of the 11th NTCIR
Conference, pp. 120-126, 2014

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ