Тип работы:
Предмет:
Язык работы:


РЕАЛИЗАЦИЯ ПОИСКА ПО ФОРМУЛАМ В МАССИВАХ МАТЕМАТИЧЕСКИХ ДОКУМЕНТОВ

Работа №33054

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы76
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
280
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
ОСНОВНЫЕ ПОНЯТИЯ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1 Представления математической информации в электронном виде....8
1.2. Языки разметки 9
1.2.1. XML 9
1.2.2. MathML 10
1.2.3. DOCX 11
1.2.4. LaTeX 12
1.3. Инвертированный индекс 13
1.4. Обзор аналогов 14
1.5. База формул 19
1.6. Конвертации представлений 20
1.6.1. Выбор опорного формата 20
1.6.2. Особенности конвертации 21
2. ТЕХНОЛОГИЧЕСКАЯ ЧАСТЬ 23
2.1. Язык программирования 23
2.2. Среда разработки 23
2.4. Фреймворк создания 24
2.5. Другие технологии 24
3. РАЗРАБОТКА ПРИЛОЖЕНИЯ
26
3.1. Архитектура приложения
26
3.2. Схема базы данных 27
3.3 Описание и разработка механизма поиска 29
3.3.1. Подготовка словаря формул
29
3.3.2. Поиск документов
30
3.3.3 Индексация документов 31
3.4 Описание и разработка механизма эквивалентности 32
3.4.1. Эквивалентность наименований формул 32
3.4.2. Эквивалентность формул 34
3.5 Разработка пользовательского интерфейса 35
3.5.1 Панель администратора 35
3.5.2 Интерфейс поиска 36
3.6 Результат индексации 37
ЗАКЛЮЧЕНИЕ 38
ЛИТЕРАТУРА
39
ПРИЛОЖЕНИЕ

По причине того, что сегодня представление информации в электронном виде является основным, для математиков особую актуальность приобрела проблема представления математических знаний в электронной форме.
Множество образовательных организаций хранят огромные массивы математических документов, в которых необходимо искать информацию. Значительной частью поисковой информации являются математические формулы. Так, часто необходимо найти документы и конкретные места в этих документах, где встречается искомая формула. Для поиска вручную пользователю требуется затратить множество времени и сил.
Кроме того, не всегда удобно вводить саму формулу, и поэтому существует потребность в поиске формулы по названию. Таким образом существует проблема поиска по формулам, в том числе и по названию, в массивах математических документов. Кроме того, задачу осложняет наличие разных форматов, в которых могут хранится документы.
Целью дипломной работы является разработка приложения, которое поможет пользователям более качественно и эффективно искать формулы в массивах математических документов. Приложение позволит искать формулы по названию, а также будет различать эквивалентные формулы. В рамках выполнения дипломной работы, были поставлены следующие задачи:
1. Изучение форматов представления математических документов
2. Изучение способов конвертации
3. Рассмотрение существующих аналогов и определение недостатков существующих подходов.
4. Разработка механизма эквивалентности формул
5. Разработка механизма поиска
6. Проектирование архитектуры приложения.
7. Реализация графического интерфейса приложения.
8. Реализация механизма просмотра результатов поиска.
Приложение должно обладать возможностью удобного ввода формул. Для многих формул требуются специальные символы и стандартных средств клавиатуры, чаще всего, бывает недостаточно. Механизм поиска должен иметь возможность вестись на произвольном множестве документов, достаточно указать корневой путь, это также является отличительной особенностью от существующих аналогов. Поиск должен учитывать эквивалентные преобразования формул, и использование различных символов для обозначения переменных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения данной работы были проанализированы основные форматы представления математических документов, был выбран опорный формат представления формул, и налажена конвертация между ними. После чего, на основе общедоступных знаний Викиданные была подготовлена база формул, способная обновляться. Был разработан механизм поиска основанный на индексации и инвертированном индексе, на основании чего было написано приложение которое способно производить поиск по формулам в файловой системе или интернет ресурсе. Спроектирована и реализована гибкая архитектура приложения. Работоспособность приложения была проверена на ресурсе “Springer”, полученные результаты были проанализированы. Таким образом, все поставленные задачи были выполнены. Дальнейшее развитие работы можно видеть в улучшении взаимодействия с другими ресурсами, конвертации документов формата pdf, который является довольно распространенным по сей день, а также в поддержке мультиязычного поиска.


1) А.М. Елизаров, Е.К. Липачёв, М.А. Малахальцев. Основы MathML.
Е[редставление математических текстов в Internet. - Казань, 2008. [Электронный ресурс]. - Режим доступа:
http://www.niimm.ksu.ru/data/preprints/. свободный.
2) Байков В. Д. «Интернет. Поиск информации. Продвижение сайтов» — СПб.: БХВ-Петербург, 2016. — 288 с
3) Терминология: словарь SEO, HTML, CSS, интернет терминов.
[Электронный ресурс]. - Режим доступа:
http://termins.evgmoskalenko.com/. свободный.
4) Языки разметки. Введение в XML. // НОУ ИНТУИТ: лекция
[Электронный ресурс]. — 12 с - Режим доступа:
https://www.intuit.ru/studies/courses/1176/186/lecture/4863. свободный
5) An Introduction to N-grams: What Are They and Why Do We Need Them? // XRDS [Электронный ресурс]. - Режим доступа: https://blog.xrds.acm.org/2017/10/introduction-n-grams-need/, свободный.
6) ApproachO [Электронный ресурс]. - Режим доступа:
https://approachO.xyz/. свободный.
7) Extensible Markup Language (XML) 1.0 (Fifth Edition). W3C Recommendation 26 November 2008 // W3C [Электронный ресурс]. - Режим доступа: https://www.w3 .org/TR/xml/. свободный.
8) F.32. pgtrgm // Postgres [Электронный ресурс]. - Режим доступа: https://postgrespro.rU/docs/postgresql/9.6/pgtrgm, свободный.
9) Kohlhase M. MathML Presenting and Capturing Mathematics for the
Web.//W3 [Электронный ресурс]. — 33 с - Режим доступа:
http://www.w3.org/Math/Documents/mathml-tutorial.pdf, свободный.
10) Mathematical Markup Language (MathML) Version 3.0 2nd Edition W3C Recommendation 10 April 2017 // W3 [Электронный ресурс]. - Режим доступа: https://www.w3 .org/TR/MathML3/. свободный
11) MathML for Math and Science Communication. // Design Science [Электронный ресурс]. - Режим доступа:
www.dessci.com/en/reference/webmath/tech/mathml.html, свободный.
12) Putting mathematics on the Web with MathML. // W3 [Электронный ресурс]. - Режим доступа: http://www.w3 .org/Math/XSF. свободный
13) RDF Stores — DB-engines [Электронный ресурс]. - Режим доступа: https://db-engines.com/en/article/RDF+Stores. свободный.
14) Search on Math [Электронный ресурс] - Режим доступа: https://approachO.xyz/. свободный.
15) Strategies for Math on the Web. // Design Science [Электронный
ресурс]. - Режим доступа:
www.dessci.com/en/reference/webmath/strategies.html. свободный.
16) The European Digital Mathematics Fibrary [Электронный ресурс]. - Режим доступа: https://eudml.org. свободный.
17) Wikidata [Электронный ресурс]. - Режим доступа: https://www.wikidata.Org/wiki/Wikidata:Introduction. свободный.
18) Zentralblatt MATH [Электронный ресурс]. - Режим доступа: https://zbmath.org. свободный.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ