Тип работы:
Предмет:
Язык работы:


МЕТОД АННОТИРОВАНИЯ НАУЧНЫХ СОКРАЩЕНИЙ НА ОСНОВЕ СЕМАНТИЧЕСКОГО АНАЛИЗА ДОКУМЕНТОВ

Работа №86183

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы43
Год сдачи2017
Стоимость4770 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
37
Не подходит работа?

Узнай цену на написание


Введение 4
2 Постановка задачи 5
3 Предварительные определения и сведения 6
3.1 Семантика и семантический веб 6
3.2 Тезаурус и онтология 6
3.2.1 Тезаурус 6
3.2.2 Онтология 7
3.3 Метаданные 8
3.3.1 Определение 8
3.3.2 Примеры использования метаданных 9
3.3.3 Функции метаданных 10
3.3.4 Средства представления метаданных 10
3.4 Рекомендательные системы 11
3.5 Меры близости 13
4 Средства реализации 15
4.1 XML 15
4.2 C# 17
4.3 PHP 18
5 Обзор работ по данной тематике 21
6 Реализация 23
6.1 Создание тезауруса аббревиатур 23
6.2 Заполнение словаря данными 25
6.3 Написание веб-сервиса 26
7 Заключение 29
Список литературы 30
Приложение


В настоящее время объемы обрабатываемой и получаемой при поиске чего-либо информации достигли невероятных объемов, намного
превышающих возможности человеческого восприятия. При этом, процент по настоящему нужных пользователю знаний очень низок. Использующиеся ныне поисковые алгоритмы работают по примитивной схеме:
они сравнивают строки запроса со строками веб-страниц и документов
в Интернете, но при этом никак не учитывается смысл информации, а
ведь ради нее и был организован поиск. Все это приводит к тому, что
найти что-нибудь необходимое подчас очень трудно, а порой практически
невозможно.
Развитие коммуникационных сетей (в особенности — сети Интернет) позволяет создать совершенно новые технологии по поиску и обработке информации. Одним из наиболее перспективных направлений развития информационного обеспечения являются информационные системы (ИС). Однако, классические ИС обладают различными недостатками,
например, неактуальность имеющейся информации и низкая интероперабельность. Преодолеть эти проблемы можно созданием интеллектуальных информационных систем (ИИС) и рекомендательных систем (РС),
которые помогут улучшить поисковые алгоритмы и поднять информационную обеспеченность пользователей на новый уровень. [1], [2]
В данной работе пойдет речь о создании веб-сервиса по подбору
«канонических» аббревиатур полных наименований различных научных
изданий, выпускаемых зарубежными и отечественными издательствами.
Во второй главе дана постановка задачи и главные цели работы. В третьей главе изложено об основных определений и терминов, напрямую
связанных с тематикой работы. В четвертой главе рассказано о средствах реализации поставленной в работе задачи. В пятой главе дан обзор различных поисковых Интернет-ресурсов. В шестой главе описан
непосредственно процесс реализации. В седьмой главе сделан вывод о
проделанной работе и перспективах развития.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения работы были осуществлены следующие задачи:
• Изучены имеющиеся списки научных изданий и поисковые сервисы;
• Сформирована собственная коллекция на их основе;
• Создан прототип тезауруса на языке XML, для него написаны
DTD-правила и XML-схема;
• Обеспечено заполнение словаря данными полуавтоматическим методом с помощью программы на C#;
• Создано визуальное представление для тезауруса средствами языка
PHP;
• Написан веб-сервис по подбору рекомендуемых сокращений.
В качестве результата создан тезаурус на языке XML, содержащий
в себе метаданные о 2769 научных изданиях на такие тематики как математика, механика и физика. В перспективе можно расширить словарь
путем добавления в него новых тегов и внесения большего количества
журналов по другим научным областям.
Еще одним результатом является веб-сервис, написанный на языке
PHP, который позволяет по введенному пользователем сокращению журнала вывести в качестве ответа метаданные об этом журнале, в том числе рекомендуемую аббревиатуру и полное наименование. В дальнейшем
можно добавить в него кроме алгоритма, основанного на использовании
меры Левенштейна, и другие способы поиска данных.


[1] Шокин Ю.И., Проблемы поиска информации / В.Б. Барахнин, А.М. Федотов, Ю.И. Шокин // Новосибирск: Наука, 2010. — 220 с.
[2] Елизаров А.М., Веб-технологии для математика: основы MathML. Практическое руководство. / А.М. Елизаров, Е.К. Липачев, М.А. Малахальцев // М.: ФИЗМАТЛИТ, 2010. — 192 с.
[3] Yu L., A Developer’s Guide to the Semantic Web / L. Yu // Springer-Verlag, 2014. — 841 p.
[4] Лукашевич Н.В., Тезаурусы в задачах информационного поиска / Н.В. Лукашевич // М.: Издательство Московского университета, 2011. — 512 с.
[5] Митрофанова О.А., Онтологии как системы хранения знаний / Н.С. Константинова, О.А. Митрофанова // Всероссийский кон-курсный отбор обзорно-аналитических статей по приоритетному направлению «Информационно-телекоммуникационные системы», 2008. — 54 с.
[6] Когаловский М.Р., Метаданные в компьютерных системах / М.Р. Когаловский // Программирование, МАИК «Наука/ Интерпериодика», 2013. — Т. 39, № 4. — с. 28-46.
[7] Trust J.P.G., Introduction to Metadata 3.0 / J.P.G. Trust // Getty Research Institute, Los Angeles Getty Publications, 2008. — 176 p.
[8] Ricci F., Recommender Systems Handbook / B. Shapira, F. Ricci, L. Rokach // Springer, 2015. — 845 p.
[9] Гасфилд Д., Строки, деревья и последовательности в алгорит¬мах: Информатика и вычислительная биология / Д. Гасфилд // Пер. с англ. И.В. Романовского. — СПб.: Невский Диалект; БХВ- Петербург, 2003. — 654 с.
[10] Левенштейн В.И., Двоичные коды с исправлением выпадений и вставок символа 1 / В.И. Левенштейн // Проблемы передачи ин-формации, 1965. — Том 1, выпуск 1, с. 12-25.
[11] Албахари Дж., С# 6.0. Справочник. Полное описание языка, 6-е изд. / Б. Албахари, Дж. Албахари // Пер. с англ. — М.: ООО «И.Д. Вильямс», 2016. — 1040 с.
[12] Виссер Дж., Разработка обслуживаемых программ на языке C# / Дж. Виссер, Г. Винхолдс, П. ван Экк, Р. ван дер Лик, С. Ригаль // пер. с англ. Р.Н. Рагимова. — М.: ДМК Пресс, 2017. — 192 с.:
[13] Никсон Р., Создаем динамические веб-сайты с помощью PHP, MySQL, JavaScript, CSS и HTML5. 4-е изд. / Р. Никсон // СПб.: Питер, 2016. — 768 с.
[14] Флойд К.С., Введение в программирование на PHP5 / К.С. Флойд // М.: Интуит, 2016. — 280 c.
[15] Aley R., PHP Beyond the Web / R. Aley // Apress, United Kingdom,
2016. — 214 p.
[16] Mitchell L.J., PHP Web Services, 2nd Edition / L.J. Mitchell // O’Reilly Media, 2016. — 180 p.
[17] Abbreviations of Names of Serials [Электронный ресурс]
// American Math Society, 2017. — Режим доступа:
http://www.ams.org/msnhtml/serials.pdf, свободный.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ