Тип работы:
Предмет:
Язык работы:


СИСТЕМА ЛИНГВИСТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ПОДОБИЯ ОПИСАНИЯ ПУБЛИКАЦИЙ

Работа №147982

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы85
Год сдачи2022
Стоимость4800 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
49
Не подходит работа?

Узнай цену на написание


ПЕРЕЧЕНЬ СОКРАЩЕНИЙ И ОБОЗНАЧЕНИЙ 5
ВВЕДЕНИЕ 6
1 Анализ предметной области 8
1.1 Обзор существующих научных электронных библиотек 8
1.1.1 eLIBRARY.RU 8
1.1.2 Scopus 10
1.1.3 Web of Science 11
1.2 Обзор основных видов рекомендательных систем 13
1.2.1 Контентная фильтрация 15
1.2.2 Коллаборативная фильтрация 18
1.2.3 Фильтрация, основанная на знаниях 20
1.2.4 Опыт построения алгоритмов прогнозирования 21
1.3 Обзор алгоритмов лингвистического определения подобия текстовых
данных 22
1.4 Выводы по разделу 25
2 Разработка системы лингвистического определения подобия описания
публикаций 26
2.1 Исходные данные для построения подсистемы определения
лингвистического подобия. Описание реляционной модели 26
2.2 Выходные данные для построения подсистемы определения
лингвистического подобия 31
2.3 Описание алгоритма определения подобия 31
2.4 Выводы по разделу 35
3 Результаты работы системы лингвистического определения подобия
описания публикаций 36
3.1 Описание API получения исходных данных 36
3.2 Описание API подсистемы лингвистического определения подобия для
осуществления межсистемного взаимодействия 47
3.3 Тестирование системы лингвистического определения подобия
описания публикаций 49
3.4 Выводы по разделу 61
ЗАКЛЮЧЕНИЕ 62
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 63
ПРИЛОЖЕНИЕ A Листинги программы 65
ПРИЛОЖЕНИЕ B Презентация 73

Начальным этапом научно-фундаментальных или прикладных исследований является выявление существующих решений исследуемого вопроса. При этом важным источником информации являются научные труды, материалы которых можно найти в специализированных базах знаний. Поиск необходимых публикаций в данных системах, как правило, осуществляется на основании только одного или нескольких критериев, предоставляемых пользователем, вследствие чего возникает проблема медленного и мало эффективного подбора релевантных источников. Решением данного вопроса является создание системы лингвистического определения подобия описания публикаций, которая позволит исследователям получить интересующую их информацию, не осуществляя фактического поиска конкретного научного труда, и, благодаря этому, повысить востребованность целевой базы знаний.
Подбор релевантной информации планируется достигнуть путем реализации рекомендательного модуля, позволяющего осуществлять многокритериальный поиск публикаций, основанный не только на параметрах, передаваемых пользователем, но и на ранее собранных данных о его взаимодействии с системой.
При создании подобного продукта необходимо учитывать возможность отсутствия информации о пользователе, а также дату публикации научного труда с целью применения наиболее актуальной научно-исследовательской базы.
Объект исследования: описания публикации в базе знаний.
Предмет исследования: система лингвистического определения подобия описания публикаций.
Цель исследования: разработка рекомендательного модуля, содержащего в себе функции вычисления уровня подобия слов, с целью предоставления пользователю релевантной подборки по интересующей его теме.
Задачи исследования:
• анализ критериев оценки подобия публикаций,
• выявление методов, используемых для формирования релевантного списка подобных публикаций,
• выявление единой шкалы подобия, учитывающей все критерии оценки схожести публикаций,
• разработка системы лингвистического определения подобия описания публикаций.
Актуальность (новизна) исследования: создание системы
лингвистического определения подобия описания публикаций, позволяющей классифицировать объекты интереса на основе предпочтений пользователя, а также учитывать дату публикации научного труда для добавления в подборку наиболее актуальной информации.
Практическая и научная значимость: модификация существующих алгоритмов подбора рекомендаций посредством применения
корректирующих коэффициентов и методов определения уровня подобия.
Границы исследования: основной акцент ставится на изучении подходов формирования релевантных подборок, а также создании алгоритма лингвистического определения подобия описания публикаций. В границы исследования не входят такие вопросы, как способы хранения и обмена данных вне рекомендательного модуля.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения выпускной квалификационной работы было проведено исследование современных подходов к реализации систем лингвистического определения подобия публикаций, в результате которого были выявлены особенности каждого из механизмов, а также проанализирована проблема холодного старта. В результате чего был разработан алгоритм, позволяющий осуществить подбор релевантных научных трудов на основании их описания, с учетом дополнительной лингвистической проверки и даты публикации.
Исследование подходов к формированию рекомендаций, а также основные выводы по ним были сформированы в рамках хоздоговорной научно-исследовательской работы «Исследование способов построения рекомендательной системы туристических маршрутов».


1. Jannach D. et al. Recommender Systems: An Introduction. - Cambridge University Press, 2010, p. 360.
2. Николенко С. Рекомендательные системы //СПб: Изд-во Центр Речевых Технологий. - 2012, с. 53.
3. Chen Y., Zhao X., de Rijke M. Top-N recommendation with high­dimensional side information via locality preserving projection //Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. - 2017. - С. 985-988.
4. Adomavicius G., Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions //IEEE transactions on knowledge and data engineering. - 2005. - Т. 17. - №. 6. - С. 734-749.
5. Королева Д. Е., Филиппов М. В. Анализ алгоритмов обучения коллаборативных рекомендательных систем //Инженерный журнал: наука и инновации. - 2013. - №. 6 (18). - С. 23.
6. Bobadilla J. et al. Recommender systems survey //Knowledge-based systems. - 2013. - Т. 46. - С. 109-132.
7. Fedorov A. V. Introduction into General Theory of Translation (linguistic problems) //St Petersburg, Moscow: Filologia Tri. - 2002.
8. Левенштейн В. И. Двоичные коды с исправлением выпадений и вставок символа 1 //Проблемы передачи информации. - 1965. - Т. 1. - №. 1. - С. 12-25.
9. Ricci F., Rokach L., Shapira B. Introduction to recommender systems handbook //Recommender systems handbook. - Springer, Boston, MA, 2011. - С. 1-35.
10. Моргунов Е. П., Рогова Е. В., Лузанова П. В. PostgreSQL. Основы языка SQL //учеб. пособие/ЕП Моргунов. - 2018.
11. Горнаков С. Осваиваем популярные системы управления сайтом (CMS). - Litres, 2022, c. 336.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ