Тип работы:
Предмет:
Язык работы:


РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА АВТОМАТИЧЕСКОГО ПОДБОРА КЛАССИФИКАТОРА НАУЧНЫХ ДОКУМЕНТОВ

Работа №50457

Тип работы

Магистерская диссертация

Предмет

математика

Объем работы69
Год сдачи2018
Стоимость5700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
256
Не подходит работа?

Узнай цену на написание


Введение 4
Постановка задачи 7
Классификаторы 8
Классификатор Scopus 8
OECD Fields of Science 9
Классификатор Web of Science (WoS) 9
Государственный рубрикатор научно-технической информации 10
ACM Computing Classification System 11
PubMed Identifier 12
Номенклатура специальностей научных работников 12
Классификатор Российского фонда фундаментальных исследований 12
Универсальная десятичная классификация 13
Библиотечно-библиографическая классификация 14
Международная патентная классификация 14
International Standard Serial Number 15
International Standard Book Number 16
Математическая предметная классификации 17
Рекомендательная система 19
Контент-ориентированные рекомендательные системы 20
Коллабораторные рекомендательные системы 21
Методы обработки информации 23
Очистка запроса от малоинформативных слов 23
Изменение регистра и расширение 24
Частеречная разметка 24
Стемминг 24
Формирование словаря рекомендательной системы 27
Формирование списка рекомендаций 30
Модель векторного пространства (VSM) 30
Анализ частоты слов 31
Сопоставление ключевых слов 32
Реализация 34
Архитектура рекомендательной системы 34
Рекомендательная система автоматического подбора классификатора УДК 35
Тест системы 36
Заключение 37
Список литературы 38
ПРИЛОЖЕНИЕ 44


С развитием информационных технологии электронные библиотеки, которые хранят основную часть научных изданий, получили широкое распространение. Большинство публикаций переводят в электронный формат, что приводит к увеличению объема информации и затруднению ручного поиска. В связи с этим возникает задача классификации информации, заключающейся в определении категории на основании содержания документа. Данная задача актуальна потому, что:
1) Наличие классификатора - одно из требований научных журналов
2) В электронных документах классификатор является одним из видов метаданных (см., например, [1-2])
Наиболее популярными классификаторами являются:
1) Библиотечно-библиографическая классификация (ББК), которая используется для библиотечных данных
2) MathematicSubjectClassification (MSC2010), которая предназначена для математических документов
3) Государственный рубрикатор научно-технической информации
(ГРНТИ) (прежнее наименование - Рубрикатор ГАСНТИ) - универсальная иерархическая классификация областей знания,
принятая для систематизации всего потока научно-технической
информации.
4) Универсальная десятичная классификация (УДК) - одна из широко распространенных классификаторов
Таблицы классификаторов содержат более сотни индексов, ручной подбор которых представляет собой непростую задачу. Одним из решений сложившейся ситуации является использование рекомендательных систем.
На сегодняшний день рекомендательные системы являются популярными механизмами, которые применяются в различных структурах. Их использование наиболее очевидна в онлайн магазинах, таких как Amazon, CDNOW, BarnesAndNoble, IMDta другие (см. [3]).Согласно [4], многие системы, которые работают с научным контентом, такие как поисковая система GoogleScholar, реферативная база данных Scopus, электронная библиотека eLIBRARY.ru, используют рекомендательные системы.
Традиционно выделяют два вида рекомендательных систем: контент- ориентированный и коллабораторный. В некоторых источниках встречаются и другие типы рекомендательных систем, такие как гибридные, которые сочетают в себе характеристики традиционных типов.
Результаты работы частично описаны встатьях[5-8].На основании данных статей были представлены доклады на XV Всероссийской молодежной школе-конференции «Лобачевские чтения-2016», XVI Всероссийской молодежной школе-конференции «Лобачевские чтения-2017» и Международной научно-практической конференции «Электронная Казань 2016».
Данная работа состоит из одиннадцати глав. Первая - введение. Далее постановка задачи. В третьей главе рассмотрены известные виды классификаторов научной информации. В четвертой главе дается определение понятия рекомендательная система, разобраны типы рекомендательных систем. В пятой рассматриваются методы обработки информации, вводится понятие стемминг. В шестой главе описывается процесс формирования словаря рекомендательной системы. В седьмой - составление списка рекомендаций по запросу пользователя. Далее описывается программная реализация рекомендательной системы. В девятой главе приводятся результаты теста системы. Десятая глава - заключение, далее список литературы. В приложении дается непосредственно сам код.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


К основным результатам проведенной работы можно отнести:
1) Рассмотрены наиболее популярные классификаторы научного- контента
2) Дан обзор рекомендательных систем
3) Изучены методы обработки информации
4) Обработана коллекция статей MathNet.Ru
5) Реализовано два варианта представления терминов: словарь терминов и инвертированный индекс
6) Рассмотрены основные методы поиска информации и меры для оценки важности слов
7) Создана рекомендательная система автоматического подбора индекса УДК
8) Проведены тесты рекомендательной системы



1) LangeC.Bringing Mathematics to the Web of Data: The Case of the Mathematics Subject Classification/ In: Simperl E., Cimiano P., Polleres A., Corcho O., Presutti V. (eds).- The Semantic Web: Research and Applications. ESWC 2012. Lecture Notes in Computer Science, 2012. - V. 7295. - P. 763-777.
2) ЕлизаровА.М.
Управлениежизненнымцикломэлектронныхпубликацийвинформаци оннойсистеменаучногожурнала / А.М. Елизаров, Д.С. Зуев, Е.К Липачёв.// Вестник Воронеж. гос. ун-та. Сер. Систем. Анализ и информ. Технологии. - 2014.- № 4. - С. 81-88.
3) MelvilleP.Content- BoostedCollaborativeFilteringforImprovedRecommendations / P. Melville, JM. Raymond, N. Ramadass.// AAAI-02 Proceedings,2002. - P.187-192.
4) Елизаров А.М.Терминологическое аннотирование и
рекомендательный сервис в системе управления физико-математическим контентом/ А.М.Елизаров, Н.Г.Жильцов, А.В.Кириллович, Е.К.Липачёв.// Труды XVII Международной конференции DAMDID/RCDL’2015 «Аналитика и управление в областях с интенсивным использование данных», Обнинск: ИАТЭ НИЯУ МИФИ. - 2015. - С.347-350.
5) Хайдаров Ш.М.Алгоритм формирования словарей рекомендующей системы подбора классификаторов научной информации / Ш.М.Хайдаров, Г.Ш.Ямалутдинова.// Ученые записки ИСГЗ - 2017. - № 1 (15). - С. 552-557.
6) Ямалутдинова Г.Ш. Формирование словаря рекомендательной системы автоматического подбора УДК // Труды Математического центра имени Н.И. Лобачевского - 2017. - Т. 55. - С. 164-167.
7) Ямалутдинова Г.Ш. Алгоритм автоматического классифицирования физико-математических публикаций // Труды Математического центра имени Н.И. Лобачевского -2016. - Т. 54. - С. 172-174.
8) Ямалутдинова Г.Ш. Метод автоматического подбора индексов УДК // Материалы ХУШВсероссийской конференции молодых ученых по математическому моделированию. г. Иркутск, Россия, 21-25 августа 2017 г. - Новосибирск: ИВТ СО РАН, 2017. - С. 97-98.
9) Ефременкова В.М. Различные возможности индексирования статей
из журналов, используя классификаторы баз данных / В.М.Ефременкова, И.Б.Кувшинова, Н.В. Круковская.//
Информационное обеспечение науки: новые технологии. - Москва: БЕН РАН, 2015. - С. 153-169.
10) БД Scopus. [Электронный ресурс]:- URL: http ://www. scopus. com
11) БД WebofScience. [Электронный ресурс]:- URL:
http: //thomsonreuters .com.
12) БД INSPEC. [Электронный ресурс]:- URL: http: //www. stn-international. de.
13) БДCAPlus. [Электронныйресурс]: - URL: http://www.cas.org/.CAS Content at Glance.html.
14) БД Pascal. [Электронный ресурс]: - URL:
http://www. inist. fr/?PASCAL-73&lang=en.
15) БД Compendex. [Электронный ресурс]:- URL:
http://www.elsevier.com/solutions/engineering_/content.
16) БД AEROSPACE. [Электронныйресурс]:- URL:
http://library.princeton.edu/ resource/title/ aerospace-high-technology- database.
17) БД ВИНИТИ РАН. [Электронный ресурс]: - URL:
http://www2.viniti.ru.
18) Working Party of National Experts on Science and Technology Indicators
[Электронныйресурс]:- URL:
http: //www.oecd. org/science/inno/38235147. pdf.
19) Научная политика в цифрах. [Электронный ресурс]: - URL: http://isterligov.blogspot.ru/2013/09/oecd-wos-scopus.html.
20) ГРНТИ. [Электронный ресурс]:- URL:
https: //www.tspu.edu.ru/tspu/files/file/grnti.pdf.
21) Антошкова О.А. Разработка базовых соответствий между ГРНТИ и другими классификационными системами / О. А. Антошкова, В. Н. Белоозеров, Е. Ю. Дмитриева. // Информационное обеспечение науки: новые технологии: Сборник научных трудов. - Москва: БЕН РАН, 2015. - C. 105-120.
22) Neal S. CoulterComputing Classification System 1998: Current Status and Future Maintenance / Neal S. Coulter,J. French, E. Glinert, et al.// Report of the CCS Update Committee, 1998. - 5 p.
23) Универсальная десятичная классификация. [Электронный ресурс]: - URL: http: //www. naukapro. ru/metod. html.
24) Библиотечно-библиографическая классификация. [Электронный ресурс]:- URL: http://roslavl.library67.ru/files/382/bbk.pdf.
25) International standard serial number International centre.
[Электронный ресурс]:- URL: http://www.issn.org/ru/comprendre-
lissn/regles-d-attribution/issn-les-grands-principes/.
26) Международный стандартный книжный номер. [Электронный
ресурс]:- URL:
https://ru.wikipedia.org/Международный стандартный книжный ном ер.
27) Национальная библиотека им. Н.Э. Баумана
(BaumanNationalLibrary). [Электронный ресурс]:- URL:
https://ru.bmstu.wiki/ISBN(International Standard Book Number).
28) MSC2010. [Электронный ресурс]: - URL:
https: //mathscinet. ams. org/msc/pdfs/classifications2010. pdf.
29) Ricci E., (Eds.) Recommender Systems Handbook / Ricci E. (Eds.). - Springer Science+Business Media New York, 2011, 2015. - 1003 p.
30) Manouselis N.Recommender Systems for Learning / N.Manouselis, H.Drachsler, K.Verbert, E. Duval.- VerlagNewYork, 2013. -84p.
31) Городецкий В.И.Онтологии и персонификации профиля пользователя в рекомендующих системах третьего поколения / В.И.Городецкий, О.Н.Тушканов.// Онтология проектирования, 2014. - №3. - С.7-31.
32) Пономарев А.В. Обзор методов учета контекста в системах коллаборативной фильтрации // Труды СПИИРАН, 2013. - С.169-188.
33) Гомзин А.Г.Системы рекомендаций: обзор современных подходов / А.Г. Гомзин, А.В. Коршунов.// Труды Института системного программирования РАН, 2012. - С. 401-417.
34) Чепикова Е.Д. Исследование алгоритмов рекомендательных систем / Е.Д.Чепикова, Е.О.Савкова, М.В. Привалов.// Информатика и кибернетика, 2016. - № 2(4). - С.57-61.
35) AdomaviciusG.Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions / G.Adomavicius, A.Tuzhilin// IEEE Transactions on Knowledge and Data Engineering, 2005. - V. 17, № 6. - P. 734-749.
36) Новиков О.В. Методы ускорения работы рекомендательных систем для высоконагруженных веб-сайтов // Прикладная информатика,
2013. - №5(47). - С.29-34.
37) ИнгерсоллГ. С.Обработка неструктурированных текстов. Поиск, организация и манипулирование /Г. С. Ингерсолл, Т.С.Мортон, Э. Л. Фэррис. // Пер. с англ. Слинкин А.А. - М.: ДМК Пресс, 2015. - 414 с.
38) Стемминг. [Электронный ресурс]:- URL:
https: //ru.wikipedia. org/wiki/Стемминг.
39) Lovins J.B. Development of a Stemming Algorithm // Mechanical Translation and Computational Linguisics, 1968. - V. 11, nos. 1 and 2. - P. 22-31.
40) Общероссийский математический портал Math-net.Ru.
[Электронный ресурс]:- URL: http: //www. mathnet.ru.
41) Маннинг К.Д. Введение в информационный поиск: Пер. с англ. / К.Д.Маннинг,П.,Рагхаван, Х.Шютце.- М.: ООО «И. Д. Вильямс»,
2014. - 528 с.
42) Резников И.А. Обзор алгоритмов извлечения ключевых слов из текста // Московский государственный университет им. М.В. Ломоносова Вычислительный центр им. А.А. Дородницына РАН
43) Недильченко О.С. Этапы и методы автоматического извлечения ключевых слов // «Молодой ученый», 2017. - №22(156). - С. 60-62.
44) Нокель М.А. Тематические модели в извлечении однословных терминов / М.А.Нокель, Н.В. Лукашевич.// Программная инженерия.
- Издательство «Новые технологии» (Москва), 2015. - №3. - С. 34¬40
45) Апанович З.В. Эволюция методов визуализации коллекций научных публикаций // RussianDigitalLibrariesJournal, 2018. - V. 21, №1. - 41 c.
46) Мухамедвалиева С.Р. Мера Жаккара в алгоритмах вычисления терминологического сходства цифровых документов: Курс. Работаю
- Казань, 2017. - 40 с.
47) Bootstrap. [Электронный ресурс]: -URL: http ://bootstrap-4. ru.
48) Труды Математического центра имени Н.И. Лобачевского. Т.55. Лобачевские чтения - 2017: материалы Шестнадцатой молодежной научной школы-конференции (Казань, 24-29 ноября 2017 г.) / сост. А.А. Агафонов. - Казань: Из-во Казан. Ун-та, 2017. - 172 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ