ВВЕДЕНИЕ 3
СПИСОК ТЕРМИНОВ И ОБОЗНАЧЕНИЙ 6
1. АНАЛИЗ АЛГОРИТМА ВЫЧИСЛЕНИЯ SJR 7
1.1. ОПИСАНИЕ АЛГОРИТМА 7
1.2. ЭТАПЫ ПОДСЧЕТА 9
1.3. ГЛОБАЛЬНЫЕ ЗНАЧЕНИЯ 10
2. АНАЛИЗ СТРУКТУРЫ САЙТА РИНЦ 11
2.1 ПОИСК ЖУРНАЛОВ 11
3. ТРЕБОВАНИЯ ДЛЯ РАЗРАБОТКИ 17
4. ПОСТАНОВКА ЗАДАЧИ 18
4.1. ИСПОЛЬЗУЕМЫЙ ИНСТРУМЕНТАРИЙ 18
5. РАЗРАБОТКА БОТА ДЛЯ СБОРА ДАННЫХ 20
5.1. СОЗДАНИЕ СУЩНОСТЕЙ 20
5.2. РАЗРАБОТКА СБОРЩИКОВ ДАННЫХ 24
6. РАЗРАБОТКА ВЕБ-ПРИЛОЖЕНИЯ 26
6.1. РЕАЛИЗАЦИЯ АЛГОРИТМА ПОДСЧЕТА SJR 26
6.2. КЭШИРОВАНИЕ ДАННЫХ 27
6.3. СОЗДАНИЕ ИНТЕРФЕЙСА 29
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 31
ПРИЛОЖЕНИЕ
Научное сообщество признает, что не все научные документы и все журналы имеют одинаковую ценность.
Вместо того, чтобы каждый исследователь присваивал субъективную ценность каждому журналу, всегда был большой интерес к определению процедуры объективной оценки.
Одним из первых поколений метрик журнала, основанных на количестве цитирований, является разработанный для оценки влияния научных исследований Импакт-фактор, который широко использовался в течение более 40 лет [1].
Поскольку не все документы и не все журналы имеют одинаковую ценность, появилось второе поколение индикаторов с идеей присвоения им разных весов. Вместо индекса популярности, концепция, которую он должен был измерить, стал престиж в смысле Боначича [2]: самый престижный журнал будет наиболее часто цитируемым журналами, также имеющими высокий престиж. С появлением алгоритма PageRank [3], разработанного создателями Google, возникли другие метрики, такие, как Invariant Method для измерение интеллектуального влияния [4], Eigenfactor [5] и рейтинг журнала Scimago [6].
Несмотря на прогресс, представленный индикаторами второго поколения, у них остаются некоторые недостатки:
• Оценки, полученные научными журналами, обычно представляют их престиж или их средний престиж на документ, но этот балл имеет смысл только по сравнению с баллами других журналов;
• Баллы нормализуются путем суммирования их до фиксированной величины (обычно, единицы). В результате, если число журналов будет
SJR разрабатывается SCImago и берет данные из базы Scopus, так как она является одной из самых больших баз данных научного цитирования в мире. Но в Scopus, на апрель 2019 года, индексируются только 558 российских научных журналов [7], в то время как в Российском Индексе Научного Цитирования (РИНЦ) индексируются более 6000 [8]. Такое соотношение приводит к тому, что многие журналы не получают нужное им внимание.
Целью данной работы является создание веб-приложения для подсчета SJR российских научных журналов. Дипломная работа разделена на 2 части:
• Бот, который будет собирать данные с сайта РИНЦ и добавлять их в базу данных.
• Веб-приложение, в котором будут высчитываться и показываться SJR журналов.
Задачи, поставленные для достижения указанной цели:
• Анализ алгоритма вычисления SJR;
• Анализ структуры сайта РИНЦ, для дальнейшего построения структуры данных;
• Разработка бота для сбора данных;
• Разработка кроссплатформенного веб-приложения для показа полученных данных;
• Реализация алгоритма вычисления SJR;
• Кэширование результатов вычисления.
Практическая значимость данной работы заключается в том, что появится инструмент для анализа большинства российских научных журналов, так как на данный момент в РИНЦ нет встроенного инструмента подсчета таких данных, кроме Импакт-фактора.
В данной работе был создан дополнительный инструмент для анализа российских научных журналов. Были изучены алгоритм вычисления SJR и существовавшие до него метрики подсчета престижа и успешности научных журналов. Были реализованы бот, собирающий информацию с сайта РИНЦ, и веб-приложение для подсчета рангов журналов, которые предоставляют удобный интерфейс для просмотра данных.
Исходный код приложения опубликован в репозитории по адресу: http: //gititis. kpfu.ru/RAMirzodzhonov/rsjr.
В качестве дальнейшего развития данного инструмента можно получить доступ к API сайта РИНЦ и на прямую оттуда брать данные. Такой метод сэкономит много времени на сборе данных. При получении доступа к API РИНЦ можно разработать алгоритм SJR2 от создателей SJR, которая в добавление к SJR использует область публикаций. То есть, если темы близкие друг другу, то эти цитирования дадут больше SJR.
1. Garfield, E. (2006). The history and meaning of the journal impact factor. Journal of the American Medical Association, 295(1), 90-93.
2. Bonacich, P. (1987). Power and centrality: A family of measures. American Journal of Sociology, 92(5), 1170-1182.
3. Page, L., Brin, S., Motwani, R., & Winograd, T. (1998). The PageRank citation ranking: Bringing order to the Web. Stanford, CA: Technical report, Stanford University.
4. Palacios-Huerta, I., & Volij, O. (2004). The measurement of intellectual influence. Econometrica, 72(3), 963-977.
5. Bergstrom, C. (2007). Eigenfactor: Measuring the value and prestige of scholarly journals. College & Research Libraries News, 68(5), 314-316.
6. Gonzalez-Pereira, B., Guerrero-Bote, V. P., & Moya-Anegon, F. (2010). A new approach to the metric of journals scientific prestige: The SJR indicator. Journal of Informetrics, 4(3), 379-391. http://dx.doi.org/10.1016/j.joi.2010.03.002
7. Российские научные журналы в Scopus [Электронный ресурс] / Elsevier, scopus - Режим доступа - URL: http://www.elsevierscience.ru/products/scopus/.
8. Российский индекс научного цитирования [Электронный ресурс] / eLibrary, РИНЦ - Режим доступа - URL: https://elibrarv.ru/proiect risc.asp.
9. SJR [Электронный ресурс] / SCImago, help - Режим доступа - URL: https://www.scimagojr.com/help.php.
10. .NET Core [Электронный ресурс] / Microsoft, Руководство по .NET Core - Режим доступа - URL: https://docs.microsoft.com/ru-ru/dotnet/core/.
11. Bootstrap [Электронный ресурс] / GetBootstrap, About - Режим доступа - URL: https: //getbootstrap .com/docs/4.3/about/overview/.
12. jQuery [Электронный ресурс] / jQuery, jQuery API - Режим доступа - URL: https://api.jquery.com/.