ВВЕДЕНИЕ 3
Глава 1. Заполнение данных по рейтингу математиков и научным областям . 5
Глава 2. Рейтинг отечественных ученых математиков 6
2.1 Правила построения рейтинга и пример 6
2.2 Критерии ранжирования ученых: разносторонность и значимость по
оценке эксперта 7
2.3 Математический аппарат рейтингов и расстояния между ними 8
2.4 Полный рейтинг и малый рейтинг с экспертной оценкой 13
Глава 3. Анализ научных областей 16
ЗАКЛЮЧЕНИЕ 21
Литература 23
ПРИЛОЖЕНИЕ
Для оценки эффективности научной деятельности ученых, в том числе математиков, и для составления рейтинга ученых существует несколько основных критериев: общее число публикаций, общее число цитирований, максимальное число цитирований одной работы, индекс Хирша. Это все относится к дисциплине - наукометрия. Численные критерии имеют свои недостатки: некоторые авторы в погоне за числом публикаций забывают о качестве статей. Поэтому, для качественного оценивания работ с такими объективными критериями могут конкурировать субъективные оценки экспертов [3].
В этой работе для построения рейтингов ученых предлагается воспользоваться экспертной оценкой и информацией с сайта Викиданных. Для сравнения рейтингов было сгенерировано множество случайных рейтингов. По полученным результатам была оценена степень многогранности ученых и ее связь со значимостью ученого, то есть позицией в рейтинге.
Викиданные - проект фонда Викимеда, официально запущенный в октябре 2012 для структурирования данных Википедии. Это свободная и открытая база знаний. Для хранения структурированных данных ВД используют следующую модель данных. Данные описываются парами «свойство-значение», которые можно извлечь с помощью языка запросов SPARQL. Например, статье в Русской Википедии об ученом П. С. Александрове соответствует объект Викиданных «Pavel Aleksandrov». Объект «Pavel Aleksandrov» имеет свойство «field of work» («область деятельности») со значением «topology» (топология). Свойства являются объектами и имеют собственные страницы в Викиданных с метками и описаниями (рис.1). Каждый объект Wikidata идентифицируется уникальным URI (рис.2) (например, https://www.wikidata.org/wiki/Q325696для элемента Q325696, Pavel Aleksandrov) [4].
Математика является одной из древнейших наук. Она параллельно развивалась во многих странах для решения различных практических задач. Начавшись с арифметики и геометрии, со временем формировались многие другие области. Например, из арифметики появились теория чисел и алгебра, геометрия разделилась на самостоятельные направления, такие как дифференциальная геометрия, проективная геометрия, топология и др., а теория групп - это раздел общей алгебры. Таким образом, можно сказать, что все разделы математики в той или иной степени переплетаются друг с другом. Эта работа преследует такую цель: проанализировать и выявить близкие научные области, для этого построить профили математиков России и мира в Викиданных, найти родственные математические предметы, выразить их связь численно.
Анализ экспертного рейтинга и рейтинга по количеству изучаемых наук показал, что больше половины ученых-математиков либо не занимаются математикой, либо не вносят никакого вклада в науку, а значимых ученых оказалось всего 35%. В этой работе был предложен алгоритм вычисления расстояния между рейтингами, с помощью которого подтвердили гипотезу о том, что рассматриваемые рейтинги ранжируют ученых в значительной степени одинаково.
Кроме этого, был проведен анализ научных областей, где выявлена связь между областями математики по Викиданным. Отметим, что неполнота Викиданных дает и неполную картину связи математических предметов: некоторые предметы, которые, казалось бы, должны быть тесно связаны друг с другом, имеют небольшое число пересечений.
В ходе работы были полностью заполнены Викиданные, касающиеся только отечественных математиков. Заполнение Викиданных по иностранным математикам оставлено на откуп студентам других стран. Это нашло свое проявление в рисунках 5, 6, 7, показывающих
непропорционально огромный вклад наших математиков в мировую науку. В настоящее время Викиданные развиваются и «стремительный рост объема данных позволяет с оптимизмом ожидать появления новых аналитических работ на их основе» [5].