Тема: Построение рейтинга вузов по данным Википедии
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 4
Глава 1 Обзор предметной области 7
1.1 Обзор глобальных рейтингов 7
1.2 Википедия 12
1.3 Особенности Википедии 18
1.4 Новый этап академического ранжирования 21
1.5 Существующие проблемы ранжирования вузов 24
Глава 2 Ранжирование вузов на основе Википедии 29
2.1 Анализ данных и извлечение информации 29
2.2 Алгоритмы ранжирования 31
2.2.1 Метод голосования 31
2.2.2 Адаптированный алгоритм PageRank 32
2.3 Результаты ранжирования 35
Глава 3 Сравнение рейтингов 39
3.1 Ошибка расстояния как мера 39
3.2 Применение меры ошибки расстояния к сравнению рейтингов 44
3.3 Метод искусственных шевелений 48
Заключение 52
Литература 54
Приложение
📖 Введение
«Академическая ранжирование» — процесс построения рейтинга высших учебных заведений на основе учёта различных факторов. Ранжирование проводится университетами, журналами, правительством, независимыми экспертами. При большом количестве ранжируемых университетов количество национальных вузов, вошедших в число лучших вузов мира, становится важным показателем, характеризующим систему высшего образования. В мире существует достаточно большое число рейтингов вузов. Рейтинги создаются для повышения конкуренции, как между отдельными вузами, так и между национальными системами высшего образования. При составлении каждого рейтинга исследовательская группа использует собственную методологию — за основу берутся различные критерии, их сочетания и методы сбора информации. Для существующих рейтингов такие термины как «качество образования», «уровень научных исследований», «академическая репутация» могут иметь различное значение. Международные рейтинги университетов задают стандарты современного университета, которым пытаются следовать многие вузы, и пытаются влиять на исследователей. Однако далеко не всеми исследователями университетские рейтинги оцениваются позитивно.
Результатом академического ранжирования являются рейтинги:
• глобальные,
• национальные,
• специализированные.
В первую очередь внимание уделяется глобальным рейтингам. Академический рейтинг университетов мира (ARWU) — один из наиболее влиятельных рейтингов лучших вузов мира. THE World University Rankings — глобальное исследование и сопровождающий его рейтинг лучших университетов мирового значения. Ведущие вузы мира стремятся занять первые позиции в глобальных рейтингах.
При составлении рейтинга важное значение имеет выбор параметров. Метод взвешивания и суммирования является наиболее распространенным при процедуре ранжирования. В соответствии с придаваемой важностью каждому показателю присваивается вес, после чего для каждого объекта все показатели суммируются для получения итогового балла. Поскольку возможность оценить качество вузов в бальной системе часто подвергается сомнению, тенденцией последнего времени является ориентация на разработку многомерных рейтингов, в которых каждый показатель ранжируется отдельно, а пользователь должен сам выбрать наиболее важные для себя показатели.
Для академического ранжирования вузов используются такие показатели как качество образования в вузе, уровень востребованности выпускников работодателями и уровень научно-исследовательской активности вуза. Существуют рейтинги, процесс составления которых существенно отличается от традиционных глобальных рейтингов. Так в исследовании испанской лаборатории «Cybermetrics» вузы сравниваются по степени наполнения их официальных интернет-сайтов.
На сегодняшний день не существует «идеального» рейтинга, то есть такого рейтинга, который сможет охватить все существующие вузы, будет обладать прозрачной методикой и все будут довольны результатами этого ранжирования. Составители рейтингов преследуют определенные цели и ориентируются на целевую аудиторию при составлении рейтингов. Так в одном рейтинге отдельный вуз может занимать лидирующие места, а в другом занимать позицию далеко не в первом десятке. Не представляется возможным равняться сразу на всех. Ключевым фактором, влияющим на величину рейтинга, является наличие (или отсутствие) того или иного показателя. Поэтому при ранжировании любой перечень учитываемых показателей должен опираться на научную основу.
Это исследование направлено на создание рейтинга вузов на основе данных из интернет-энциклопедии. У каждого значительного вуза есть статья в Википедии. В этом исследовании проверяется гипотезу викиметрики (wikiometrics) о том, что степень популярности статей в Википедии соответствует позиции вуза в рейтинге. Таким образом, целью этого исследования является создание нового рейтинга вузов и сравнение его с существующими глобальными рейтингами академического ранжирования.
Данная работа содержит три главы и заключение. В первой главе приведен обзор существующих глобальных моделей академического ранжирования и обзор Википедии как площадки для построения нового рейтинга. Во второй главе представлено описание методов для ранжирования и анализ результатов ранжирования. В третьей главе описана предложенная метрика для сравнения рейтингов.
✅ Заключение
В исследовании предметной областью стали статьи в Английской и Русской Википедии о высших учебных заведениях в России и за рубежом. Используя метод голосования и адаптированный алгоритм ссылочного ранжирования, составлены википедийный рейтинги по данным десяти количественных параметров статей Википедии для выбранных 65 вузов. В ходе исследования было показано, что рейтинги, построенные в разных версиях Википедии, существенно отличаются друг от друга. Полученные рейтинги сравнивались с глобальными при помощи ранговой корреляции. Так же для сравнения рейтингов предложен метод вычисления «ошибки расстояния» (edit distance). В результате было наглядно показано, что википедийными рейтингами было занято «центральное» (промежуточное) положение между тремя глобальными рейтингами, Википедийный рейтинг находится ближе к каждому из глобальному рейтингу, чем они друг к другу. Самое близкое положение ко всем глобальным рейтингам занял википедийный рейтинг, построенный в Английской Википедии по алгоритму ссылочного ранжирования. Для подтверждения полученных результатов в будущем исследовании следует охватить большее количество рассматриваемых вузов, поскольку сейчас рассматривалась часть глобальных рейтингов, ограниченная 65 позициями.
В используемых методах построения рейтинга не применялись весовые коэффициенты — все параметры равнозначны. Выбирая различные весовые коэффициенты для параметров при построении рейтинга можно получить итоговый рейтинг максимально приближенный к глобальному. Таким образом, можно выяснить какие из параметров Википедии являются наиболее важными для каждого из трех глобальных рейтингов, а от каких параметров можно вовсе отказаться.
В будущей работе планируется охватить максимально возможное количество вузов, определить самые значимые параметры статей и воспользоваться данными от инфобоксов. Также следует расширить метод вычисления «ошибки расстояния», например, учитывая расстояние между элементами пары объектов в рейтинге. То есть чем больше расстояние между элементами, тем больше ошибка, следовательно, расхождение между рейтингами.



