Тема: Классификация документов посредством кластеризации графа ссылок между ними
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Обзор традиционных алгоритмов текстовой классификации ... 4
1.1. Подготовка данных 4
1.2. Алгоритм k-means 6
1.3. Алгоритм k ближайших соседей 8
1.4. Метод опорных векторов (SVM) 9
1.5. Латентное размещение Дирихле (LDA) 11
Глава 2. Частичное обучение на графе 14
2.1. Постановка задачи частичного обучения 14
2.2. Обучение на графе 14
Глава 3. Проведение эксперимента 18
Выводы 22
Заключение 23
Список литературы
📖 Введение
Существует множество способов находить скрытые структуры в данных, одним из них является анализ графа ссылок между документами. Во многих случаях классификация коллекции документов может быть сведена к исследованию графа, порожденного ею.
Мы рассмотрим случай классификации статей на сайте Википедия, используем для решения этой задачи анализ графа ссылок, а также сравним, полученные результаты с текстовой классификацией.



