Тема: Применение методов машинного обучения в задаче агрегации новостных статей
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 3
Постановка задачи 4
Обзор литературы 5
1 Анализ предметной области 7
1.1 Анализ существующих решений 7
2 Классификация текста 11
2.1 Предобработка и векторизация текста 12
2.2 Разметка и балансировка данных для обучения 18
2.3 Методы классификации 19
3 Процесс разработки 23
3.1 Создание датасета 23
3.2 Предобработка текста 24
3.3 Векторизация текста 25
3.4 Классификация текста 29
4 Результаты исследования 33
Выводы 36
Заключение 36
Список литературы 37
📖 Введение
Актуальность работы заключается в исследовании методов автоматического разделения коллекции новостей на заранее заданные тематики. Это поможет автоматизировать новостные агрегаторы и позволит им пользоваться новостными ресурсами без предварительной разметки.
Объект исследования - применение методов классификации для предоставления пользователю средств навигации по коллекции документов.
Предмет исследования - разбиение новостных документов на темы при помощи классификации и векторных моделей.
Цель работы - сравнение методов машинного обучения в задаче классификации и векторизации новостных статей.
✅ Заключение
Данное исследование имеет перспективы в дальнейшей работе. Существует множество методов машинного обучения, нейросетевых архитектур и векторизаторов, которые можно рассмотреть в данной задаче, а также каждый год появляются новые, более инновационные и прорывные решения.



