Тема: Разработка системы анализа мнений отзывов о фильмах
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи 5
Обзор литературы 6
Глава 1. Обзор предметной области 9
1.1 Обработка естественного языка 9
1.2 Анализ тональности 10
1.2.1 Виды шкал для определения тональности 10
1.2.2 Подходы к определению тональности текстов 10
1.2.3 Метод фрагментных правил 12
1.2.4 Оценка качества анализа тональностей 12
1.2.5 Оценка качества анализа тональностей в многоклассовом случае 14
1.2.6 Обзор существующих решений 15
Глава 2. Постановка эксперимента и результаты 17
2.1 Тестовые коллекции 17
2.2 Построение матрицы документ/термин 22
2.3 Random Forest 25
2.4 Построение классификатора 27
2.5 Результаты 29
2.6 Выводы 30
Глава 3. Разработка и создание Web-сайта 31
3.1 Web-crawler 31
3.2 ElasticSearch 32
3.3 Страница фильма 34
Заключение 36
Список литературы 37
Приложение 39
📖 Введение
Все больше и больше людей делятся своим личным опыт с незнакомцами благодаря интернету. Существует огромное множество ресурсов с отзывами на разные тематики, будь то книги, одежда или электронные предметы, пользователь первым делом прочитает мнения об этом конкретном продукте и затем только задумается о приобретении.
Дисциплину анализу мнений можно разделить на две большие части. Первая - извлечение тональности мнения, обычно подразумевает задачу классификации текста по тональности эмоции. Вторая - извлечение мнений, когда выделяется не только эмоция, но и объект этой эмоции и что именно вызвало эмоцию.
В данной работе используются обзоры на фильмы. Производители могут собирать обзоры пользователей, независимо от того, являются ли они положительным или нет, относительно фильма и в следующих своих работах попытаться повысить качество произведения киноискусства. Так к примеру на сайтах ivi5, tvzavr6 и кинотеатр.ру7 пользователи не могут выставлять свои собственные оценки фильму. Поэтому важно разработать классификатор по определению тональности мнений.
✅ Заключение
• Рассмотрены возможные подходы и алгоритмы к построению моделей классификации отзывов фильмов по трем классам тональности: “негативные”, “нейтральные”, “позитивные”.
• Собраны наборы данных кинорецензий для тестирования моделей.
• Сравнены различные способы обработки текстовых данных и их влияние на модель классификации.
• Разработан Web-сайт для поиска необходимого фильма и рассмотрения отзывов о нем.





