Тема: АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА В TWITTER
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Анализ тональности 3
1.1. Подходы к определению тональности текста 5
1.2. Социальная сеть Twitter как площадка мнений 5
1.3. Постановка задачи 6
Глава 2. Алгоритмы и модели 9
2.1. Последовательность действий, необходимая для написания программы
для анализа тональности твитов 9
2.2. Препроцессинг твитов 9
2.3. Методы классификации текста 11
2.3.1. Наивный байесовский классификатор 11
2.3.2. Модель логистической регрессии 14
2.3.3. Метод опорных векторов 15
2.4. Инструменты, используемые при разработке алгоритмов определения тональности текста 17
Глава 3. Процесс и результаты практического использования разработки 19
3.1. Точность и сравнение разработанных алгоритмов при разных типах
тренировочной выборки 19
3.2. Построение облака слов 22
3.3. Анализ тональности мирового события 23
3.4. Пользовательский интерфейс 36
Заключение 39
Список литературы 40
Приложение
📖 Введение
По данным Twitter, на конец 2018 года среднее количество пользователей, которые ежедневно заходят в социальную сеть составляет 126 миллионов человек. Количество пользователей, которые посещают социальную сеть хотя бы один раз в месяц, оценивается в 321 миллионов человек.
Таким образом, сервисы с элементами социальных сетей можно характеризовать как крайне информативный открытый источник актуальной информации, а объемы генерируемых сообщений делают невозможным обработку этих данных человеческими силами. Одной из наиболее актуальных задач в области анализа текстовых сообщений в сайтах с элементами социальных сетей является задача распознавания эмоциональной окраски текста, которая позволяет извлечь из текстовой информации полярность мнения человека об объекте высказывания. Анализ тональности текстов применяется в следующих сферах:
• Рекомендательные системы - из отзывов о товарах или услугах выделяются основные характеристики (аспекты), а так же отношение автора к ним (полярность). Далее на основе полученного вектора признаков строится рекомендательная система.
• Выявление отношение клиента к товару либо услуге. Анализ пользовательских оценок по отзывам позволяет оперативно принимать решения
• Мониторинг общественных настроений. Многие сервисы предоставляют возможность публиковать сообщения с точным указанием геолокации, что позволяет анализировать эмоциональную окраску пользователей относительно конкретных географических объектов. Например, на основе данных из Twitter с сентября 2006 по август 2009 была построена статистическая карта настроений населения США, а так же были визуализированы графики изменения настроения в зависимости от времени суток либо дня недели.
• Предсказание результатов политических выборов по сообщениям в социальных сетях, в частности по текстам из Твиттера.
Исследования в области автоматического извлечения мнений проводятся и сейчас, так как на данный момент оптимальное решение для задачи анализа тональности не найдено. Ежегодно проводится множественно международных конференций, посвященных проблемам компьютерной лингвистики в целом и анализу тональности в частности. Например, The Association for Computational Linguistics, International Conference on Application of Information and Communication Technologies и International Conference on Applications of Natural Language to Information Systems. В России также проводят масштабные конференции с акцентом на обработку русскоязычных текстов: Международная конференция по компьютерной лингвистике «Диалог».
Работа состоит из следующих структурных блоков: в первой главе рассмотрены подходы к анализу тональности текста; второй раздел посвящен описанию алгоритмов, выбранных для анализа тональности в рамках данной работы, описана реализация программы. В заключительном разделе описаны процесс и результаты практического использования разработки.
✅ Заключение
месяца.



