Тема: Извлечение мнений и объектов мнений из постов социальных систем
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи 7
Обзор литературы 8
Глава 1. Обзор предметной области 9
§1. Анализ тональностей 9
1.1. Сущность анализа тональностей 9
1.2. Виды классификации тональностей 9
1.3. Алгоритмы анализа тональностей 10
1.4. Оценка качества анализа тональностей 12
§2. Извлечение мнений 13
2.1. Сущность извлечения мнений 13
2.2. Общая модель объекта 13
2.3. Виды мнений 14
§3. Уровни, на которых проводится сентимент-анализ 15
§4. Задачи сентимент-анализа 15
§5. Применение 16
§6. Обзор существующих готовых решений 16
Глава 2. Проектирование системы, выполняющей сентимент-анализ 18
§1. Конкретизация задачи 18
§2. Входная коллекция 19
§3. Начальные категории 20
3.1 Построение начальных категорий 20
3.2 Алгоритмы пополнения начальных категорий 21
3.3 Пополнение начальных категорий 23
§4. Тональные словари 23
§5. Общий алгоритм решения задач 23
Глава 3. Реализация системы, выполняющей сентимент-анализ 26
§1. Реализация системы 26
§2. Оценка качества 26
§4. Выводы 31
Заключение 33
Список литературы 34
Дополнительные ссылки 36
Приложение
📖 Введение
Казалось бы, в век современных технологий что может быть проще, чем послать запрос поисковой машине, а она, в свою очередь, выдаст ответы на все вопросы пользователя. Но действительно ли такие инструменты поиска помогают в полной мере удовлетворить информационную потребность человека? Из-за огромного количества разнообразного контента в мировом вебе, стремительно растущего с каждым днем, очень часто релевантная информация теряется среди мегабайт бесполезных данных. К тому же традиционный информационный поиск и веб-поиск, в частности, не всегда помогает в нахождении сторонних мнений для принятия собственного решения.
Вместе с этим, последнее десятилетие характеризуется ростом популярности различных социальных систем: блогов (пр.: Livejoumal, Twitter), форумов (огромное количество тематических сообществ, пр.: Трипадвизор - форум путешественников, Киберфорум - форум программистов), социальных сетей (пр.: ВКонтакте, Facebook, Instagram), интернет-сервисов, аккумулирующих мнения о том или ином объекте (пр.: Яндекс.Маркет, Кинопоиск, Amazon). Ежедневно пользователи подобных ресурсов размещают множество сообщений, материалов, высказывают мнение о том или ином объекте. На основании подобных комментариев человек может сделать вывод о том, пользоваться или нет интересующей услугой, покупать или нет нужный продукт. На данный момент, несмотря на всю полезность такого подхода к мониторингу мнений, существует ряд серьезных недостатков: сложности в ручной обработке огромных объемов данных, нахождении мнений и их эмоциональной оценки, приведении результата к удобной форме.
Исходя из выше сказанного, появляется необходимость в создании системы автоматического нахождения и анализа мнений. Подобная задача ставится в дисциплине, которая находится на стыке информационного поиска и компьютерной лингвистики - анализ тональности текста и извлечение мнений (англ. sentiment analysis & opinion mining, также употребим термин сентимент-анализ). Сентимент-анализ - система автоматического получения из текстов эмоционально окрашенной лексики и мнений по отношению к объектам, речь о которых идет в тексте. Тональностью называется эмоциональное отношение автора высказывания, к некоторому объекту, выраженное в тексте. Под мнением будем понимать эмоциональную оценку чего-либо (формальное определение вводится в главе 1, §2).
Как понятно из полного названия предмета сентимент-анализа, всю дисциплину можно разделить на две большие части. Первая - анализ тональности текста, которая зачастую ставит перед собой задачу классификации корпуса документов на основе найденных в них тональностей. Вторая часть - извлечение мнений, обычно ставит перед собой целью выделить все мнения об интересующих нас объектах из корпуса документов.
Задачи обоих блоков сентимент-анализа возникли сравнительно недавно, поэтому работа над ними продолжается. Несмотря на наличие существующих инструментов и платформ, позволяющих определять не только тональность сообщений в социальных медиа, но и выявлять обсуждаемые темы, проводить анализ мнений о брендах, а также анализировать некоторые другие параметры, единого точного алгоритма решения данной задачи не существует. Следовательно, все еще актуальна задача построения системы извлечения мнений и анализа тональностей.
✅ Заключение
В качестве базового подхода к решению был выбран метод, использующий исключительно тональные словари. Именно этим подходом и обуславливаются относительно низкие показатели при выполнении оценки качества работы системы.
Наиболее очевидным способом улучшения разработанного сервиса является добавление к тональному подходу правил, основанных на морфологическом разборе. Кроме того, можно обратить внимание и на довольно популярные методы, основанные на машинном обучении.



