📄Работа №203563

Тема: Разработка и исследование рекурсивной нейронной сети для выявления тональности сообщений в социальных сетях

📝

Тип работы Дипломные работы, ВКР

📚

Предмет математика и информатика

📄

Объем: 50 листов

📅

Год: 2019

👁️

4500 руб.

🛒 Купить работу

Не подходит эта работа?
Закажите новую по вашим требованиям

Узнать цену на написание

ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить

📋 Содержание

АННОТАЦИЯ 2
ВВЕДЕНИЕ 7
1 ПОДХОДЫ К ЗАДАЧЕ АНАЛИЗА ТОНАЛЬНОСТИ ТЕКСТА 9
1.1 Методы классификации тональности 9
1.1.1 Методы, основанные на правилах и словарях 9
1.1.2 Метод, основанный на теоретико-графовых моделях 9
1.1.3 Машинное обучение без учителя 10
1.1.4 Машинное обучение с учителем 10
1.2 Обучение с учителем для задачи анализа тональности текста .... 11
1.2.1 Наивный байесовский классификатор 11
1.2.2 Метод опорных векторов 13
1.2.3 Рекурсивная нейронная сеть 14
1.3 Программное обеспечение для построения искусственной
нейронной сети 17
1.4 Методы построения векторного представления текста 18
1.4.1 «Мешок слов» 18
1.4.2 Word2vec 19
1.5 Постановка задачи 21
1.6 Выводы по разделу 21
2 МОДЕЛИ ВЕКТОРИЗАЦИИ ТЕКСТА И РЕКУРСИВНОЙ
НЕЙРОННОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ВЫЯВЛЕНИЯ ТОНАЛЬНОСТИ СООБЩЕНИЙ 23
2.1 Векторизация текста 23
2.2 Математическая модель рекурсивной нейронной сети 25
2.2.1 Функция активации 26
2.2.2 Функция потерь 28
2.2.3 Проблема переобучения модели 29
2.2.4 Обучение методом адаптивного градиента 30
2.3 Выводы по разделу 31
3 РАЗРАБОТКА АЛГОРИТМОВ И ПРОГРАММЫ ДЛЯ АНАЛИЗА
ТОНАЛЬНОСТИ ТЕКСТА 33
3.1 Алгоритм предварительной обработки 33
3.2 Алгоритм обучения нейронной сети 36
3.3 Алгоритм работы программы анализа тональности 37
3.4 Выводы по разделу 37
4 МЕТОДИКА И ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА ... 40
4.1 Исходные данные 40
4.2 Методика экспериментального исследования 40
4.3 Результаты эксперимента 42
4.4 Выводы по разделу 43
ЗАКЛЮЧЕНИЕ 44
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 46
ПРИЛОЖЕНИЕ 1 Текст программы 49

📖 Введение

В наше время социальные сети играют не последнюю роль в жизни каждого человека. Социальные сети с момента их создания притягивают пользователей тем, что можно делиться своими впечатлениями и мыслями, где бы они ни находились. Число пользователей в социальных сетях превышает миллиард, и они оставляют по несколько миллиардов сообщений в день. При этом количество пользователей социальных сетей увеличивается с каждым годом, люди регистрируют все большее количество аккаунтов на различных сайтах, постоянно высказывают свое мнение по поводу товаров в различных магазинах, часто пишут свежие обзоры на новинки гаджетов, обсуждают различные события на форумах, происходящие в мире. Таким образом, в социальных сетях формируется огромнейшая база информации по различным темам. Знание мнения людей может дать огромное преимущество в различных областях, к примеру, социологам - для определения отношения пользователей социальных сетей к тем или иным событиям, маркетологам - узнать оценку качества товаров и услуг на основе отзывов пользователей, психологам - для определения депрессии у пользователей социальных сетей.
Мы будем рассматривать такую социальную сеть, как Twitter. Twitter является одной из самых популярных социальных сетей, которая позволяет пользователям читать и отправлять сообщения (т. е. твиты) длиной до 280 символов. Среди большого разнообразия тем, люди в Twitter, как правило, выражают свое мнение о брендах, знаменитостях, продуктах и общественных мероприятиях.
Анализ тональности текста является одним из методов исследования в компьютерной лингвистике. Анализ мнений включает в себя несколько задач, направленных на решение одной и той же проблемы - качественная оценка отношения автора текста к субъекту, который рассматривается в этом же тексте. Из конкретных задач, которые входят в анализ мнений, можно выделить такие задачи, как оценка субъективности или объективности текста по отношению к субъекту, классификация отношения автора к субъекту. Последняя задача - это задача выявления тональности текста, она является фундаментальной в анализе мнений. Сначала необходимо понять, как автор относится к субъекту, чтобы делать какие-то дальнейшие выводы про мнение.
Задача выявления тональности текста сводится к задаче классификации. Имеется три класса эмоциональной окраски: положительная, нейтральная или отрицательная, к которым нужно отнести текст.
В последнее время искусственные нейронные сети доказали свою эффективность для многих задач. Так, нейронные сети могут распознавать цифры, изображения, классифицировать объекты и т. д. Одной из таких сетей является рекурсивная нейронная сеть. Рекурсивные нейросети добились значительного успеха в решении задач обработки естественного языка [1].

✅ Заключение

Целью работы состояла в разработке и исследовании рекурсивной нейронной сети для выявления тональности сообщений в социальных сетях.
Разработанная программа позволяет производить предварительную обработку сообщений из социальной сети Twitter с дальнейшей их векторизацией. Далее векторное представление слов обрабатывается рекурсивной нейронной сетью, в результате чего определяется класс. Каждый класс имеет оценку -1, 0, 1. Таким образом, сообщения с положительной тональностью оцениваются в 1, нейтральные - 0 и оценка -1 - для отрицательной. Программа реализует предложенный алгоритм на языке Python 3, его можно использовать в качестве подключаемого модуля. Данный модуль можно использовать для приложений, связанных с анализом тональности текста.
В результате работы решены следующие задачи:
1) рассмотрены методы, применяющиеся в анализе тональности текста и для векторного представления текста;
2) разработаны математические модели векторизации текста и рекурсивной нейронной сети, решающие задачу выявления тональности сообщений в социальных сетях;
3) программно реализованы предварительная обработка текста, модель векторного представления слов и рекурсивная нейронная сеть;
4) проведены численные эксперименты при обучении реализованной нейронной сети;
5) осуществлена проверка работа программы на экспериментальных данных.
Разработанная модель имеет ряд преимуществ над классическими методами анализа тональности. Рекурсивная нейронная сеть показала лучшие результаты. Точность классификатора на ее основе составила - 78,7%, тогда как у других методов точность классификации не превосходит 75%.
Возможным направлением для дальнейшей работы может быть применение модели для других языков: английского, казахского и другие. В данной работе модель работает с русским языком. Также можно провести анализ тональности на других подходах классификации и рассмотреть различные возможности других нейронных сетей.

Нужна своя уникальная работа?

Срочная разработка под ваши требования

Рассчитать стоимость

ИЛИ

Поиск аналога

📕 Список литературы

1 Socher, R. Recursive deep models for semantic compositionality over a sentiment Treebank / R. Socher, A. Perelygin, J. Wu [и др.] // EMNLP. - 2013. - V. 1631. - P. 1642.
2 Пазельская, А. Метод определения эмоций в текстах на русском языке / А. Пазельская, А. Соловьев // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции Диалог. - Москва, 2011. - С. 510-522.
3 Усталов, Д. Извлечение терминов из русскоязычных текстов при помощи графовых моделей / Д. Усталов. - Екатеринбург, УРФУ: конференция, 2012. - С. 62-69.
4 Клековкина, М.В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики / М.В. Клековкина, Е.В. Котельников // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. - Переславль-Залесский, Россия: конференция. - 2012. - C. 118-123.
5 Сарбасова, А.Н. Исследование методов сентимент-анализа русскоязычных текстов // Молодой ученый. - 2015. - №8. - С. 143-146.
6 Naive Bayes. - URL: https://scikit-learn.org/stable/modules/naive bayes. html (дата обращения: 15.02.2019).
7 Вьюгин, В.В. Математические основы теории машинного обучения и прогнозирования. - Москва: 2013. - 390 с.
8 Рекурсивные нейронные сети. - Дата обновления: 09.12.2017. URL: https://ru.wikipedia.огд^1к1/Рекурсивные нейронные сети (дата обращения: 05.02.2019).
9 Модель «Мешок слов». - Дата обновления: 11.03.2019. URL: https://en.wikipedia.org/wiki/Bag-of-words model (дата обращения: 25.04.2019).
10 Word2vec. - Дата обновления: 08.04.2019. URL: https://en.wikipedia. org/wiki/Word2vec (дата обращения: 05.05.2019).
11 Mikolov, T. Efficient estimation of word representations in vector space / T. Mikolov, K. Chen, G. Corrado, J. Dean. - Cornell University, 2013. - P. 1-12.
12 Mikolov, T. Distributed representations of word and phrases and their compositionaly / T. Mikolov, I. Sutskever, K. Chen, G. Corrado, J. Dean // Conference on Neural Information Processing Systems, 2013. - P. 3111-3119.
13 О методе кодирования слов word2vec. - Дата обновления: 7.09.2017. URL: http://mechanoid.kiev.ua/ml-w2v.html (дата обращения 03.05.2019).
14 Minnaar, A. Word2Vec Tutorial Part I: The Skip-Gram Model. - Дата обновления: 12.04.2015. URL: http: //alexminnaar. com/author/alex-minnaar.html (дата обращения: 04.04.2019).
15 Dong, L. Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification / L. Dong, F. Wei, C. Tan [и др.] // Conference: Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics June 2014. - volume 2. - P.49-54.
..22

🖼 Скриншоты

Содержание

🛒 Оформить заказ

⚡ Работу высылаем в течении 5 минут после оплаты.

Имя

E-mail

Телефон

Дополнительная информация

С условиями приобретения работы согласен

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить ⬆️

Оценка стоимости

Предмет *

Тип работы *

Объем работы *

Срок выполнения *

Это краткая форма заказа. После ее заполнения вы перейдете на полную форму заказа работы

Каталог работ (209234)

Статьи

»» Все статьи

Вход в личный кабинет