Тип работы:
Предмет:
Язык работы:


АНАЛИЗ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ СЕТЯХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

Работа №77682

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы65
Год сдачи2017
Стоимость4850 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
285
Не подходит работа?

Узнай цену на написание


Введение 1
Способы получения информации из социальных сетей 3
Методы анализа тональности текста 6
Подходы к классификации тональности 6
Машинное обучение с учителем 8
Классификация 8
Выбор признаков 9
Взвешивание признаков 9
Предварительная обработка данных 10
Оценка качества анализа тональности 10
Нейронные сети. Рекуррентные нейронные сети 12
Рекуррентные нейронные сети 12
Theano и keras 18
Методы обработки и формирования данных для обучения нейронной сети 20
Частотный словарь слов 21
Проектирование 22
Реализация получения данных из социальной сети 22
Получение данных при помощи VK Api 22
Получение данных при помощи Selenium 28
Реализация нейронной сети 34
Выводы 43
Список литературы 44
Приложение

Выпускная квалификационная работа посвящена анализу информации в социальных сетях с использованием нейронных сетей.
Актуальность темы. Данная тема является актуальной, поскольку на сегодняшний день человечество все больше и больше времени проводит в социальных сетях. Для людей социальная сеть является пространством общения, развлечения, работы и т.д. В ней пользователи социальной сети могут хранить информацию о себе (ФИО, дата рождения, номер телефона, место проживания, место учебы и работы, интересы, хобби и прочее). Помимо этого, некоторые социальные сети позволяют размещать фотографии и видеоматериалы. Конечно же, пользователи могут указать неправильные данные в силу каких-либо причин, однако многие все же указывают действительные данные о себе. Пользователи многих социальных сетей имеют возможность создавать сообщества, делиться своими находками, мнениями, оставлять свои отзывы и комментарии по разной тематике (например, обсуждать недавно вышедший на экраны фильм, либо обсуждать и делиться своим опытом по приобретению того или иного товара в том или ином магазине). Таких мнений и отзывов довольно много, как и собственно пользователей социальной сети, поэтому для анализа большого количества текстовых сообщения необходимо прибегнуть к современным методам обработки и выявления тональности мнений и отзывов.
Sentiment analysis(по-русски: «анализ тональности») — это область компьютерной лингвистики, занимающаяся изучением мнений и эмоций в текстовых документах. Целью анализа тональности является классификация текстовых данных.
Анализ тональности может быть применен в разных областях (социология, маркетинг, политология, медицина и т.д.)
Цель работы. Исследовать способы получения информации из социальных сетей и исследовать методы анализа тональности текста с использованием аппарата нейронных сетей. Провести сравнительный анализ существующих методов машинного обучения по анализу тональности текстовых данных. На основе рассмотренных методов предложить лучший вариант анализа текстовых данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе были проведены исследования по анализу текстовой информации в социальных сетях.
Были получены следующие результаты:
1. Метод нейронных сетей показал хорошие результаты при анализе тональности текстовых данных. Точность определения тональности русскоязычных текстов с использованием спецсимволов составила более 95%. Без использования спецсимволов 76%, что также является хорошим результатом по сравнению с результатами среднестатистического человека, точность определения которого составляет 70%.
2. Методы получения информации из социальных сетей показали свою применимость в этой области. Средство Selenium совместно с VKApi позволили за приемлемое время получать текстовые данные из социальной сети ВКонтакте по выбранным критериям.
3. Была реализована программа на языке программирования Python в виде встраиваемого модуля, позволяющая получать текстовую информацию из социальной сети ВКонтакте, сохранять их в Excel - файл, анализировать полученные данные с помощью обученной нейронной сети.
Кроме текстовой информации в социальных сетях содержится большое количество другой информации (фотографии, видеоматериалы, аудиозаписи и другое). Анализ такого рода информации представляется сложной, но решаемой задачей. В дальнейшем предполагается также рассмотреть задачу более сложной и тонкой классификации мнений (не только на позитивные и негативные).



1. “Анализ социальных сетей: методы и приложения” А. Коршунов.
2. “Sentimental analysis” Александр Пак. (https://habrahabr.ru/post/149605/)
3. “Что такое Selenium?” Алексей Баранцев. (https://habrahabr.ru/post/152653/)
4. Stefano Baccianella Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining (англ.) // Proceedings of LREC : конференция. — 2010. — P. 2200-2204.
5. Анна Пазельская, Алексей Соловьев. Метод определения эмоций в текстах на русском языке // The international conference on computational linguistics and intellectual technologies “Dialogue 2011” : конференция. — Москва, 2011. — С. 510 - 522.
6. М. В. Клековкина, Е.В. Котельников Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики (рус.) // RCDL-2012, Переславль-Залесский, Россия : конференция. — 2012.
7. “Автоматический анализ тональности текстов на основе методов машинного обучения” Котельников Е. В., Клековкина М. В. — 2011.
8. Sebastiani F. (2002), Machine learning in automated text categorization ACM Computing Surveys, Vol. 34, no. 1, pp. 1-47.
9. Lewis D. D. Naive (Bayes) at forty: The independence assumption in information retrieval. Proceedings of 10th European Conference on Machine Learning, Chemnitz, Germany, 1998, pp. 4-15.
10. Субботин С. В., Большаков Д. Ю. Применение байесовского классификатора для распознавания классов целей. // «Журнал Радиоэлектроники», 2006, № 4 (available online)
11. Diederik P. Kingma, Jimmy Ba. Adam: “A Method for Stochastic Optimization”
12. Рубцова Ю. В. Разработка и исследование предметно независимого классификатора текстов по тональности //Труды СПИИРАН. - 2014. - Т. 5. - №. 36. - С. 59-77.
13. ‘ ‘Рекуррентные нейронные сети в задаче анализа тональности текста”Джанелидзе Г. М.
14. “Смайл!” сайт: http://itc.ua/articles/smajl_-_jemocii_v_tekste_13123/
15. DCA(Data-Centric Alliance company
(https://habrahabr.ru/company/dca/blog/274027/)
16. ‘ ‘Правильный подход к использованию API Вконтакте” Павел Савинов (https: //habrahabr.ru/post/221949/)
17. ‘ ‘Learning Recurrent Neural Networks with Hessian-Free Optimization” James Martens, Ilya Sutskever (http://www.icml- 2011.org/papers/532_icmlpaper.pdf)


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ