🔍 Поиск работ

Разработка приложения для интеллектуального анализа отзывов пользователей магазина приложений Google Play

Работа №207212

Тип работы

Дипломные работы, ВКР

Предмет

программирование

Объем работы48
Год сдачи2020
Стоимость4480 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
13
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Обзор работ по тематике исследования 8
1.2. Особенности магазина приложений Google Play 12
2. ПРОЕКТИРОВАНИЕ 14
2.1. Формальные определения 14
2.2. Требования к системе 16
2.3. Варианты использования системы 16
2.4. Графический интерфейс 18
2.5. Описание модели предметной области 19
3. ПОДХОД К АНАЛИЗУ ОТЗЫВОВ 21
3.1. Извлечение аспектов 22
3.2. Извлечение тональной лексики 24
3.3. Формирование резюме 26
4. РЕАЛИЗАЦИЯ 28
4.1. Компонент базы данных 29
4.2. Компонент управления базой данных 31
4.3. Компонент загрузки отзывов 33
4.4. Компонент извлечения аспектов 34
4.5. Компонент анализа тональности 36
4.6. Компонент графического интерфейса 38
5. ЭКСПЕРИМЕНТЫ 41
ЗАКЛЮЧЕНИЕ 45
ЛИТЕРАТУРА 47

Актуальность темы
В связи с активным развитием социальных сетей, форумов, блогов и других сетевых ресурсов, которые предоставили людям возможность дискутировать, общаться, выражать свое мнение и массово взаимодействовать друг с другом, образовалось большое количество публично доступных неструктурированных текстовых данных. Возможность получить ценную информацию о субъективных суждениях и оценках людей стала причиной большого интереса к исследованиям в области анализа мнений (opinion mining) и анализа тональности текстов (sentiment analysis). Одной из форм выражения мнения является пользовательский отзыв.
Одной из популярных площадок для публикации мобильных приложений является магазин приложений Google Play. Эта площадка предоставляет разработчикам доступ к потенциальной аудитории и снабжена механизмом публикации отзывов, что позволяет пользователям публично делиться своим мнением о приложении. Такая информация является полезной не только для разработчиков, но и для самих пользователей. Существует большое количество приложений со схожей функциональностью, и при выборе пользователи часто руководствуются оценками и отзывами других пользователей. Однако изучение отзывов с целью формирования объективного представления о качестве приложения является непростой задачей, которая может потребовать значительных временных затрат. Причиной этого является многочисленность отзывов, их противоречивость и недостоверность. Все это затрудняет потенциальному пользователю оценку качества приложения и принятие решения о его покупке, установке и использовании.
Данная работа посвящена созданию программной системы, которая осуществляет группировку отзывов по упоминаемым в них аспектам приложения и тональности по отношению ним, с использованием технологий интеллектуального анализа данных. Это позволит потенциальному пользо- 5
вателю выборочно ознакомиться с общим мнением относительно конкретной интересующей его характеристики приложения и сделать более осознанный выбор среди аналогов.
Цель и задачи
Целью данной работы является разработка приложения для интеллектуального анализа отзывов пользователей магазина приложений Google Play.
Для достижения цели работы необходимо решить следующие задачи.
1. Провести обзор работ на тему интеллектуального анализа отзывов потребителей в интернете.
2. Разработать подход к анализу отзывов.
3. Выполнить проектирование архитектуры системы.
4. Реализовать систему.
5. Провести эксперименты, исследующие эффективность предложенного подхода к анализу отзывов.
Структура и объем работы
Работа состоит из введения, 5 разделов, заключения и списка литературы. Объем работы составляет 48 страниц. Объем списка литературы составляет 20 наименований.
Содержание работы
В первом разделе, «Анализ предметной области», содержится обзор работ по тематике исследования и описание особенностей магазина приложений Google Play.
Во втором разделе, «Проектирование», даны формальные определения предметной области, выполнен анализ требований, приведена диаграмма вариантов использования системы, построен макет графического интерфейса и диаграмма сущность-связь.
В третьем разделе, «Подход к анализу отзывов», приведена диаграмма деятельности разработанного подхода, рассмотрены этапы извлечения аспектов, извлечения тональной лексики, формирования резюме, а также составляющие их шаги.
В четвертом разделе, «Реализация», приведена диаграмма компонентов системы, описана реализация каждого компонента, используемые технологии и инструменты.
В пятом разделе, «Эксперименты», описано исследование эффективности предложенного подхода к анализу отзывов и процесс формирования набора данных для экспериментов, построены графики.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной выпускной квалификационной работы было разработано приложение для интеллектуального анализа отзывов пользователей магазина приложений Google Play, которое осуществляет поиск частых аспектов, определение тональности по отношению к ним и формирование резюме.
В ходе работы были выполнены следующие задачи.
1. Проведен обзор работ на тему интеллектуального анализа отзывов потребителей в интернете. Рассмотрены работы по направлениям выявления спам-отзывов, определения полезности отзывов и обобщения отзывов.
2. Разработан подход к анализу отзывов. Подход основан на поиске мнений, которые включают в себя аспект и тональную лексику. Аспекты, о которых пользователи часто высказывались в своих отзывах, извлекались с помощью алгоритма поиска частых наборов Apriori. Полярность тональной лексики определялась по тональному словарю, составленному из переведенного на русский язык лексического ресурса WordNet-Affect и РуСенти- Лекс.
3. Выполнено проектирование архитектуры системы. Проектирование включает в себя описание модели предметной области, выбор модели организации данных, анализ требований и построение диаграммы вариантов использования системы, создание макета графического интерфейса, построение диаграммы компонентов системы.
4. Реализована программная система. Реализованы компоненты базы данных, управления доступом к базе данных, загрузки отзывов, извлечения аспектов, анализа тональности и графического интерфейса. Загрузка отзывов осуществляется с использованием технологии синтаксического разбора веб-страниц и инструмента для автоматизации действий браузера Selenium. Для обработки отзывов использовались пакеты nltk и pymorphy2. В качестве СУБД использовалась MongoDB. Графический интерфейс реализован на основе пакета PyQt5.
5. Проведены эксперименты, исследующие эффективность предложенного подхода к анализу отзывов. Был сформирован и вручную размечен набор данных из 500 отзывов. Проведена оценка точности и полноты определения тональности по отношению к аспектам при различных значениях минимальной поддержки.
Исходные коды компонентов системы, разработанной в рамках работы, свободно доступны в сети Интернет по адресу: https://github.com/ShumilinPavel/diploma


1. Agrawal R., Srikant R. Fast Algorithms for Mining Association Rules // Proceedings of the 20th International Conference on Very Large Data Bases. 1994. C. 487-499.
2. Akoglu L., Chandy R., Faloutsos C. Opinion fraud detection in online reviews by network effects // Seventh international AAAI conference on weblogs and social media. 2013.
3. Bobicev V. [и др.]. Emotions in words: Developing a multilingual wordnet-affect // International Conference on Intelligent Text Processing and Computational Linguistics. 2010. C. 375-384.
4. Feng S. [и др.]. Recommended or not recommended? Review classification through opinion extraction // 12th International Asia-Pacific Web Conference. 2010. C. 350-352.
5. Hu M., Liu B. Mining and summarizing customer reviews // Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004. C. 168-177.
6. Hu M., Liu B. Mining Opinion Features in Customer Reviews // AAAI. 2004. № 4 (4). C. 755-760.
7. Kim S.-M. [и др.]. Automatically assessing review helpfulness // Proceedings of the 2006 Conference on empirical methods in natural language processing. 2006. C. 423-430.
8. Loukachevitch N., Levchik A. Creating a general russian sentiment lexicon // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16). 2016. C. 1171-1176.
9. Maharani W., Widyantoro D.H., Khodra M.L. Aspect-based opinion summarization: a survey // Journal of Theoretical and Applied Information Technology. 2017. № 2 (31).
10. Miller G.A. WordNet: An electronic lexical database / G.A. Miller, MIT press, 1998.
11. Ott M. [и др.]. Finding deceptive opinion spam by any stretch of the imagination // ACL-HLT 2011 - Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. 2011. (1). C. 309-319.
12. Popescu A.-M., Etzioni O. Extracting product features and opinions from reviews // Natural language processing and text mining. 2007. C. 9-28.
13. Savage D. [и др.]. Detection of opinion spam based on anomalous rating deviation // Expert Systems with Applications. 2015. № 22 (42). C. 86508657.
14. Sharma K., Lin K.-I. Review spam detector with rating consistency check // Proceedings of the 51st ACM southeast conference. 2013. C. 1-6.
15. Strapparava C., Valitutti A. WordNet-Affect: An affective extension of WordNet // Proceedings of the 4th International Conference on Language Resources and Evaluation, LREC 2004. 2004. № January 2004. C. 1083-1086.
..20


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ