📄Работа №207212

Тема: Разработка приложения для интеллектуального анализа отзывов пользователей магазина приложений Google Play

Характеристики работы

Тип работы Дипломные работы, ВКР
Программирование
Предмет Программирование
📄
Объем: 48 листов
📅
Год: 2020
👁️
Просмотров: 42
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ВВЕДЕНИЕ 5
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Обзор работ по тематике исследования 8
1.2. Особенности магазина приложений Google Play 12
2. ПРОЕКТИРОВАНИЕ 14
2.1. Формальные определения 14
2.2. Требования к системе 16
2.3. Варианты использования системы 16
2.4. Графический интерфейс 18
2.5. Описание модели предметной области 19
3. ПОДХОД К АНАЛИЗУ ОТЗЫВОВ 21
3.1. Извлечение аспектов 22
3.2. Извлечение тональной лексики 24
3.3. Формирование резюме 26
4. РЕАЛИЗАЦИЯ 28
4.1. Компонент базы данных 29
4.2. Компонент управления базой данных 31
4.3. Компонент загрузки отзывов 33
4.4. Компонент извлечения аспектов 34
4.5. Компонент анализа тональности 36
4.6. Компонент графического интерфейса 38
5. ЭКСПЕРИМЕНТЫ 41
ЗАКЛЮЧЕНИЕ 45
ЛИТЕРАТУРА 47

📖 Аннотация

В данной выпускной квалификационной работе представлена разработка программного приложения для автоматизированного интеллектуального анализа пользовательских отзывов из магазина Google Play. Актуальность исследования обусловлена экспоненциальным ростом объема неструктурированных текстовых данных в виде отзывов, что создает значительные сложности как для разработчиков, стремящихся улучшить свои продукты, так и для пользователей, пытающихся составить объективное мнение о приложении среди множества противоречивых оценок. Основным результатом работы является реализованная система, которая автоматически загружает отзывы, выявляет в них частые аспекты (например, "интерфейс", "производительность") с помощью алгоритма Apriori, определяет тональность высказываний по этим аспектам на основе интеграции словарей WordNet-Affect и РуСентиЛекс и формирует структурированное резюме. Научная значимость заключается в адаптации и комбинации методов анализа мнений (opinion mining) и тональности (sentiment analysis) для специфической предметной области русскоязычных отзывов о мобильных приложениях, а практическая — в предоставлении удобного инструмента для автоматизации извлечения инсайтов из массивов пользовательского фидбека. Теоретической основой послужили фундаментальные работы в области data mining, такие как исследование Agrawal и Srikant по алгоритмам поиска ассоциативных правил, труды Hu и Liu по суммированию потребительских отзывов, а также исследования Bobicev et al. по эмоциональным лексиконам и Akoglu et al. по выявлению мошеннических мнений.

📖 Введение

Актуальность темы
В связи с активным развитием социальных сетей, форумов, блогов и других сетевых ресурсов, которые предоставили людям возможность дискутировать, общаться, выражать свое мнение и массово взаимодействовать друг с другом, образовалось большое количество публично доступных неструктурированных текстовых данных. Возможность получить ценную информацию о субъективных суждениях и оценках людей стала причиной большого интереса к исследованиям в области анализа мнений (opinion mining) и анализа тональности текстов (sentiment analysis). Одной из форм выражения мнения является пользовательский отзыв.
Одной из популярных площадок для публикации мобильных приложений является магазин приложений Google Play. Эта площадка предоставляет разработчикам доступ к потенциальной аудитории и снабжена механизмом публикации отзывов, что позволяет пользователям публично делиться своим мнением о приложении. Такая информация является полезной не только для разработчиков, но и для самих пользователей. Существует большое количество приложений со схожей функциональностью, и при выборе пользователи часто руководствуются оценками и отзывами других пользователей. Однако изучение отзывов с целью формирования объективного представления о качестве приложения является непростой задачей, которая может потребовать значительных временных затрат. Причиной этого является многочисленность отзывов, их противоречивость и недостоверность. Все это затрудняет потенциальному пользователю оценку качества приложения и принятие решения о его покупке, установке и использовании.
Данная работа посвящена созданию программной системы, которая осуществляет группировку отзывов по упоминаемым в них аспектам приложения и тональности по отношению ним, с использованием технологий интеллектуального анализа данных. Это позволит потенциальному пользо- 5
вателю выборочно ознакомиться с общим мнением относительно конкретной интересующей его характеристики приложения и сделать более осознанный выбор среди аналогов.
Цель и задачи
Целью данной работы является разработка приложения для интеллектуального анализа отзывов пользователей магазина приложений Google Play.
Для достижения цели работы необходимо решить следующие задачи.
1. Провести обзор работ на тему интеллектуального анализа отзывов потребителей в интернете.
2. Разработать подход к анализу отзывов.
3. Выполнить проектирование архитектуры системы.
4. Реализовать систему.
5. Провести эксперименты, исследующие эффективность предложенного подхода к анализу отзывов.
Структура и объем работы
Работа состоит из введения, 5 разделов, заключения и списка литературы. Объем работы составляет 48 страниц. Объем списка литературы составляет 20 наименований.
Содержание работы
В первом разделе, «Анализ предметной области», содержится обзор работ по тематике исследования и описание особенностей магазина приложений Google Play.
Во втором разделе, «Проектирование», даны формальные определения предметной области, выполнен анализ требований, приведена диаграмма вариантов использования системы, построен макет графического интерфейса и диаграмма сущность-связь.
В третьем разделе, «Подход к анализу отзывов», приведена диаграмма деятельности разработанного подхода, рассмотрены этапы извлечения аспектов, извлечения тональной лексики, формирования резюме, а также составляющие их шаги.
В четвертом разделе, «Реализация», приведена диаграмма компонентов системы, описана реализация каждого компонента, используемые технологии и инструменты.
В пятом разделе, «Эксперименты», описано исследование эффективности предложенного подхода к анализу отзывов и процесс формирования набора данных для экспериментов, построены графики.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В рамках данной выпускной квалификационной работы было разработано приложение для интеллектуального анализа отзывов пользователей магазина приложений Google Play, которое осуществляет поиск частых аспектов, определение тональности по отношению к ним и формирование резюме.
В ходе работы были выполнены следующие задачи.
1. Проведен обзор работ на тему интеллектуального анализа отзывов потребителей в интернете. Рассмотрены работы по направлениям выявления спам-отзывов, определения полезности отзывов и обобщения отзывов.
2. Разработан подход к анализу отзывов. Подход основан на поиске мнений, которые включают в себя аспект и тональную лексику. Аспекты, о которых пользователи часто высказывались в своих отзывах, извлекались с помощью алгоритма поиска частых наборов Apriori. Полярность тональной лексики определялась по тональному словарю, составленному из переведенного на русский язык лексического ресурса WordNet-Affect и РуСенти- Лекс.
3. Выполнено проектирование архитектуры системы. Проектирование включает в себя описание модели предметной области, выбор модели организации данных, анализ требований и построение диаграммы вариантов использования системы, создание макета графического интерфейса, построение диаграммы компонентов системы.
4. Реализована программная система. Реализованы компоненты базы данных, управления доступом к базе данных, загрузки отзывов, извлечения аспектов, анализа тональности и графического интерфейса. Загрузка отзывов осуществляется с использованием технологии синтаксического разбора веб-страниц и инструмента для автоматизации действий браузера Selenium. Для обработки отзывов использовались пакеты nltk и pymorphy2. В качестве СУБД использовалась MongoDB. Графический интерфейс реализован на основе пакета PyQt5.
5. Проведены эксперименты, исследующие эффективность предложенного подхода к анализу отзывов. Был сформирован и вручную размечен набор данных из 500 отзывов. Проведена оценка точности и полноты определения тональности по отношению к аспектам при различных значениях минимальной поддержки.
Исходные коды компонентов системы, разработанной в рамках работы, свободно доступны в сети Интернет по адресу: https://github.com/ShumilinPavel/diploma
Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Agrawal R., Srikant R. Fast Algorithms for Mining Association Rules // Proceedings of the 20th International Conference on Very Large Data Bases. 1994. C. 487-499.
2. Akoglu L., Chandy R., Faloutsos C. Opinion fraud detection in online reviews by network effects // Seventh international AAAI conference on weblogs and social media. 2013.
3. Bobicev V. [и др.]. Emotions in words: Developing a multilingual wordnet-affect // International Conference on Intelligent Text Processing and Computational Linguistics. 2010. C. 375-384.
4. Feng S. [и др.]. Recommended or not recommended? Review classification through opinion extraction // 12th International Asia-Pacific Web Conference. 2010. C. 350-352.
5. Hu M., Liu B. Mining and summarizing customer reviews // Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004. C. 168-177.
6. Hu M., Liu B. Mining Opinion Features in Customer Reviews // AAAI. 2004. № 4 (4). C. 755-760.
7. Kim S.-M. [и др.]. Automatically assessing review helpfulness // Proceedings of the 2006 Conference on empirical methods in natural language processing. 2006. C. 423-430.
8. Loukachevitch N., Levchik A. Creating a general russian sentiment lexicon // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16). 2016. C. 1171-1176.
9. Maharani W., Widyantoro D.H., Khodra M.L. Aspect-based opinion summarization: a survey // Journal of Theoretical and Applied Information Technology. 2017. № 2 (31).
10. Miller G.A. WordNet: An electronic lexical database / G.A. Miller, MIT press, 1998.
11. Ott M. [и др.]. Finding deceptive opinion spam by any stretch of the imagination // ACL-HLT 2011 - Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. 2011. (1). C. 309-319.
12. Popescu A.-M., Etzioni O. Extracting product features and opinions from reviews // Natural language processing and text mining. 2007. C. 9-28.
13. Savage D. [и др.]. Detection of opinion spam based on anomalous rating deviation // Expert Systems with Applications. 2015. № 22 (42). C. 86508657.
14. Sharma K., Lin K.-I. Review spam detector with rating consistency check // Proceedings of the 51st ACM southeast conference. 2013. C. 1-6.
15. Strapparava C., Valitutti A. WordNet-Affect: An affective extension of WordNet // Proceedings of the 4th International Conference on Language Resources and Evaluation, LREC 2004. 2004. № January 2004. C. 1083-1086.
..20

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ