📄Работа №216426

Тема: Разработка информационной системы для анализа поисковых запросов в социальных сетях

📝
Тип работы Бакалаврская работа
📚
Предмет информатика и вычислительная техника
📄
Объем: 41 листов
📅
Год: 2022
👁️
Просмотров: 0
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Введение 4
Глава 1 Обзор технологий text mining 7
1.1 Области применения технологий анализа текстовых данных 7
1.2 Моделирование процесса определение интересов пользователя .. 12
Глава 2 Проектирование системы для анализа поисковых запросов в социальных сетях 16
2.1 Алгоритм анализа поисковых запросов 16
2.2 Детализация алгоритма анализа текстовых данных поисковых
запросов 20
Глава 3 Разработка приложения для анализа поисковых запросов 23
3.1 Особенности реализации программного модуля 23
3.2. Результаты тестирования приложения 34
Заключение 37
Список используемой литературы и используемых источников 39

📖 Введение

Развитие технологий text mining связано с необходимостью анализа и понимания естественных языков. В настоящее время text mining применяется при создании чат-бот, инкассировании текстовых документов, анализе эмоциональной составляющей текста, определения ключевой темы текста и при решении других задач [1], [5].
В данной бакалаврской работе разрабатывается система определения интересующих пользователя тем на основе анализа его текстовых запросов в социальных сетях с использованием технологий text mining [8].
Актуальность выбранной темы исследования обусловлена в первую очередь ростом популярности социальных сетей. Так по официальным данным социальной сети Вконтакте ее ежедневно посещают около 52% российских интернет-пользователей [4]. Одновременно с этим доход социальных сетей, связанный с рекламой, зависит в количества времени, проведенном в них пользователями. Для удержания внимания пользователей социальной сети необходимо понимать интересы каждого пользователя и рекомендовать для просмотра тот контент, который ему будет интересен.
Источником информации об интересах пользователя может являться как данные, указанные им в анкете (город проживания, увлечения и т.д.), так и статистическая информация о просмотренных им страницах в социальных сетях (тематические публики и группы).
В рамках данного исследования предложено расширить список источников информации об интересах пользователя и добавить туда данные, полученные в ходе анализа поисковых запросов пользователя.
Проблема использования поисковых запросов для определения интересов пользователя заключается в том, что обычно задаются в произвольной форме в текстовом виде. Для извлечения требуемых данных из текста необходимо применение технологий text mining [7].
Цель выпускной квалификационной работы - разработка информационной системы анализа поисковых запросов в социальных сетях для определения для определения интересов пользователя.
Для достижения данной цели необходимо выполнить следующие задачи:
- моделирование процесса определения интересов пользователя;
- проектирование системы для анализа поисковых запросов в социальных сетях;
- реализация и тестирование системы поисковых запросов.
Методы исследования - технологии текстовых данных (text mining), технологии проектирования информационных систем, технологии программирования.
Практическая значимость бакалаврской работы заключается в разработке программного продукта для оценки интересов пользователя на основе анализа его поисковых запросов, представленных в текстовом виде.
Данная работа состоит из введения, трех глав, заключения, списка используемой литературы и приложений.
В первой главе приводится описание исследований в области text mining, раскрывается проблема удержания внимания пользователей социальных сетей, а также моделируется процесс определения интересов пользователей в нотации IDEF0.
Вторая глава посвящена проектированию системы для анализа поисковых запросов в социальных сетях. В этой главе раскрывается схема функционирования разрабатываемого программного обеспечения и описывается алгоритм анализа текстовых данных.
В третьей главе представлен процесс разработки программного обеспечения. Также здесь приведены результаты тестирования программного модуля на собственных поисковых запросах.
В заключении описываются результаты выполнения выпускной квалификационной работы.
В ходе выполнения бакалаврской работы на языке программирования python разработано приложение, реализующее следующий функционал по анализу текстовых поисковых запросов: загрузка и обзор данных о поисковых запросах, предварительная обработка текстовых запросов, очистка текстовой информации от стоп-слов, трансформация слов в основную форму, частотный анализ слов и визуализация наиболее часто используемых слов в запросах в виде облака.
Разработанное программное обеспечение протестировано на реальных текстовых поисковых запросах.
Бакалаврская работа состоит из 41 страниц текста, 26 рисунков, и 20 источников.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В качестве заключения приведем результаты выполнения бакалаврской работы:
- в ходе анализа литературных данных установлено, что одной важных задач для компаний, владеющих сервисами социальных сетей, является удержание пользователей на своих площадках;
- для удержания внимания пользователей сервисам необходимо уметь определять интересы пользователей с целью предоставления интересующего их контента;
- в рамках бакалаврской работы предложено производить определение интересов пользователя на основе их текстовых поисковых запросов, которые предлагается анализировать с помощью технологий text mining;
- анализ литературных источников показал, что основными этапами text mining является: сбор данных, парсинг текста, фильтрация текста, преобразование пространства признаков и анализ данных.
- с использованием методологии IDEF0 проведено функциональное моделирование процесса «Определение интересов пользователя» в ходе которого определена составные элементы процесс и роль разрабатываемой информационной системы;
- предложена схема работы программного обеспечения, которая включает в себя: информации об активности пользователя в социальной сети, формирование списка поисковых запросов пользователя, определение интересующих пользователя тем на основе частотного анализа текста запросов;
- предложен алгоритм анализа текстовых данных поисковых запросов для определения, интересующих пользователя, тем, который включает в себя: загрузку поисковых запросов из текстового файла, токенизацию текста запросов, удаление стоп-стоп слов, частотный анализ токенов, построение графика популярности слов, построение облака слов.
- на языке программирования python разработано приложение, реализующее следующий функционал по анализу текстовых поисковых запросов: загрузка и обзор данных о поисковых запросах, предварительная обработка текстовых запросов, очистка текстовой информации от стоп-слов, трансформация слов в основную форму, частотный анализ слов и визуализация наиболее часто используемых слов в запросах в виде облака.
- разработанное программное обеспечение протестировано на текстовых поисковых запросах, полученный результаты подтверждают работоспособность созданного приложения.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Агеев М. С. Автоматическая рубрикация текстов: методы и проблемы / М.С. Агеев, Б.В. Доброе, Н.В. Лукашевич // Ученые записки казанского государственного университета, 2008. - №4. - с. 25-41
2. Григорьев Е.А. Разведочный анализ данных с помощью Python /
Григорьев Е.А., Климов Н.С. // E-Scio. 2020. №2 (41). URL:
https://cyberleninka.rU/article/n/razvedochnyy-analiz-dannyh-s-pomoschyu-python(дата обращения: 22.09.2022).
3. Г ришков, Д.Ю. Язык высокого уровня программирования Python /
Гришков Данила Юрьевич, Аусилова Назерке Мырзабековна // HHP/S&R. 2022. №1 (9). URL: https://cyberleninka.ru/article/n/yazyk-vysokogo-urovnya-
programmirovaniya-python (дата обращения: 22.09.2022).
4. Ершов, В.Е. Тенденции развития рекламной деятельности в
социальных сетях / Ершов Вадим Евгеньевич // Вестник евразийской науки. 2015. №5 (30). URL: https://cyberleninka.ru/article/n/tendentsii-razvitiya-
reklamnoy-deyatelnosti-v-sotsialnyh-setyah (дата обращения: 22.09.2022).
5. Корелов, С.В. Предобработка текстов электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков, А.А. Горбунов // Труды учебных заведений связи, 2020. - №4. - с. 80-91
6. Леоненков А. В. Объектно-ориентированный анализ и проектирование с использованием UML и IBM Rational Rose [Электронный ресурс] : учебное пособие. М. : Интернет-Университет Информационных Технологий (ИНТУИТ), Ай Пи Ар Медиа, 2020. 317 c. [Электронный ресурс]. URL: https://www.iprbookshop.ru/97554.html(дата обращения: 06.09.2021).
7. Маннинг, К.Д. Введение в информационный поиск / Г Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце. : Пер. с англ. - М. : ООО “И.Д. Вильямс”, 2014 - 528c.
8. Мкртычев С.В., Гущина О.М., Очеповский А.В. Прикладная информатика. Бакалаврская работа [Электронный ресурс] : электрон. учеб- метод. пособие. Тольятти. ТГУ: Изд-во ТГУ, 2019. 1 оптический диск.
9. Тарасова А.Н. Сентиментальный анализ постов в социальных
сетях посредством Python / Тарасова А.Н., Иванов К.О. // Символ науки. 2022. №3-1. URL: https:ZZcyberleninka.ru/articleZn/sentimentalnyy-analiz-postov-v-
sotsialnyh-setyah-posredstvom-python (дата обращения: 22.09.2022).
10. Чибирова, М.Э. Анализ данных и регрессионное моделирование с
применением языков программирования Python и R / Чибирова Марина Эльбрусовна // Научные записки молодых исследователей. 2019. №2. URL: https:ZZcyberleninka.ru/articleZnZanaliz-dannyh-i-regressionnoe-modelirovanie-s- primeneniem-yazykov-programmirovaniya-python-i-r (дата обращения:
22.09.2022).
11. Amasaki, S. The Effects of Vectorization Methods on Non-Functional Requirements Classification Z Sousuke Amasaki, Pattara Leelaprute ZZ 2018 44th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), 2018. - IEEE, Prague, Czech Republic, 2018. - pp.55-78.
12. Bird, S. Natural Language Processing with Python Z Steven Bird, Ewan Klein, Edward Loper. - Published by O’Reilly Media, Inc., 2009. - 502p.
13. Bugueno, М. Learning to combine classifiers outputs with the transformer for text classification Z Margarita Bugueno, Marcelo Mendoza ZZ Intelligent Data Analysis, 2020 - № 24. - pp. 15-41
14. Business Process Model and Notation [Электронный ресурс]. URL:
https:ZZwww.omg.orgZspecZBPMNZ2.0ZAbout-BPMN/ (дата обращения:
22.08.2021).
15. Gao, G. Research on Routing Selection Algorithm Based on Genetic Algorithm Z Guohong Gao, Baojian Zhang, Xueyong Li, Jinna Lv ZZ International Conference on Intelligent Computing and Information Science - International Conference, ICICIS 2011, Chongqing, China, January 8-9, 2011. Proceedings, Part II: Intelligent Computing and Information Science. - Springer-Verlag Berlin Heidelberg 2011. - pp. 353-358
16. Higuchi, T. Special Section on Nonparametric Approach to T ime Series Analysis / Tomoyuki Higuchi, Genshiro Kitagawa // Annals of the Institute of Statistical Mathematics, 2002. - №54 (169). - Springer Nature Switzerland AG 2002. - pp.101-112
17. Jurafsky, D. Speech and Languge Processing: An Introduction to Natural Language Proccerring, Computation Linguistics and Speech Recognition / Jurafsky, Daniel; H. James, Martin. - Stanford University, 2021. - 613 p.
18. Kowsari, K. Text Classification Algorithms: A Survey / Kamran Kowsari, Kiana Jafari Meimandi, Mojtaba Heidarysafa, Sanjana Mendu, Laura Barnes, Donald Brown // Machine Learning on Scientific Data and Information. - Cornell University, 2019. - pp. 100-168.
19. Srividhya, V. Evaluating Preprocessing Techniques in Text Categorization / V. Srividhya, R. Anitha // International Journal of Computer Science and Application Issue 2010. - pp. 49-51.
20. Sun, C. How to Fine-Tune BERT for Text Classification? / Chi Sun, Xipeng Qiu, Yige Xu, Xuanjing Huang // Computation and Language, 2020. - Cornell University, 2020. - pp. 23-45.

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ