Тема: Разработка информационной системы для анализа поисковых запросов в социальных сетях
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1 Обзор технологий text mining 7
1.1 Области применения технологий анализа текстовых данных 7
1.2 Моделирование процесса определение интересов пользователя .. 12
Глава 2 Проектирование системы для анализа поисковых запросов в социальных сетях 16
2.1 Алгоритм анализа поисковых запросов 16
2.2 Детализация алгоритма анализа текстовых данных поисковых
запросов 20
Глава 3 Разработка приложения для анализа поисковых запросов 23
3.1 Особенности реализации программного модуля 23
3.2. Результаты тестирования приложения 34
Заключение 37
Список используемой литературы и используемых источников 39
📖 Введение
В данной бакалаврской работе разрабатывается система определения интересующих пользователя тем на основе анализа его текстовых запросов в социальных сетях с использованием технологий text mining [8].
Актуальность выбранной темы исследования обусловлена в первую очередь ростом популярности социальных сетей. Так по официальным данным социальной сети Вконтакте ее ежедневно посещают около 52% российских интернет-пользователей [4]. Одновременно с этим доход социальных сетей, связанный с рекламой, зависит в количества времени, проведенном в них пользователями. Для удержания внимания пользователей социальной сети необходимо понимать интересы каждого пользователя и рекомендовать для просмотра тот контент, который ему будет интересен.
Источником информации об интересах пользователя может являться как данные, указанные им в анкете (город проживания, увлечения и т.д.), так и статистическая информация о просмотренных им страницах в социальных сетях (тематические публики и группы).
В рамках данного исследования предложено расширить список источников информации об интересах пользователя и добавить туда данные, полученные в ходе анализа поисковых запросов пользователя.
Проблема использования поисковых запросов для определения интересов пользователя заключается в том, что обычно задаются в произвольной форме в текстовом виде. Для извлечения требуемых данных из текста необходимо применение технологий text mining [7].
Цель выпускной квалификационной работы - разработка информационной системы анализа поисковых запросов в социальных сетях для определения для определения интересов пользователя.
Для достижения данной цели необходимо выполнить следующие задачи:
- моделирование процесса определения интересов пользователя;
- проектирование системы для анализа поисковых запросов в социальных сетях;
- реализация и тестирование системы поисковых запросов.
Методы исследования - технологии текстовых данных (text mining), технологии проектирования информационных систем, технологии программирования.
Практическая значимость бакалаврской работы заключается в разработке программного продукта для оценки интересов пользователя на основе анализа его поисковых запросов, представленных в текстовом виде.
Данная работа состоит из введения, трех глав, заключения, списка используемой литературы и приложений.
В первой главе приводится описание исследований в области text mining, раскрывается проблема удержания внимания пользователей социальных сетей, а также моделируется процесс определения интересов пользователей в нотации IDEF0.
Вторая глава посвящена проектированию системы для анализа поисковых запросов в социальных сетях. В этой главе раскрывается схема функционирования разрабатываемого программного обеспечения и описывается алгоритм анализа текстовых данных.
В третьей главе представлен процесс разработки программного обеспечения. Также здесь приведены результаты тестирования программного модуля на собственных поисковых запросах.
В заключении описываются результаты выполнения выпускной квалификационной работы.
В ходе выполнения бакалаврской работы на языке программирования python разработано приложение, реализующее следующий функционал по анализу текстовых поисковых запросов: загрузка и обзор данных о поисковых запросах, предварительная обработка текстовых запросов, очистка текстовой информации от стоп-слов, трансформация слов в основную форму, частотный анализ слов и визуализация наиболее часто используемых слов в запросах в виде облака.
Разработанное программное обеспечение протестировано на реальных текстовых поисковых запросах.
Бакалаврская работа состоит из 41 страниц текста, 26 рисунков, и 20 источников.
✅ Заключение
- в ходе анализа литературных данных установлено, что одной важных задач для компаний, владеющих сервисами социальных сетей, является удержание пользователей на своих площадках;
- для удержания внимания пользователей сервисам необходимо уметь определять интересы пользователей с целью предоставления интересующего их контента;
- в рамках бакалаврской работы предложено производить определение интересов пользователя на основе их текстовых поисковых запросов, которые предлагается анализировать с помощью технологий text mining;
- анализ литературных источников показал, что основными этапами text mining является: сбор данных, парсинг текста, фильтрация текста, преобразование пространства признаков и анализ данных.
- с использованием методологии IDEF0 проведено функциональное моделирование процесса «Определение интересов пользователя» в ходе которого определена составные элементы процесс и роль разрабатываемой информационной системы;
- предложена схема работы программного обеспечения, которая включает в себя: информации об активности пользователя в социальной сети, формирование списка поисковых запросов пользователя, определение интересующих пользователя тем на основе частотного анализа текста запросов;
- предложен алгоритм анализа текстовых данных поисковых запросов для определения, интересующих пользователя, тем, который включает в себя: загрузку поисковых запросов из текстового файла, токенизацию текста запросов, удаление стоп-стоп слов, частотный анализ токенов, построение графика популярности слов, построение облака слов.
- на языке программирования python разработано приложение, реализующее следующий функционал по анализу текстовых поисковых запросов: загрузка и обзор данных о поисковых запросах, предварительная обработка текстовых запросов, очистка текстовой информации от стоп-слов, трансформация слов в основную форму, частотный анализ слов и визуализация наиболее часто используемых слов в запросах в виде облака.
- разработанное программное обеспечение протестировано на текстовых поисковых запросах, полученный результаты подтверждают работоспособность созданного приложения.



