Тип работы:
Предмет:
Язык работы:


ПОСТРОЕНИЕ ГРАФА ИНТЕРЕСОВ ПОЛЬЗОВАТЕЛЕЙ НА ОСНОВЕ МОБИЛЬНОГО ПРИЛОЖЕНИЯ SAZAN

Работа №55128

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы54
Год сдачи2017
Стоимость4760 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
438
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 6
1. МОБИЛЬНОЕ ПРИЛОЖЕНИЕ SAZAN 9
1.1 Главная страница приложения 9
1.2 Доступные тесты в приложении 10
1.3 Отправка данных 12
1.4 Неразглашение конфиденциальной информации 13
2. СБОР ДАННЫХ, НЕОБХОДИМЫХ ДЛЯ ИССЛЕДОВАНИЯ 15
2.1 Сбор данных 15
2.2 Бесплатные каналы продвижения: 15
2.3 Платные каналы продвижения 17
3. ПОЛУЧЕНИЕ КЛАСТЕРИЗАЦИИ САЙТОВ 19
3.1 Исходные данные 19
3.2 Перекодирование данных 19
3.3 Алгоритм кластеризации 21
4. ФАКТОРНЫЙ АНАЛИЗ ИНТЕРЕСОВ ПОЛЬЗОВАТЕЛЕЙ 28
5. ПОСТРОЕНИЕ ГРАФА ИНТЕРЕСОВ ПОЛЬЗОВАТЕЛЕЙ 41
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 47
ПРИЛОЖЕНИЕ


Айзенка тест (англ. Intelligencetest) - это тесты, которые предназначены для для определения уровня интеллектуального развития человека и выявления особенностей их интеллекта. Известно восемь различных вариантов данного теста. Первые пять тестов схожи между собой и дают общую оценку интеллекта человека при условии, что проходящий данный тест человек будет следовать всем инструкциям и условиям. Также существуют три специальных теста: числовой, зрительно-пространственный и словесный. Данные тесты направлены на выявление специфических особенностей, которые невозможно определить с помощью обычных тестов.
Вершина графа- это элемент (точка) графа, который обозначает объект любой природы, входящий в множество объектов, описываемое графом.
Взвешенный граф- это граф, у которого каждому ребру поставлено какое-то значение
Граф интересов— это представление интересов конкретного человека, полученное на основе его активности в сети Интернет.
Иерархическая кластеризация (графовые алгоритмы кластеризации) - это совокупность алгоритмов упорядочивания данных, визуализация которых представляется в виде графов.
Индикатор типов личности Майер-Бриггс- это такая методика по выявлению типов руководителей, которая была построена на основе Юнговской классификации типов личности. Данный индикатор разделяет людей на 16 типов. Для каждого человека существует только один способ поведения внутри каждой категории, который ему использовать легче, чем другой, т.е. человек одну функцию «предпочитает» другой. Данная комбинация «предпочтений» определяет психологический тип. Эти предпочтения стали основой теории психологического типа личности MBTI. Данные комбинации формируют 16 психологических типов.
Кластеризация (или кластерный анализ)— это метод поиска закономерностей, предназначенный для разбиения совокупности объектов на однородные группы (кластеры) или поиска существующих структур в данных.
Кластер (англ. cluster — скопление, кисть, рой) — это объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами.
Критерий хи-квадрат —это любая статистическая проверка гипотезы, в которой выборочное распределение критерия имеет распределение хи- квадрат при условии верности нулевой гипотезы.
Нейротизм - это такая черта личности человека, проявляющаяся в беспокойстве и отличающаяся повышенной тревожностью, эмоциональной неустойчивостью. Выражает особенности нервной системы: лабильность и реактивность
Ориентированный граф- это граф, у которых есть направление.
Психизм - это термин, обозначающий то, что душа есть нечто отвлеченное и чисто духовное. На сегодняшний день данный термин используется в любом виде ментальных феноменов, например, медиумизму и более высокому сенситивизму, гипнотической восприимчивости и вдохновенному прорицанию.
Психологический портрет личности - это комплексная психологическая характеристика человека, содержащая в себе полную характеристику человека и возможных поступков в определенных ситуациях. Психологический портрет - это не график, который описывает соотношение баллов по разным факторам, а текстовая интерпретация соотношения этих баллов.
Ребро графа- линия, которая соединяет вершины графа.
Факторный анализ - это методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя. Факторы в результате анализа получают количественную и качественную оценку. Каждый показатель может в свою очередь выступать и в 4
роли факторного, и результативного. Это методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя.
Хеш код (англ. Hashcode)- это результат преобразований входного массива данных произвольной длины в выходную битовую строку фиксированной длины.
Экстравертизм - это поведенческий тип, характеризующий человека как энергичного, для восстановления сил которого требуется побыть в окружении людей. Данный тип людей можно описать следующими словами: звонкость, говорливость, энергичность, природная живость и высокий уровень коммуникативных навыков.Для них присущи такие качества, как постоянная активность, быть в толпе, лидерство, спонтанность. Противоположный тип экстравертизму - интровертизм.
GPS (GlobalPositioningSystem - система глобального
позиционирования) - это навигационная система, которая состоит из 24 спутников, работающих в одной единой сети и находящаяся на 6 орбитах. Одним из важнейших преимуществ является всепогодность. Сигнал ОРЗ-спутника содержит «псевдослучайный код», эфимерис и альманах. Псевдослучайный код служит для идентификации передающего спутника. Он пронумерован от 1 до 32. Количество псевдослучайного кода-номеров больше, чем количество спутников, потому что это облегчает работу всей системы. Новый спутник может уже введен в работу до того, как старый выйдет из строя. Данные эфимериса содержат такую важную информацию, как состояние спутника (рабочее или нерабочее), текущая дата и время. Данные альманаха говорят о том, где в течение дня должны находиться все GPS-спутники.
MAC-адрес (англ. Media Access Control — управление доступом к среде, адрес) - этоуникальный идентификатор сетевого интерфейса для
реализации коммуникации устройств в сети на физическом уровне.
ВВЕДЕНИЕ
Сегодня Интернет, или Глобальная сеть, представляет собой способ передачи данных, а также является одним из важнейших инструментов ориентации человека в мире, позволяет ему соответствовать постоянно ускоряющемуся темпу жизни. На сегодняшний день в Сети можно найти полезную информацию, спутника по жизни, попутчика для путешествий во время отпуска, совершить покупки, работать, наладить деловые контакты, найти собеседника по интересам и т.д. Интернет - это не только новый канал связи, но и новая социокультурная среда, накладывающая отпечаток на все стороны общения, включая и язык, являющийся основным средством общения, орудием выражения мыслей и чувств.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе работы над данным исследованием получены следующие результаты:
• Была получена кластеризация множества пользователей из нескольких групп в зависимости от их демографических признаков, таких как возраст, профессиональный статус и т.д., а также сайты, которые они посетили. Для решения данной задачи был применен алгоритм иерархической кластеризации с евклидовым расстоянием. В конечном итоге было получено представление так называемых связей между социальным статусом пользователей и их предпочтений на интернет-сайтах.
• Была проведена проверка независимости атрибутов категорий данных и сайтов. Для этой цели был использован хи-квадрат тест, если найденные признаки являются качественными.
• На основе полученных данных и кластеров был построен граф интересов пользователей.
Граф интересов описывает систему, состоящую из людей, интересов и связей между ними. Своё место он найдет в применении точного и корректного построения психологического портрета личности человека, а также в области маркетинга.



1. Максим Каракулов. Граф интересов (Interest graph): новый принцип
взаимодействия в сети [Электронный ресурс] -
https://geektimes.ru/post/129488/, 2011
2. Оре О. Теория графов // Либроком. 2009. 354с
3. Приложение SAZANCRR[Электронный ресурс] -
https://play.google.com/store/apps/details?id=com.srr.Sazan&hl=ru, 2013
4. Примеры использования графов для ведения сообществ [Электронный ресурс] - http://www.cossa.ru/155/46216/, 2013
5. Теория графов и социальные сети [Электронный ресурс] -
https: //medium.com/eggheado-science/778c92d20cea# .29i8u6fj a, 2014
6. Сутурин Г.С. Формирование сообществ на основе граф-интересов //
Современные исследования социальных проблем, Общество с ограниченной ответственностью «Научно-инновационныйцентр»
(Красноярск), 2013 // Сборникматериаловконференции, 2013. - 214-218
7. Akaike, H. Information theory and an extension of the maximum likelihood principle, in Petrov, B.N.; Cski, F. // 2nd International Symposium on Information Theory // Tsahkadsor, Armenia, USSR, September 2-8, 1971, Budapest: Akadmiai Kiad. P. 267-281.
8. Martin Szomszor, Harith Alani, Ivan Cantador, Kieron O’Hara, Nigel Shadbolt. Semantic Modelling of User Interests Based on Cross-Folksonomy Analysis // ISWC '08 Proceedings of the 7th International Conference on The Semantic Web. 2008. P. 632-648
9. R Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing[Text] // Vienna, Austria. - 2016. https://www.R- pro ject.org/
10. Rokach, Lior, and Oded Maimon. Clustering methods. Data mining and knowledge discovery handbook // Springer US. - 2005
ll.Sloan L., Morgan J., Burnap P., Williams M. Who Tweets? Deriving the Demographic Characteristics of Age, Occupation and Social Class from Twitter User Meta-Data. //Preis T, ed. PLoS ONE. - 2015. - 10(3).
12.Stattner E., Collard M. Clustering of links and clustering of nodes: Fusion of knowledge in social networks. // Studies in Computational Intelligence. -2017. 665, pp. 255-276.
13. What is the interest graph, and what sites have done the best job of mapping it?
[Электронныйресурс] -https://www.quora.com/What-is-the-interest-graph-
and-what-sites-have-done-the-best-job-of-mapping-it, 2013
14. Zamfir V. The effects of unemployment on social issues and health matters // Review of Economic Studies and Research Virgil Madgearu 01. - 2017. pp. 125-144.
15. Zhang Y., Xu G., Zhou X. A Latent Usage Approach for Clustering Web Transaction and Building User Profile. // Advanced Data Mining and Applications: First International Conference, ADMA 2005, Wuhan, China. - July 22-24, 2005. Proceedings, pp 31-42.
16. Zhao H. and He C. Objective Cluster Analysis in Value-Based Customer Segmentation Method // 2009 Second International Workshop on Knowledge Discovery and Data Mining, Moscow. - 2009, pp. 484-487.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ