Введение 3
Постановка задачи 5
Актуальность 6
Глава 1. Алгоритмы профилирования пользователей 7
1.1 Метод Хортинга 12
1.2 Кластеризация методами. Байесовские и небайесианские методы 12
1.3 SVM 13
Глава 2. Структура исходных данных 14
2.1 Языковая поддержка 15
2.2 Сравнение структур данных в функциональном и императивном
программировании 16
2.3 Исходные данные приложения Sazan SRR 17
Глава 3. Построение графа интересов 18
3.1 Изображение графов на плоскости 18
3.2 Граф интересов 20
3.3 Социальный граф 23
3.4 Взаимосвязь графа интересов с социальным графом 26
Заключение 32
Используемые источники литературы 33
Приложение
Профили клиентов представляют собой "типы клиентов", которые генерируются для представления типичных пользователей продукта или услуги.
Профили клиентов создаются из понимания типичной аудитории генерируется из исследования клиента, и внимания на различные цели и ситуации, из-за которых клиенты могут взаимодействовать с конкретными веб-сайтами, каталогами и т.д.
Профилирование клиентов следует предпринять, чтобы предоставить информацию и информировать проектную команду о конечных пользователях и / или клиентов, чтобы проектные решения должны были быть сделаны с точки зрения обычного пользователя, или помочь проектной группе в принятии клиентов в центре проектных решений, результатом которого будет продукт или услуга, который лучше отвечает потребностям и ожиданиям клиента, и, следовательно, больше шансов на успех.
Инструмент для определения демографического профиля это использование демографических разделов. Демографические разделы ссылаются на множество продвинутых сегментаций групп пользователей. Структура сегментации определяется через анализ больших массивов данных, где выводы являются специфическими для базового набора инициатив. Получение данных в этом случае происходит на основании активов, использования и определения различных основных ключевых показателей эффективности. Быстрое составление пользовательских демографических данных по цифровым каналам (в частности, социальные медиа) позволило дальнейшее совершенствование прогностического моделирования, предоставляя бизнес-аналитику на растущих рынках, таких как цифровой рекламы и конверсии.
Применение алгоритмов позволяет быстро решать однотипные задачи, сократить время на поиск решения, автоматизировать процесс его нахождения, а также распространять найденное решение в стандартизованной — а значит, понятной всем форме.
Для создания поиска по интересам необходимо создать граф интересов, который является полезным и ценным аспектом, потому что интересы людей являются важной частью их личности, и могут быть использованы в качестве указателей того, что бы они могли посмотреть, сделать, обсудить и другие возможности, о которых они могут не знать.
В результате дипломной работы был создан прототип поиска фильмов по интересам, который показывает возможные варианты фильмов отталкиваясь от предложенных интересов пользователя, что позволяет более точно находить подходящий видеоматериал.
В процессе выполнения дипломной работы были решены следующие задачи:
1) рассмотрены алгоритмы:
• алгоритмы профилирования пользователей:
a) подход основанный на соседстве;
b) подход основанный на модели;
c) гибридный подход;
• алгоритмы демографического профилирования:
a) байесовский метод;
b) SVM.
2) подробно изучена структура исходных данных и граф интересов.
В дальнейшем планируется ввести дополнительную функцию, которая будет помогать в поиске фильмов, распознавая эмоциональное состояние человека.
1. Ширшова Л., Машинное обучение [Электронный ресурс]. -
Режим доступа: http://theasder.github.io/leaming/2014/11/17/the-simplest-
introduction-to-machine-learning.html (Дата обращения 23.03.16), свободный.
2. Гомзин А.Г., Кузнецов С.Д., Методы построения социо- демографических профилей пользователей сети Интернет // Труды института системного программирования РАН, том 27 (выпуск 4), 2015 г. стр. 129-144. DOI: 10.15514/ISPRAS-2015-27(4)-7 [Электронный ресурс]. - Режим доступа: http://www.ispras.ru/proceedings/docs/2015/27/4/isp_27_2015_4_129.pdf (Дата обращения 23.03.16), свободный.
3. Тапехин А.Н., Исследование и разработка гибридных систем рекомендаций музыкальных произведений [Электронный ресурс]. - Режим доступа: http: //seminar. at.ispras. ru/wp-content/uploads/2012/07/tapekhin.pdf (Дата обращения 25.05.16), свободный.
4. Владимир Маслов, Highload-blog о программировнаии и
интернет-бизнесе [Электронный ресурс]. - Режим доступа:
http://web.ritg.ru/blog/rekomendatelnye-sistemy-v-ecommerce/ (Дата обращения 25.05.16), свободный.
5. Телемтаев А.Р., Профилирование пользователей в сети интернет
[Электронный ресурс]. - Режим доступа: http://sci-
article.ru/stat.php?i=1441716281 (Дата обращения 21.03.16), свободный.
6. Метод опорных векторов // «Википедия» свободная
энциклопедия [Электронный ресурс]. - Режим доступа:
https: //ru.wikipedia. org/wiki/Метод_опорных_векторова (Дата обращения
23.03.16), свободный.
7. Gavin Powell (2006) // Chapter 8: Building Fast-Performing Database Models // Beginning Database Design ISBN 978-0-7645-7490-0. Wrox Publishing
[Электронный ресурс]. - Режим доступа:
http://searchsqlserver.techtarget.com/feature/Efficient-indexing-for-performance (Дата обращения 24.05.16), свободный.
8. The GNU C Manual// Free Software Foundation [Электронный ресурс]. - Режим доступа: http://www.freepascal.org/docs-html/ref/ref.html (Дата обращения 24.05.16), свободный.
9. Free Pascal: Reference Guide// Free Pascal [Электронный ресурс]. - Режим доступа: http ://www. gnu. org/software/gnu-c-manual/gnu-c-manual. html (Дата обращения 20.05.16), свободный.
10. Структура данных // «Википедия» свободная энциклопедия
[Электронный ресурс]. - Режим доступа:
https://ru.wikipedia.org/wiki/Структура_данных (Дата обращения 17.04.16), свободный.
11. Mashaghi, A.; et al. (2004) // Investigation of a protein complex
network // European Physical Journal B 41 (1): 113-121 [Электронный ресурс]. - Режим доступа:
http://cogentoa.tandfonline.com/doi/full/10.1080/23311983.2016.1171458 (Дата обращения 02.04.16), свободный.
12. Grandjean // Martin (2016) // A social network analysis of Twitter:
Mapping the digital humanities community // Cogent Arts & Humanities 3 (1): 1171458 [Электронный ресурс]. - Режим доступа:
http://link.springer.com/article/10.1140%2Fepjb%2Fe2004-00301-0 (Дата
обращения 03.04.16), свободный.
13. How the Interest Graph will shape the future of the web
[Электронный ресурс]. - Режим доступа: https://miter.mit.edu/articlehow- interest-graph-will-shape-future-web/ MIT Entrepreneurship Review (Дата
обращения 21.04.16), свободный.
14. Денисова А., Социальный граф [Электронный ресурс]. - Режим доступа: http://www.seonews.ru/analytics/sotsialnyiy-graf/ (Дата обращения 25.05.16), свободный.
15. Facebook: One Social Graph to Rule Them All? // CBS News
[Электронный ресурс]. - Режим доступа:
http://www.cbsnews.com/news/facebook-one-social-graph-to-rule-them-all/ (Дата обращения 22.05.16), свободный.
16. Facebook Unveils Platform for Developers of Social Applications //
Facebook [Электронный ресурс]. - Режим доступа:
https://newsroom.fb.com/#_=_ (Дата обращения 14.05.16), свободный.
17. Каракулов М., Граф интересов (Interest graph): новый принцип взаимодействия в сети [Электронный ресурс]. - Режим доступа: https://geektimes.ru/post/129488/ (Дата обращения 19.05.16), свободный.
18. Социальный граф // Took Took Agency [Электронный ресурс]. - Режим доступа: http://tooktook.agency/blog/socialnyj-graf/ (Дата обращения 25.05.16), свободный.
19. One Graph To Rule Them All? // A VC [Электронный ресурс]. - Режим доступа: http://avc.com/2010/04/one-graph-to-rule-them-all/ (Дата обращения 24.05.16), свободный.
20. Google Launches Social Graph API // InformationWeek
[Электронный ресурс]. - Режим доступа:
http://www.informationweek.com/google-launches-social-graph-api/d/d- id/1064084? (Дата обращения 23.05.16), свободный.
21. Renewing old resolutions for the new year // Official Google Blog
[Электронный ресурс]. - Режим доступа:
https://googleblog.blogspot.ru/2012/01/renewing-old-resolutions-for-new- year.html (Дата обращения 22.05.16), свободный.
22. Barok, Dusan (2011-05-22) // Privatising Privacy: Trojan Horse in Free Open Source Distributed Social Platforms [Электронный ресурс]. - Режим
доступа: https://pzwiki.wdka.nl/mediadesign/Main_Page (Дата обращения
22.05.16), свободный.
23. Graph API // Facebook [Электронный ресурс]. - Режим доступа: https://developers.facebook.com/docs/graph-api (Дата обращения 21.05.16), свободный.
24. Miller, Paul // Radar Networks opens Twine to the world with version
1.0, ZDNet [Электронный ресурс]. - Режим доступа:
http://www.zdnet.com/article/radar-networks-opens-twine-to-the-world-with- version-1-0/ (Дата обращения 21.05.16), свободный.
25. Jamison, Jay // Three Reasons to Watch Interest-Based Social Networks in 2013 // All Things D [Электронный ресурс]. - Режим доступа: http://allthingsd.com/20121228/three-reasons-to-watch-interest-based-social- networks-in-2013/ (Дата обращения 11.05.16), свободный.
26. Firuta, Jakub // How to create an Interest Graph, LiveChat
[Электронный ресурс]. - Режим доступа:
https://www.livechatinc.com/blog/how-to-create-an-interest-graph/ (Дата
обращения 11.05.16), свободный.
27. Harris, Derrick // The personalized web is just an interest graph away
// GIGAOM [Электронный ресурс]. - Режим доступа:
https://gigaom.com/2012/03/15/the-personalized-web-is-just-an-interest-graph- away/ (Дата обращения 15.05.16), свободный.
28. Hossain, Nadim // Why the Interest Graph Is a Marketer’s Best Friend // Mashable [Электронный ресурс]. - Режим доступа: http://mashable.com/2012/06/19/interest-graph-marketer/#LSe3T_RvyuqF (Дата обращения 15.05.16), свободный.
29. Perez, Sarah // Formspring Relaunches As An Interest-Based Social
Network // TechCrunch [Электронный ресурс]. - Режим доступа:
http://techcrunch.com/2012/06/19/formspring-relaunches-as-interest-based-social- network/ (Дата обращения 15.05.16), свободный.
30. Jamison, Jay // Beyond Facebook: The Rise Of Interest-Based Social
Networks // TechCrunch [Электронный ресурс]. - Режим доступа:
http://techcrunch.com/2012/02/18/beyond-facebook-the-rise-of-interest-based- social-networks/ (Дата обращения 20.05.16), свободный.
31. Rashad, Moataz // 5 Key Components of a Successful Interest Graph //
Mashable [Электронный ресурс]. - Режим доступа:
http://mashable.com/2012/02/21/interest-graph/ (Дата обращения 20.05.16), свободный.
32. Rogers, David // The Future of the Social Web: Social Graphs Vs. Interest Graphs // ReadWriteWeb // Boston [Электронный ресурс]. - Режим доступа:
http: //readwrite. com/2011/09/30/the_future_of_the_social_web_social_graphs_vs_ interest_graphs/ (Дата обращения 20.05.16), свободный.
33. Mims, Christopher // Yahoo’s plan for a turnaround: juice its
advertising revenue by reading your mind, Quartz [Электронный ресурс]. - Режим доступа: http://qz.com/18492/yahoos-plan-for-a-turnaround-juice-its-
advertising-revenue-by-reading-your-mind/ (Дата обращения 14.05.16),
свободный.
34. WebProNews Staff // The Era of the Interest Graph: Studying The Top
Starbucks Followers // WebPro [Электронный ресурс]. - Режим доступа: http://www.webpronews.com/the-era-of-the-interest-graph-2011-02 (Дата
обращения 14.05.16), свободный.
35. Perez, Sarah // How Twitter Is Pairing Its Interest Graph With Ads //
TechCrunch [Электронный ресурс]. - Режим доступа:
http://techcrunch. com/2012/03/01/how-twitter-is-pairing-its-interest-graph-with- ads/ (Дата обращения 14.05.16), свободный.
36. Sweeney, Peter // Five Surprising Ways to Use Interest Networks // Primal [Электронный ресурс]. - Режим доступа: https://corp.primal.com/blog/ (Дата обращения 12.05.16), свободный.
37. Shah, Semil // Frequently Asked Questions About Quora //
TechCrunch [Электронный ресурс]. - Режим доступа:
http://techcrunch.com/2011/01/09/frequently-asked-questions-quora/ (Дата
обращения 12.05.16), свободный.
38. O’Dell, Jolie // What the heck is an interest graph? Pearltrees raises
$6.6M to show us // VentureBeat [Электронный ресурс]. - Режим доступа: http://venturebeat.com/2012/02/13/pearltrees-funding-interest-graph/ (Дата
обращения 23.05.16), свободный.
39. Feldstein, Michael // Desire2Learn Mobile Contest Winners // e-Literate [Электронный ресурс]. - Режим доступа:
http://mfeldstein.com/desire2learn-mobile-contest-winners/ (Дата обращения 24.05.16), свободный.
40. Граф интересов // «Википедия» свободная энциклопедия w
[Электронный ресурс]. - Режим доступа:
https://ru.wikipedia.org/wiki/Граф_интересов (Дата обращения 22.05.16), свободный.