Введение 4
1.1. Рекомендательные системы 4
1.2. Измерение результатов 6
2. Постановка задачи 8
3. Обзор рекомендательных систем 9
3.1. Контентно-ориентированные 9
3.2. Коллаборативные 9
3.3. Гибридные 10
4. Коллаборативный подход 11
4.1. Алгоритм 11
4.2. Инструменты 12
4.3. Реализация 12
5. Контентно-ориентированный подход 14
5.1. Алгоритм 14
5.2. Реализация 15
6. Гибридный подход 16
7. Измерение результатов 17
7.1. Описание методов 17
7.2. Распределение данных 17
7.3. Пользователи с двумя конференциями 18
7.4. Пользователи, у которых больше двух конференций ... 19
7.5. Гибридный алгоритм 22
Заключение 27
Список литературы
Ученые во время проведения своих исследований сталкиваются с проблемой поиска научных конференций для нахождения релевантных статей и публикации собственных исследований. При этом количество статей, конференций и публикаций постоянно растет. Решением этой проблемы может выступать рекомендательная система, которая для конкретного исследователя будет рекомендовать релевантные для него конференции.
• Была реализован гибридный рекомендательный алгоритм, состоящий из коллаборативного и контентно-ориентированного подхода.
• Было проведено тестирование с использование метрик precision и recall. По результатам тестирования гибридная модель превзошла коллаборативную. При этом лучший прирост она показала для пользователей с небольшим числом конференций.
• Итоговая формула для гибридной системы : гь = 0.8 * rcf+0.2 * rcb
• Код работы доступен по адресу : [8]
[1] Combining content-based and collaborative filters in an online newspaper / Mark Claypool, Anuja Gokhale, Tim Miranda et al. // Proceedings of ACM SIGIR workshop on recommender systems / Citeseer. — Vol. 60. — 1999.
[2] DBLP. — 2016. — May. — URL: http://dblp.uni-trier.de/.
[3] Ho Yvonne, Fong Simon, Yan Zhuang. A Hybrid GA-based Collaborative Filtering Model for Online Recommenders // ICE- B 2007 - Proceedings of the International Conference on e¬Business, Barcelona, Spain, July 28-31, 2007, ICE-B is part of ICETE - The International Joint Conference on e-Business and Telecommunications. — 2007. — P. 200-203.
[4] Lang Ken. NewsWeeder: Learning to Filter Netnews // Machine Learning, Proceedings of the Twelfth International Conference on Machine Learning, Tahoe City, California, USA, July 9-12, 1995.— 1995. — P. 331-339.
[5] Linden Greg, Smith Brent, York Jeremy. Amazon.com Recommendations: Item-to-Item Collaborative Filtering // IEEEInternet Computing.— 2003.— Vol. 7, no. 1.— P. 76-80.— URL: http://dx.doi.org/10.1109/MIC.2003.1167344.
[6] Lops Pasquale, de Gemmis Marco, Semeraro Giovanni. Content-basedRecommender Systems: State of the Art and Trends // Recommender Systems Handbook.— 2011.— P. 73-105.— URL: http://dx.doi.org/10.1007/978-0-387-85820-3_3.
[7] Mooney Raymond J., Roy Loriene. Content-based book recommendingusing learning for text categorization// ACM DL. — 2000. — P. 195¬204. — URL: http://doi.acm.org/10.1145/336597.336662.
[8] Pesults.— 2016. — May.— URL: https://github.com/
Ershov-Alexander/rec_sys_for_sci_conf.
[9] Pytables. — 2016. — May. — URL: http://www.pytables.org/.
[10] Roh Tae Hyup, Oh Kyong Joo, Han Ingoo. The collaborative filtering recommendation based on SOM cluster-indexing CBR //Expert Syst.Appl. — 2003. — Vol. 25, no. 3. — P. 413-423. — URL: http://dx.doi.org/10.1016/S0957-4174(03)00067-8.
[11] Science Concierge: A fast content-based recommendation system for scientific publications / Titipat Achakulvisut, Daniel E Acuna, Tulakan Ruangrong, Konrad Kording // arXiv preprint arXiv:1604.01070. - 2016.
[12] Scikit-learn. — 2016.--May. — URL: http://scikit-learn.org/stable/.
[13] Scipy. -- 2016. -- May. -- URL: https://www.scipy.org/.
[14] Scipy sparse matrix. -- 2016. -- May. -- URL: http://docs.scipy.org/doc/scipy/reference/sparse.html.
[15] Shani Guy, Gunawardana Asela. Evaluating RecommendationSystems // Recommender Systems Handbook.-- 2011.-- P. 257¬297. — URL: http://dx.doi.org/10.1007/978-0-387-85820-3_8.
[16] Smyth Barry, Cotter Paul. A personalized television listings service // Communications of the ACM. — 2000. — Vol. 43, no. 8. — P. 107-111.
[17] Ungar Lyle H, Foster Dean P. Clustering methods for collaborative filtering // AAAI workshop on recommendation systems.— Vol. 1.—
1998. --P. 114-129.
[18] Vozalis Manolis G., Margaritis Konstantinos G. Using SVD and demographic data for the enhancement of generalized Collaborative Filtering // Inf. Sci. -- 2007. -- Vol. 177, no. 15. -- P. 3017-3037. -¬URL: http://dx.doi.org/10.1016/j.ins.2007.02.036.
[19] numpy. — 2016. — May. — URL: http://www.numpy.org/.