Готовая ВКР на тему: Оптимизация инструментария для работы с большими данными в задаче построения рекомендательных систем

Содержание

Введение 3
Постановка задачи 5
Глава 1. Описание процедурах обучения и базовая модель 7
1.1. Оценка качества предложенных моделей 7
1.2. Разбиение исторических данных 9
1.3. Вычислительные ресурсы 10
1.4. Базовая модель 11
1.5. Результаты 12
Глава 2. Алгоритм SVD 13
2.1. Описание модели 13
2.2. Программная реализация 14
2.3. Результаты 15
Глава 3. Полносвязная нейронная сеть и исследование применимости word2vec в задаче рекомендации 16
3.1. Описание модели 16
3.2. Программная реализация 18
3.3. Результаты 19
Глава 4. Ансамблирование моделей 20
4.1. Описание модели 20
4.2. Программная реализация 22
4.3. Результаты 23
Заключение 24
Список литературы 25

Введение

Развитие электронной коммерции и социальных сетей обусловило рост необходимости в качественных системах рекомендации. Рядовой пользователей затруднен в выборе релевантных объектов среди всего обилия предлагаемых товаров и цифрового контента. Кроме того, алгоритмы машинного обучения и анализа данных увеличивают не только удобство пользователя, но также напрямую влияют на выручку компаний. Так, например, 35% покупок крупнейшей компании на рынке электронной коммерции Amazon, а также 75% просмотров видео сервиса Netflix, приходится на продукты, предложенные рекомендательной системой [3].
Данная работа посвящена построению рекомендательной системы для одного из крупнейших игроков Азии на рынке розничной продажи товаров из области "Здоровье и Красота". Готовые решения обычно не имеют открытого кода, медленно расширяют инструментарий доступных методов и недостаточно гибко адаптируются под особенности данных компании.
Рекомендательные системы в большинстве своем обучаются на истории активности пользователей, что требует привлечения инструментов из области Big Data, т.е. обработки больших объемов данных. В частности, в данной задаче имелись данные о примерно 12 миллионах транзакций пользователей.
В работе представлено решение основное на открытом программном обеспечении, таком как Apache Hadoop, Apache Spark и TensorFlow. Таким образом описанные алгоритмы могут быть использованы при построении рекомендательной системы для решения других задач.
Глава 1 содержит предварительные сведения необходимые для корректного обучения и оценки моделей, а также базовые модели рекомендаций.
Главы 2-3 содержат описание основных моделей: модификация распространенного алгоритма SVD, а также решение, основанное на глубоком обучении.
Глава 4 содержит описание эффективного способа ансамблирования моделей, позволяющего совместить преимущества всех использованных моделей.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

КУРСОВЫЕ СТАТЬИ ВКР

Заключение

Был разработан набор методов рекомендации товаров на основе факторизации матриц и глубокого обучения. Внедрение рекомендательной системы на основе предложенных методов позволило увеличить переходи! по ссылке из e-mail рассылки на 97% относительно рекомендации наиболее популярных товаров. Алгоритм ансамблирования, описанный в последней главе, позволяет расширять систему новыми моделями рекомендации, не переживая о выборе наиболее эффективного метода.
Кроме того, в процессе разработки нейросетевой модели исследован вопрос о применимости модели анализа текстов word2vec к задаче рекомендации товаров.
Использование открв1тв1х технологий, обладающих возможности развертывания в гетерогенных системах, а также их высокая масштабируемость позволяет адаптировать предложенную систему для решения широкого спектра задач рекомендации контента, в том числе на больших объемах данных. Использование современных языков разработки, таких как Scala и Python, облегчает поддержку и дальнейшее развитие системы.

Литература

1. Мерков А. Б. Распознавание образов. Введение в методв1 статистического обучения. URSS, 2011. 256 с.
2. Garcin F., Fallings В., Donatsch О., Alazzawi A., Bruttin С., Huber A. Offline and Online Evaluation of News Recommender Systems at swissinfo.cli // Proceedings of the 8th ACM Conference on Recommender systems. 2014. C. 169-176.
3. How retailers can keep up with consumers
[Электронный ресурс]: URL: https : //www.
mckinsey.com/industries/retail/our-insights/ how-retailers-can-keep-up-with-consumers (дата обращения: 21.05.20).
4. Apache Hadoop [Электронный ресурс]: URL:https:// hadoop.apache.org/(дата обращения: 21.05.20).
5. Aggarwal C. Recommender Systems: The Textbook. Springer, 2016. 498 c.
6. Mikolov T., Sutskever I., Chen K., Corrado G., Dean J. Distributed representations of words and phrases and their compositionality // Proceedings of the 26th International Conference on Neural Information Processing Systems. 2013. C. 3111-3119.
7. Recommender Systems Handbook / Ricci, Bracha, Shapira, Kantor, Springer, 2011.
8. Bennett J., Lanning S. The Netflix Prize //In KDD Cup and Workshop in conjunction with KDD. 2007.
9. Tensor Flow [Электронный ресурс]: URL: https:
//www.tensorflow.org/(дата обращения: 21.05.20).
10. Ferrari M., Cremonesi P., Jannach D. Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches // Proceedings of the 13th ACM Conference on Recommender Systems. 2019.

КУПИТЬ

Работу высылаем на протяжении 30 минут после оплаты.

Подобные работы

РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА СИНТЕЗА ОПТИМАЛЬНЫХ МНОГОЦЕЛЕВЫХ МАРШРУТОВ НА БАЗЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ТУРИСТИЧЕСКИХ ПРЕДПОЧТЕНИЙ
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 5500 р. Год сдачи: 2022
ФОРМИРОВАНИЕ КАДРОВОЙ ПОЛИТИКИ ПРЕДПРИЯТИЯ В УСЛОВИЯХ ПРОВЕДЕНИЯ ОРГАНИЗАЦИОННЫХ ИЗМЕНЕНИЙ
Магистерская диссертация, менеджмент. Язык работы: Русский. Цена: 4930 р. Год сдачи: 2018
УЧЕТ, ЭКОНОМИЧЕСКИЙ АНАЛИЗ И ВНУТРЕННИЙ АУДИТ В СИСТЕМЕ УПРАВЛЕНИЯ ОРГАНИЗАЦИЕЙ
Дипломные работы, ВКР, экономика. Язык работы: Русский. Цена: 4385 р. Год сдачи: 2017
Применение международных стандартов в российской практике налогового регулирования трансфертного ценообразования
Магистерская диссертация, налогообложение. Язык работы: Русский. Цена: 12700 р. Год сдачи: 2015
Применение международных стандартов в российской практике налогового регулирования трансфертного ценообразования
Магистерская диссертация, налогообложение. Язык работы: Русский. Цена: 9700 р. Год сдачи: 2015
Управление рисками промышленных предприятий в условиях смены технико-экономических укладов
Диссертация , экономика. Язык работы: Русский. Цена: 3900 р. Год сдачи: 2017
ИНТЕГРАЦИЯ ХОЗЯЙСТВУЮЩИХ СУБЪЕКТОВ В РЫНОЧНОЙ ЭКОНОМИКЕ
Диссертации (РГБ), экономика. Язык работы: Русский. Цена: 500 р. Год сдачи: 2004
Бухгалтерская отчетность в системе управления финансами организации: формирование и использование
Магистерская диссертация, бухгалтерский учет, анализ и аудит. Язык работы: Русский. Цена: 2800 р. Год сдачи: 2020
Информационная система профессионального спортивного клуба
Магистерская диссертация, менеджмент. Язык работы: Русский. Цена: 4850 р. Год сдачи: 2016

Оптимизация инструментария для работы с большими данными в задаче построения рекомендательных систем

Тип работы

Магистерская диссертация

Предмет

информатика

ПУБЛИКУЕТСЯ ВПЕРВЫЕ

Просмотрено

128

Подобные работы

Логин
Пароль


Тип работы:	Предмет:	Язык работы: