Тема: ИСПОЛЬЗОВАНИЕ ЯЗЫКОВОЙ МОДЕЛИ В РЕШЕНИИ ЗАДАЧИ СОЗДАНИЯ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Список иллюстраций 4
Список таблиц 5
Глоссарий 6
Введение 8
1 Анализ задачи создания рекомендательной системы для сети ресторанов быстрого питания 11
1.1 Состав данных 16
2. Классические подходы к созданию рекомендательных систем 21
2.1 Коллаборативная фильтрация 21
2.2 Селективная модель 23
2.3 Реализация классических подходов 24
3 Классификация и векторизация 25
3.1 Векторизация и языковые модели 26
3.2 Классификация с помощью бустинг-моделей 28
3.2 Классификация с помощью глубоких нейронных сетей 29
4 Метрика 30
5 Реализация 32
5.1 Подготовка данных 32
5.2 Используемые инструменты 33
5.3 Обучение 33
5.4 Результаты для домена сети ресторанов быстрого питания 35
6 Анализ задачи создания рекомендательной системы для сайта медиаконтента
жанра аниме 39
6.1 Состав данных 42
6.2 Метрики и результаты для домена медиаконтента 45
7 Результаты 47
Заключение 48
Список литературы 49
📖 Введение
Данная работа анализирует применимость специфического подхода к созданию рекомендательной системы для сети ресторанов быстрого питания с использованием языковых моделей для обработки естественного языка. После чего проводится анализ эффективности данного подхода к более шаблонной задаче создания рекомендательной системы в домене медиаконтента жанра аниме.
Система рекомендаций для киосков сети ресторанов быстрого питания должна позволить увеличить доход на одного посетителя за счет создания уникального пользовательского опыта. Благодаря этому опыту:
• посетитель ресторана быстрого питания будет регулярно знакомиться с рекомендациями;
• рекомендации будут стимулировать покупку;
• лояльность посетителей не снизится из-за навязчивости.
Механизм работы этой рекомендательной системы состоит в том, чтобы предлагать пользователю товары на основе его опыта взаимодействия с киоском во время сеанса непосредственно перед оформлением заказа. В процессе разработки были использованы различные подходы к созданию рекомендательных систем. Опробованные системы сравнивались между собой с использованием A/B тестирования, измеряющего прибыль, полученную от товаров, проданных по рекомендации. Таким образом, навигационная функция рекомендательной системы при сравнении метрик моделей не учитывается. Система была опробована более чем в 170 ресторанах быстрого питания в течение 4 месяцев. Тестовые рестораны были распределены по всем федеральным округам Российской Федерации. Каждый киоск в тестовой выборке ресторанов в процессе оформления заказа при переходе на экран оформления заказа отправлял запрос к одной из моделей, выбираемой случайно.
Для выполнения требований соглашения о неразглашении, компания- заказчик данной рекомендательной системы не будет названа в этой работе. Все наименования товаров будут изменены на схожие по семантике.
Для ядра рекомендательной системы был предложен алгоритм, состоящий из языковой модели и полносвязной нейросети для классификации данных пользователя. Данные о заказе сначала отправляются в языковую модель для преобразования в векторное пространство признаков, после чего модель-классификатор определяет рекомендацию для данного заказа. После успешного применения этого алгоритма возникла гипотеза об эффективности данного подхода в рамках более шаблонной задачи по созданию рекомендательной системы.
Дальнейшая проверка этой гипотезы проводилась на наборе данных более чем 300.000 пользователей сайта MyAnimeList.net [1] за 2020 год. Датасет представлен в открытом доступе на сайте Kaggle.com [9].
Исходя из представленных выше условий, для достижения цели работы, были сформированы задачи работы.
Задачи работы:
1. Проанализировать требования к созданию и использованию рекомендательной системы в киосках самообслуживания.
2. Подготовить обучающие и тестовые выборки путем обработки датасета в подходящий для моделей формат.
3. Разработать модели классических подходов, а также подхода
тестируемой гипотезы.
4. Проанализировать метрики моделей.
5. Подготовить датасет для задачи рекомендации медиаконтента,
сформировать обучающие и тестовые выборки.
6. Обучить и проанализировать показатели эффективности моделей на тестовой выборке домена медиаконтента.
7. Подвести итоги касательно эффективности подхода к созданию рекомендательной системы с использованием языковых моделей.
✅ Заключение
Использование классических подходов к созданию рекомендательных систем в контексте задач, рассматриваемых в данной работе, не позволяет достичь желаемых результатов в точности как по проценте дополнительной прибыли, так и оффлайн метрике.
Эмпирические свидетельства результата проверки алгоритмов на тестовых данных и в рамках A/B тестирования позволяют утверждать, что использование алгоритма рекомендательной системы, содержащего языковую модель и модель-классификатор, значительно повышает показатели точности общего предсказания, а также метрику дополнительной прибыли. Экспериментальным путем установлена размерность векторного пространства языковой модели, чтобы общее время работы алгоритма укладывалось в заданные заказчиком условия, при этом минимизировав потери в точности работы рекомендательной системы.
Результаты работы по созданию модели рекомендательной системы с использованием языковых моделей представлены в публикации [47]. В дальнейшем при необходимости алгоритм может быть доработан путем обучения на большем временном промежутке и увеличенном количестве пользователей.





