АННОТАЦИЯ 2
ВВЕДЕНИЕ 1
1 ОБЪЯСНЕНИЕ ЭТАПА ПРОЕКТА 2
2 АНАЛИЗ ДАННЫХ 2
2.1 УТИЛИЗАЦИЯ ДАННЫХ 2
2.1.1 РЕАЛИЗАЦИЯ TWINT 3
3 MultiClassTextClassification 4
3.1 ПОСТАНОВКА ПРОБЛЕМЫ 6
3.2 МНОГОКЛАССНАЯ КЛАССИФИКАЦИЯ ТЕКСТА
ИСПОЛЬЗОВАНИЕМ DOCS & Logistic Regression 6
3.2.1 НАСТРОЙКА ТРЕНИРОВОЧНЫХ МОДЕЛЕЙ Doc2Vec 17
3.2.2 РАСПРЕДЕЛЕННАЯ ПАМЯТЬ 20
3.3 КЛАССИФИКАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ TFIDF 22
3.3.1 ПОЧЕМУ TF IDF ? 22
3.3.2 CORPUS 23
3.3.3 ПОИСК КОНЕЧНОГО РЕЗУЛЬТАТА 24
3.3.4 ОГРАНИЧЕНИЕ 33
3.4 ПРИМЕНЕНИЕ МОДЕЛИ К ДАННЫМ TWITTER 36
3.4.1 ОЧИСТКА ДАННЫХ 38
3.5 ВСТУПЛЕНИЕ 47
3.6 ЧТО ТАКОЕ СИСТЕМА РЕКОМЕНДАЦИЙ? 48
3.7 ЗАЧЕМ НАМ НУЖНЫ РЕКОМЕНДАЦИОННЫЕ СИСТЕМЫ 49
3.8 КАК РАБОТАЕТ СИСТЕМА РЕКОМЕНДАЦИЙ 50
3.9 ВИДЫ СИСТЕМЫ РЕКОМЕНДАЦИЙ 50
3.9.1 DEMOGRAPHIC СИСТЕМА ДЕМОГРАФИЧЕСКИХ: 51
3.9.2 UTILITY BASED СИСТЕМА РЕКОМЕНДАЦИЙ: 54
3.9.3 KNOWLEDGE BASED СИСТЕМА РЕКОМЕНДАЦИЙ: 57
3.9.4 Collaborative filtering 58
4 КАРТИРОВАНИЕ КНИГ ДЛЯ ПОЛЬЗОВАТЕЛЕЙ 85
4.1 Content Based Filtering 85
4.2 ВЕКТОРНО-ПРОСТРАНСТВЕННАЯ МОДЕЛЬ 87
ЗАКЛЮЧЕНИЕ 93
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 94
За последние несколько десятилетий, с появлением Youtube, Amazon, Netflix и многих других подобных веб-сервисов, системы рекомендаций занимали все больше и больше места в нашей жизни. От электронной коммерции (предлагая клиентам статьи, которые могут их заинтересовать) до онлайн-рекламы (предлагая пользователям правильный контент, соответствующий их предпочтениям), системы рекомендаций сегодня неизбежны в наших ежедневных онлайн-путешествиях.
В самом общем смысле системы рекомендаций -это алгоритмы, нацеленные на то, чтобы предлагать пользователям релевантные товары (например, фильмы для просмотра, текст для чтения, продукты для покупки или что-то еще, в зависимости от отрасли).
Рекомендательные системы действительно важны в некоторых отраслях, потому что они могут принести огромную прибыль, когда они эффективны, или также могут быть способом значительно выделиться среди конкурентов. В качестве доказательства важности рекомендательных систем мы можем упомянуть, что несколько лет назад Netflix организовал конкурс («Приз Netflix»), целью которого было создание рекомендательной системы, которая работает лучше, чем ее собственный алгоритм, отмеченный наградами. 1 миллион долларов на победу.
В этом проекте и тезисе алгоритмы машинного обучения использовались, чтобы рекомендовать книги пользователям, используя алгоритмы NLP, анализируя информацию пользователей и твиты из твиттера и находя интерес каждого пользователя из этих данных, и на основе этой информации механизм рекомендаций будет рекомендовать книги. для пользователей
В этой дипломной работе применяются алгоритмы машинного обучения, чтобы рекомендовать книги пользователям, с использованием алгоритмов НЛП, она классифицирует Tweets Твиттера по заранее определенным классам, таким как бизнес, политика, спорт, развлечения, технологии и другие классы.
система проанализировала и получила информацию об интересах каждого отдельного пользователя, и на основе этой информации была проведена исследовательская работа по применению различных алгоритмов рекомендаций, таких как совместная фильтрация, алгоритмы на основе контента и другие, чтобы рекомендовать книги пользователям.