Тема: РАЗРАБОТКА ЧАТ-БОТА ПО ТЕМАТИКЕ УСЛУГ КИНОТЕАТРОВ С РАСПОЗНАВАНИЕМ ИНТЕНЦИЙ НЕДОВОЛЬСТВА В КЛИЕНТСКИХ ОТЗЫВАХ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 2
Глава 1. Теоретические основы применения методов сентимент-анализа для построения клиентоориентированных диалоговых систем 5
1.1 Сентимент-анализ в контексте обработки естественного языка 5
1.2 Методы сентимент-анализа 8
1.3 Нейронные сети и их преимущества 13
1.4 Чат-бот как диалоговая система: история, современное состояние и
классификации 18
1.5 Чат-боты в сфере бизнеса: клиентоориентированность 23
1.6 Сентимент-анализ в сфере бизнеса 26
Выводы по главе 1 29
Глава 2. Построение модели сентимент-анализа и создание прототипа чат-бота
31
2.1 Определение задач и функционала чат-бота 31
2.2 Сбор и анализ материала 32
2.3 Использование LSTM для построения алгоритма сентимент-анализа 39
2.4 Rasa: функционал и архитектура 43
2.5 Разработка минимального жизнеспособного продукта чат-бота 45
2.6 Интеграция чат-бота Rasa в мессенджер Telegram 56
Выводы по главе 2 58
ЗАКЛЮЧЕНИЕ 60
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 62
ПРИЛОЖЕНИЕ А. Листинг кода на языке программирования Python 69
ПРИЛОЖЕНИЕ Б. Графики метрик для различных значений epochs и betch_size 75
ПРИЛОЖЕНИЕ В. Примеры размеченных по интентам и сущностям отзывов 79
📖 Введение
Сентимент-анализ клиентских отзывов также является актуальной проблемой для изучения как в отечественной научной парадигме, так и в англоязычной, причем англоязычные публикации по теме распознания тональности средствами машинного обучения известный ещё в начале 2000-х [18], в то время как аналогичные публикации на русском языке появляются в 2012 году [29, 42, 60]. Примечательно использование в качестве материала исследований как отзывов и рецензий из социальных сетей и форумов [1, 51, 56], внутренних сайтов заинтересованных компаний [38], так и специализированных площадок, таких как Amazon Customer Reviews, ConsumerReports, irecommend, yelp.com и пр. [34, 49].
Применение методов машинного обучения для обработки и порождения естественного языка именно для нужд кинотеатров можно встретить в научных исследованиях, затрагивающих следующие аспекты: бронирование билетов с помощью чат-бота [10], сентимент-анализ удовлетворенности пользователей сети Интернет закрытием кинотеатров в связи с ограничениями в период COVID-19 [24], оценка влияния кинотеатров как носителей
культурного наследия путем анализа мнения интернет-пользователей [5]. Таким образом, вопрос анализа тональности отзывов на услуги кинотеатров в целях синтеза клиентоориентированного ответа чат-бота не был изучен, в чем также заключается актуальность нашей работы.
Объектом исследования являются эмоционально-оценочные аспекты в использовании диалоговых систем для взаимодействия с клиентами.
Предмет исследования - особенности использования сентимент- анализа в клиентоориентированном русскоязычном чат-боте как средство автоматизации взаимодействия между кинотеатром и клиентом.
Цель данной работы - разработка прототипа чат-бота, способного распознать тональность клиентского отзыва на качество обслуживания в кинотеатре.
Для достижения цели работы были поставлены следующие задачи:
1. Охарактеризовать диалоговые системы в контексте методов сентимент- анализа в коммуникации с клиентом;
2. Обосновать клиентоориентированность как подход в построении коммуникативных схем в разработке чат-ботов;
3. Разработать парсер для скачивания клиентских отзывов по тематике работы кинотеатра и провести тематическую систематизацию материала для построения датасета;
4. Апробировать применение модели рекуррентной нейронной сети для сентимент-анализа клиентских отзывов;
5. Изучить платформу для построения пользовательских чат-ботов Rasa Open Source;
6. Создать минимальный жизнеспособный продукт виртуальной диалоговой системы по тематике работы кинотеатра;
7. Интегрировать чат-бот в социальную сеть Telegram.
Методы исследования были следующие:
Основной метод - метод автоматической обработки естественного языка, в частности, прием предварительной обработки текстовых данных, анализ текста с применением моделей автоматического анализа; методы машинного обучения, а также методы оценки качества нейронных сетей. Для отбора материала одной из моделей чат-бота был применен метод целенаправленной выборки. Также используются общенаучные методы обобщения и систематизации.
Материалом исследования послужили текстовые данные отзывов на кинотеатры со специализированного сайта flamp.ru объёмом 10036 текстов (776.125 слов), из которых 4574 - негативные отзывы, и 5462 - позитивные.
Практическая значимость данной работы заключается в создании клинтоориентированной диалоговой системы на русском языке, призванной автоматизировать работу персонала кинотеатров, отвечающих за связи с общественностью и формирующих имидж компании среди клиентов.
Теоретическую основу исследования составили работы в области обработки естественного языка (Natural Language Processing): определение тональности текстов [3, 15, 18, 44] и разработка диалоговых систем [7, 16, 21, 41, 42].
Структурно исследование соответствует поставленным задачам и включает в себя введение, две главы, заключение, список использованных источников и литературы и приложения.
Во введении обоснована актуальность и практическая значимость выбранной темы, поставлены цель и задачи исследования, представлены методы, материалы и теоретическая основа исследования.
✅ Заключение
В ходе работы было создано два минимальных жизнеспособных продукта русскоязычного чат-бота, распознающего положительный и отрицательный сентименты в клиентских отзывах, получаемых из чата в популярном мессенджере Telegram, и синтезирующего соответствующий ответ.
В результате сравнительного анализа двух моделей был сделан вывод о том, что модель «с нуля», опирающаяся на рекуррентную нейронную сеть LSTM в вопросах определения тональности, демонстрирует свое превосходство в анализе хаотичной живой речи клиентов кинотеатров над чат- ботом Rasa, опирающегося на правила, как минимум в том, что способен самостоятельно и верно принимать решение относительно общего сентимента политонального отзыва. Эмпирический анализ ответов чат-бота на монотональные отзывы также подтверждает преимущество чат-бота на основе LSTM, несмотря на более высокое значение метрик для чат-бота Rasa (ср. accuracy = 0.87 для чат-бота «с нуля» и accuracy = 0,98 для чат-бота Rasa).
При этом оба чат-бота показывают слабую эффективность в ситуациях, когда клиентский отзыв содержит несколько объектов сентимента. В этих случаях объект либо не определяется вовсе, либо определяется последний упомянутый.
Тем не менее, Rasa имеет преимущество над чат-ботом «с нуля» в том, что обладает встроенным функционалом для определения и сохранения конкретных употреблений объектов через компоненты slots и forms. Это оказывается очень полезным для понимания компанией того, что конкретно в их товарах и услугах не устраивает клиента, и на какие цели должны быть направлены денежные средства для большего притока и удержания потребителей и, соответственно, для получения прибыли с них. В добавлении компонентов slots и forms, позволяющих сохранять информацию по объектам, оцениваемых клиентами негативно и требующих исправления, заключается одна из перспектив нашей работы.
Также в перспективе появляется необходимость разрешения проблемы распознания нескольких объектов одновременно, каждого со своим сентиментом.





