Тип работы:
Предмет:
Язык работы:


Методы распознавания интентов в русскоязычном пользовательском контенте

Работа №147610

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы40
Год сдачи2024
Стоимость5500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
27
Не подходит работа?

Узнай цену на написание


Введение 3
Обзор литературы 6
1. Обзор методов и технологий для выявления
интентов в диалоговых системах 10
1.1. Диалоговые системы и существующие решения 10
1.2. Обзор методов кодирования текста 14
1.3. Методы распознавания интентов 16
1.3.1. Классические методы машинного обучения 16
1.3.2. Нейросетевые методы 18
1.4. Метрики оценки качества в задаче распознавания
интентов 19
1.5. Открытые датасеты 19
2. Разработка методов выделения интентов 24
2.1. Общая архитектура решения 24
2.2. Разработка методов выделения интентов 25
2.3. Оценка качества предложенных методов 29
2.3.1. Постановка эксперимента 29
2.3.2. Результаты эксперимента 29
2.4. Примеры выделения интентов 33
2.5. Выводы 34
Заключение 37
Список литературы 39


Актуальность работы
Искусственный интеллект и машинное обучение несомненно привнесли много инноваций в нашу жизнь. Диалоговые системы, чат-боты и голосовые ассистенты становятся все более популярными, а использование больших генеративных моделей лишь усиливает эту тенденцию. При этом одним из ключевых исследовательских направлений остается разработка методов, позволяющих системам точно интерпретировать и понимать намерения пользователей — интенты.
С голосовыми ассистентами и чат-ботами распознавание интентов становится критически важным. Сегодня они играют центральную роль в развитии и автоматизации диалоговых систем, построенных на базе нейронных сетей и других методов машинного обучения. Эти системы должны точно интерпретировать намерения пользователей, что усложняется разнообразием выражения их запросов и потребностей. Сложности вызывают как многообразие способов построения предложения, так и присутствие шума в данных, например, использование сленга пользователями.
Это приводит к необходимости классификации интентов, что является отдельной и нетривиальной задачей. Более того, после определения намерения системе необходимо задействовать метод принятия решений, чтобы обработать и удовлетворить запросы пользователей. Исследователи используют различные методы для распознавания интентов, но достижение высокой точности остается актуальной задачей.
Цель работы
Целью научно-исследовательской работы является разработка классических и нейросетевых методов для выделения интентов для встраивания их в русскоязычные диалоговые системы, позволяющие эффективно учитывать особенности пользовательского контента независимо от формы его словесного выражения.
Задачи работы
Для достижения цели были поставлены следующие задачи:
1. Провести обзор и классификацию современных моделей для выделения интентов.
2. Провести сравнительный анализ найденных методов.
3. Провести обзор современных методов кодирования текста.
4. Провести обзор существующих диалоговых систем.
5. Провести обзор метрик оценки качества для сравнения моделей.
6. Спроектировать общую архитектуру методов для анализа и поиска ин- тентов.
7. Найти датасет.
8. Провести эксперименты с существующими моделями.
9. Провести оценку существующих алгоритмов для русского языка.
Практическая значимость работы
Данное исследование стремится к преодолению описанных сложностей в области создания текстовых чат-ботов и диалоговых систем, применяя новейшие методы и техники машинного обучения и нейронных сетей. Это представляет огромное значение для постоянно развивающейся области обработки естественного языка. В частности, развитие автоматизированных диалоговых систем позволит улучшить взаимодействие компании и клиента: увеличить уровень доверия клиента к компании, предоставить более широкий доступ к экспертной информации, необходимой клиенту, сократить использование человеческого ресурса и времени.
Разработанные методы могут быть внедрены в системы чат-ботов таких организаций, как службы поддержки банка, университетов, в системы колл- центров, государственных организаций и МФЦ и в системы принятия решений. Также данные методы найдут применение в разработке коммерческих сервисов, требующих высокого уровня автоматизации и точности в распознавании пользовательских запросов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате работы над ВКР были решены следующие задачи:
1. Выполнен обзор литературы.
2. Выполнен обзор существующих диалоговых систем и проведен их сравнительный анализ.
3. Проведен обзор общих подходов к задаче выделения интентов.
4. Выполнен обзор методов кодирования текста.
5. Выполнен обзор современных методов выделения интентов.
6. Проведен обзор метрик качества для сравнения моделей.
7. Разработана общая архитектура для решения задачи классификации ин- тентов.
8. Разработаны методы машинного обучения и нейросетевые методы, такие как LR + TF-IDF, Decision Tree + TF-IDF, Random Forest + TF-IDF, AdaBoost + TF-IDF, AdaBoost + M-USE, KNN + TF-IDF, KNN + mini- LM, KNN + M-USE, SVM + TF-IDF, SVM + mini-LM, SVM + M-USE, RNN + TF-IDF, LSTM + TF-IDF, LSTM + mini-LM, LSTM + M-USE, BiLSTM + TF-IDF, Rubert tiny 2 + NN, DistilBert + NN.
9. Проведен эксперимент по оценке качества разработанных методов, который показал, что метод “LSTM + M-USE” дает наилучшие результаты по метрикам accuracy, precision, recall, F1-мера при малом времени ответа.
Исходный код доступен по сссылке: https://github.com/AirisFiorentini/Intent- recognition-methods-in-Russian-language-user-generated-content.
Перспективы развития исследования
В качестве развития исследования планируется попробовать полные версии моделей, основанных на трансформерах, такие как BERT и GPT. Эти модели не удалось запустить из-за наличия ограничений доступности вычислительных ресурсов.
Предложенные методы можно встроить в диалоговые системы и голосовые помощники, которые позволят не только определять категорию запроса, но и генерировать ответ пользователю.


[1] Attention Is All You Need / A. Vaswani, N. Shazeer, N. Parmar et al.— 2017.— URL: https://arxiv.org/abs/1706.03762 (online; accessed: 02.06.2024).
[2] Autofaq.ai. — URL: https://autofaq.ai (online; accessed: 31.05.2024).
[3] Ayanouz Soufyane, Abdelhakim Boudhir Anouar, Benhmed Mohammed. A Smart Chatbot Architecture based NLP and Machine Learning for Health Care Assistance.— 2020.— URL: https://dl.acm.org/doi/abs/10. 1145/3386723.3387897 (online; accessed: 02.06.2024).
[4] BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding / J. Devlin, M.W. Chang, K. Lee, K. Toutanova. — 2019. — URL: https://arxiv.org/abs/1810.04805 (online; accessed: 02.06.2024).
[5] Benchmarking Language-agnostic Intent Classification for Virtual Assistant Platforms / Gengyu Wang, Cheng Qian, Lin Pan et al.— 2022.— URL: https://aclanthology.org/2022.mia-1.7.pdf (online; accessed: 02.06.2024).
[6] Breiman Leo. Random Forest.— 2001.— URL: https://link. springer.com/article/10.1023/A:1010933404324 (online; accessed: 02.06.2024).
[7] Chen Qian, Zhuo Zhu, Wang Wen. BERT for Joint Intent Classification and Slot Filling. — 2019. — URL: https://arxiv.org/pdf/1902.10909v1. pdf (online; accessed: 02.06.2024).
[8] Cognity.— URL: https://www.cognigy.com (online; accessed: 31.05.2024).
[9] Cortes Corinna, Vapnik Vladimir. Support-Vector Networks. — 1995. — URL: https://dl.acm.org/doi/10.1023/A%3A1022627411411 (online; accessed: 02.06.2024).
[10] Cunningham Padraig, Delany Sarah Jane. k-Nearest Neighbour Classifiers 2nd Edition (with Python examples). — 2020. — URL: https://arxiv. org/abs/2004.04523 (online; accessed: 02.06.2024).
[11] Dialogflow.— URL: https://cloud.google.com/dialogflow?hl=ru (online; accessed: 31.05.2024).
[12] DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter / Victor Sanh, Lysandre Debut, Julien Chaumond, Thomas Wolf. — 2020.— URL: https://arxiv.org/abs/1910.01108 (online; accessed: 02.06.2024).
[13] An Evaluation Dataset for Intent Classification and Out-of-Scope Prediction / Stefan Larson, Anish Mahendran, Joseph J. Peper et al.— 2019.— URL: https://arxiv.org/pdf/1909.02027v1 (online; accessed: 02.06.2024).
[14] Event2Mind для русского языка. Как мы обучили модель читать между строк и понимать намерения собеседника (EVENT2MIND FOR RUSSIAN: UNDERSTANDING EMOTIONS AND INTENTS IN TEXTS. CORPUS AND MODEL FOR EVALUATION) / Fenogenova A. S., Tikhonova M. I., Filipetskaya D. V. et al.— 2020.— URL: https:// www.dialog-21.ru/media/5090/fenogenovaasplusetal-010.pdf (online; accessed: 02.06.2024).
[15] Freund Yoav, Schapire Robert E. A Decision-Theoretic Generaliza
tion of On-Line Learning and an Application to Boosting.— 1996.— URL: https://www.sciencedirect.com/science/article/pii/
S002200009791504X (online; accessed: 02.06.2024).
[16] Ha§im Sak Andrew Senior Frangoise Beaufays. Long Short-Term Memory Based Recurrent Neural Network Architectures for Large Vocabulary Speech Recognition. — 2014. — URL: https://arxiv.org/abs/1402.1128 (online; accessed: 02.06.2024).
[17] IBM Cloud Docs: watsonx Assistant.— URL: https:
//cloud.ibm.com/docs/watson-assistant?topic= watson-assistant-welcome-new-assistant (online; accessed: 31.05.24).
[18] Just AI. Conversational Platform. — URL: https://just-ai.com (online; accessed: 31.05.2024).
[19] Khan Vasima, Meenai Tariq Azfar. Pretrained Natural Language Processing Model for Intent Recognition (BERT-IR).— 2021.— URL: https: //www.atlantis-press.com/journals/hcis/125963694 (online; accessed: 02.06.2024).
[20] Multilingual Universal Sentence Encoder for Semantic Retrieval / Yin- fei Yang, Daniel Cer, Amin Ahmad et al. — 2019. — URL: https://arxiv. org/pdf/1907.04307v1.pdf (online; accessed: 02.06.2024).
... Всего источников –33.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ