Тема: Методы персонификации текстовых диалоговых систем на русском и английском языках
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ГЛАВА 1. ПЕРСОНИФИКАЦИЯ В ДИАЛОГОВЫХ СИСТЕМАХ 7
1.1 Диалоговые системы 7
1.2 Диалог с человеком vs диалог с машиной 8
1.3 Архитектура диалоговых систем 12
1.3.1 Распознавание естественного языка 13
1.3.2 Диалоговый менеджер 14
1.3.3 Генерация естественного языка 16
1.4 Классификация диалоговых систем 19
1.5 Понятие персонификации 22
1.6 Человек как система уровней 26
1.6.1 Психологический уровень 27
1.6.2 Социально-культурный уровень 33
1.7 Модели коммуникации 38
1.7.1 Адресант 41
1.7.2 Контекст 45
1.7.3 Интенция 47
1.8 Диалог через канал Интернет-коммуникации 51
1.9 Персонифицированная система как персонаж 55
1.10 Уровни персонификации и их реализация в речи 57
ГЛАВА 2. АНАЛИЗ ДИАЛОГОВЫХ СИСТЕМ 60
2.1 Метод анализа 60
2.2 Диалоговые системы общего назначения 63
2.2.1 Диалоговые системы на русском языке 63
2.2.1.1 xu.su 64
2.2.1.1.1 Эксплицитные характеристики 64
2.2.1.1.2 Имплицитные характеристики 66
2.2.1.2 p-bot 68
2.2.1.2.1 Эксплицитные характеристики 69
2.2.1.2.2 Имплицитные характеристики 70
2.2.2 Системы на английском языке 74
2.2.2.1 Replica.ai 75
2.2.2.1.1 Эксплицитные характеристики 76
2.2.2.1.2 Имплицитные характеристики 78
2.2.2.2 Kuki 82
2.2.2.2.1 Эксплицитные характеристики 82
2.2.2.2.2 Имплицитные характеристики 84
2.2.3 Сравнительный анализ 87
2.3 Целеориентированные диалоговые системы 92
2.3.1 Параметры стандартной целеориентированной диалоговой системы 92
2.3.2 Диалоговые системы на русском языке 96
2.3.3 Системы на английском языке 99
ГЛАВА 3. РАЗРАБОТКА ПЕРСОНИФИЦИРОВАННОЙ
ДИАЛОГОВОЙ СИСТЕМЫ 105
3.1 Концепция чатбота 105
3.2 JAICP 106
3.3 Telegram 108
3.4 Архитектура чатбота 109
3.5 Персонификация 110
3.5.1 Эксплицитные характеристики 110
3.5.2 Имплицитные характеристики 113
ЗАКЛЮЧЕНИЕ 117
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 121
ПРИЛОЖЕНИЯ 128
Приложение А - Среда разработки чатбота 128
Приложение Б - Примеры взаимодействия с чатботом 129
📖 Введение
Актуальность темы дипломной работы обусловлена развитием рынка диалоговых систем и необходимостью в формировании инструментов для создания персонифицированных диалоговых агентов. По результатам исследований, персонифицированная диалоговая система делает взаимодействие более увлекательным, формируя положительный пользовательский опыт. Более того, в эпоху соцсетей, социального дистанцирования и растущей оторванности людей друг от друга, подобные персонифицированные диалоговые агенты могут быть одним из средств борьбы с одиночеством и депрессией; развитие сервиса Replica. ai подтверждает наличие пользовательского запроса на персонифицированные системы.
Объект исследования — текстовые диалоговые системы на русском и английском языках.
Предмет исследования — методы персонификации.
Новизна исследования заключается в том, что большая часть работ по персонификации диалоговых систем исследовала производимый эффект, а не сами методы персонификации. Работ же на русском языке, посвящённых данной проблематике и анализирующих диалоговые системы на русском языке, чрезвычайно мало, что придаёт данной работе научной новизны.
Практическая значимость работы заключается в возможности использовать результаты исследования для создания персонифицированных диалоговых систем.
Целью работы является анализ существующих текстовых диалоговых систем для выявления и классификации методов и подходов, используемых при персонификации диалоговых систем для дальнейшего использования при создании собственного диалогового агента.
Задачи:
- Изучить структуру и типы диалоговых систем;
- Дать определение персонификации и выявить её структуру;
- Проанализировать и сравнить диалоговые системы общего назначения и целеориентированные диалоговые системы на русском и английском языках на предмет персонифицированности и используемых средств персонификации;
- Сравнить результаты анализа диалоговых системы общего назначения и целеориентированных диалоговых систем;
- Выявить используемые методы персонификации;
- Применить методы персонификации при создании собственной диалоговой системы.
В работе использованы следующие методы исследования:
- Анализ;
- Классификация;
- Описание;
- Сравнение.
В качестве материала исследования были использованы реплики диалоговых систем на английском и русском языках в форме текста и изображений, а также изображения самих диалоговых интерфейсов. В качестве критерия отбора материала выступало наличие текстовой формы взаимодействия с диалоговой системой как основной, а также наличие признаков персонифицированности.
Структура дипломной работы обусловлена целью и задачами исследования и состоит из введения, трёх глав, заключения, списка используемых источников и приложения.
В первой главе исследуется классификация и структура диалоговых систем; также раскрываются теоретические основы персонификации и предлагается уровневая модель персонификации, опирающаяся на основные аспекты человеческой жизни, используемые для имитации.
Во второй главе производится анализ нескольких диалоговых систем общего назначения и целеориентированных диалоговых систем на русском и английском языках, выявляются особенности персонификации в каждом типе систем и вычленяются методы используемые методы персонификации, включающие в себя методы выражения имплицитных и эксплицитных характеристик.
Третья глава посвящена разработке прототипа собственной персонифицированной диалоговой системы с опорой на тип системы, деятельность и личность владельца, а также на исследованные в второй главе методы персонификации.
В заключении формируются окончательные выводы по изучаемой теме, подводятся итоги исследования.
✅ Заключение
Диалоговые системы — это компьютерные системы, с которыми пользователь взаимодействует на естественном языке. Их базовая архитектура включает в себя модуль понимания естественного языка (NLU), диалоговый менеджер (DM) и модуль генерации естественного языка (NLG). Диалоговые системы различаются как по функционалу, так и по устройству работы. По функционалу (или цели) диалоговые системы делятся на целеориентированные, то есть спроектированные для выполнения конкретных задач, и общего назначения — спроектированные исключительно для общения. По механике диалоговые системы делятся на две основные группы: функционирующие на основе правил и основанные на корпусах текстов. Внутри второй группы есть дополнительное деление по способу создания ответных реплик: системы, использующие список заранее заданных ответов; системы, создающие ответ при помощи порождающих моделей; системы, создающие ответ при помощи извлечения и обработки информации.
При общении с диалоговой системой у человека может наблюдаться механизм персонификации, благодаря которому тот начинает относиться к диалоговой системе как к человеку; также персонификацией называют литературный троп. После анализа ряда определений термина в сфере разработки диалоговых интерфейсов, мы выдвинули своё определение персонификации как «придания человеческих черт и характеристик неживым объектам или животным.»
На основе аспектов человеческой жизни, которые потенциально может имитировать система, был предложена уровневая структура персонификации, состоящая из 3 уровней: биологического уровня, выражающего базовые биологические характеристики персонажа; психологического уровня, отражающего эмоции, ценности и черты личности по выбранной нами пятифакторной модели личности; социальный уровень, отражающий персонажа как участника социально-культурных отношений с набором ролей и статусов; биографический уровень — отражает предысторию персонажа.
Также были выделены 4 уровня языка, средствами которых эти характеристики могут выражаться: графический уровень, лексический уровень, синтаксический уровень и прагматический уровень.
Каждый уровень персонификации представляет собой набор характеристик; для удобства мы разделили эти характеристики на 2 категории: эксплицитно выраженные характеристики, демонстрируемые диалоговой системой в форме самопрезентации, и имплицитно выраженные характеристики, извлекаемые при помощи анализа речи и поведения.
С помощью опросника, содержащего в себе разные речевые акты и вопросы по характеристикам разного уровня, были проанализированы 4 диалоговые системы общего назначения и 12 целеориентрированных диалоговых систем. В результате анализа было выявлено:
- Диалоговые системы общего назначения обладают высокими коммуникативными способностями, но при использовании реплик пользователей для обучения не могут сохранить устойчивость при выражении персонифицирующих характеристик
- Диалоговые системы общего назначения чаще ориентированы на Экстраверсию, Сотрудничество, Эмоциональную стабильность и Открытость новому опыту. Однако низкий уровень Сотрудничества и высокий уровень Невротизма также может использоваться в качестве яркой персонифицирующей черты; также они чаще функционирую в рамках неформального регистра;
- Целеориентированные системы демонстрируют гораздо более низкий уровень персонифицированности по причине ориентированности на функциональную эффективность, в то время как впечатление от общения является фактором второстепенным. Некоторые системы демонстрировали сравнительно высокий уровень персонифицированное™, как правило, имитируя склонность к Экстраверсии, Сотрудничеству и Эмоциональной стабильности, однако всё равно уступали диалоговым системам общего назначения. Подобные системы преимущественно используют нейтральный или формальный регистр;
На основе анализа мы выделили несколько методов персонификации.
Самым базовым является создание образа персонажа при помощи эксплицитных характеристик биологического, психологического, социального и биографического уровня при помощи 3 подходов:
- персонификация как очеловечивание — диалоговая система отвечает на реплики, имитируя человека;
- персонификация как одушевление — диалоговая система отвечает, не имитируя человека (чаще всего обозначая себя как робота, при этом стилизуя человеческие особенности под свою природу)
- персонификация через персонифицирующее сокрытие информации — система уходит от ответа исходя из логики виртуального персонажа.
Также возможно создание образа персонажа при помощи имплицитных характеристик:
- Социальный регистр — использование неформального и полу- неформального регистра Интернет-коммуникации;
- Графический уровень — использование эмотиконов, ненормативной орфографии и пунктуации, аббревиатур;
- Лексический уровень — использование сленга, стилистически окрашенных слов, пропорция в использовании слов с положительной и отрицательной эмоциональной окраской;
- Синтаксический уровень — пропорция использования эллиптичных, простых и сложных предложений;
- Уровень средств канала коммуникации — наличие иконки процесса написания ответной реплики, графические эмотиконы, дневник с записями;
- Прагматический уровень — пропорция использования речевых стратегий кооперации и конфронтации.
На основе полученных результатов мы создали свою персонифицированную целеориентированную диалоговую систему в мессенджере Telegram с помощью платформы JAICP. Выявленные нами методы персонификации потенциально могут использоваться для разработки правдоподобных персонифицированных диалоговых агентов для компаний, которым помимо функциональной эффективности важно эмоциональное удовлетворение пользователей.



