Аннотация
ВВЕДЕНИЕ 7
1 Теоретические основы исследования вербальных реакций ИИ-систем на
эмоциональные стимулы в аспекте уровня универсальности (на примере эмоции «страх») 15
1.1 ИИ-система как средство моделирования вербальной продукции 15
1.1.1 Общая характеристика ИИ-систем 15
1.1.2 Вербальная продукция ИИ-систем 18
1.2 Лингвистическая теория эмоций и эмоция «страх» 21
1.2.1 Вербальная экспликация эмоций 22
1.2.2 Психологическая концепция выражения эмоции «страх» 25
1.2.3 Лингвистическая концепция выражения эмоции «страх» 28
Выводы к главе 1 30
2 Анализ вербального моделирования реакций на эмоцию «страх» голосовыми
помощниками 32
2.1 Параметры построения стимульных выражений и анализа реактивных
выражений 32
2.2 Анализ реактивных высказываний на стимулы с прямыми вербальными
фиксациями 36
2.3 Анализ реактивных высказываний на стимулы с косвенными
вербальными фиксациями, включающими номинацию эмоции 44
2.4 Анализ реактивных высказываний на стимулы с косвенными
вербальными фиксациями, не включающими номинацию эмоции 50
2.5 Сопоставление результатов вербального моделирования Алисы и Siri. 52
Выводы к главе 2 54
ЗАКЛЮЧЕНИЕ 56
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 58
Данная работа посвящена исследованию вербальных экспликаций голосовых помощников - систем искусственного интеллекта, в аспекте уровня универсальности, специфике их моделирования и разнице реактивных высказываний оригинального и переводного вокальных медиа.
Распознавание эмоций - это область, традиционно изучаемая в психологии и когнитивистике, но на сегодняшний день область науки об искусственном интеллекте особенно заинтересована в этой области. Здесь становится главным понимание необходимости интерфейсов в речевом общении. Существенным и мотивирующим аспектом взаимодействия человека и компьютера является идентификация эмоций по речевым сигналам. Методы распознавания речевых эмоций, включая многочисленные, возможно, наиболее известные алгоритмы обработки и классификации речи, которые использовались для получения чувств или эмоций с помощью сигналов.
Искусственный интеллект начинает приобретать способность моделировать и распознавать эмоциональные единицы, и вскоре им может быть дана способность «иметь эмоции». Современные гаджеты с помощью моделирования естественного (т.е. человеческого) языка могут взаимодействовать с человеком через голосовых помощников, таких как Алиса, Siri, Cortana, Alexa и т.п. Благодаря этому компьютеры и смартфоны стали восприниматься как активные участники социального взаимодействия.
На современном этапе развития технологий ИИ-система способна не только к вербальному моделированию эмоций, но и к распознаванию, вложению языковой информации об эмоции в культуре. Существенная роль эмоций, как в человеческом познании, так и в восприятии указывает на то, что искусственный интеллект должен не только обеспечивать лучшую производительность в оказании помощи людям, принимать решения, но и улучшать коммуникацию, обеспечивать возможность повседневного общения.
Некоторые западные междисциплинарные исследования направлены на рассмотрение киберязыка, систем искусственного интеллекта как социальных акторов (работа в условиях парадигмы CASA - Computers are social actors), мультимодальных подходов рассмотрения распознавания и синтеза речи, распознавания речевых эмоций на основе тактик и алгоритмов машинного обучения и т.д. Существуют отдельные периодические издания по теме (Computers in Human Behavior, Telematics and Informatics, Speech Communication и др.). Отечественных источников, связанных с вербализацией систем искусственного интеллекта и эмотиологии, меньше, в большей степени представлены отдельные исследования по направлениям. Ежегодно представляющим указанную область является крупнейшая в России международная научная конференция по компьютерной лингвистике и ведущий мировой форум по проблемам компьютерного анализа русского языка «Диалог».
В рамках исследования были выбраны голосовые помощники - Алиса и Siri. Алиса - самый популярный отечественный голосовой помощник. Также ее оценивают как самую функциональную голосовую систему из всех официально представленных в России. Она доступна от браузера «Яндекс» для компьютеров с Windows, Linux, MacOS, смартфонов под Android и iOS, встроена в умную колонку «Яндекс.Станция». Siri - один из самых часто используемых зарубежных виртуальных голосовых ассистентов. Это связано также с тем, что Siri по умолчанию включена в пакет программ любой техники компании Apple (iPhone, iPad, Apple Watch, Mac, HomePod), являющейся мировым лидером на рынке смартфонов. У Алисы и Siri схожи функции. Алиса - оригинальная ИИ-система, Siri - переводная. Siri использует технологию Speech Recognizer, позволяющую распознавать голос и переводить речь на 20 языков. Таким образом виртуальный помощник понимает и воспроизводит конкретно русскую речь не в полной мере корректно. Алиса работает на технологии распознавания человеческой речи SpeechKit, настроенной на русский язык.
Актуальность работы определяется ее направленностью на аффективные вычисления (вычисления, которые связаны с эмоциями, возникают из них или влияют на них) вербализации голосовых помощников, декодирование вербальной экспликации оригинальных и адаптированных вокальных медиа и выявление специфики реактивных высказываний на эмоциональные стимулы. Кроме того, аффективные вычисления в сочетании с возможностями искусственного интеллекта также обеспечивают возможность сбора новых данных, необходимых для развития теории эмоций и работы ИИ-систем.
Жизнь современного человека тяжело представить без компьютеров, смартфонов и других гаджетов, представляющих системы искусственного интеллекта. В связи с этим изучается вопрос о реакции людей на компьютер, которые они используют. Многочисленные исследования показали, что люди реагируют на компьютеры на основе социальных правил и что у людей есть социальные ожидания от компьютеров, аналогичные ожиданиям в человеческих социальных отношениях. Кроме того, исследователи обнаружили, что люди приписывают компьютерам человеческие качества и оценивают роботов с личностями, похожими на их собственные, как социально привлекательных. Минимальные социальные сигналы, такие как человекоподобный голос облачного персонального ассистента, например, могут обеспечить взаимодействие человека и технологии, приближенное к социальному взаимодействию человека. Современные постоянно развивающиеся технологии позволили голосовым помощникам использовать естественный язык и иметь голоса, похожие на человеческие (например, вербальные сигналы при разговоре), что делает этих помощников воспринимаемыми как социальные субъекты. Пользователь может использовать виртуального помощника не только как исполнителя прикладных системных задач, но и собеседника. В связи с этим для разработки распознавания и синтезирования подобной вербализации разработчикам ИИ-систем необходимо обращаться к лингвистике не только на уровне декодирования речевого потока, разделения его на фонемы, членения предложения на меньшие языковые единицы, определения семантики ключевых слов и связи с другими единицами, но и синтезирования связной реакции, отвечающей правилам диалога, речевого взаимодействия.
Передавая информацию, реагируя на высказывания, выстраивая диалог, голосовые сообщения виртуальных помощников обычно также содержат обильную эмоциональную информацию. Именно поэтому мы также обращаемся к лингвистической теории эмоции, которая, таким образом, обретает новое звучание в контексте распознавания и моделирования эмоций. Интерес представляет вербализация эмоций системами искусственного интеллекта на русском языке.
Объект исследования: реактивные высказывания виртуальных голосовых помощников.
Предмет исследования: уровень обобщенности содержания и формы вербальной экспликации эмоций вокальными медиа, специфика вербализации оригинального и адаптированного вокальных медиа.
Цель: охарактеризовать результаты вербального моделирования реакции на эмоцию «страх» голосовыми помощниками - Алисой, Siri, в аспекте уровня универсальности реакций.
В данном исследовании русскоязычные вербальные реакции вокальных медиа противопоставлены высказываниям на естественном русском языке.
Цель направлена на проверку гипотезы о том, что вербальные реакции вокальных медиа в силу универсальности не соответствуют принципам формирования высказываний на естественном языке. Это ограничивает их использование как средства замещения партнера в естественной коммуникации.
Для достижения цели поставлены следующие задачи:
1. Изучить теорию по вокальным персональным помощникам как разновидностям искусственного интеллекта системы чат-бота, проанализировать концепции вербального представления эмоции «страх» с точки зрения психологической и лингвистической теорий эмоций.
2. Разработать концепцию сбора материала, направленную на выявление реакций вокальных медиа на эмоциональные стимулы. Под ними мы понимаем высказывания в процессе исследования, которые обрабатываются искусственным интеллектом. Они были построены в соответствии с интуитивными ощущениями в контексте вербализации эмоций и потенциальной реакции на них.
3. Выявить типы вербальных фиксаций в стимульных выражениях в естественном русском языке.
4. Выявить принципы формирования аналогичных реакций стимульным выражениям в естественном русском языке и на их основании собрать материал из корпуса.
5. Сопоставить реактивные высказывания голосовых помощников в аспекте соответствия/несоответствия реакциям, представленным в корпусе.
6. Выявить специфику организации вербальной реакции на эмоциональные стимулы через моделирование оригинальным голосовым помощником (Алиса) и адаптированным (Siri).
7. Охарактеризовать вербальное моделирование эмоции страха в аспекте уровня обобщенности содержания.
8. Составить список несоответствий в моделировании эмоций.
9. Представить оценку вербального моделирования аутентичным и переводным голосовыми помощниками в аспекте уровня универсальности.
Исследование проведено на материале 58 реактивных высказываний голосовых помощников - Алиса и Siri, на 29 стимульных высказываний. Дополнительным источником для сбора материала для аналитической части исследования послужили данные Национального корпуса русского языка. При анализе было рассмотрено около 10 500 контекстов.
Теоретической базой исследования стали работы, посвященные:
- особенностям вербализации ИИ-систем (Williams, Noel, Nass C., Moon Y., Matthieu Guitton, Shuang Huang, Xuan Zhou, А. В. Остроух, Р. Душкин, официальные сайты Apple и Алисы от Яндекс и др.);
- лингвистической теории эмоций (В. И. Болотов, Л. Г. Бабенко, P. Ekman and M. J. Power, В. И. Шаховский, Agnieszka Landowska и др.);
- психологической теории эмоций (К. Э. Изард, Е. П. Ильин и др.);
- лингвистическому анализу вербализации эмоции «страх» (З. Д. Попова, И. А. Стернин и др.).
Для сбора материала использовался метод, интегрировавший метод экспериментальной лингвистики и метод включенного наблюдения. Сначала были смоделированы стимульные выражения на основе интроспекции, далее по типу эксперимента был проведен диалог с вокальными медиа, специфика указанной коммуникации заключается во взаимодействии с обученной системой. Уровень ожидания определенных реакций от систем искусственного интеллекта выше, чем от человека. Диалог является запрограммированным, отработанным при машинном обучении, вопрос при диалоге несет запланированный характер. Возможность создать искусственные условия уточняют концепцию метода включенного наблюдения, множество раз проверенного в лингвистике.
При анализе материала использовались методы систематизации и обобщения материала. Работа со стимульными и реактивными высказываниями предполагала интерпретационный метод и метод интроспекции. Сравнительно-сопоставительный метод использовался для выявления уровня разработки ИИ-систем и определения степени соответствия заявленным задачам оригинальной и переводной диалоговых систем.
При описании материала использовался метод научного описания, включающий приемы классификации единиц, анализа, количественных подсчетов. Также мы использовали корпусный метод, позволяющий выявить реальные словоупотребления в естественной языковой среде и сопоставить их с вербальными реакциями систем искусственного интеллекта в аспекте уровня универсальности. Был произведен поиск фрагментов реактивных высказываний вокальных медиа, в найденных контекстах выявлялась эмоция «страх» для определения связи со стимульными выражения, включающими данную эмоцию.
Практическая значимость данного исследования заключается в возможности рассмотрения разработчиками ИИ-систем списка недочетов по работе с голосовыми помощниками в аспекте уровня универсальности вербализации эмоции, что может помочь при машинном обучении и понимании естественного языка технологиями искусственного интеллекта.
Структура работы. Исследование состоит из введения, основной части, заключения и списка использованной литературы.
Во введении обозначены квалификационные параметры исследования: предмет и объект, цель, задачи; определяется актуальность и новина темы, описаны используемые методы, также представлена практическая значимость.
В первой главе представлена теоретическая часть исследования: дается характеристика основных терминов и понятий, использованных в работе, на основании изученного теоретического материала. Представлены две теории концепций, на которые опирается исследование.
Во второй главе проведена аналитическая работа, представлены стимульные высказывания, описаны критерии характера вербализации, рассмотрены реактивные высказывания в аспекте уровня обобщенности, типовой индивидуализации и лингвокультурной специфики. Проведен сопоставительный анализ вербального моделирования оригинального и переводного голосовых помощников.
В заключении приводятся результаты проведенного исследования.
В список использованной литературы включены теоретические источники, статьи, сайты и работы, материал которых пересекается с настоящим исследованием. Список включает 57 единиц, в том числе 24 на английском и итальянском языках.
Новизна представленного исследования заключается в обращении к анализу вербального моделирования систем искусственного интеллекта, рассмотрению вербальных реакций Siri и Алисы в аспекте уровня универсальности выражения эмоции «страх», сопоставлению результатов вербализации аутентичного и адаптированного голосовых помощников, анализу реактивных высказываний ИИ-систем в сравнении с корпусным материалом. Вербализация искусственного интеллекта также представляет собой новый фокус для интеллектуального анализа данных.
Апробация работы проводилась в рамках международной научно-практической конференции молодых ученых «Актуальные проблемы лингвистики и литературоведения» (Томск, апрель 2021, 2022). В сборнике «Актуальные проблемы лингвистики и литературоведения: сборник материалов VIII (XXII) Международной научно-практической конференции молодых ученых (15-17 апреля 2021 г.)» представлена статья «Лингвистический анализ вербальных реакций ИИ-систем на эмоциональные стимулы в аспекте уровня обобщенности содержания», в следующей выпуске сборника будет выпущена статья «Универсальность реакции на эмоциональный стимул как показатель разработанности коммуникативного статуса голосового помощника (на примере эмоции «страх»)».
В работе были представлены результаты анализа вербального моделирования реакций голосовых помощников - Алисы и Siri, на эмоцию «страх» в аспекте уровня универсальности реакций.
В ходе достижения цели были построены стимульные высказывания с прямыми вербальными фиксациями и косвенными вербальными фиксациями эмоций (с / без номинации эмоции «страх»). Результаты показали, что уровень обобщенности содержания выше при ответах на стимулы с косвенными вербальными фиксациями, то есть ИИ-система распознала их хуже. Можно сделать вывод, что фразеологические единицы, метафоры при разработке алгоритмов распознавания и синтезирования речи систем искусственного интеллекта либо не вносятся в список синонимов слову, например, «бояться» при построении алгоритмов системы, либо вносятся в недостаточном количестве. Также само соотношение реактивных высказываний, отвечающих критерию распознавания «положительно» и «отрицательно», показывает, что в корпусные системы вокальных ассистентов вносится ограниченное количество языкового эмотивного материала.
Для анализа реактивных высказываний были разработаны два критерия: распознавания и характера вербализации, включающего уровень обобщенности, типовую индивидуализацию и лингвокультурную специфику. Ни в одном из реактивных высказываний не были эксплицированы устоявшиеся представления, особенности определенной лингвокультуры. Специфика вербальной реакции на стимулы через моделирование эмоций оригинальным голосовым помощником (Алиса) и адаптированным (Siri) заключается в экспликации обобщенного ответа с типовой индивидуализацией.
По результатам проведенного анализа следует, что Siri распознала меньшее количество стимулов, чем Алиса. Можно предположить, что это связано с разными задачами программ, описанными на официальных сайтах голосовых помощников: решение повседневных функций системы (звонок, набор сообщение, установление таймера, поиск на карте, активация приложения) у Siri; имитация живого диалога, ответы на вопросы пользователя у Алисы. Также стоит учитывать, что Алиса производит коммуникацию на языке оригинала, Siri - переводная система. Системы используют разные технологии - Speech Recognizer (Siri), направленную на распознавание и перевод речи на другой язык, SpeechKit (Алиса), настроенную на распознавание русского языка.
Ответы персональных голосовых ассистентов характеризируются обобщенностью, косвенные вербальные фиксации остаются не распознанными, часть реактивных высказываний не соответствует естественному ответу в контексте речевого поведения, что было подтверждено примерно 10 500 контекстами Национального корпуса русского языка. Также ИИ-система не учитывает лингвокультурную специфику. Адаптированный голосовой помощник эксплицирует одинаковые реакции на разные стимульные высказывания, оригинальный голосовой помощник использует аналогичные формальные структуры высказываний, иронию и недружелюбный тон при вербальном моделировании.
Таким образом, заявленная производительность работы ИИ-систем в поддержке естественной коммуникации, эмоциональной поддержки и возможности повседневного общения не является релевантной относительно вербальной экспликации.
1. Апресян В. Ю. Уступительность: механизмы образования и взаимодействия сложных значений в языке : дис. ... д-ра филол. наук / В. Ю. Апресян. - М., 2015. - 287 с.
2. Бабенко Л. Г. Алфавит эмоций. Словарь-тезаурус эмотивной лексики / Л. Г. Бабенко - [Б. м.] : Кабинетный ученый, 2021. - 432 с.
3. Бабенко Л. Г. Лексические средства обозначения эмоций в русском языке / Л. Г. Бабенко. - Свердловск : Изд-во Урал. Ун-та, 1989. - 184 с.
4. Белая Е. Н. Теоретические основы исследования языковых и речевых репрезентаций базовых эмоций человека (на материале русского и французского языков) : дис. ... канд. филол. наук / Е. Н. Белая. - Омск, 2006. - 210 с.
5. Бочкарев А. Е. О способах и средствах выражения страха в русской языковой картине мира // Вестник НГУ. Серия : Лингвистика и межкультурная коммуникация. - 2016. - № 3. URL: https://cyberleninka.ru/article/n/o- sposobah-i-sredstvah-vyrazheniva-straha-v-russkov-vazykovov-kartine-mira (дата обращения: 16.04.2022).
6. Диалог. - [Б. м.], 2022. - URL: https://www.dialog-21.ru/ (дата обращения:
13.03.2022)
7. Иванова Е. С. Опознание и вербализация эмоций как основа эмоционального интеллекта // Известия Уральского государственного университета. Серия 1 : Проблемы образования, науки и культуры. - 2010. - № 4 (81). - С. 82-88.
8. Ильин Е. П. Эмоции и чувства. / Е. П. Ильин. - СПб. : Питер, 2001. - 752 с.
9. Интерактивное голосовое редактирование текста с помощью новых речевых технологий от Яндекса. - [Б. м.], 2017. - URL: https://habr.com (дата обращения: 08.05.2022).
10. Клинические рекомендации. Тревожно-фобические расстройства. - [М.],
2016. - URL: https://medi.ru/klinicheskie-rekomendatsii/trevozhno-
fobicheskie-rasstrojstva-u-vzroslykh 14300/ (дата обращения: 23.05.2022).
11. Лингвистический энциклопедический словарь / гл. ред. В.Н. Ярцева. - 2-е изд., доп. - М. : Большая рос. энцикл., 2002. - 709 с.
12. Мещерякова Т. Г. Путь от акустического сигнала к распознанному тексту: механизм автоматической обработки речи / Т. Г. Мещерякова, А. В. Рыжков, В. В. Чекрыжов // Время науки - The Times of Science. - 2021. - № 3. - С. 9-11. - URL: https://e.lanbook.com/journal/issue/316477 (дата обращения: 28.04.2022). - Режим доступа: для авториз. пользователей.
13. Национальный корпус русского языка. - [М.], 2003-2022. - URL: https://ruscorpora.ru/new/index.html (дата обращения 22.05.2021).
14. Новицкая Т. А. Концептуальная структура ФСП "Эмоциональное состояние человека" во фразеологической подсистеме французского языка : ав- тореф. дис. ... канд. филол. наук / Т. А. Новицкая. - М. : [б. и.], 2008.
15. Осинцева Т. В. Способы вербализации эмоций и эмотивный потенциал языкового знака / Т. В. Осинцева // Научный результат. Вопросы теоретической и прикладной лингвистики. - 2019. - № 2. - С. 59-66. - URL: https://e.lanbook.com/journal/issue/311840 (дата обращения: 23.05.2022)....57