Лингвистические средства выражения мнений в потребительских отзывах (на примере системы Яндекс.Маркет)
|
Введение 4
Глава I. Изучение оценочной лексики потребительских отзывов в контексте анализа тональности. 6
1.1. Отзыв на товар как фактор, влияющий на потребительский выбор в условиях современного общества. 6
1.1.1 История появления отзывов 6
1.1.2 Жанровые особенности интернет-отзыва 7
1.1.3 Отзыв как фактор, влияющий на потребительский выбор 9
1.2. Анализ тональности как инструмент извлечения мнений из неструктурированных текстов. 11
1.2.1. История становления анализа тональности 11
1.2.2. Понятие мнения в анализе тональности 13
1.2.3. Три уровня анализа тональности: уровень документа, уровень предложения, уровень объекта и его аспектов 14
1.3. Подходы к определению тональности текстов и соревнования по анализу тональности 15
1.3.1. Подходы к определению тональности текстов 15
1.3.2. Подходы к извлечению аспектов 19
1.3.3. Соревнования по анализу тональности 25
Глава II. Теоретические основы изучения потребительского поведения. 29
2.1. Понятие потребительских товаров, их номенклатура и основные свойства. 29
2.1.1. Сущность основных понятий, связанных с вопросом изучения потребительского поведения. 29
2.1.2. Номенклатура потребительских товаров 32
2.2. Мультиатрибутивные модели товара в маркетинге и экономические модели поведения потребителя в 50-80-е годы XX века 34
2.2.1. Мультиатрибутивные модели товаров в маркетинге 34
2.2.2. Потребительские свойства товаров народного потребления в советских ГОСТах 39
2.3. Поведенческая экономика как альтернатива модели рационального выбора 45
Глава III. Эксперименты по автоматическому извлечению аспектов и определению контекстов параметрических прилагательных. 55
3.1. Материал исследования 55
3.2. Подход к автоматическому извлечению аспектов 56
3.3. Автоматическое определение контекстов употребления параметрических прилагательных 64
Заключение 79
Список литературы 80
Глава I. Изучение оценочной лексики потребительских отзывов в контексте анализа тональности. 6
1.1. Отзыв на товар как фактор, влияющий на потребительский выбор в условиях современного общества. 6
1.1.1 История появления отзывов 6
1.1.2 Жанровые особенности интернет-отзыва 7
1.1.3 Отзыв как фактор, влияющий на потребительский выбор 9
1.2. Анализ тональности как инструмент извлечения мнений из неструктурированных текстов. 11
1.2.1. История становления анализа тональности 11
1.2.2. Понятие мнения в анализе тональности 13
1.2.3. Три уровня анализа тональности: уровень документа, уровень предложения, уровень объекта и его аспектов 14
1.3. Подходы к определению тональности текстов и соревнования по анализу тональности 15
1.3.1. Подходы к определению тональности текстов 15
1.3.2. Подходы к извлечению аспектов 19
1.3.3. Соревнования по анализу тональности 25
Глава II. Теоретические основы изучения потребительского поведения. 29
2.1. Понятие потребительских товаров, их номенклатура и основные свойства. 29
2.1.1. Сущность основных понятий, связанных с вопросом изучения потребительского поведения. 29
2.1.2. Номенклатура потребительских товаров 32
2.2. Мультиатрибутивные модели товара в маркетинге и экономические модели поведения потребителя в 50-80-е годы XX века 34
2.2.1. Мультиатрибутивные модели товаров в маркетинге 34
2.2.2. Потребительские свойства товаров народного потребления в советских ГОСТах 39
2.3. Поведенческая экономика как альтернатива модели рационального выбора 45
Глава III. Эксперименты по автоматическому извлечению аспектов и определению контекстов параметрических прилагательных. 55
3.1. Материал исследования 55
3.2. Подход к автоматическому извлечению аспектов 56
3.3. Автоматическое определение контекстов употребления параметрических прилагательных 64
Заключение 79
Список литературы 80
Применения языка, на котором говорят люди, очень многообразны. Одним из таких применений является выражение оценок и мнений по поводу каких-либо вещей, людей, событий, фактов. В последние десятилетия мы наблюдаем быстрое развитие интернета, в том числе его русскоязычного сегмента. В своей повседневной жизни мы каждый день сталкиваемся с различными оценками и мнениями: читаем отзывы перед покупкой чего-либо, ставим отметки «нравится» и «не нравится», пишем комментарии, читаем новости. Нас окружает мир рейтингов и мнений. Современное общество в значительной степени подвержено оценочной деятельности как в культуре, так и в дискурсе. Это явление получило очень широкое распространение, вследствие чего появилась необходимость тщательного его исследования.
Исследованиями в области анализа оценок и мнений занимаются разные науки: от философии и аксиологии до психологии, политологии и лингвистики. В лингвистике сформировалась отдельная область, занимающаяся изучением мнений, получившая название анализ тональности. Двумя основными задачами этой области являются автоматическое определение тональности и извлечение аспектов. Анализ тональности бурно развивается, ежегодно публикуется огромное количество работ в этой области. Однако, ввиду обширности проблемной области в ней существует большое количество нерешенных задач и слабо изученных тем. Одной из таких тем является изучение потребительских мнений в отзывах на товары на русском языке. Обзор работ по этой теме представлен в работе [Большакова, 2017].
Задачи определения тональности и извлечения аспектов для потребительских отзывов на русском языке решены не в полной мере. В частности, не решена задача структурной организации аспектов, определения тональности в отношении к определенным аспектам. Решение данных задач позволит извлекать более детальную информацию о каждом аспекте и определять полярность, связанную с каждым аспектом. Сложность решения данных задач заключается в том, что список аспектов не известен заранее, к тому же аспекты сильно меняются в зависимости от предметной области.
В данной работе мы предлагаем комплексный подход к изучению аспектов и отношений между ними. В связи с задачей определения тональности в отношении к определенным аспектам мы изучаем проблему изменения полярности параметрических прилагательных в зависимости от их отношения к аспектам. В качестве материала для исследования использовался корпус из 41913 отзывов (4 739 010 словоупотреблений) на 28 категорий товаров, собранных с ресурса Яндекс.Маркет.
Выпускная квалификационной работа организована следующим образом: первая глава посвящена характеристике отзыва как особого жанра текста, также в ней обсуждаются общие вопросы анализа тональности; во второй главе рассматриваются теоретические основы изучения потребительского поведения, мультиатрибутивные модели товаров, связи между атрибутами, формулируется гипотеза, что структура аспектов и связей между ними соответствует структуре атрибутов товара, которые воспринимает потребитель; третья глава посвящена экспериментам по извлечению аспектов и определению контекстов параметрических прилагательных; в заключении мы приводим основные результаты работы и определяем дальнейшие направления исследований.
Апробация исследования: основные положения исследования и полученные результаты были представлены в докладах и в дальнейшем опубликованы в трудах26-й международной конференции Ассоциации открытых инноваций FRUCT и семинара «ComputationalModelsinLanguageandSpeech» в рамках XVI международной конференции по компьютерной и когнитивной лингвистике TEL 2020.
Исследованиями в области анализа оценок и мнений занимаются разные науки: от философии и аксиологии до психологии, политологии и лингвистики. В лингвистике сформировалась отдельная область, занимающаяся изучением мнений, получившая название анализ тональности. Двумя основными задачами этой области являются автоматическое определение тональности и извлечение аспектов. Анализ тональности бурно развивается, ежегодно публикуется огромное количество работ в этой области. Однако, ввиду обширности проблемной области в ней существует большое количество нерешенных задач и слабо изученных тем. Одной из таких тем является изучение потребительских мнений в отзывах на товары на русском языке. Обзор работ по этой теме представлен в работе [Большакова, 2017].
Задачи определения тональности и извлечения аспектов для потребительских отзывов на русском языке решены не в полной мере. В частности, не решена задача структурной организации аспектов, определения тональности в отношении к определенным аспектам. Решение данных задач позволит извлекать более детальную информацию о каждом аспекте и определять полярность, связанную с каждым аспектом. Сложность решения данных задач заключается в том, что список аспектов не известен заранее, к тому же аспекты сильно меняются в зависимости от предметной области.
В данной работе мы предлагаем комплексный подход к изучению аспектов и отношений между ними. В связи с задачей определения тональности в отношении к определенным аспектам мы изучаем проблему изменения полярности параметрических прилагательных в зависимости от их отношения к аспектам. В качестве материала для исследования использовался корпус из 41913 отзывов (4 739 010 словоупотреблений) на 28 категорий товаров, собранных с ресурса Яндекс.Маркет.
Выпускная квалификационной работа организована следующим образом: первая глава посвящена характеристике отзыва как особого жанра текста, также в ней обсуждаются общие вопросы анализа тональности; во второй главе рассматриваются теоретические основы изучения потребительского поведения, мультиатрибутивные модели товаров, связи между атрибутами, формулируется гипотеза, что структура аспектов и связей между ними соответствует структуре атрибутов товара, которые воспринимает потребитель; третья глава посвящена экспериментам по извлечению аспектов и определению контекстов параметрических прилагательных; в заключении мы приводим основные результаты работы и определяем дальнейшие направления исследований.
Апробация исследования: основные положения исследования и полученные результаты были представлены в докладах и в дальнейшем опубликованы в трудах26-й международной конференции Ассоциации открытых инноваций FRUCT и семинара «ComputationalModelsinLanguageandSpeech» в рамках XVI международной конференции по компьютерной и когнитивной лингвистике TEL 2020.
Таким образом, данная работа посвящена изучению мнений в потребительских отзывах. В работе был предложен подход к автоматическому извлечению аспектов с использованием алгоритма машинного обучения «Дерево решений», для обучения которого в качестве признаков были использованы морфологические и синтаксические теги, частоты слов и номера кластеров векторных представлений слов. Этот метод показал хорошую точность и полноту как для одной предметной области, так и при переносе на другую.
В связи с задачей определения тональности в отношении к определенным аспектам мы изучили проблему изменения полярности параметрических прилагательных в зависимости от их отношения к аспектам. В качестве материала для исследования был подготовлен и использовался корпус из 41913 отзывов (4 739 010 словоупотреблений) на 28 категорий товаров, собранных с ресурса Яндекс.Маркет.
Кроме того, в работе было показано, что многие идеи, возникшие в маркетинге и экономике в XX-XXIвеке, в некоторой мере перекликаются с базовыми представлениями анализа тональности. В ходе анализа теоретического материала была сформулирована гипотеза, что результаты маркетинговых и экономических исследований могут быть полезны при решении сложных задач аспектного анализа тональности. В частности, потребительские свойства и показатели качества потребительских товаров, представленные в ГОСТах, маркетинговые мультиатрибутивные модели товаров и модели потребительского выбора могут быть использованы при экспертном составлении списков тематических классов аспектов и для иерархической организации аспектов.
Дальнейшим направлением исследований является проверка гипотезы, сформулированной во второй главе. Такой проверкой могла бы стать работа по автоматическому извлечению и организации аспектов в виде графа, которая планируется нами в ближайшем будущем.
В связи с задачей определения тональности в отношении к определенным аспектам мы изучили проблему изменения полярности параметрических прилагательных в зависимости от их отношения к аспектам. В качестве материала для исследования был подготовлен и использовался корпус из 41913 отзывов (4 739 010 словоупотреблений) на 28 категорий товаров, собранных с ресурса Яндекс.Маркет.
Кроме того, в работе было показано, что многие идеи, возникшие в маркетинге и экономике в XX-XXIвеке, в некоторой мере перекликаются с базовыми представлениями анализа тональности. В ходе анализа теоретического материала была сформулирована гипотеза, что результаты маркетинговых и экономических исследований могут быть полезны при решении сложных задач аспектного анализа тональности. В частности, потребительские свойства и показатели качества потребительских товаров, представленные в ГОСТах, маркетинговые мультиатрибутивные модели товаров и модели потребительского выбора могут быть использованы при экспертном составлении списков тематических классов аспектов и для иерархической организации аспектов.
Дальнейшим направлением исследований является проверка гипотезы, сформулированной во второй главе. Такой проверкой могла бы стать работа по автоматическому извлечению и организации аспектов в виде графа, которая планируется нами в ближайшем будущем.



