Тип работы:
Предмет:
Язык работы:


Исследование оценочной лексики потребительских отзывов в системе Яндекс.Маркет

Работа №130415

Тип работы

Магистерская диссертация

Предмет

лингвистика

Объем работы71
Год сдачи2018
Стоимость4930 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
23
Не подходит работа?

Узнай цену на написание


Введение 3
Глава 1. Философский и лингвистический аспекты категории оценки 5
1.1. Философский аспект оценок 5
1.2. Оценки как предмет изучения лингвистики 12
1.3. Типология оценок 17
Глава 2. Словари оценочной лексики для целей анализа тональности 22
2.1. Анализ тональности 22
2.1.1. Понятие анализа тональности 22
2.1.2. Подходы к определению тональности текстов 27
2.1.3. Системы анализа тональности текстов на русском языке 29
2.2. Словари оценочной лексики 31
Глава 3. Создание тезауруса оценочной лексики 37
3.1. Материал исследования 37
3.2. Этапы разработки тезауруса оценочной лексики 41
3.2.1. Извлечение оценочных слов и словосочетаний и группировка в
семантические категории 41
3.2.2. Расширение тезауруса с помощью правил 44
3.2.3. Характеристика полученного тезауруса 49
3.3. Экспериментальная проверка 58
Заключение 62
Список литературы 63
Приложение А. Код программы для автоматического извлечения отзывов с ресурса Яндекс.Маркет 69
Приложение Б. Пример правила для


В последние годы стремительно развивается интернет, в том числе его русскоязычный сегмент. В интернете и повседневной жизни мы ежечасно сталкиваемся с оценками: прежде чем что-нибудь купить, мы знакомимся с отзывами, ставим «лайки», сочиняем комментарии, оставляем записи в блогах. Нас окружает мир оценок, рейтинговый мир. Это явление приобрело такую тотальную массовость, что возникает потребность в ее внимательном изучении, обратившись к языковым проявлениям всех форм оценки.
В современном языкознании стала активно развиваться область исследований, которая занимается анализом мнений, чувств, эмоций, оценок людей по отношению к различным объектам. Эта область называется оценкой тональности. Наше исследование вписывается в эту область.
Основные подходы к изучению тональности текста можно разделить на две большие группы. Подходы первой группы основаны на использовании словарей и правил, вторая группа использует методы машинного обучения.
В данной работе предлагается подход к составлению словаря оценочной лексики для заданной предметной области.
Актуальность выбранной темы обусловлена необходимостью разработки новых методов автоматического анализа оценочной лексики.
Цель работы – представить систему оценок объекта в виде словаря тезауруса, основанного на иерархическом принципе.
В качестве базы для исследования использовались отзывы на товары, размещенные на портале Яндекс.Маркет.
В соответствии с данной целью необходимо решить следующие задачи:
 дать понятие оценки и рассмотреть, как развивались философские взгляды на определение оценок;
 выделить отличительные характеристики оценок как предмета изучения лингвистики;4
 проанализировать различные существующие классификации оценок;
 дать характеристику проблеме анализа тональности;
 проанализировать существующие словари оценочной лексики для целей анализа тональности;
 создать словарь-тезаурус оценочной лексики потребительских отзывов.
Практическая значимость работы заключается в том, что её результаты могут быть использованы для автоматического анализа тональности текстов.
Апробация исследования: основные положения исследования и полученные результаты были представлены в докладе на XIX
Международной научной конференции молодых филологов, проходившей в период с 15 до 17 февраля 2018 года в Таллине.
Структура квалификационной работы: работа состоит из введения, трёх глав, заключения, списка использованной литературы и приложений.
В первой главе рассматривается сущность оценок с философской точки зрения, а также особенности категории оценки как предмета изучения лингвистики. В конце главы приводятся различные подходы к классификации оценок.
Во второй главе дается характеристика проблемы анализа тональности.
Затем приводится обзор существующих словарей оценочной лексики для задач анализа тональности.
В третьей главе описывается материал исследования, этапы составления тезауруса оценочных слов и словосочетаний. В заключении главы дается характеристика полученного тезауруса, приводится экспериментальная проверка применения тезауруса для анализа тональности

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Таким образом, данная работа посвящена проблеме разработки тезауруса оценочных слов для заданной предметной области.
В работе были проанализированы особенности оценок как предмета изучения философии и лингвистики. Было показано, что оценочная лексика является неотъемлемым компонентом систем автоматического анализа тональности. В работе были рассмотрены подходы к анализу тональности, особое внимание было уделено подходу с использованием словарей оценочной лексики, дана характеристика некоторым существующим словарям оценочных слов.
В работе был описан собственный подход к созданию тезауруса оценочной лексики для заданной предметной области. На основе коллекции из 3850 отзывов на кофемашины был составлен тезаурус оценочных слов и словосочетаний, упорядоченных по семантическим категориям трех уровней, который затем был автоматически расширен с помощью правил. Общий
объем словаря составил 2900 словарных единиц. Полученная нами структура семантических категорий оценок может носить в некоторой степени универсальный характер применительно к отзывам на разные группы товаров.
Применение разработанного тезауруса может служить основой для глубокого анализа тональности, позволяющего определять, не только, как пользователь оценивает объект в целом – положительно или отрицательно, но и выявить, что именно в объекте ему нравится, а что нет.
Первичная оценка результатов показала неплохие значения точности и
полноты для задачи классификации отзывов по общей полярности.
В дальнейшем планируется расширить спектр правил и настроить систему весов оценочных слов для улучшения производительности. Кроме этого, планируется более тщательно оценить эффективность тезауруса и попытаться адаптировать тезаурус к другим предметным областям


1. Анисимов С. Ф. Духовные ценности: производство и потребление
//М.: Мысль. – 1988. 253 с.
2. Анисимов С.Ф. Введение в аксиологию. Учебное пособие для
изучающих философию. – М.: Современные тетради, 2001. 128 с.
3. Арутюнова Н.Д. Об объекте общей оценки // Вопросы
языкознания. - 1985, № 3. - С.13-24.
4. Арутюнова Н.Д. Типы языковых значений. Оценка. Событие.
Факт. – М.: Наука, 1988. 346 с.
5. Бабаева Е. В. Культурно-языковые характеристики отношения к
собственности (на материале немецкого и русского языков: диссертация на
соискание ученой степени кандидата филологических наук. Волгоград, 1997.
6. Батурин Н.А. Оценочная функция психики: диссертация на
соискание ученой степени доктора психологических наук. Санкт-Петербург,
1998.
7. Богданова М. А. Хорошо – слово категории оценки // Вестник
Московского государственного областного университета. Серия: Русская
филология. 2014. №. 3. С. 26-30.
8. Брожик В. Марксистская теория оценки. – М.: Прогресс, 1982.
264 с.
9. Вестфальская А. В. Оценка и коннотация: современные подходы
// Язык и текст. 2015. Т. 2. №. 3. С. 3-11.
10. Вольф Е.М. Варьирование в оценочных структурах //
Семантическое и формальное варьирование. – М.: Наука, 1979. С.273-294.
11. Вольф Е.М. Оценочное значение и соотношение признаков
"хорошо/плохо" // Вопросы языкознания. 1986. № 5. С.98-106.
12. Вольф Е.М. Функциональная семантика оценки. – М.: Наука,
1985. 228 с.64
13. Воркачев С.Г. Оценка и ценность в языке. Монография. –
Волгоград: Парадигма, 2006. 186 с.
14. Воронина И. Е., Гончаров В. А. Анализ эмоциональной окраски
сообщений в социальных сетях (на примере сети «вконтакте») // Вестник
Воронежского государственного университета. Серия: Системный анализ и
информационные технологии. 2015. № 4. С. 151-158.
15. Ермаков А. Е., Киселев С. Л. Лингвистическая модель для
компьютерного анализа тональности публикаций СМИ // Компьютерная
лингвистика и интеллектуальные технологии: труды Международной
конференции Диалог. 2005. С. 282-285.
16. Ермаков С. А., Ермакова Л. М. Методы оценки эмоциональной
окраски текста. // Вестник Пермского университета. №. 1. 2012. С. 85-89
17. Золотова Г.А. Коммуникативные аспекты русского синтаксиса.
Монография. – М.: Наука, 1982. 368 с.
18. Ивин А.А. Основания логики оценок. – М.-Берлин: ДиркетМедиа, 2015. 337 с.
19. Кабирова Г. У. Оценка как языковой концепт // Актуальные
вопросы филологических наук: материалы Междунар. науч. конф. (г. Чита,
ноябрь 2011 г.). – Чита: Издательство Молодой ученый, 2011. С. 85-87.
URL https://moluch.ru/conf/phil/archive/25/1253/
(дата обращения: 08.03.2018).
20. Кант И. Собрание сочинений в 8-ми томах. Том 6. – М.: Чоро,
1994. 613 с.
21. Клековкина М. В., Котельников Е. В. Метод автоматической
классификации текстов по тональности, основанный на словаре
эмоциональной лексики // Труды 14-й Всероссийской научной конференции
«Электронные библиотеки: перспективные методы и технологии,
электронные коллекции RCDL-2012», Переславль-Залесский, Россия, 15-18
октября 2012 г.65
22. Кочеткова Е. В. Языковые средства выражения негативной
оценки мира и человека в поэзии Игоря Северянина: диссертация на
соискание ученой степени кандидата филологических наук. – Хабаровск:
Дальневосточный государственный университет, 2004.
23. Лукашевич Н. В., Левчик А. В. Создание лексикона оценочных
слов русского языка РуСентиЛекс // Труды VI международной научнотехнической конференции «Открытые семантические технологии
проектирования интеллектуальных систем OSTIS-2016», Минск, Белоруссия,
18-20 февраля 2016 г.
24. Лукашевич Н. В., Четвёркин И. И. Комбинирование тезаурусных
и корпусных знаний для извлечения оценочных слов // Системы и средства
информатики. 2015. Т. 25. № 1. С. 20-33.
25. Маркелова Т.В. Семантика оценки и средства ее выражения в
русском языке. Учеб. пособие по спецкурсу. – М.: Изд-во МПУ, 1993. 125 с.
26. Мартыненко Г. Я. Об истоках тезаурусного подхода: к 130-летию
со дня рождения К.И. Чуковского // Структурная и прикладная лингвистика.
2012 . № 9. С. 65-07.
27. Меньшиков И. Л., Кудрявцев А. Г. Обзор систем анализа
тональности текста на русском языке // Молодой ученый. 2012. №12. С. 140-
143.
URL https://moluch.ru/archive/47/5951/
(дата обращения: 10.02.2018).
28. Миронова Н. Н. Оценочный дискурс: проблемы семантического
анализа // Известия Российской академии наук. Серия литературы и языка.
1997. Т. 56, № 4. С. 52–59.
29. Мур Дж. Принципы этики. – М.: Прогресс, 1984. 326 с.
30. Неновски Н. Право и ценности. Пер. с болг. – М.: Прогресс,
1987. 248 с.
31. Ожегов С.И. Толковый словарь русского языка. – М.: Мир и
Образование, Оникс, 2011. 736 с.66
32. Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в
текстах на русском языке // Компьютерная лингвистика и интеллектуальные
технологии: по материалам ежегодной Международной конференции
«Диалог». – М.: Изд-во РГГУ. 2011. №. 10. С. 17.
33. Плохинский Н.А. Алгоритмы биометрии. – М.: Изд-во Моск. гос.
ун-та, 1980. 150 с.
34. Сердобольская Н. В., Толдова С. Ю. Оценочные предикаты: тип
оценки и синтаксис конструкции // Компьютерная лингвистика и
интеллектуальные технологии. Труды Международной конференции Диалог.
2005. С. 436-443.
35. Столович Л.Н. Красота. Добро. Истина: Очерк истории
эстетической аксиологии. М.: Республика, 1994, 464 с.
36. Телия В.Н. Коннотативный аспект семантики номинативных
единиц. – М.: Наука, 1986. 144 с.
37. Тихонова М. А. Оценочная лексика русского языка: проблемы
лексикографирования // Вестник Московского государственного
университета печати. 2015. №. 2. С. 352-358
38. Тугаринов В. П. Теория ценностей в марксизме. Л.: – Изд.
Ленингр. ун-та, 1968. 124 c.
39. Усминский О. И. Сенсорно-прагматические и типологические
аспекты русских тропов: автореф. дис. д-ра филол. наук, Екатеринбург. 1997.
40. Фомина Ю. А. Аспекты изучения языковой оценки // Вестник
Челябинского государственного университета. 2007. № 20.
41. Фон В. Г. Х. Логико-философские исследования: избранные
труды. – М.: Прогресс. 1986. 600 с.
42. Хохлова М. В. Глава 5. Анализ тональности // Прикладная и
компьютерная лингвистика. – М.: Ленанд, 2016. С. 245-258.
43. Щерба Л. В. О частях речи в русском языке // Языковая система и
речевая деятельность. 1974. С. 77-10067
44. Wilson T., Wiebe J., Hoffmann P. Recognizing contextual polarity in
phrase-level sentiment analysis // Proceedings of the conference on human
language technology and empirical methods in natural language processing.
Association for Computational Linguistics, 2005. P. 347-354.
45. Andreevskaia A., Bergler S. Mining WordNet for a Fuzzy Sentiment:
Sentiment Tag Extraction from WordNet Glosses // EACL. 2006. Vol. 6. P. 209-
216
46. Chetviorkin I., Loukachevitch N. Extraction of domain-specific
opinion words for similar domains // Proceedings of the Workshop on Information
Extraction and Knowledge Acquisition held in conjunction with RANLP 2011.
2011. P. 7-12.
47. Chetviorkin I., Loukachevitch N. Extraction of Russian sentiment
lexicon for product meta-domain // Proceedings of COLING 2012. 2012. P. 593-
610.
48. Korobov M. Morphological analyzer and generator for Russian and
Ukrainian languages // International Conference on Analysis of Images, Social
Networks and Texts. Springer, Cham, 2015. P. 320-332.
49. Liu B. Sentiment analysis and opinion mining // Synthesis lectures on
human language technologies. 2012. Vol. 5. №. 1. P. 1-167.
50. Pang B., Lee L. A sentimental education: Sentiment analysis using
subjectivity summarization based on minimum cuts // Proceedings of the 42nd
annual meeting on Association for Computational Linguistics. Association for
Computational Linguistics, 2004. P. 271.
51. Pang B., Lee L. Opinion mining and sentiment analysis //
Foundations and Trends® in Information Retrieval. 2008. Vol. 2. №. 1–2. P. 1-
135.
52. Qiu G. et al. Expanding domain sentiment lexicon through double
propagation // IJCAI. – 2009. Vol. 9. P. 1199-1204.
53. Steinberger J. et al. Creating sentiment dictionaries via triangulation
//Decision Support Systems. 2012. Vol. №. 4. P. 689-694.68
54. Thelwall, M., Buckley, K., Paltoglou, G. Sentiment strength detection
for the social Web // Journal of the American Society for Information Science and
Technology, 63(1), 2012 P. 163-173.
55. Volkova S., Wilson T., Yarowsky D. Exploring Sentiment in Social
Media: Bootstrapping Subjectivity Clues from Multilingual Twitter Streams //
ACL (2). 2013. P. 505-510.
56. Ру Тез [Электронный ресурс]:
URL: http://www.labinform.ru/pub/ruthes/index.htm
(дата обращения: 18.03.2018).
57. Анализ тональности текста (на примере русского и английского
языков) [Электронный ресурс]:
URL:http://www.i-teco.ru/solutions/business_intelligence_products/
analiz_tonalnosti_teksta/
(дата обращения: 16.03.2018).
58. Проект ВААЛ [Электронный ресурс]:
URL: http://www.vaal.ru/
(дата обращения: 08.03.2018).
59. RCO Fact Extractor SDK [Электронный ресурс]:
URL: http://www.rco.ru/product.asp?ob_no=5047
(дата обращения: 08.03.2018).
60. API Маркета [Электронный ресурс]:
URL:https://tech.yandex.ru/market/
(дата обращения: 10.04.2018)

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ