Введение 3
Глава 1. Теоретические и методологические вопросы анализа тональности текстов 9
1.1. Понятие Sentiment Analysisи подходы к классификации тональности
текстов 9
1.2. Байесовский классификатор в задачах классификации текстов 16
1.3. Анализ тональности текстов в социальных сетях во время эпидемий и
вспышек болезней 18
1.4. Процедура и алгоритм анализа тональности текста 22
1.5. Анализ тональности текстов в Python с помощью TextBlob 24
1.6. Анализ тональности текстов с помощью онлайн-приложений 28
Глава 2. Анализ тональности COVID-19 сообщений 31
2.1. Построение выборок для анализа 33
2.2. Анализ тональности твитов с помощью Brand24 60
2.3. Анализ тональности Twitter в Python с помощью Textblob 83
Заключение 89
Список использованной литературы
Коронавирусная инфекция COVID-19, вызываемая вирусом SARS-CoV-2, в настоящее время стремительно распространяется по всему миру и приводит к резкому росту новых случаев инфицирования, а также смертей среди населения [Liu et al. 2020]. SARS-CoV-2 был обнаружен в Китае в конце 2019 года, и миллионы людей, в конечном итоге, были заражены [Velavan &Meyer 2020: 278-280]. Статистика отчетов Всемирной организации здравоохранения (ВОЗ) о ситуации на 10 января 2021 года показала 88 383 771 подтвержденных случая, включая число смертей 1 919 126 во всем мире [ВОЗ 2020]. Точные данные о COVID-19 могут быть получены только тогда, когда пандемия закончится, поскольку из-за постоянно меняющейся статистики обновление данных практически невозможно [Hamzah et al. 2020]. Из-за высоких рисков распространения заболевания 28 февраля 2020 года ВОЗ запустила протоколы экстренной помощи во всех медицинских системах [Epidemiol 2020: 139-144]. COVID-19 - не первая глобальная пандемия: в прошлом врачи и медицинские исследователи серьезно занимались различными вирусами, такими как Эбола [McMullan 2020], Mers-Cov и SARS; и их усилия не были напрасными [Elder et al. 2020]. Тем не менее, следует учитывать текущие тенденции развития технологий, которые показали свой вклад в принятие медицинских решений, связанных с инфекционными заболеваниями и их вспышками [Bhat et al. 2020, Soliman et al. 2020: 92-97]. В этом процессе используются исторические данные, и возможность к их доступу позволяет исследователям принимать более обоснованные решения и выводы [Pan et al. 2020: 86-91].
Одними из самых доступных и существующих в настоящее время источников получения данных можно выделить платформы социальных сетей, такие как Twitter, Facebook и YouTube [Tyagi & Tripathi 2019]. В то время как в социальных сетях люди свободно обсуждают и высказывают свои мнения о событиях, происходящих в повседневной жизни, или выражают эмоции, связанные с пандемией, многие исследователи и медицинские работники получают возможность анализировать появляющиеся данные, что помогает 3 медицинскому персоналу и государственным организациям понимать реакцию населения на происходящие события, извлекая пользу в интересах общества [Alsaeedi &Khan 2019]. Таким образом, социальные данные служат основой для анализа мнений и эмоционального отношения (тональности) автора текста к некоторым объектам, процессам или событиям, что привело к множеству исследований в области обработки текстов на естественном языке.
Повышенный интерес к тональному анализу и анализу субъективных мнений в пользовательских текстах относится к началу 2000-х гг. [Pang &Lee 2008]. С тех пор сложилось поле исследований тональности англоязычных текстов разного происхождения [Kan 2012]. Развитию конкурентных методов тонального анализа способствовали международные воркшопы. Так, команда под руководством Накова и Розенталя в рамках воркшопов SensEval и SemEval предложила для развития методов тонального анализа пять больших заданий (tasks), в которых разные группы ученых со всего мира применяли различные методики сентимент-анализа для решения одной и той же задачи [Nakov et al. 2016: 35-65]. Проводились подобные воркшопы и в России. Анализ тональности текста был изучен в трудах многих отечественных и зарубежных ученых и исследователей, таких как Д. Усталов [2012], И. Четверкин [2012], Н. Лукачевич [2012], А. Пазельская [2011], А. Соловьев [2011], И. Меньшиков [2012], М. Клековкина [2012], Е. Котельников [2012], Д. Яровски [1995], К. Страппарава [2004], А. Валитутти [2004], Б. Снайдер [2007], Р. Барзилай [2007], Н. Пономарева [2012], М. Телуолл [2012], Бо Панг [2002, 2004, 2005], Б. Маньини [2010], Г. Кавалья [2010], Б. Лю [2010], Н. Кобаяши [2006], Э. Голдберг [2006], Э. Камбрия [2009], В. Бобичев [2010], В. Ангелуш [2010], С. Баччанелла [2010], Э. Контопулос [2013], А. Хогенбум [2014], К. Шуанг [2018], П. Шарма [2020], Э. Камбрия [2020], К. Сингх [2020]. Так как речь идет об обработке текста на естественном языке, необходимо отметить, что большая часть литературы написана с целью обработки англоязычных текстов.
В книге «Sentiment Analysis and Opinion Mining» [Liu 2012: 10-108] показана важность применения данного анализа во всех сферах бизнеса и 4 социальной сферы, описана задача автоматического определения тональности текса, а также проблемы, c которыми чаще всего сталкиваются исследователи. Также интересной является книга «Прикладная и компьютерная лингвистика» на русском языке, которая дает возможность найти ответы на общие вопросы, связанные с компьютерной лингвистикой [Митренина и др. 2017].
Таким образом, анализ тональности текста сегодня можно считать одной из самых популярных тем исследований в области обработки естественного язка [Sailunaz &Alhajji 2019], и много молодых ученых работают над анализом тональности текстов из социальных сетей, например, касающихся болезни COVID-19. Так, Кор и Шарма анализируют тональность сообщений - твитов в социальной сети Twitter и определяют отношение людей к коронавирусной болезни COVID-19 [Kaur &Sharma 2020]. Кайла занимается сбором данных, подходящих для применения в экспериментах о новых вспышках COVID-2019 [Kaila 2020]. Мэдфорд составил список связанных с COVID-19 хэштегов - меток, которые использовались для распределения сообщений в социальных сетях и блогах, после чего был выполнен анализ их тональности для определения эмоциональной значимости каждого сообщения и выявления преобладающей эмоции [Medford 2020]. Под хештегом понимается начинающееся со знака решётки ключевое слово или несколько слов сообщения в микроблогах и социальных сетях, что облегчает поиск сообщений по теме или содержанию. Сайлуназ и Аль-Хадж проводят анализ тональности арабских твитов - записей в Twitter, содержащих хэштеги, относящиеся к введенными правительством мерам общественного здравоохранения, и измеряют количество положительных и отрицательных сообщений [Sailunaz &Alhajj 2019]. Пастор изучает отношение филиппинцев к карантину, вызванного пандемией COVID-19 [Pastor 2020]. Исследователь также анализирует влияние карантина на сообщества и изучает влияние пандемии на личный образ жизни на основе твитов пользователей. Гровер и Рати в своей работе собрали данные, относящиеся к твитам, и заявили, что количество сообщений в Твиттере, посвященных коронавирусу, постоянно растет [Grover &Rathi 2020]. Также 5
было выявлено очень много повторяющихся слов, таких как COVID-19 и Coronavirus. Ра при анализе тональности твитов определяет влияние коронавируса (COVID-19) на Землю, таким образом выявляя положительные и отрицательные мнения широкой общественности [Ra et al. 2020]. Дубей целью этого анализа ставит узнать, как люди в разных странах реагируют на вспышки болезни [Dubey 2020].
В перечисленных выше работах исследуется вопрос взаимосвязи социальных сетей и поведения людей во время пандемии GOVID-19, подчеркивается практическая значимость анализа тональности текстов в решении поставленных задач.
Анализ тональности текстов находит свое применение, начиная с оценки качества товаров и услуг и заканчивая составлением текстов с заранее заданными эмоциональными характеристиками. Объектом эмоционального оценивания может быть имя собственное, название продукта, организации, услуги или профессии, по отношению к которым выражается мнение. Однако ежедневное количество публикуемых отзывов в социальных сетях достигает огромного количества, поэтому обработка отзывов вручную оказывается невозможной и требует автоматизации. Поэтому анализ тональности текстов с каждым годом становится все более актуальной задачей как с теоретической, так и с практической точек зрения. Это преимущественно связано с развитием интернета и с изменением в формате коммуникаций между людьми.
Целью данной работы является анализ тональности сообщений в социальных сетях на примере сети Twitter в острый пандемийный период с 21.12.20 по 21.01.21. Под тональностью мы понимаем эмоционально окрашенную лексику и эмоциональную оценку, выраженную автором относительно болезни COVID-19.
Это исследование не нацелено на конкретный континент, страну или город для сбора данных, потому что коронавирус - это почти повсеместная проблема, угрожающая здоровью людей.
Для достижения поставленной цели в исследовании были поставлены следующие задачи и подзадачи:
1) изучение одного из направлений обработки естественного языка - Sentiment analysis - анализ тональности текста:
• исследование существующих инструментов и подходов для обработки текстов и автоматического определения их эмоциональной составляющей;
• исследование особенностей сообщений в социальной сети Twitter;
2) сбор данных из социальной сети Twitter:
• используя программный интерфейс приложения (Twitter API), позволяющий одной компьютерной программе взаимодействовать с другой, загрузить библиотеку данных Tweepy;
3) извлечение необходимой информации по ключевым словам:
• определить новые слова 2020 года, связанные с изучаемой тематикой;
• проанализировать динамику и частоту их использования; выделить наиболее часто употребляемые;
• извлечь основанные на ключевых словах данные из социальной сети Twitter: a) через язык программирования Python, используя библиотеку Tweepy; б) с помощью инструмента аналитики социальных данных - Brand24;
4) применение обработанных данных по назначению: для анализа тексов на субъективность и определение их полярности (обычно «положительной» или «отрицательной») :
• использовать библиотеку Textblob и метод машинного обучения - наивный Байевский классификатор;
5) графическое представление и объяснение полученных результатов.
Объектом данного исследования являются сообщения-твиты из специальной сети Twitter. Предметом исследования является тональность (т^. эмоциональный окрас) анализируемых сообщений.
Для достижения цели и поставленных задач использованы 2 основные методологии:
1) основана на анализе массовых данных социальной сети Twitter: сбор, обработка и анализ данных;
2) на базе извлеченных твитов обработка естественного языка (далее NLP - Natural language processing) для определения тональности настроений пользователей.
Методология, основанная на анализе массовых данных, заключается в использовании интерфейса прикладного программирования Twitter API для доступа через язык программирования Python к библиотеке Tweepy, которая позволяет извлечь соответствующие данные с помощью поиска по ключевым словам и хэштегам (#). В методологии на базе извлеченных твитов используется TextBlob - библиотеки для обработки текста, написанной на Python, а также метод машинного обучения - классификатор Наивного Байеса. Английский является доминирующим языком, используемым в исследованиях по анализу тональности текстов.
Новизна исследования заключается не только в понимании взаимосвязи между полученными из социальных сетей данными и поведением людей в период вспышки коронавируса, известного как COVID-19, но также мы показываем, как люди, государственные организации и информационные агентства транслируют подобные ситуации. Практическая значимость исследования заключается в том, что данная работа может быть использована в качестве модели для определения эмоционального состояния интернет- пользователей в различных ситуациях. Следует учесть, что исследование проводилось непосредственно во время глобального кризиса, и всего за несколько месяцев многое изменилось с момента развития событий начала 2020 года. Это означает, что полученные результаты, вероятно, могут быть пересмотрены и изменены.
Структура работы. Данная магистерская диссертация состоит из введения, двух глав, заключения и списка использованной литературы.
В настоящем исследовании применен анализ тональности по теме COVID-19, собранных их базы данных социальной сети Twitter. 818 224 сообщений по коронавирусной тематике, из которых 89 025 содержали слова «COVID-19» и «Coronavirus», были собраны в острый период пандемии с 22 декабря 2020 года по 22 января и проанализированы с помощью онлайн- сервиса для анализа социальных данных Brand24. 530 232 твитов, в которых упоминается хотя бы один из двух вышеупомянутых хэштегов, были собраны в течение недели с 1 по 7 января 2021. Для этого с помощью Twitter API и гибкой библиотеки Python Tweepy были выбраны два ключевых слова для поиска твитов #Ooronovirus и #COVID-19 и определения их полярности и субъективности. TextBlob библиотека методов анализа тональности текстов Python была применена для собранных твитов. Результаты показали нейтральность в отношении большинства твитов, значительная часть записей была объективной, что составляло примерно 64 процента. Однако тональность остальной части сообщений - отрицательная. Из этого исследования мы можем сказать, что реакция людей менялась день ото дня в зависимости от изменяющихся событий. Эти данные о вспышке коронавируса, известного как COVID-19, показывали нам, как люди, государственные организации и информационные агентства транслировали ситуации.
Данное исследование показывает обсуждения и отношение пользователей Twitter к COVID-19. Полученные результаты помогают быстро и в реальном времени понять общественные настроения по поводу вспышки COVID-19, способствуя тем самым пониманию развивающейся ситуации. Исследование преодолевает ограничения традиционного подхода социальных наук, который полагается на трудоемкие, ретроспективные, отсроченные по времени мелкомасштабные опросы и интервью. Выявленные закономерности и эмоции в публичных твитах можно использовать для руководства целевыми программами вмешательства. Во-первых, раннее выявление случаев COVID-19 были выявлены среди огромного количества твитов, что свидетельствует о том, 89 что сообщество Twitter признало серьезность заболевания. Быстрое выявление и использование сообщений в социальных сетях может помочь общественности и властям отреагировать на распространение болезни на ранних стадиях. У исследования есть несколько ограничений. Во-первых, мы отбираем только 2 хэштега в качестве поисковых запросов для сбора данных Twitter. Некоторые новые хэштеги стали новым модным термином для пользователей Твиттера с течением времени. Во-вторых, пользователи Твиттера не являются репрезентативными для всего населения и лишь указывают мнения и реакцию онлайн-пользователей на COVID-19. Тем не менее, набор данных Twitter является ценным источником для понимания создаваемого в реальном времени пользовательского контента Twitter, связанного с деятельностью по заболеванию COVID-19. В-третьих, неанглоязычные твиты удаляются из анализа, а результаты ограничиваются определенной группой. В будущих исследованиях рекомендуется включить итальянский, немецкий и испанский языки для анализа COVID-19. Данные Twitter могут предоставить полезную информацию об эпидемических заболеваниях (например, H1N1, лихорадке Эбола), включая отслеживание быстро меняющихся настроений общественности, измерение общественных интересов и озабоченностей, оценку активности и тенденций заболеваний в реальном времени, а также отслеживание зарегистрированных уровней заболеваний. Однако у этих исследований есть ограничения: только качественное ручное кодирование очень небольшого количества твитов. Им требуются более совершенные методы для повышения точности изучения общественного мнения и настроений. Кроме того, остается неизвестным реакция общественности на COVID в сети.
В рамках работы было проанализировано 818 224 сообщения по 17-ти ключевым словам, из которых 89 025 сообщений содержали слова «COVID-19» и «Goronavirus». Было найдено сходство между результатами анализа тональности текста с помощью онлайн-сервиса Brand24 и результатами, полученными в Python с помощью библиотеки Textblob: большая часть 90
сообщений имела отрицательную тональность, т.е. высказывания по поводу коронавируса были негативными; но стоит отметить, что более 50% твитов являлись нейтральными, не выражающими никаких мнений, таким образом, не обладающих эмоциональной окраски.
Из-за нехватки времени и вычислительного процесса многие аспекты оставлены на будущую работу. Было бы интересно принять во внимание следующую область исследований:
1. Исследовать надежность социальной сети Twitter как источника информации и сравнить с другими социальными сетями, такими как Facebook, Wechat, Instagram. Однако очень важно изучить другие социальные сети с
Что касается анализа тональности текстов:.
2. В своем сообщении мы выбрали Textblob, который использует в качестве классификатора модель Наивного Байеса. Но есть и другие модели, которые могут дать интересные результаты, например алгоритмы на основе лексики;
3. Это исследовательское приложение может также быть принятым в качестве модели для выявления эмоциональных чувств для будущих подобных случаев.
1. Меньшиков И.Л. Анализ тональности текста на русском языке при помощи графовых моделей (рус.) / И.Л. Меньшиков. - УРФУ, Екатеринбург, Россия : конференция. - 2012.
2. Вальковская Н. В., Илюшкина М. Ю. & Гузикова М. О. Чтение и понимание английских текстов: учебно - методическое пособие / Н. В. Вальковская, М. Ю. Илюшкина, М. О. Гузикова. - Москва, 2016. - C.44.
3. Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке / А.Г. Пазельская, А.Н. Соловьев. - Компьютерная лингвистика и интеллектуальные технологии: по мат. ежегодной Междунар. конф. «Диалог» (Бекасово, 25—28 мая 2011 г.). -М.: Изд-во РГГУ, 2011.
4. Клековкина М. В., Котельников Е.В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики (рус.) / М. В. Клековкина, Е.В. Котельников // Труды XIV Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». - Переславль-Залесский, Россия 2012. С. 118— 123.RCDL-2012, : конференция. - 2012.
5. Митренина О. В., Николаева И.С., Т. М. Прикладная и компьютерная лингвистика / О. В. Митренина, И.С. Николаева, Т. М. Ландо. Под ред. Изд. 2-е — М.:ЛЕНАНД, 2017. — 320с.
6. Hamzah F.B., Lau C., Nazri H., Ligot D., Lee G. CoronaTracker: Worldwide COVID-19 outbreak data analysis and prediction / Fairoza Amira Binti Hamzah, Cher Han Lau, Hafeez Nazri, Dominic Vincent Ligot, Guanhua Lee. - Bull World Health Organ, 2020. 32p.
7. Soliman H., Tabak F. Sciences P. Deep learning framework for RDF and knowledge graphs using fuzzy maps to support medical decision / Hatem Soliman, Fatema Tabak. - Journal of International Research in Medical and Pharmaceutical Sciences, 2020. 92-97p.
8. Epidemiol C.P.M.A. An update on the epidemiological characteristics of novel coronavirus pneumonia (COVID-19) Preventive Medicine Association, 2020. 41, 139-144p.
9. McMullan, L. K. Clinical trials in an Ebola outbreak seek to find an evidence-based cure / Laura K. McMullan. - EBioMedicine, 2020.
10. Elder E., Johnston A.N., Wallis M., Crilly J. The demoralisation of nurses and medical doctors working in the emergency department: A qualitative descriptive study / Elizabeth Elder, Amy N. B. Johnston, Marianne Wallis, Julia Crilly. - International Emergency Nursing, 2020;100841.
11. Bhat M., Qadri M., Noor-ul-Asrar Beg M.K., Ahanger N., Agarwal B.J.B. Behavior, & immunity. Sentiment analysis of social media response on the Covid19 outbreak / Muza Bhat, Monisa Qadri, Noor-ul-Asrar Beg, Majit Kundroo, Naffi Ahanger and Basant Agarwal. - Brain, Behavior, and Immunity, 2020.
12. Pan X., Ojcius D.M., Gao T., Li Z., Pan C., Pan C.J.M. Infection. Lessons learned from the 2019-nCoV epidemic on prevention of future infectious diseases/ Xingchen Pan, David M. Ojcius, Tianyue Gao, Shongsheng Li. - Microbes and Infection, 2020;22:86-91p.
13. P. Tyagi and R.C. Tripathi. A Review towards the Sentiment Analysis Techniques for the Analysis of Twitter Data/ Ptiyanka Tyagi, Rama Charan Tripathi, 2019.
14. A. Alsaeedi and M. Z. J. I. Khan, "A Study on Sentiment Analysis Techniques of Twitter Data/ Abdullah Alsaeedi, Mohammad Zubair Khan. - vol. 10, no. 2, 2019.
15. Pang B., Lee L. Opinion mining and sentiment analysis / Bo Pang, Lilian Lee. Foundations and Trends® in Information Retrieval 2 (1-2), 2008: 1—135.
16. Nakov P., Rosenthal S., Kiritchenko S., Mohammad S. M., Kozareva Z., Ritter A., Zhu X. Developing a successful SemEval task in sentiment analysis of Twitter and other social media texts / Preslav Nakov, Sara Rosenthal, Svetlana Kiritchenko, Saif M. Mohammad, Zornitsa Kozareva, Alan Ritter, Veselin Stoyanov, Xiaodan Zhu. - Language Resources and Evaluation 50 (1), 2016: 35—65p.
17. Snyder B., Barzilay B. Multiple Aspect Ranking using the Good Grief Algorithm / Benjamin Snyder, Regina Barzilay // Proceedings of the Joint Human Language Technology / North American Chapter of the ACL Conference (HLT- NAACL) : conference. - 2007. - P. 300-307.
18. Ponomareva N., Thelwall M. Do Neighbours Help? An exploration of Graph-based Algorithms for Cross-domai Sentiment Classification / Natalia Ponomareva, Mike Thelwall // Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and omputational Natural Language Learning conference. - 2012. - P. 655-665.
19. B. Pang, L. Lee, S. Vaithyanathan. Thumbs Up? Sentiment Classification using Machine Learning Techniques / Bo Pang, Lillian Lee, Shivakumar Vaithyanathan // EMNLP. - 2002. - P. 79-86.
20. B. Magnini, G. Cavaglia. Integrating subject field codes into WordNet / Bernardo Magnini, Gabriela Cavaglia: LREC - 2000.
21. N. Kobayashi, R. lida, K. Inui, Y. Matsumoto. Opinion Mining on the Web by Extracting Subject-Aspect-Evaluation Relation / Nozomi Kobayashi, Ryu lida, Kentaro Inui, Yuji Matsumoto // Nara Institute of Science and Technology, Takayama, Ikoma, Nara 630-0192, Japan : конференция. - 2006. - 1-6p.
22. A. Goldberg, X. Zhu. Seeing stars when there aren't many stars: Graph-based semi-supervised learning for sentimnet categorization / Andrew Goldberg, Xiaojin Zhu // Proceedings of the First Workshop on Graph Based Methods for Natural Language Processing, Computer Sciences Department University of Wisconsin-Madison: conference. - 2006. - 45-52p.
23. Chikersal P., Poria S., Cambria E. SeNTU: Sentiment Analysis of Tweets by Combining a Rule-based Classifier with Supervised Learning / Prerna Chikersal, Soujanya Poria, and Erik Cambria. In SemEval@ NAACL-HLT, 2015. - 647-651p.
24. Sokolova M., Bobicev V. Classification of Emotion Words in Russian and Romanian Languages/ Marina Sokolova, Victoria Bobicev. -In RANLP, 2009. - 416-420p.
25. Baccianella S., Esuli A., Sebastiani F. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining / Stefano Baccianella, Andrea Esuli, and Fabrizio Sebastiani. - In LREC Vol. 10, 2010. - 2200-2204 p.
26. Kontopoulos E., Berberidis C., Dergiades T., Bassiliades N. Ontology¬based sentiment analysis of twitter posts / Efstratios Kontopoulos, Christos Berberidis, Theologos Dergiades, Nick Bassiliades. - Expert systems with applications 40 (10), 2013. - 4065-4074 p.
27. E. Cambria. SenticNet 2: A semantic and affective resoutce for opinion mining and sentiment analysis / Erik Cambria. - Proceedings of AAAI FLAIRS : conference, 2012. - 202-207 p.
28. Hogenboom A., Frasincar F., Kaymak U., de Jong F.Polarity analysis of texts using discourse structure / Alexander Hogenboom, Flavius Frasincar, Franciska de Jong, Uzay Kaymak. - In Proceedings of the 20th ACM international conference on Information and knowledge management, 2011. 1061-1070p.
29. Shuang, L. Becoming intercultural: Exposure to foreign cultures and intercultural competence / Shuang Liu. - China Media Research, 10(3), 2014. 7-14p.
30. C. Kaur and A. Sharma. Twitter Sentiment Analysis on Coronavirus using Textblob / Navprabhjot Kaur, Poonam Sharma. - EasyChair 2516-2314, 2020.
31. Singh R., Bhatia A. Sentiment analysis using Machine Learning technique to predict outbreaks and epidemics / Ramandeep Singh, Arti Bhatia // International Journal of Advanced Science and Research. 2018; 3:19-24p.
32. R. J. Medford, S. N. Saleh, A. Sumarsono, T. M. Perl, and C. U. J. m. Lehmann. An "Infodemic": Leveraging High-Volume Twitter Data to Understand Public Sentiment for the COVID-19 Outbreak / Richard J. Medford, Sameh N. Saleh, Andrew Sumarsono, Trish M. Perl, Christoph U. Lehmann, 2020.
33. Choi S., Lee J., Kang M.-G., Min H., Chang Y.-S., Yoon S.J.M. Large¬scale machine learning of media outlets for understanding public reactions to nation¬wide viral infection outbreaks / Sungwoon Choi, Jangho Lee, Min Gyu Kang, Hyeyoung Min, Yoon Seok Chang, Sungroh Yoon. - Methods, 2017. - 129:50-59p.
34. Khan M.S., Varathan K.D., Mujtaba G., Al-Kabsi A.M. Using online social networks to track a pandemic: A systematic review/ Mohammed Ali Al-Garadi, Muhammad Sadiq Khan, Kasturi Dewi Varathan, Ghulam Mujtaba, Abdelkodose M Al-Kabsi // Journal of Biomedical Informatics. 2016; 62: 1-11p.
35. Barbosa L., Feng J. Robust Sentiment Detection on Twitter from Biased and Noisy Data/ Luciano Barbosa, Junlan Feng. - In Proc. of 23rd Int. Conf, on Computational Linguistics: Posters (COLING ‘10), Association for Computational Linguistics, - Stroudsburg, PA, USA, 2010. P.36-44.
36. Thelwall M., Buckley K., Paltoglou G., Cai D. Sentiment strength detection in short informal text / Mike Thelwall, Kevan Buckley, Georgios Paltoglou, Di Cai // Journal of the American Society for Information Science and Technology, -2010. P.2544-2558.
37. Thelwall M., Buckley K, Paltoglou G. Sentiment in Twitter Events / Mike Thelwall, Kevan Buckley, and Georgios Paltoglou // Journal of the American Society for Information Science and Technology archive Vol. 62, 2011.
38. Liu B. Sentiment Analysis and Subjectivity / Bing Liu // Handbook of Natural Language Processing, Second Edition, 2010.
39. Serrano-Guerrero J., Olivas J. A., Romero F. P., Herrera-Viedma E. Sentiment analysis: A review and comparative analysis of web services / Jesus Serrano-Guerrero, Jose A Olivas, Francisco P Romero, Enrique Herrera-Viedma // Information Sciences 311, 2015: 18-38p.
40. Tan C., Lee L., Tang J., Jiang L., Zhou M., Li P. User-level sentiment analysis incorporating social networks/ Chenhao Tan, Lillian Lee, Jie Tang, Long Jiang, Ming Zhou, and Ping Li. - Proceedings of the Sixteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD), 2011.
41. Ali K., Dong H., Bouguettaya A., Erradi A., Hadjidj R. Sentiment analysis as a service: a social media based sentiment analysis framework / Kashif Ali, Hai Dong, Athman Bouguettaya, Abdelkarim Erradi, Rachid Hadjidj. - IEEE; 2017. P.660-667.
42. Jansen B.J., Zhang M., Sobel K., Chowdury A. Twitter power: Tweets as electronic word of mouth / Bernard J. Jansen, Mimi Zhang, Kate Sobel , Abdur Chowdury // Journal of the American Society for Information Science and Technology Vol 60, 2009.
43. Rodrigues R. G., das Dores R. M., Camilo-Junior C. G., & Rosa T. C. SentiHealth-Cancer: A sentiment analysis tool to help detecting mood of patients in online social networks / Ramon Gouveia Rodrigues, Rafael Marques das Dores, Celso G Camilo-Junior , Thierson Couto Rosa. -International Journal of Medical Informatics, -85, -2016, - P.80-95.
44. Appel G., Grewal L., Hadi R., Stephen A.T. The future of social media in marketing/ Gil Appel, Lauren Grewal, Rhonda Hadi, Andrew T. Stephen // Journal of the Academy of Marketing Science, 2020; - 48: - P. 79-95.
45. Mr. S.M. Vohra, Prof. J.B. Teraiya. A comparative study of sentiment analysis techniques / Saifee Vohra, Jay Teraiya // Journal of information, knowledge and research in computer engineering, issn: 0975 - 6760| nov 12 to oct 13, p. 313¬317.
46. Kim E.H.-J., Jeong Y.K., Kim Y., Kang K.Y., Song M. Topic-based content and sentiment analysis of Ebola virus on Twitter and in the news / Erin Hea- Jin Kim, Yoo Kyung Jeong, Yuyoung Kim, Keun Young Kang, Min Song // Journal of Information Science, - 2016; - 42. P.763-781.
47. Bordia P., Hunt E., Paulsen N., Tourish D., DiFonzo N. Uncertainty during organizational change: Is it all about control? / Prashant Bordia, Elizabeth Hunt, Neil Paulsen, Dennis Tourish // European Journal of Work and Organizational Psychology, - 13(3), - 2004. P.345-365.
48. Pastor C.K. Sentiment analysis of filipinos and effects of extreme community quarantine due to Coronavirus (Covid-19) / Cherish Kay L. Pastor // Pandemic. Journal of Critical Reviews, 2020.
49. Pollacci L., Sirbu A., Giannotti F., Pedreschi D., Lucchese C., Muntean C.I. Sentiment spreading: An epidemic model for lexicon-based sentiment analysis on twitter / Laura Pollacci Email author, Alina Sirbu, Fosca Giannotti, Dino Pedreschi, Claudio Lucchese // - Springer, 2017. 114-127p.
50. Ainin S., Feizollah A., Anuar N.B., Abdullah N.A. Sentiment analyses of multilingual tweets on halal tourism / Ainin Sulaiman, Ali Feizollah, Nor Badrul Anuar, Nor Aniza Abdullah // Tourism Management Perspectives. -2020; - 34:100658.
51. Bodrunova S. S., Blekanov I. S., Maksimov A. Measuring influencers in twitter ad-hoc discussions: active users vs. internal networks in the discourse on biryuliovo bashings in 2013 / Sergei Sergeev, Ivan Blekanov, Aleksei Maksimov // In Artificial Intelligence and Natural Language Conference (AINL), IEEE, 2016. P. 1-10.
52. Nielsen F. A. A new ANEW: Evaluation of a word list for sentiment analysis in microblogs / Finn Arup Nielsen, - In arXiv preprint arXiv: 1103.2903, - 2011.
53. A. D. J. A. a. S. Dubey, "Twitter Sentiment Analysis during COVID19 Outbreak," 2020 // Kurdistan Journal of Applied Research | Special Issue on Coronavirus (COVID-19)| , 2020.
54. Kim K.-S., Sin S.-C.J., Yoo-Lee E.Y. Undergraduates' use of social media as information sources / Kyung-Sun Kim, Sei-Ching Joanna Sin, Eun Young Yoo- Lee // WKWSCI Journal Articles, 2014.
55. Zarrad A., Jaloud A., Alsmadi I. The evaluation of the public opinion-a case study: Mers-cov infection virus in ksa / Anis Zarrad, Abdulaziz Jaloud, Izzat Alsmadi, - IEEE; 2014. pp. 664-670.
56. Chakraborty K., Bhattacharyya S., Bag R. Sentiment Analysis on a Set of Movie Reviews Using Deep Learning Techniques / Koyel Chakraborty, Siddhartha Bhattacharyya, Rajib Bag. - Social Network Analytics, - 2019. P.127-147.
57. Pak A., Paroubek P. Twitter as a corpus for sentiment analysis and opinion mining / Alexander Pak, Paroubek Patrick. - Proceedings of the International Conference on Language Resources and Evaluation, LREC, Vol. 10 -Valletta, - Malta, 2010.
58. F. Benamara, C. Cesarano, A. Picariello, D. R. Recupero, and V. S.
Subrahmanianin. Sentiment analysis: Adjectives and verbs are better than ajectives alone / Farah Benamara, Carmine Cesarano, Antonio Picariello, Diego Reforgiato Recupero, Venkatramana S Subrahmanian. - Proceedings of
International Conference on Weblogs and Social Media, ICWSM '10, - 2007.
59. Jindal N. and Liu B. Mining Comparative Sentences and Relations / Nitin Jindal N. and Bing Liu. // Proceedings of 21st National Conference on Artificial Intelligence, AAAI '06. Boston, MA, - July 2006.
60. K. Sailunaz & R. Alhajj. Emotion and sentiment analysis from Twitter text / Kashfia Sailunaz, Reda Alhajj // Journal of Computational Science, Vol. 36, - 2019.
61. McCallum A., Nigam K. A comparison of event models for naive bayes text classification / Andrew McCallum and Kamal Nigam // AAAI-98 workshop on learning for text categorization, - 1998, - T. 752, - P.41-48.
62. N. K. Rajput, B. A. Grover, and V. K. J. a. p. a. Rathi, "Word frequency and sentiment analysis of twitter messages during Coronavirus pandemic,"// Kurdistan Journal of Applied Research, vol. 5, no. 3, pp. 54-65, May 2020.
63. Castillo C. Big crisis data: social media in disasters and time-critical situations / Carlos Castillo // Cambridge University Press, - 2016, - 225p.
64. Vilares D., Alonso M. A., Gomez-Rodriguez C. Supervised sentiment analysis in multilingual environments / David Vilares, Miguel A Alonso, Carlos Gomez-Rodriguez // Information Processing & Management 53 (3), -2017. P. 595-607p.
65. Bodrunova S. S. When Context Matters. Analyzing Conflicts with the Use of Big Textual Corpora from Russian and International Social Media / Svetlana Bodrunova // PArtecipazione е COnflitto. The Open Gournal of Sociopolitical Studies11 (2), - 2018, P. 497-510.
Электронные ресурсы
66. Global Language Monitor [Электронный ресурс]. - Режим доступа: https://languagemonitor.com/(дата обращения: 29.01.2021).
https://www.dictionary.eom/e/s/new-words-we-created-because-of-coronavirus/#1(дата обращения: 29.01.2021).
68. Everyday Health [Электронный ресурс] - Режим доступа:
https://www.everydayhealth.com/coronavirus/coronavirus-glossary-key-terms-about- the-pandemic-explained/(дата обращения: 29.01.2021).
69. Oxford English Dictionary [Электронный ресурс]. - Режим доступа:
https://public.oed.com/updates/new-words-list-july-2020/ (дата обращения:
29.01.2021).
70. BBC news [Электронный ресурс]. - Режим доступа:
https://www.bbc.com/news/uk-54878910(дата обращения: 29.01.2021).
71. Meriam Webster [Электронный ресурс]. - Режим доступа:
https://www.merriam-webster.com/words-at-play/new-dictionary-words-coronavirus- covid-19(дата обращения: 29.01.2021).
72. Financial Times [Электронный ресурс]. - Режим доступа:
https://www.ft.com/content/b7a6b3f0-830b-11ea-b872-8db45d5f6714 (дата
обращения: 29.01.2021).
73. The New York Times [Электронный ресурс]. - Режим доступа: https://www.nytimes.com/2020/12/24/opinion/coronavirus-language-words.html(дата обращения: 29.01.2021).
74. English-Corpora.org[Электронный ресурс]. - Режим доступа: https://www.english-corpora.org/corona/(дата обращения: 29.01.2021).