ЛИДЕРЫ МНЕНИЙ КАК ВЕКТОРЫ РАСПРОСТРАНЕНИЯ МЕДИАИНФОРМАЦИИ
|
ВВЕДЕНИЕ 3
ГЛАВА 1. ЛИДЕРЫ МНЕНИЙ В ПОСТМОДЕРНИСТСКОМ
ДИСКУРСЕ 8
1.1 Проблема определения термина «Лидер Мнений» 8
1.2 Интернет-дискурс как карнавал 14
1.2.1 Характеристика постмодернистского дискурса 19
1.3 Место блогерского стиля в функциональной стилистике 22
1.3.1 Идеологемы в речи лидеров мнений 24
1.4 Модель передачи медиаинформации 27
1.5 Теория графов в анализе социальных сетей 31
ГЛАВА 2. РОЛЬ ЛИДЕРОВ МНЕНИЙ В ФОРМИРОВАНИИ
ОБЩЕСТВЕННОГО ДИСКУРСА 36
2.1 Специфика сбора данных и ручной анализ 36
2.1.1 Интертекстуальное ядро в малой выборке 42
2.2 Анализ гомогенного дискурса 44
2.2.1 Графовый анализ данных 45
2.2.2 Интертекстуальное ядро в большой выборке 48
2.2.3 Кластеризация дискурса и проверка результатов 50
2.2.4 Поликодовый текст как элемент интертекстуального ядра 59
2.3 Анализ гетерогенного дискурса 61
2.4 Перспективы развития приложения 68
ЗАКЛЮЧЕНИЕ 72
СПИСОК ЛИТЕРАТУРЫ 75
ПРИЛОЖЕНИЕ
ГЛАВА 1. ЛИДЕРЫ МНЕНИЙ В ПОСТМОДЕРНИСТСКОМ
ДИСКУРСЕ 8
1.1 Проблема определения термина «Лидер Мнений» 8
1.2 Интернет-дискурс как карнавал 14
1.2.1 Характеристика постмодернистского дискурса 19
1.3 Место блогерского стиля в функциональной стилистике 22
1.3.1 Идеологемы в речи лидеров мнений 24
1.4 Модель передачи медиаинформации 27
1.5 Теория графов в анализе социальных сетей 31
ГЛАВА 2. РОЛЬ ЛИДЕРОВ МНЕНИЙ В ФОРМИРОВАНИИ
ОБЩЕСТВЕННОГО ДИСКУРСА 36
2.1 Специфика сбора данных и ручной анализ 36
2.1.1 Интертекстуальное ядро в малой выборке 42
2.2 Анализ гомогенного дискурса 44
2.2.1 Графовый анализ данных 45
2.2.2 Интертекстуальное ядро в большой выборке 48
2.2.3 Кластеризация дискурса и проверка результатов 50
2.2.4 Поликодовый текст как элемент интертекстуального ядра 59
2.3 Анализ гетерогенного дискурса 61
2.4 Перспективы развития приложения 68
ЗАКЛЮЧЕНИЕ 72
СПИСОК ЛИТЕРАТУРЫ 75
ПРИЛОЖЕНИЕ
Социальные сети активно входят в жизнь российского общества. Они становятся неотъемлемой частью повседневности россиян. На январь 2020 года 70 млн. россиян являются активными пользователями социальных сетей [Statista 2020 (55)]. Если пользователь зарегистрирован в социальной сети, то его удержанию на площадке способствует развитие мобильного и широкополосного интернета, техническое удобство и привлекательный дизайн сайта. Желание постоянно оставаться на связи, своевременно узнавать новости и не отставать от развивающегося общества заставляет людей регистрироваться сразу в нескольких социальных сетях.
Средства массовой информации в желании угнаться за пользователями переходят в интернет. Они создают новостные сайты, где рассказывают о произошедших событиях. Другие пользователи, прочитавшие публикации на этом сайте, субъективно исказив полученную медиаинформацию, высказывают свои оценки, мнения и суждения в социальных сетях. Под медиаинформацией мы понимаем информацию, полученную из СМИ. Если множество пользователей прочитали это высказывание и отреагировали на него одобрительно, к примеру, поставили «лайк», т.е. выражение одобрения, или сделали «репост», т.е. поделились высказыванием с другими, то первый пользователь в цепочке оказывает влияние на другого пользователя. Если мнение пользователя имеет вес в обществе, то такой пользователь становится лидером мнений. Другие пользователи, получившие новость от лидера мнений, также транслируют данное мнение в высказываниях или сообщают его искаженный вариант массовой аудитории в социальной сети. В связи с этим можно говорить о формировании лидерами мнений определённых дискурсов по общественно-значимой теме.
Так как современные коммуникации состоят из набора цитаций, передающихся СМИ и лидерами мнений [Кристева 2000], то мы можем говорить об ограниченном наборе вербальных маркеров различных концептов. Яркий пример таких маркеров - это идеологемы, отображающие мифологизированные представления общества о власти [Малышева 2009]. Если количество маркеров ограниченно, то мы можем составить ядро дискурса, сложившегося по общественно-значимой теме.
Социальная сеть Instagram, в которой на 3 квартал 2019 году было зарегистрировано 37,1 млн. россиян [Statista 2020 (53)], дает возможность для размещения сформировавшихся форм дискурса. Обычно определенная дискурсивная формация маркируется хэштегами (#). «Хэштег (hashtag), также известный как тег или метка, представляет собой знаковую когнитивную структуру, в которой за первым символом # следует одна или несколько лексем, репрезентирующих смысловое послание текстового или другого материала, размещаемого в Интернет-пространстве и сопровождаемого этим хэштегом» [Кайгородова 2015: 111]. Количество публикаций по хэштегам варьируется в зависимости от популярности общественно-значимого события.
В пределах хэштега или связанной группы хэштегов через лидеров мнений к обычным пользователям передаются определенные концепты. В связи с этим возникает вопрос: насколько мнения коммуникантов являются личными мнениями? Мы предполагаем, что некоторые лидеры мнений оказывают влияние так сильно, что пользователи транслируют не свое мнение, используя «чужие слова» [Бахтин 1996]. Проблема заключается в невозможности с достаточной долей достоверности определить, насколько критически человек относится к проблеме: передает ли он свое мнение или транслирует чужое. Вопросы, касающиеся лидеров мнений и способов влияния на других пользователей, являются актуальными в связи с распространением социальных сетей.
Проблема анализа публикаций по хэштегам до сих пор не проработана, так как это требует больших ресурсов для анализа. Исследование лидеров мнений проводится в PR для продвижения продукта и в политологии для
продвижения идей. Однако исследования в данных областях подсчитывают эффективность лидеров мнений как рекламного канала коммуникации. В лингвистике изучением лидеров мнений занимаются в функциональной стилистике. Ученые определяют лексикон и составляют языковую личность в определенных жанрах блогосферы. Работ по изучению полного дискурса с участием лидеров мнений до настоящего момента достаточно мало.
Исходя из вышесказанного, в качестве объекта исследования выступает медиадискурс в социальных сетях. Предметом исследования является динамика распространения информации в социальных сетях.
Цель - создать модель распространение медиаинформации на основе лидеров мнений.
Для достижения цели нами были поставлены следующие задачи:
1) Установить основные черты интернет-дискурса.
2) Создать корпусы текстов, размещенных по определенным хэштегам.
3) Проанализировать собранные тексты и экстралингвистические факторы.
4) Создать граф подписчиков и лайков по определённому хэштегу.
5) Выявить ядро дискурса и интерпретировать вербальные репрезентации идеологем.
6) Определить кластеры влияния лидеров мнений на подписчиков.
Основные методы работы - это контент-анализ, графовый анализ, системный анализ, математические методы обработки естественного языка.
Материалом исследования является корпус из 258 текстов, собранных от 200 аккаунтов по теме «Егор Жуков», и 216 текстов, собранных со 115 аккаунтов по теме «Коронавирус». Тексты из первой выборки были размещены со 2 августа по 12 декабря 2019 года, тексты из второй выборки были размещены с 27 марта по 30 апреля 2020 года.
В первой главе работы мы определяем термин «лидер мнений» и отделяем его от схожих терминов: «блогер» и «инфлюенсер». Предлагается рассматривать интернет-коммуникацию как карнавальный дискурс, предложенный Бахтиным. В продолжение идей Бахтина авторы изучают такие черты постмодернистской интернет-коммуникации, как интертекстуальность [Кристева 2000], ироничность [Пономарев 2020] и отсутствие автора [Барт 2008]. На основе философского осмысления предлагается интерпретация функционального стиля лидеров мнений как публицистического. Авторы рассматривают подходы к понятию «идеологема» и выбирают подходящую парадигму. Но основе построенной методологии предлагается схема медиадискурса в социальных сетях на основе лидеров мнений.
Во второй главе проводится исследование гомогенного медиадискурса, образовавшегося вокруг хэштега «#свободуегоружукову» и гетерогенного дискурса по теме «коронавирус». Предлагается граф подписчиков и лайков, а также кластеры влияния и ядро дискурса. Основываясь на данных показателях, мы устанавливаем лидера мнений, повлиявшего на дискурс, и интерпретируем вербальные репрезентации идеологем.
Новизна работы заключается в автоматизации дискурсивного анализа в социальных сетях и создании графа подписчиков по определённым хэштегам. В ходе выполнения работы мы выявляем лидеров мнений, которые повлияли на процесс.
Теоретическая значимость работы заключается в анализе единого интернет-дискурса по социально-значимой теме как интертекстуального целого, деленного на множество кластеров, объединенных одинаковыми цитациями.
Используя методологию исследования, мы в дальнейшем займемся разработкой приложения для анализа текстов и автоматического составления графа влияния лидеров мнений на подписчиков. Практическая значимость созданного приложения заключается в выявлении наиболее влиятельных элементов дискурса и эффективного маркетингового продвижения продукта через них.
Полученный опыт анализа дискурса эффективен в практике контент- менеджмента. Данная методология позволяет понять, какие мнения распространены в определённом дискурсе, о чем можно говорить, о чем нельзя говорить и какие слова эффективнее использовать для влияния на аудиторию.
В основе нашего исследования лежат следующие гипотезы:
1) Пользователи выражают мнения в социальных сетях посредством ограниченного набора вербальных маркеров, который можно подвергнуть анализу.
2) В Instagram существует два вида дискурса: гомогенный и гетерогенный.
3) В гомогенном дискурсе есть один или два наиболее влиятельных лидера мнений, которые влияют на коммуникацию во всем дискурсе.
4) В гетерогенном дискурсе есть множество лидеров мнений, вокруг которых выстраивается коммуникация.
5) Дискурс делится на отдельные кластеры, в которых представлен определенный набор вербальных маркеров.
Работа прошла апробацию на ежегодной научной конференции студентов, аспирантов и молодых ученых филологического факультета «Проблемы филологии глазами молодых исследователей» за 2019 и 2020 года. По аналогичной работе размещена публикация «Создание инструментального средства для анализа исчезающего контента (на примере stories в Instagram)» в сборнике «Проблемы филологии глазами молодых исследователей».
Средства массовой информации в желании угнаться за пользователями переходят в интернет. Они создают новостные сайты, где рассказывают о произошедших событиях. Другие пользователи, прочитавшие публикации на этом сайте, субъективно исказив полученную медиаинформацию, высказывают свои оценки, мнения и суждения в социальных сетях. Под медиаинформацией мы понимаем информацию, полученную из СМИ. Если множество пользователей прочитали это высказывание и отреагировали на него одобрительно, к примеру, поставили «лайк», т.е. выражение одобрения, или сделали «репост», т.е. поделились высказыванием с другими, то первый пользователь в цепочке оказывает влияние на другого пользователя. Если мнение пользователя имеет вес в обществе, то такой пользователь становится лидером мнений. Другие пользователи, получившие новость от лидера мнений, также транслируют данное мнение в высказываниях или сообщают его искаженный вариант массовой аудитории в социальной сети. В связи с этим можно говорить о формировании лидерами мнений определённых дискурсов по общественно-значимой теме.
Так как современные коммуникации состоят из набора цитаций, передающихся СМИ и лидерами мнений [Кристева 2000], то мы можем говорить об ограниченном наборе вербальных маркеров различных концептов. Яркий пример таких маркеров - это идеологемы, отображающие мифологизированные представления общества о власти [Малышева 2009]. Если количество маркеров ограниченно, то мы можем составить ядро дискурса, сложившегося по общественно-значимой теме.
Социальная сеть Instagram, в которой на 3 квартал 2019 году было зарегистрировано 37,1 млн. россиян [Statista 2020 (53)], дает возможность для размещения сформировавшихся форм дискурса. Обычно определенная дискурсивная формация маркируется хэштегами (#). «Хэштег (hashtag), также известный как тег или метка, представляет собой знаковую когнитивную структуру, в которой за первым символом # следует одна или несколько лексем, репрезентирующих смысловое послание текстового или другого материала, размещаемого в Интернет-пространстве и сопровождаемого этим хэштегом» [Кайгородова 2015: 111]. Количество публикаций по хэштегам варьируется в зависимости от популярности общественно-значимого события.
В пределах хэштега или связанной группы хэштегов через лидеров мнений к обычным пользователям передаются определенные концепты. В связи с этим возникает вопрос: насколько мнения коммуникантов являются личными мнениями? Мы предполагаем, что некоторые лидеры мнений оказывают влияние так сильно, что пользователи транслируют не свое мнение, используя «чужие слова» [Бахтин 1996]. Проблема заключается в невозможности с достаточной долей достоверности определить, насколько критически человек относится к проблеме: передает ли он свое мнение или транслирует чужое. Вопросы, касающиеся лидеров мнений и способов влияния на других пользователей, являются актуальными в связи с распространением социальных сетей.
Проблема анализа публикаций по хэштегам до сих пор не проработана, так как это требует больших ресурсов для анализа. Исследование лидеров мнений проводится в PR для продвижения продукта и в политологии для
продвижения идей. Однако исследования в данных областях подсчитывают эффективность лидеров мнений как рекламного канала коммуникации. В лингвистике изучением лидеров мнений занимаются в функциональной стилистике. Ученые определяют лексикон и составляют языковую личность в определенных жанрах блогосферы. Работ по изучению полного дискурса с участием лидеров мнений до настоящего момента достаточно мало.
Исходя из вышесказанного, в качестве объекта исследования выступает медиадискурс в социальных сетях. Предметом исследования является динамика распространения информации в социальных сетях.
Цель - создать модель распространение медиаинформации на основе лидеров мнений.
Для достижения цели нами были поставлены следующие задачи:
1) Установить основные черты интернет-дискурса.
2) Создать корпусы текстов, размещенных по определенным хэштегам.
3) Проанализировать собранные тексты и экстралингвистические факторы.
4) Создать граф подписчиков и лайков по определённому хэштегу.
5) Выявить ядро дискурса и интерпретировать вербальные репрезентации идеологем.
6) Определить кластеры влияния лидеров мнений на подписчиков.
Основные методы работы - это контент-анализ, графовый анализ, системный анализ, математические методы обработки естественного языка.
Материалом исследования является корпус из 258 текстов, собранных от 200 аккаунтов по теме «Егор Жуков», и 216 текстов, собранных со 115 аккаунтов по теме «Коронавирус». Тексты из первой выборки были размещены со 2 августа по 12 декабря 2019 года, тексты из второй выборки были размещены с 27 марта по 30 апреля 2020 года.
В первой главе работы мы определяем термин «лидер мнений» и отделяем его от схожих терминов: «блогер» и «инфлюенсер». Предлагается рассматривать интернет-коммуникацию как карнавальный дискурс, предложенный Бахтиным. В продолжение идей Бахтина авторы изучают такие черты постмодернистской интернет-коммуникации, как интертекстуальность [Кристева 2000], ироничность [Пономарев 2020] и отсутствие автора [Барт 2008]. На основе философского осмысления предлагается интерпретация функционального стиля лидеров мнений как публицистического. Авторы рассматривают подходы к понятию «идеологема» и выбирают подходящую парадигму. Но основе построенной методологии предлагается схема медиадискурса в социальных сетях на основе лидеров мнений.
Во второй главе проводится исследование гомогенного медиадискурса, образовавшегося вокруг хэштега «#свободуегоружукову» и гетерогенного дискурса по теме «коронавирус». Предлагается граф подписчиков и лайков, а также кластеры влияния и ядро дискурса. Основываясь на данных показателях, мы устанавливаем лидера мнений, повлиявшего на дискурс, и интерпретируем вербальные репрезентации идеологем.
Новизна работы заключается в автоматизации дискурсивного анализа в социальных сетях и создании графа подписчиков по определённым хэштегам. В ходе выполнения работы мы выявляем лидеров мнений, которые повлияли на процесс.
Теоретическая значимость работы заключается в анализе единого интернет-дискурса по социально-значимой теме как интертекстуального целого, деленного на множество кластеров, объединенных одинаковыми цитациями.
Используя методологию исследования, мы в дальнейшем займемся разработкой приложения для анализа текстов и автоматического составления графа влияния лидеров мнений на подписчиков. Практическая значимость созданного приложения заключается в выявлении наиболее влиятельных элементов дискурса и эффективного маркетингового продвижения продукта через них.
Полученный опыт анализа дискурса эффективен в практике контент- менеджмента. Данная методология позволяет понять, какие мнения распространены в определённом дискурсе, о чем можно говорить, о чем нельзя говорить и какие слова эффективнее использовать для влияния на аудиторию.
В основе нашего исследования лежат следующие гипотезы:
1) Пользователи выражают мнения в социальных сетях посредством ограниченного набора вербальных маркеров, который можно подвергнуть анализу.
2) В Instagram существует два вида дискурса: гомогенный и гетерогенный.
3) В гомогенном дискурсе есть один или два наиболее влиятельных лидера мнений, которые влияют на коммуникацию во всем дискурсе.
4) В гетерогенном дискурсе есть множество лидеров мнений, вокруг которых выстраивается коммуникация.
5) Дискурс делится на отдельные кластеры, в которых представлен определенный набор вербальных маркеров.
Работа прошла апробацию на ежегодной научной конференции студентов, аспирантов и молодых ученых филологического факультета «Проблемы филологии глазами молодых исследователей» за 2019 и 2020 года. По аналогичной работе размещена публикация «Создание инструментального средства для анализа исчезающего контента (на примере stories в Instagram)» в сборнике «Проблемы филологии глазами молодых исследователей».
Интернет-дискурс обладает чертами карнавального дискурса: всеобъемлющая свобода, отсутствие классовой иерархии, общение через «маски» и амбивалентность происходящего. Лидеры мнений выступают как «шуты», передающие искаженную субъективную информацию народу. «Маски» и иронизация происходящих событий обнуляет роль автора, оставляя читателя наедине с письмом. Читатель, прочитавший письмо, пропускает его через призму субъективного восприятия и выдает переработанное высказывание нулевого автора в своем высказывании. Таким читателем может быть как лидер мнений, так и обычный пользователь. Сопоставив интернет- дискурс с карнавальным, мы смогли установить его основные черты и рассмотрели их дальнейшее развитие в постмодернистской коммуникации.
Блогерский стиль, по нашей интерпретации, находится на периферии разговорного и публицистического стиля. Воздействующая функция, характерная для публицистики, становится актуальной в блогерском сообщении для массового адресата. Идеологемы, являющиеся когнитивными концептами, объективация которых может происходить с помощью любых средств языка, в блогерском дискурсе становятся инструментами воздействия на аудиторию, отображающими концептуальную картину дискурса. Такую картину мы воссоздали с помощью автоматического сбора ядра дискурса, состоящего из наиболее частотных вербальных маркеров. Наличие ядра дискурса говорит об определенном интертекстуальном начале в коммуникации. В нашей работе мы осуществили поиск начальных лидеров мнений, которые распространяли данные вербальные маркеры.
Ограниченное количество вербальные маркеры передаются от СМИ и от лидеров мнений обычным пользователям интернет-коммуникации, которые в свою очередь также транслируют их в высказываниях в интернете. Фундаментом для изучения такой коммуникации послужили работы Лазерсфельда, развитые Шрамом в теорию «многоступенчатой коммуникации».
Для составления модели распространения медиинформации на основе лидеров мнений, мы собрали корпус текстов по двум темам. Каждый текст мы лемматизировали и записали в формате ISO. Из полученного корпуса мы извлекли ядро дискурса и предложили интерпретацию основных идеологем в ядре. С использованием алгоритма affinity propagation, каждый текст был превращен в N-мерный вектор. На основе векторов мы провели кластеризацию дискурса и сравнили тексты в кластерах. Тексты имели высокое сходство из- за ряд вербальных маркеров, отличающих их от других кластеров. На основе экстралингвистических факторов мы составили графы взаимодействия аккаунтов друг с другом. По каждому кластеру мы проверили наличие взаимодействия между аккаунтами и отметили, что оно может определять идеологемы в кластере, а может быть второстепенной характеристикой или вовсе отсутствовать. Поделив коммуникацию на кластеры и установив влияние лидеров мнений в каждой группе, мы предложили определенную модель распространения медиаинформации в двух видах дискурса: в гомогенном и гетерогенном.
Мы провели анализ каждого вида дискурса и установили их особенности. В гомогенном дискурсе наблюдается центризм мнений. Дискурс выстраивается вокруг одного-двух лидеров мнений, передающих вербальные репрезентации идеологем, соответствующие их картине мира. Эти маркеры переходят из одного высказывания в другое, тем самым из их отражения можно вычленить корпус текстов, характерных для этого дискурса. С извлечением всех вербальных репрезентаций мы смогли составить картину мира, свойственную для участников дискурса, сформированного лидером мнений.
Гетерогенный дискурс представляет собой систему из множества гомогенных дискурсов по разным темам. В каждом элементе есть определенный лидер мнений, который влияет на коммуникацию. Весь гетерогенный дискурс состоит из множества лидеров мнений, в нем отсутствует единый центр влияния внутри самого дискурса. Анализ целостной системы достаточно сложен, необходимо рассматривать каждый ее элемент по отдельности. Приложение поделило дискурс на кластеры, объединенные общей темой или интенциями. Для более полного анализа гетерогенного дискурса необходимо создать корпус текстов для каждого кластера и проанализировать их методологией анализа гомогенного дискурса. В результате мы получим масштабное представления о различных доминирующих мнениях в обществе по поводу различных тем.
Предложенная нами методология анализа интернет-дискурса внесет вклад в развитие компьютерной лингвистики. Она упростит составление корпуса интернет-текстов и позволит определить интертекстуальное ядро в каждом дискурсе за несколько минут. Лингвисты смогу проследить распространения идеологем в дискурсе, изучить неологизмы и современный сленг.
Мы продолжим развитие приложения, оптимизируем его для исследовательских и коммерческих целей. Полученный опыт работы понадобится нам для дальнейшей практики в Data Science для составления полной картины мышления в условиях пандемии.
Блогерский стиль, по нашей интерпретации, находится на периферии разговорного и публицистического стиля. Воздействующая функция, характерная для публицистики, становится актуальной в блогерском сообщении для массового адресата. Идеологемы, являющиеся когнитивными концептами, объективация которых может происходить с помощью любых средств языка, в блогерском дискурсе становятся инструментами воздействия на аудиторию, отображающими концептуальную картину дискурса. Такую картину мы воссоздали с помощью автоматического сбора ядра дискурса, состоящего из наиболее частотных вербальных маркеров. Наличие ядра дискурса говорит об определенном интертекстуальном начале в коммуникации. В нашей работе мы осуществили поиск начальных лидеров мнений, которые распространяли данные вербальные маркеры.
Ограниченное количество вербальные маркеры передаются от СМИ и от лидеров мнений обычным пользователям интернет-коммуникации, которые в свою очередь также транслируют их в высказываниях в интернете. Фундаментом для изучения такой коммуникации послужили работы Лазерсфельда, развитые Шрамом в теорию «многоступенчатой коммуникации».
Для составления модели распространения медиинформации на основе лидеров мнений, мы собрали корпус текстов по двум темам. Каждый текст мы лемматизировали и записали в формате ISO. Из полученного корпуса мы извлекли ядро дискурса и предложили интерпретацию основных идеологем в ядре. С использованием алгоритма affinity propagation, каждый текст был превращен в N-мерный вектор. На основе векторов мы провели кластеризацию дискурса и сравнили тексты в кластерах. Тексты имели высокое сходство из- за ряд вербальных маркеров, отличающих их от других кластеров. На основе экстралингвистических факторов мы составили графы взаимодействия аккаунтов друг с другом. По каждому кластеру мы проверили наличие взаимодействия между аккаунтами и отметили, что оно может определять идеологемы в кластере, а может быть второстепенной характеристикой или вовсе отсутствовать. Поделив коммуникацию на кластеры и установив влияние лидеров мнений в каждой группе, мы предложили определенную модель распространения медиаинформации в двух видах дискурса: в гомогенном и гетерогенном.
Мы провели анализ каждого вида дискурса и установили их особенности. В гомогенном дискурсе наблюдается центризм мнений. Дискурс выстраивается вокруг одного-двух лидеров мнений, передающих вербальные репрезентации идеологем, соответствующие их картине мира. Эти маркеры переходят из одного высказывания в другое, тем самым из их отражения можно вычленить корпус текстов, характерных для этого дискурса. С извлечением всех вербальных репрезентаций мы смогли составить картину мира, свойственную для участников дискурса, сформированного лидером мнений.
Гетерогенный дискурс представляет собой систему из множества гомогенных дискурсов по разным темам. В каждом элементе есть определенный лидер мнений, который влияет на коммуникацию. Весь гетерогенный дискурс состоит из множества лидеров мнений, в нем отсутствует единый центр влияния внутри самого дискурса. Анализ целостной системы достаточно сложен, необходимо рассматривать каждый ее элемент по отдельности. Приложение поделило дискурс на кластеры, объединенные общей темой или интенциями. Для более полного анализа гетерогенного дискурса необходимо создать корпус текстов для каждого кластера и проанализировать их методологией анализа гомогенного дискурса. В результате мы получим масштабное представления о различных доминирующих мнениях в обществе по поводу различных тем.
Предложенная нами методология анализа интернет-дискурса внесет вклад в развитие компьютерной лингвистики. Она упростит составление корпуса интернет-текстов и позволит определить интертекстуальное ядро в каждом дискурсе за несколько минут. Лингвисты смогу проследить распространения идеологем в дискурсе, изучить неологизмы и современный сленг.
Мы продолжим развитие приложения, оптимизируем его для исследовательских и коммерческих целей. Полученный опыт работы понадобится нам для дальнейшей практики в Data Science для составления полной картины мышления в условиях пандемии.



