Тип работы:
Предмет:
Язык работы:


АВТОМАТИЧЕСКОЕ ВЫЯВЛЕНИЕ СКРЫТЫХ СООБЩЕСТВ В ТЕКСТАХ РУССКОЯЗЫЧНОГО КОРПУСА СОЦИАЛЬНЫХ СЕТЕЙ

Работа №143436

Тип работы

Магистерская диссертация

Предмет

лингвистика

Объем работы93
Год сдачи2021
Стоимость4920 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
61
Не подходит работа?

Узнай цену на написание



ВВЕДЕНИЕ 4
ГЛАВА 1. ИНТЕРНЕТ И СОЦИАЛЬНЫЕ СЕТИ 9
1.1. Интернет-общение и его лингвистические особенности 9
1.2. Определение социальных сетей и проблемы их анализа 15
Выводы к первой главе 19
ГЛАВА 2. СКРЫТЫЕ СООБЩЕСТВА 20
2.1. Скрытые сообщества: определение и применение 20
2.2. Определение скрытых сообществ в социальных сетях математическими методами 24
2.3. Кластерный анализ как способ определения скрытых сообществ в социальных сетях 27
Выводы ко второй главе 31
ГЛАВА 3. МЕТОДОЛОГИЧЕСКИЕ ОСНОВАНИЯ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ 32
3.1. Определение и основные понятия тематического моделирования 32
3.2. Автоматическое назначение меток тем 38
Выводы к третьей главе 42
ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНОЕ ВЫЯВЛЕНИЕ СКРЫТЫХ СООБЩЕСТВ В СОЦИАЛЬНЫХ СЕТЯХ 43
4.1. Создание корпуса постов социальной сети ВКонтакте 43
4.2. Построение автор-тематической модели 47
4.3. Разработка алгоритма автоматического назначение меток тем 50
4.4. Построение модели скрытых сообществ 55
4.5. Сравнение различных методов выявления скрытых сообществ, оценка и анализ результатов 62
Выводы к четвёртой главе 68
ЗАКЛЮЧЕНИЕ 69
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 71
СПИСОК ЭЛЕКТРОННЫХ РЕСУРСОВ 80
ПРИЛОЖЕНИЕ 1. ПРИМЕРЫ НЕКОТОРЫХ ВИЗУАЛИЗИРОВАННЫХ ТЕМАТИЧЕСКИХ МОДЕЛЕЙ 83
ПРИЛОЖЕНИЕ 2. РЕЗУЛЬТАТЫ ЭКСПЕРТНЫХ ОЦЕНОК ДЛЯ КАНДИДАТОВ В МЕТКИ ТЕМ 87


В связи со стремительным ростом информационных технологий внимание исследователей социальных сетей приковано к текстам пользователей и выявлению связей между ними. Социальные сети – это зеркало общества, они позволяют оценить тенденции развития социума по формальным признакам. На основании общности этих тенденций выделяют пользовательские сегменты – скрытые сообщества. Для анализа используют графовые методы или кластерный анализ, однако эти методы чаще всего упускают из вида лингвистические признаки. Современные алгоритмы компьютерной лингвистики позволяют упростить задачу анализа дискурса, обработать и представить репрезентативные данные для больших текстовых коллекций, в том числе и для постов социальных сетей. Основываясь на тематической структуре текстов, можно выявить более устойчивые связи между пользователями.
Актуальность работы обусловлена необходимостью сочетания методов лингвистического и количественного анализа данных для построения семантической сети пользователей на основе тематической близости их постов.
Новизна исследования заключается в том, что в данной работе обсуждаются эксперименты по выявлению скрытых сообществ методами тематического моделирования и автоматического назначения меток тем, которые впервые выполнены на корпусе постов русскоязычных пользователей ВКонтакте .
Объект исследования–скрытые сообщества, выявленные с помощью алгоритмов тематического моделирования среди пользователей русскоязычного сегмента социальной сети ВКонтакте.
Предмет исследования–количественные и качественные параметры скрытых сообществ, которые позволяют судить об актуальном состоянии групп и их тематике.
Цель исследования состоит в том, чтобы выявить скрытые связи между пользовательскими постами социальных сетей, основанные на общности лингвистических параметров текстов и их тематики.
Для достижения данной цели требуется решить следующие задачи:
1) исследовать специфику интернет-дискурса и выявить специфические лингвистические параметры текстов социальных сетей;
2) подготовить лингвистические данные для проведения экспериментов: произвести сборку и предобработку исследовательского корпуса;
3) разработать процедуру выявления скрытых связей между текстами социальных сетей;
4) произвести планирование и проведение экспериментов:
a) построение автор-тематической модели ATM для определения тематической специализации авторов;
b) автоматическое назначение меток тем из внешних и внутренних источников;
c) соотнесение данных о тематике текстов авторов с формулировками их интересов и с принадлежностью их к тем или иным сообществам;
d) выявление скрытых групп авторов с точки зрения общности их интересов;
e) сравнение трёх методов выделения скрытых сообществ: графового, кластерного и смешанного.
5) оценить результаты экспериментов.
Материалом исследования послужил корпус объёмом25768 русскоязычных постов 714 пользователей социальной сети ВКонтакте объёмом 8679402токенов.
Гипотеза исследования формулируется следующим образом: алгоритмы тематического моделирования позволяют выявить семантическое сходство анализируемых текстов, поэтому они могут применяться для построения моделей скрытых сообществ.
В данной работе применяются методы корпусной лингвистики, дистрибутивной семантики, вероятностного тематического моделирования и лингвистические приёмы анализа интернет-дискурса. Также были использованы следующие инструменты:
1) библиотекаgensim для построения дистрибутивной и тематической моделей корпуса;
2) библиотека pymorphy2 для морфологического анализа русскоязычных постов;
3) приложение Gephi для визуализации модели скрытых сообществ (на основе тематического моделирования и на основе графовых методов);
4) библиотеки scikit-learn иmatplotlib для построения кластеров скрытых сообществ.
Теоретическая значимость исследования состоит в создании методики выявления скрытых сообществ на основе тематического сходства текстов корпуса.
Практическая значимость исследования заключается в том, что результаты исследования могут быть использованы для решения дальнейших задач не только в компьютерной лингвистике, но и в социологии: выявление онлайн-трендов, выявление потенциально опасных группировок и т.д.
Объём и структура диссертации. Работа состоит из четырёх глав, введения, заключения, списка использованной литературы, списка электронных ресурсов и двух приложений. В главах1–3отражены теоретические аспекты исследования. Глава 4 посвящена экспериментам с корпусом постов: сбор и обработка текстовых данных, построение тематической модели, автоматическое назначение меток тем, а также графическая реализация модели скрытых сообществ. В работе обсуждаются сложности, с которыми пришлось столкнуться при реализации экспериментов, а также делаются выводы по каждому этапу. В приложениях объёмом10 стр. приведены примеры визуализированных тематических моделей и результаты экспертных оценок для автоматически извлечённых меток тем. Общий объём работы –92 стр., основное содержание изложено на 82 стр. В тексте ВКР содержится4 таблицы, 5 диаграмм и 16 рисунков. Список литературы включает70источников, из них – 30 на русском языке, 40 – на иностранных. Список электронных ресурсов состоит из 28 позиций.
Для ознакомления с корпусом пользовательских постов, скриптами программ по тематическому моделированию и автоматическому назначению меток тем, а также визуализированными результатами необходимо перейти в репозиторий GitHub .
Основные положения данной ВКР были представлены в следующих публикациях.
1. Mamaev I. Automatic Detection of Hidden Communities in the Texts of Russian Social Network Corpus / I. Mamaev, O. Mitrofanova // Artificial Intelligence and Natural Language. AINL 2020. Communications in Computer and Information Science. — Vol. 1292. — Springer, Cham, 2020. — P. 17–33.
2. Mamaev I. Hidden Communities in the Russian Social Network Corpus: a Comparative Study of Detection Methods / I. Mamaev, O. Mitrofanova // Proceedings of the Computational Models in Language and Speech Workshop (CMLS 2020)co-located with 16th International Conference on Computational and Cognitive Linguistics (TEL 2020). — 2020. — P. 69–78.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


На сегодняшний день люди активно пользуются социальными сетями: они обсуждают бытовые или рабочие дела, играют или ищут различный контент. Наше знание о способах интернет-общения растёт быстро, мы начинаем замечать, что между всеми вещами в интернет-пространстве существует гораздо большая взаимосвязь, чем мы предполагали ранее. Такая же взаимосвязь существует и между пользователями. Обнаружение скрытых сообществ и присущих им особенностей помогает нам всесторонне понять окружающее нас общество и объяснить сложные социальные явления.
Многие исследователи при построении алгоритмов поиска скрытых сообществ часто используют графовые методы. Объединение тематического моделирования и автоматического назначения меток тем позволяет восполнить пробелы в теории выявления скрытых сообществ.
В данной выпускной квалификационной работе был предложен гибридный алгоритм обнаружения сообществ русскоязычной социальной сети, были описаны преимущества и недостатки, а также проведён сравнительный анализ с уже существующими методами. Результаты позволяют получить новую информацию о возможных социальных группировках в интернет-пространстве. Качественная оценка процедур показала, что, несмотря на трудности при работе с постами социальных сетей, они сопоставимы с методами, основанными на математических моделях. Гипотеза, выдвинутая в работе, подтвердилась.
Использование данных из социальных сетей позволяет решить ряд смежных задач: например, отслеживание тенденций среди пользователей и, как следствие, создание соответствующего контента. Дальнейшие исследования будут связаны:
• с увеличением корпуса, включая посты других российских онлайн-платформ, что позволит обнаружить скрытые сообщества пользователей в различных социальных сетях;
• с привлечением других алгоритмов тематического моделирования: например, динамическое тематическое моделирование позволит сформировать динамические структуры скрытых сообществ и оценить изменение интересов пользователей в разные временные периоды;
• с улучшением алгоритма автоматического назначения меток тем и созданием «золотого стандарта» для оценки извлечённых кандидатов.



1. Бодулева А.Р. Лингвистические особенности СМС-сообщений английского языка/ А.Р. Бодулева, А.З. Зарипова // Инновационная наука. — 2016. — №2 (5). —С. 76–78.
2. Вебер К.С. Сравнительный анализ социальных сетей/ К.С. Вебер, А.А. Пименова //Вестник Тамбовского университета. Серия «Естественные и технические науки».— 2014. —Т. 19. Вып. 2. —С. 634–636.
3. Воронцов К.В. Вероятностное тематическое моделирование. [Электронный ресурс] URL:http://www.machinelearning.ru/wiki/images/2/22/Voron-2013-ptm.pdf(дата обращения: 21.01.2021).
4. Глушков Н.А. Анализ методов тематического моделирования текстов на естественном языке / Н.А. Глушков // Молодой учёный. —2018. —№19.— С. 101–103.
5. Ерофеева А.Р. Автоматическое назначение меток тем в тематических моделях русскоязычных корпусов текстов/ А.Р. Ерофеева, О.А. Митрофанова // Структурная и прикладная лингвистика: межвузовский сборник. Выпуск 12. К 60-летию отделения прикладной, компьютерной и математической лингвистики СПбГУ. — 2019. — №12. — С. 122–147.
6. Иноземцева Н.В. Парцелляция как основная синтаксическая модель заголовков англоязычных статей по методической проблематике / Н.В. Иноземцева // Вестник Оренбургского государственного университета. — 2011. — №11 (130). — С. 114–118.
7. Ипатов Ю.А. Анализ динамических характеристик сложных графовых структур/ Ю.А. Ипатов, И.В. Калагин, А.В. Кревецкий [и др.]// Известия высших учебных заведений. Приборостроение.— 2018. — №6 (2).—С. 511–516.
8. Калинина Л.В. Вербальная конкуренция в пространстве Интернета: реклама, рерайт, репост / Л.В. Калинина // Вестник Вятского государственного гуманитарного университета. —Киров, 2014. —№3.—С. 80–88.
9. Карасик В.И. О типах дискурса / В.И. Карасик // Языковая личность:институциональный и персональный дискурс: сб. науч. тр. — Волгоград, 2000. — С. 5–20.
10. Коломейченко А.А. Алгоритм выделения сообществ в социальных сетях / М.И. Коломейченко, А.А. Чеповский, А.М. Чеповский, // Фундаментальная и прикладная математика. — 2014. —№19:1. — С. 21–32.
11. Мамаев И.Д. Адаптация заимствованных слов к русской морфологии / И.Д. Мамаев, А.А. Зайцева // International Journal ofAdvancedStudiesinLanguageandCommunication. — 2019. —№2. — С. 106–113.
12. Матусевич А.А. Общение в социальных сетях: прагматический, коммуникативный, лингвостилистический аспекты характеристики: дис. … канд. филол. наук / А.А. Матусевич. —Киров, 2016. —190 с.
13. Мейлахс П.А. Онлайновое сообщество СПИД-диссидентов в социальной сети «ВКонтакте»: структура и риторические стратегии/ П.А. Мейлахс, Ю.Г. Рыков // XV апрельская международная научная конференция по проблемам развития экономики и общества: в 4-х книгах. Отв. ред.: Е. Г. Ясин. — Кн. 3. — М.: Издательский дом НИУ ВШЭ. — 2015. —С. 137-146.
14. Митрофанова О.А. Исследование структурной организации художественного произведения с помощью тематического моделирования: опыт работы с текстом романа «Мастер и Маргарита» М.А. Булгакова / О.А. Митрофанова // Труды международной конференции «Корпусная лингвистика–2019». — 2019. — С. 387–394.
15. Митрофанова О.А. Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала) / О.А. Митрофанова, А.С. Шиморина// Структурная и прикладная лингвистика: межвузовский сборник. —2014. —№10.— С. 151–168.
16. Митрофанова О.А. Тематическое моделирование корпуса «Народных русских сказок А.Н. Афанасьева» / О.А. Митрофанова // Структурная и прикладная лингвистика. — 2015. — №11. — С. 146–154.
17. Митягин С.А. Исследование социальных сетей Интернет на предмет выявления сопутствующих интересов лиц, склонных к наркомании / С.А. Митягин, А.В. Якушев, А.В. Бухановский // Международный научно-исследовательский журнал. Технические науки. — 2012. — Вып. 6(6). — С. 59–64.
18. Морозова О.Н. Особенности Интернет-коммуникации: определение и свойства // О.Н. Морозова / Вестник ЛГУ им. А. С. Пушкина. Серия «Филология». —2010.—№5. T.1.—С. 150–158.
19. Нашхоева М.Р. Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов / М.Р. Нашхоева // Вестник Челябинского государственного педагогического университета. — 2011. — № 12. — С. 321–327.
20. Нокель М.А., Лукашевич Н.В. Тематические модели: добавление биграмм иучет сходства между униграммами и биграммами/ М.А. Нокель, Н.В. Лукашевич // Вычислительные методы и программирование. — 2015. — №6 (2). — С. 215–234.
21. Орлова Н.В. Голосовые сообщения как источник сведений о коммуникативных нормах и ценностях / Н.В. Орлова // Экология языка и коммуникативная практика. —2018. —№3 (14). —С. 57–66.
22. Рябцева Н.К. Интернет-коммуникация в лингвистическом и когнитивном аспекте / Н.К. Рябцева // RussianLinguisticBulletin. — 2016. —№4 (8). —C. 70–73.
23. Смирнова Е.В. Гендерные различия в молодежном Интернет-дискурсе (на материале англоязычных Интернет-блогов и чатов) / Е.В. Смирнова //Лексикографическая копилка: сб. науч. ст. Вып. 8. — СПб.: Изд-во СПбГЭУ, 2019. — С. 73–79.
24. Смирнова О.С. Определение группы риска аккаунтов социальной сети «Вконтакте», попадающих под влияние квестовой игры суицидального характера/ О.С. Смирнова // Современные информационные технологии и ИТ-образование. — 2017. — №13 (3). — С. 53–60.
25. Смородина А.А. Интернет-мемы как способ коммуникации человека в современном мире/ А.А. Смородина // Международный журнал гуманитарных и естественных наук. — 2019. — №5 (3). — С. 78–82.
26. Хлопотов М.В. Исследование кластеров кинолюбителей и их тем в социальных сетях / М.В. Хлопотов, Н.В. Старцева, А.А. Макаренко // Вестник евразийской науки. — 2019. — №11 (2). — С. 1–11.
27. Холодковская Е.В. Особенности синтаксиса англоязычного интернет-комментария социальной сети Facebook / Е.В. Холодковская // Вестник Волгоградского государственного университета. Серия 2, Языкознание. — 2014. — №1 (20). — С. 79–83.
28. Хорошевский В.Ф. Семантические технологии в наукометрии: задачи, проблемы, решения и перспективы / В.Ф. Хорошевский, И.Е. Ефименко // Когнитивно-семиотические аспекты моделирования в гуманитарной сфере. Под редакцией В.Л. Стефанюка, Э.А. Тайсиной. — Академия наук РТ, Институт прикладной семиотики АН РТ. — Казань: Изд-во Академии наук РТ, 2017. —C. 222–266.
29. Щурина Ю.В. Интернет-мемы как феномен интернет-коммуникации/ Ю.В. Щурина //Научный диалог. — 2011. — №3. — С. 160–172.
30. Ярцева В.Н. Лингвистический энциклопедический словарь / Гл. ред. В.Н. Ярцева. — М., 1990; DVD-версия. — М., 2008.
31. Acharya D. B. Community Detection Clustering via Gumbel Softmax / D.B. Acharya, H. Zhang // SN Computer Science. — 2020. — Vol. 1. — P. 1–11.
32. Aletras N. Representing topics using images / N. Aletras, M. Stevenson // Proceedings of the 2013 Conference of the North American Chapter of the Association for ComputationalLinguistics: Human Language. — 2013.— P. 158–167.
33. Arefyev N.V. Word2Vec not dead: predicting hypernyms of co-hyponyms is better than reading definitions / N.V. Arefyev, M.V. Fedoseev, A.V. Kabanov [et al.] // Computational Linguisticsand Intellectual Technologies. Papers from the Annual InternationalConference “Dialogue” (2020). — 2020. — Iss. 19. — P. 13–32.
34. Baumes J. Discovering Hidden Groups in Communication Networks / J. Baumes, M. Goldberg, M. Magdon-Ismail [et al.] // Intelligence and Security Informatics, Proceedings of the Second Symposium on Intelligence and Security Informatics, ISI 2004. —2004. — P. 378-389.
35. Bhatia S. Automatic labelling of topics with neural embeddings / S. Bhatia, J.H. Lau, T. Baldwin // Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. — 2016. —P. 953–963.
36. Blei D. Latent Dirichlet Allocation / D. Blei, A. Ng, M. Jordan // Journal of Machine Learning Research. — 2003. — Vol. 3. — P. 993–1022.
37. Bodrunova S. S. Topic Modeling for Twitter Discussions: Model Selection and Quality Assessment / S.S. Bodrunova, I.S. Blekanov, M. Kukarkin // Proceedings of the 6TH SWS International Scientific Conferences on Social Sciences 2019. — 2019. — P. 207–214.
38. Buchanan, M. Nexus: small worlds and the groundbreaking science of networks. —W.W. Norton & Company, 2002. —235 р.
39. Chobe S. Advancing community detection using Keyword Attribute Search. / S. Chobe, J. Zhan // Journal of Big Data. — 2019. — Vol. 6. — P. 1–33.
40. Crystal D. Language and the Internet. Cambridge: Cambridge University Press. — 2001. — 272 p.
41. Fortunato S. Community detection in networks: A user guide / S. Fortunato, D. Hric // Physics Reports. — 2016. — Vol. 659. — P. 1–44.
42. Gmati H.A new algorithm for communities detection in social networks with node attributes / H. Gmati, A. Mouakher, A. Gonzalez-Pardo [et al.] // Journal of Ambient Intelligence and Humanized Computing. — 2018. — P. 1–13.
43. He K. Hidden community detection in social networks / K. He, Y. Li, S. Soundarajan [et al.] // Information Sciences. — 2018. — Vol. 425. P. 92–106.
44. Herring S.C. Grammar and electronic communication. // The encyclopedia of applied linguistics. —2012.— P. 2338–2346.
45. Jia Y. CommunityGAN: Community Detection with Generative Adversarial Nets / Y. Jia, Q. Zhang, W. Zhang [et al.] // Proceedings of the World Wide Web. — 2019. — P. 784–794.
46. Koltsova O. Redefining Media Agendas: Topic Problematization in Online Reader Comments / O. Koltsova, O. Nagornyy // Media and communications. — 2019. — Vol. 7, iss. 3. — P. 145–156.
47. Kriukova A.Explicit Semantic Analysis as a Means for Topic Labelling / A. Kriukova, A. Erofeeva, O. Mitrofanova [et al.] // Artificial Intelligence and Natural Language. AINL 2018. Communications in Computer and Information Science. —Springer, Cham, 2018. — Vol. 930. — P. 110–116.
48. Krzemień A. Detection of Jihadism in Social Networks Using Big Data Techniques Supported by Graphs and Fuzzy Clustering / A. Krzemień, C. Sánchez-Rebollo, C. Puente [et al.] // Advances in Complex Systems and Their Applications to Cybersecurity. — 2019. — Vol. 2019. — P. 1–13.
49. Lau J.H. Automatic labelling of topic models / J.H. Lau, K. Grieser,D. Newman [et al.] // Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. — 2011. — P. 1536–1545.
50. Li Y.H.Classification of Text Documents / Y.H. Li, A.K. Jain // The Computer Journal. —1998. —Vol. 41, №. 8. —P. 537–546.
51. Liu F. Deep learning for community detection: progress, challenges and opportunities / F. Liu, S. Xue, J. Wu [et al.] // Proceedings of the 29th International Joint Conference on Artificial Intelligence, IJCAI 2020. — 2020. —P. 4981–4987.
52. López-Rúa P. Teaching L2 vocabulary through SMS language: some didactic guidelines// ELIA. — 2007.— Vol. 7. — P. 165–188.
53. Magatti D. Automatic Labeling OfTopics / D. Magatti, S. Calegari, D. Ciucci [et al.] // Ninth International Conference on Intelligent Systems Design and Applications.—2009. — P. 1227–1232.
54. Manika L. Author-Topic Modeling of DESIDOC Journal of Library and Information Technology (2008-2017), India [Электронный ресурс] / L. Manika, M. Margam // Library Philosophy and Practice (e-journal). — 2019. URL: https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=5983&context=libphilprac (дата обращения: 10.12.2020).
55. Mehdi A.A knowledge-based topic modeling approach for automatic topiclabeling / A.A. Mehdi, P. Seyedamin, K. Kochut [et al.] // International Journal of Advanced Computer Science and Applications. — 2017. —Vol. 8(9). — P. 335–349.
56. Mei Q. Automatic labeling of multinomial topic models. / Q. Mei, X. Shen,C. Zhai //Proceedings of the 13th ACM SIGKDDinternational conference on Knowledge discoveryand data mining. —2007. —P. 490–499.
57. Mirzagitova A. Automatic Assignment of Labels in Topic Modelling for Russian Corpora / A. Mirzagitova, O. Mitrofanova // Proceedings of 7th ExLing 2016. — 2016. — P. 115–118.
58. Mishra N. Clustering Social Networks. / N. Mishra, R. Schreiber, I. Stanton [et al.] // Algorithms and Models for the Web-Graph. WAW 2007. Lecture Notes in Computer Science.—Springer, Berlin, Heidelberg, 2007. — Vol. 4863. — P. 56–67.
59. MitrofanovaO. Topic Modelling of the Russian Corpus of Pikabu Posts: Author-Topic Distribution and Topic Labelling / O. Mitrofanova, V. Sampetova, I. Mamaev [et al.] // International conference «Internet and Modern Society» (IMS-2020) Proceedings, International Workshop «Computational Linguistics» (CompLing-2020). In press.
60. Panicheva P.Semantic feature aggregation for gender identification in Russian Facebook / P. Panicheva, A. Mirzagitova, Y. Ledovaya // Artificial Intelligence and Natural Language. AINL 2017. Communications in Computer and Information Science.—Springer, Cham, 2017. — Vol. 789.—P. 3–15.
61. Ramage D. Labeled LDA: A supervised topic model for credit attribution in multi-labeled corpora / D. Ramage, D. Hall, R. Nallapati [et al.] // Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing.— 2009. —Vol. 1. — P. 248–256.
62. Reihanian A. Topic-oriented community detection of rating-based social networks / A. Reihanian, B. Minaei-Bidgoli, H. Alizadeh // Journal of King Saud University. Computer and Information Sciences. — 2016. — Vol. 28, iss. 3. —P. 303–310.
63. Rytsarev I.A. Clustering of social media content with the use of BigData technology / I.A. Rytsarev, A.V. Kupriyanov, D.V. Kirsh [et al.] // Journal of Physics: Conference Series. — 2018. — Vol. 1096. — P. 1–7.
64. Salz D.Hidden Community Detection in Online Forums / D. Salz, N. Benavides, J. Li // CS224W:Machine Learning with Graphs. — 2019. — P. 1–10.
65. Singh K. Clustering of people in social network based on textual similarity. / K. Singh, H. K. Shakya, B. Biswas // Perspectives in Science. — 2016. — Vol. 8. — P. 570–573.
66. Smoliarova A.S.Detecting pivotal points in social conflicts via topic modeling of twitter content / A.S. Smoliarova, S.S. Bodrunova, A.V. Yakunin [et al.] // Internet Science. INSCI 2018. Lecture Notes in Computer Science.—Springer, Cham, 2018. — Vol. 11551. — P. 61–71.
67. Squires L. Enregistering internet language // Language in Society. — 2010. — 457–492 pp.
68. Stevens K. Exploring Topic Coherence over Many Models and Many Topics / K. Stevens, P. Kegelmeyer, D. Andrzejewski [et al.] // Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. — 2012. — P. 952–961.
69. Tikhomirov M.M.Combined Approach to Hypernym Detection for Thesaurus Enrichment / M.M. Tikhomirov, N.V. Loukachevitch, E.A. Parkhomenko // Computational Linguisticsand Intellectual Technologies. Papers from the Annual InternationalConference “Dialogue” (2020). — 2020. — Iss. 19. — P. 736–746.
70. Yadrintsev V.V. Distributional Models and Auxiliary Methods for Determining the Hypernyms of Words in Russian / V.V. Yadrintsev,A.A. Ryzhova, I.V. Sochenkov // Computational Linguisticsand Intellectual Technologies. Papers from the Annual InternationalConference “Dialogue” (2020). — 2020. — Iss. 19. — P. 762–772.
СПИСОК ЭЛЕКТРОННЫХ РЕСУРСОВ
1. Ваша сеть ВКонтакте. Одной картинкой [Электронный ресурс]. URL: http://www.yasiv.com/vk (дата обращения: 12.04.2020)
2. Викисловарь [Электронный ресурс]. URL: https://ru.wiktionary.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0(дата обращения: 11.09.2020)
3. ВКонтакте [Электронный ресурс]. URL: https://vk.com/(дата обращения: 22.07.2020)
4. Жизнь в Кудрово [Электронный ресурс] // ВКонтакте. URL: https://vk.com/kudrovolife(дата обращения: 18.01.2020)
5. Морфологический анализатор pymorphy2 [Электронный ресурс]. URL: https://pymorphy2.readthedocs.io/en/latest/(дата обращения: 17.04.2020)
6. Национальный корпус русского языка [Электронный ресурс]. URL: https://ruscorpora.ru/new/(дата обращения: 12.04.2020)
7. Новости для прессы [Электронный ресурс] // ВКонтакте. URL: https://vk.com/press/press-vk-12(дата обращения: 12.04.2020)
8. Новый частотный словарь русской лексики [Электронный ресурс]. URL: http://dict.ruslang.ru/freq.php(дата обращения: 06.03.2020)
9. Описание методов API [Электронный ресурс] // VKDevelopers. URL: https://vk.com/dev(дата обращения: 10.04.2020)
10. Открытый корпус [Электронный ресурс]. URL: http://opencorpora.org/(дата обращения: 10.04.2020)
11. Программное обеспечение [Электронный ресурс] // Лаборатория интернет-исследований. URL: https://linis.hse.ru/soft-linis/(дата обращения: 03.04.2020)
12. Реставрация книг, переплётное дело [Электронный ресурс] // Alib.ru - букинистические книги. URL: https://www.alib.ru/forumarhtema.phtml?forumbeg=150&arhtema=apteka(дата обращения: 11.11.2020)
13. Тезаурус русского языка RuWordNet [Электронный ресурс]. URL: https://ruwordnet.ru/ru(дата обращения: 23.04.2020)
14. Beautiful Soup Documentation [Электронный ресурс]. URL: https://www.crummy.com/software/BeautifulSoup/bs4/doc/(дата обращения: 21.04.2020)
15. Facebook [Электронный ресурс]. URL: https://www.facebook.com/(дата обращения: 12.05.2020)
16. Gensim. Topic modelling for humans [Электронный ресурс]. URL: https://radimrehurek.com/gensim/(дата обращения: 12.04.2020)
17. Gephi. Makesgraphshandy [Электронный ресурс]. URL: https://gephi.org/(дата обращения: 15.04.2020)
18. GitHub [Электронный ресурс]. URL: https://github.com/(дата обращения: 06.12.2020)
19. GoogleФормы [Электронный ресурс]. URL: https://www.google.com/intl/ru_ru/forms/about/(дата обращения: 17.04.2020)
20. Matplotlib. Version 3.3.3 [Электронный ресурс]. URL: https://matplotlib.org/(дата обращения: 02.07.2020)
21. Orange [Электронный ресурс]. URL: https://orangedatamining.com/(дата обращения: 10.07.2020)
22. Python 3.7.0 [Электронный ресурс]// Python. URL: https://www.python.org/downloads/release/python-370/(дата обращения: 01.02.2020)
23. Requests: HTTP for Humans [Электронный ресурс]. URL: https://requests.readthedocs.io/en/master/(дата обращения: 09.03.2020)
24. Scikit-learn. Machine learning in Python [Электронный ресурс]. URL: https://scikit-learn.org/stable/(дата обращения: 15.03.2020)
25. Stanford Topic Modeling Toolbox [Электронный ресурс] // The Stanford Natural Language Processing Group. URL: https://nlp.stanford.edu/software/tmt/tmt-0.4/(дата обращения: 10.07.2020)
26. The Ideal Length for Instagram, Facebook, Twitter, & LinkedIn Posts [Электронный ресурс] // HubSpot. URL: https://blog.hubspot.com/marketing/character-count-guide(дата обращения: 25.03.2020)
27. Topic Modeling [Электронный ресурс] // MAchine Learning for LanguagE Toolkit. URL: http://mallet.cs.umass.edu/topics.php(дата обращения: 10.07.2020)
28. Vandrouki | Путешествия почти бесплатно (RU) [Электронный ресурс] // ВКонтакте. URL: https://vk.com/vandroukiru(дата обращения: 10.04.2020)


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ