Тема: Агрегирование данных из социальных сетей в целях упреждающей диагностики уязвимостей пользователей к СИА (проектная работа)
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. Описание предметной области 12
1.1. Актуальность исследования 12
1.2. Обоснование целей и задач работы 13
2. Используемые подходы и программные средства 15
2.1. Подход к идентификации пользователей социальных сетей 15
2.2. Описание используемых программных средств 16
2.3. Описание используемых теоретических методов 16
2.3.1.Процедура скользящего контроля 16
3. Восстановление мета-профиля пользователя и агрегирование данных 18
3.1. Восстановление фрагмента мета-профиля пользователя 18
3.2. Сбор и агрегирование данных из различных социальных сетей 22
3.2.1. Формализация задачи агрегации данных из различных социальных сетей 23
3.2.2. Подходы к определению наиболее вероятной конфигурации набора параметров мета-профиля пользователя 26
4. Прототип программного модуля для восстановления фрагмента мета-профиля пользователя 27
4.1. Разработка программного модуля 27
4.2. Тестирование 29
Заключение 32
Список литературы 33
Словарь терминов 36
ПРИЛОЖЕНИЕ А. СВИДЕТЕЛЬСТВО О РЕГИСТРАЦИИ 38
📖 Введение
Существуют подходы [1, 15] к анализу степени защищённости пользователей информационных систем, основанные на оценке параметров моделей комплекса «критичные документы — информационная система —пользователь—злоумышленник» Согласно им, производится оценка защищённости пользователей информационных систем от социоинженерных атак путем построения профиля уязвимостей пользователя. Профиль уязвимостей пользователя строится на основании социальных, культур антропологических, психологических и иных особенностей пользователя [15]. В настоящей работе рассматривается подход к восстановлению фрагмента мета-профиля пользователя, способствующий оценке степени выраженности ряда психологических особенностей пользователей, как основы для построения их профилей уязвимостей. Под мета-профилем в данном контексте понимается набор анкетных данных пользователя, таких как ФИО, возраст, родной город, город проживания и др. Степень выраженности психологических особенностей пользователя может оцениваться на основании мнений экспертов, исходя из результатов анкетирования, а также на основании данных, извлекаемых из социальных сетей.
Основной подход, который описан в этой работе, будет основываться на работе с социальными сетями. Социальные сети сегодня — один из важных источников информации о пользователях киберфизических/киберсоциальных систем. Ежемесячно в Интернет в России выходят 65,9 млн человек, из которых социальные сети посещают более 90% [3]. По данным BrandAnalytics, каждый день в социальных сетях появляется порядка 30 млн. новых сообщений (350 постов в секунду), и 35 млн. человек оставляют хотя бы одно публичное сообщение в месяц [22]. В России наиболее популярными социальными сетями являются ВКонтакте (https://vk.com/), Одноклассники (https://ok.ru/), Instagram (https://www.instagram.com/), Twitter (https://twitter.com/), Facebook (https://www.facebook.com/) и Мой Мир (https://my.mail.ru/)[21]. Каждая из представленных социальных сетей ориентирована на свой сегмент пользователей.
С помощью анализа различных данных о пользователе, полученных из социальных сетей можно оценить различные особенности пользователя. Например, для оценки психологических особенностей пользователей, служащих основой для построения профиля уязвимостей, важно анализировать наиболее подробную информацию о пользователе, но часто в аккаунте заполнены не все анкетные данные. Недостающие данные можно извлекать из аккаунтов пользователя в других социальных сетях, а также исходя из социального круга пользователя. Данная работа посвящена методике и реализации восстановления фрагмента мета-профиля пользователя на основании информации, извлекаемой из социальной сети ВКонтакте.
Степень разработанности темы. На базе лаборатории теоретических и междисциплинарных проблем информатики Санкт-Петербургского института информатики и автоматизации РАН (ТиМПИ СПИИРАН) проводятся исследования, направленные на разработку автоматизированной системы анализа защищённости пользователей киберфизических/киберсоциальных систем от социоинженерных атак. Результаты, достигнутые коллективом исследователей, в проблемно-постановочной и методологической части, отражены в монографии Азаров А.А., Тулупьева Т.В., Суворова А.В., Тулупьев А.Л., Абрамов М.В., Юсупов Р.М. Социоинженерные атаки. Проблемы анализа. СПб.: Наука, 2016. 352 с. Разработаны модели и алгоритмы для идентификации аккаунтов сотрудников компании в социальной сети [8, 1].
Также проводились исследования в сфере идентификации пользователей социальных сетей на основе представленных данных и имеющихся ссылок на аккаунты других социальных сетей пользователя [16].
Цель данной работы заключается в восстановлении фрагмента мета-профиля пользователя за счёт агрегации данных, извлекаемых из контента, публикуемого пользователями в социальных сетях.
Для достижения цели работы были поставлены и решены следующие задачи:
1. Исследовать предметную область, изучить разработанные ранее подходы к агрегации сведений, получаемых из контента и связей пользователей в социальных сетях.
2. Исследовать предложенные средства APIразработки различных социальных сетей.
3. Разработать подход к восстановлению фрагмента мета-профиля (родного города, города проживания, года рождения) пользователя на основании анализа сведений, извлекаемых из социальной сети.
4. Разработать алгоритмы для восстановления фрагмента мета-профиля пользователя, основанные на агрегации сведений из социальной сети.
5. Разработать алгоритмы, решающие задачу агрегации данных из социальных сетей для определения наиболее вероятной конфигурации пропущенных значений параметров мета-профиля пользователя.
6. Разработать прототип программного модуля, целью которого является восстановление фрагмента мета-профиля пользователя по сведениям из социальной сети ВКонтакте.
Объектом исследования являются аккаунты пользователей социальной сети.
Предметом исследования являются методы автоматизированного получения информации, входящий в мета-профиль пользователя, но не указанной им в явном виде.
Научная новизна исследования заключается в том, что предложены новые алгоритмы определения более вероятной комбинации значений атрибутов мета-профиля пользователя на основе его социального окружения.
Рассмотрены новые подходы агрегации нескольких мета-профилей одного пользователя из различных социальных сетей на основе тех данных, которые указал пользователь и на основе анализа его социального окружения.
Теоретическая и практическая значимость исследования. В ходе исследования были разработаны новые подходы к агрегированию и анализу данных о пользователях в социальных сетях, которые используются для дополнения мета-профиля. Дополненный мета-профиль ляжет в основу оценок психологических особенностей сотрудников компании. Психологические особенности пользователя играют важную роль при построении профиля уязвимостей.
Полученная разработка, в свою очередь будет входить в общий комплекс программ для автоматизированной оценки защищённости пользователей информационных систем от социоинженерных атак.
Методология бакалаврской работы заключается в постановке и формализации задач, связанных с возможностью дополнения недостающих параметров мета-профиля пользователя социальной сети, описании моделей сущностей, используемых для построения оценок, разработке алгоритмов для определения недостающих данных мета-профиля и способам агрегации данных из нескольких социальных сетей, а также описание полученных теоретических результатов посредством реализации алгоритмов и методов в комплексе программ.
Методы. В процессе разработки практической части исследования бакалаврской квалификационной работы были использованы методы объектно-ориентированного программирования (ООП). Также в процессе создания архитектуры программного модуля использовались различные паттерны проектирования. В теоретической части исследования применялись утверждения и методы таких дисциплин, как теория вероятностей и эмпирическое оценивание алгоритмов, в частности, процедура скользящего контроля.
Положения, выносимые на защиту. На защиту выносятся следующие положения:
1. Подход к восстановлению фрагмента мета-профиля (родного города, города проживания, года рождения) пользователя на основании анализа сведений, извлекаемых из социальной сети.
2. Алгоритмы для восстановления фрагмента мета-профиля пользователя, основанные на агрегации сведений из социальной сети.
3. Алгоритмы, решающие задачу агрегации данных из социальных сетей для определения наиболее вероятной конфигурации пропущенных значений параметров мета-профиля пользователя.
4. Прототип программного модуля, целью которого является восстановление фрагмента мета-профиля пользователя по сведениям из социальной сети ВКонтакте.
Апробация результатов. Итоги исследования были представлены на ряде научных мероприятий:
• Информационная безопасность регионов России (ИБРР-2017). X Санкт-Петербургская межрегиональная конференция. (Санкт-Петербург, 1–3 ноября 2017 г.);
• Первая Всероссийская научно-практическая конференция (г. Ульяновск, 14-15 ноября, 2017 г.).
Результаты, полученные в работе, были использованы в научно-исследовательских проектах, поддержанных грантами РФФИ №18-37-00323, №18-01-00626 и проектом по госзаданию СПИИРАН №0073-2018-0001.
Публикации. По теме выпускной квалификационной работы бакалавра было сделано3 научных публикации, 2 из которых индексируются в РИНЦ [20, 19], а 1 из них принята к публикации в издании, индексируемом Scopus, также было получено свидетельство о регистрации программы для ЭВМ в Роспатент (приложение А), а также отправлены 2 новые заявки.
Благодарности. Данная выпускная квалификационная работа бакалавра содержит материалы исследований, частично поддержанных грантами: №18-01-00626 — «Методы представления, синтеза оценок истинности и машинного обучения в алгебраических байесовских сетях и родственных моделях знаний с неопределенностью: логико-вероятностный подход и системы графов», №18-37-00323 — «Социоинженерные атаки в корпоративных информационных системах: подходы, методы и алгоритмы выявления наиболее вероятных траекторий» и проектом по госзаданию СПИИРАН №0073-2018-0001.
Структура и объем работы. Представленная работа состоит из введения, четырех глав, заключения, используемой литературы, словаря терминов и приложения, содержащие свидетельства о регистрации программ для ЭВМ. Общий объем работы— 38 страниц.
Глава 1 содержит описание предметной области, основные определения и понятия, связанные с областью работы, а также список используемых средств.
Глава 2 посвящена разработке системы восстановления мета-профиля пользователя социальной сети ВКонтакте: описаны основные разработанные алгоритмы и подходы, представлены полученные результаты.
Глава 3 посвящена построению системы агрегирования данных из различных социальных сетей. Рассказывается в рамках каких социальных сетях разрабатывалась программа, основные алгоритмы сбора данных, анализы полученных данных.
Глава 4 описывает подход объединения систем в программу, работающую с различными социальными сетями. В ней рассказывается о выбранных алгоритмах слияния нескольких информационных блоков одного человека в один, выставление приоритетов этих данных, распознавания схожести аккаунтов двух пользователей и вывод получившейся статистики.
✅ Заключение
1. Исследована предметная область, изучены разработанные ранее подходы к агрегации сведений, получаемых из контента и связей пользователей в социальных сетях;
2. Исследованы предложенные средства APIразработки различных социальных сетей;
3. Разработан подход к восстановлению фрагмента мета-профиля (родного города, города проживания, года рождения) пользователя на основании анализа сведений, извлекаемых из социальной сети;
4. Разработаны алгоритмы для восстановления фрагмента мета-профиля пользователя, основанные на агрегации сведений из социальной сети;
5. Разработаны алгоритмы, решающие задачу агрегации данных из социальных сетей для определения наиболее вероятной конфигурации пропущенных значений параметров мета-профиля пользователя.
6. Разработан прототип программного модуля, целью которого является восстановление фрагмента мета-профиля пользователя по сведениям из социальной сети ВКонтакте.
Таким образом, все поставленные задачи выполнены, цель работы, которая заключалась в создании программы, нацеленной на восстановление недостающих данных о пользователе и агрегирование страниц пользователя в различных социальных сетях, достигнута.



