Готовая ВКР на тему: Анализ социальных сетей с помощью технологий больших данных

Содержание

Введение.
Постановка задачи
Обзор литературы
Глава 1. Социальные графы и их анализ.
1.1. Обзор области.
1.2. Определение социального графа
1.3. Характеристики социальных графов
1.4. Основные алгоритмы анализа графов.
Глава 2. Граф соискатели — работодатели.
2.1. Определение основных понятий
2.2. Разбор резюме и вакансий.
2.3. Использование Word2Vec и Doc2Vec
Глава 3. Подготовка данных
3.1. Описание структуры данных
3.2. Работа с данными в Apache Spark
Глава 4. Реализация
4.1. Классификация документов и ключевых навыков
4.2. Анализ резюме
4.3. Анализ вакансии.
4.4. Определение связей между соискателями и вакансиями. . . . . . . . . .31
4.5. Построение графа.
Выводы
Заключение
Дальнейшая работа
Список литературы

Введение

В связи с ростом популярности интернета, мобильных устройств, и т. д. наблюдается значительный рост объемов информация. Эта информация представлена в самом разном виде, как структурированная, так и без какой-либо определенной структуры. Хранение таких данных и последующий их анализ может привести к полезным, а иногда довольно
неожиданным, результатам. Но для работы с таким количеством информации требуются новые технологии и методы, которые обозначаются термином Big Data.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

КУРСОВЫЕ СТАТЬИ ВКР

Заключение

В результате работы было разработано программное обеспечение для сбора данных о вакансиях и резюме. Полученные данные были обработаны, приведены к более удобной для дальнейшего анализа форме и сохранены в формате JSON. Затем были определены возможные подходы извлечения полезной информации из слабоструктурированных данных, проведено их сравнение и выбран наиболее подходящий для данной работы вариант. Был разработан алгоритм, основанный на векторном представлении слов, который позволяет анализировать обработанные данные и находить связи между сущностями. На основе найденных связей был построен граф, на котором был выполнен алгоритм по нахождению наиболее оптимального множества паросочетаний. Все эти алгоритмы рассматривались в контексте фреймворка для обработки Big Data — Apache Spark. Можно считать, что все поставленные задачи в результате работы выполнены

Литература

1. Carsten Lygteskov Hansen, Melanie Tosik, Gerard Goossen, Chao Li, Lena
Bayeva, Florence Berbain, Mihai Rotaru How to Get the Best Word Vectors
for Resume Parsing // 2013.
2. Enda Liu, Tomoki Ito, Kiyoshi Izumi Comparison among multilingual
financial words using the word2vec and clustering with news resources for
automatic creation of financial dictionaries // 2016.
3. Manaal Faruqui, Chris Dyer Improving Vector Space Word Representations
Using Multilingual Correlation // 2014.
4. Marc A. Smith NodeXL: Simple network analysis for social media // 2013.
5. Matei Zaharia, Mosharaf Chowdhury, Tathagata Das, Ankur Dave, Justin
Ma, Murphy McCauley, Michael J. Franklin, Scott Shenker, Ion Stoica
Resilient Distributed Datasets: A FaultTolerant Abstraction for InMemory
Cluster Computing // 2012.
6. Michal Campr, Karel Jezek Comparing Semantic Models for Evaluating
Automatic Document Summarization // 2015.
7. Quoc Le, Tomas Mikolov Distributed Representations of Sentences and
Documents // 2014.
8. Reynold S. Xin, Joseph E. Gonzalez, Michael J. Franklin, Ion Stoica
GraphX: A Resilient Distributed Graph System on Spark // 2013.
9. Sumit Maheshwari, Abhishek Sainani, P Krishna Reddy An Approach to
Extract Special Skills to Improve the Performance of Resume Selection //
2010.
10.Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, Jeffrey Dean
Distributed Representations of Words and Phrases and their
Compositionality // 2013.
3611.Yilong Geng, Mingyu Gao Distributed Stable Marriage with Incomplete List
and Ties using Spark // 2015.

КУПИТЬ

Работу высылаем на протяжении 30 минут после оплаты.

Подобные работы

ВЕРОЯТНОСТНЫЙ РАСЧЕТ ЗНАЧЕНИЙ НЕДОСТАЮЩИХ ДАННЫХ ПОЛЬЗОВАТЕЛЯ СОЦИАЛЬНОЙ СЕТИ
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2019
ФОРМИРОВАНИЕ ПРОЕКТНЫХ КОМАНД НА ОСНОВЕ АНАЛИЗА СОЦИАЛЬНЫХ СЕТЕЙ
Бакалаврская работа, математика. Язык работы: Русский. Цена: 5900 р. Год сдачи: 2016
Анализ показателей и уменьшение рисков хронических заболеваний с помощью технологий больших данных
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2020
ЭТНИЧЕСКАЯ МАНИФЕСТАЦИЯ КОРЕННЫХ НАРОДОВ СИБИРИ В СЕТИ ИНТЕРНЕТ
Бакалаврская работа, культурология. Язык работы: Русский. Цена: 5900 р. Год сдачи: 2018
МЕХАНИЗМ ИСПОЛЬЗОВАНИЯ ТЕХНОЛОГИИ BIG DATA В УПРАВЛЕНИИ БИЗНЕС-ПРОЦЕССАМИ БАНКА: ВОЗМОЖНОСТИ И РИСКИ
Бакалаврская работа, банковское дело и кредитование. Язык работы: Русский. Цена: 4750 р. Год сдачи: 2018
Большие Данные как объект международно-правового регулирования
Дипломные работы, ВКР, юриспруденция. Язык работы: Русский. Цена: 4390 р. Год сдачи: 2021
Интернет-аддикция юношей и девушек в контексте их активности в социальных сетях (Московский Педагогический Государственный Университет)
Курсовые работы, психология. Язык работы: Русский. Цена: 800 р. Год сдачи: 2023
СТРАТЕГИЧЕСКОЕ И ТЕРРИТОРИАЛЬНОЕ ПЛАНИРОВАНИЕ В ГОРОДСКОМ УПРАВЛЕНИИ НА ОСНОВЕ БОЛЬШИХ ДАННЫХ
Дипломные работы, ВКР, политология. Язык работы: Русский. Цена: 4300 р. Год сдачи: 2017
Социальные сети как инструмент мировой политики
Бакалаврская работа, международные отношения. Язык работы: Русский. Цена: 4310 р. Год сдачи: 2020
Виртуальное общение молодежи в социальных сетях (Социологический практикум, Российская Академия народного хозяйства и государственной службы (РАНХ и ГС))
Курсовые работы, социология. Язык работы: Русский. Цена: 500 р. Год сдачи: 2020

Анализ социальных сетей с помощью технологий больших данных

Тип работы

Бакалаврская работа

Предмет

информатика

ПУБЛИКУЕТСЯ ВПЕРВЫЕ

Просмотрено

16

Подобные работы

Логин
Пароль


Тип работы:	Предмет:	Язык работы: