Введение и постановка задачи 4
1. Обзор способов применения BigData для Умного города 5
1.1. Применения BigData для обеспечения безопасности 5
1.2. Применения BigData в здравоохранении 5
1.3. Применения BigData в сфере электроснабжения 6
1.4. Применения BigData для организации дорожного движения 6
2. Обзор существующих решений 8
3. Описание получаемых данных 10
4. Реализация алгоритмов работы с данными 12
4.1. Реализация алгоритма получения данных 12
4.2. Использованные алгоритмы анализа данных 14
5. Полученные результаты 15
Заключение 19
Список литературы 20
BigData - термин, используемый для обозначения экспоненциально растущего объема доступных данных [8]. Однако, BigData относится не только к самому объему информации, но также к “скорости данных”, что подразумевает потоки данных, которые поступают и обрабатываются в реальном времени, и к различным источникам этих данных.
В современном мире развитие технологий, связанных с обработкой больших данных, позволяет делать определенные предсказания и автоматически решать задачи планирования в самых разных областях. Одним из известных примеров таких областей является ритейл [9], но аналогичные подходы можно использовать для решения задач Умного города.
В данной работе рассмотрены способы использования BigData для решения задач Умного города и приведена реализация одного из них - определения и предсказывания событий и числа их участников. Предложено решение данной задачи с использованием большого объема данных, получаемого с помощью социальной сети ’’ВКонтакте”. Для этого разработаны инструменты, позволяющие получать наборы таких данных, выбирать из них наиболее актуальные, визуализировать и анализировать их.
В рамках данной работы рассмотрены различные применения BigData для решения задач Умного города. Подробно рассмотрены задача определения и предсказания происходящих в городе событий. Получены и визуализированы наборы данных, представляющих события в социальной сети ’’ВКонтакте” за различные периоды времени. Созданы и многократно использованы инструменты для дальнейшего расширения этих наборов данных. Также использованы методы анализа данных для кластеризации событий и прогнозирования числа их участников.