Введение 2
Глава 1. Постановка задачи 4
1.1. Формулировка задачи демографического анализа 4
1.2. Математическая постановка задачи 5
1.3. Обзор литературы 8
Глава 2. Описание Алгоритма 11
2.1 Обзор данных 11
2.2 Панхроматическое слияние 16
2.3. Семантическая сегментация 18
2.4. Прогнозирование численности населения 21
2.5. Улучшение прогноза численности населения 23
Глава 3. Реализация и результаты 24
3.1. Реализация модифицированной сети U-Net++ 24
3.2. Реализация сети прогнозирования диапазона численности населения 32
3.3. Реализация регрессионных моделей 40
Заключение 43
Список литературы 44
Приложение 47
Актуальность темы исследования. Точное знание численности населения является критичной информацией для таких задач, как градостроение, планирование борьбы с инфекционными заболеваниями, уменьшение ущерба от природных катастроф и социально-экономических исследований.
На текущий момент единственный надёжный способ получения информации о фактической численности населения является перепись. Этот процесс невероятно трудоёмкий и дорогой. Даже с автоматизацией и цифровизацией некоторых процессов, перепись занимает месяцы и требует отправлять переписчиков в труднодоступные районы без постоянного транспортного сообщения и надёжных способов коммуникации.
Поскольку переписи, как правило проходят раз в 10 лет, то если для решения задачи требуется текущая численность населения некоторой территории, но единственные доступные данные были собраны несколько лет назад, это может существенно затруднить её выполнение. Вдобавок к этому если между переписями произошли события, которые могли сильно и за короткое время изменить число населения рассматриваемой территории, данные переписи могут стать вообще бесполезными.
На текущий момент на земной орбите находятся более чем 150 спутников, которые способны брать высококачественные снимки поверхности Земли в момент, когда это нам потребуется. Именно эта их способность может помочь решить проблему потери актуальности данных переписи.
Ухудшающаяся экологическая ситуация и следующие из этого природные катастрофы и социально-экономические кризисы делает задачу создания системы, которая будет способна получать релевантные данные о численности населения, используя только спутниковые изображения, как никогда актуальной.
Цели и задачи. Целью работы является изучение применения сверточных нейронных сетей для демографического анализа спутниковых изображений.
Задачами этой работы являются:
• Создание и тренировка нейронной сети для семантической сегментации спутниковых снимков на типы земных покровов.
• Провести ряд экспериментов с разными модификациями нейронной сети для семантической сегментации.
• Создание и тренировка сетей для прогнозирования численности населения со спутниковых снимков.
• Эмпирически доказать, что дополнение спутниковых изображений картами земных покровов, которые генерируются нейронными сетями семантической сегментации, приведет к улучшению способности моделей прогнозировать численность населения.
Структура. Работа состоит из введения, трех глав, заключения, списка литературы и приложения.
В ходе проделанной работы были получены следующие результаты:
• Построена система прогнозирования численности населения
• Модифицирована архитектура нейронная сеть для семантической сегментации спутниковых изображений.
• Разработана архитектура нейронной сети для классификации диапазонов численности населения.
• Натренированы регрессионные модели численности населения.
• Разработан алгоритм подготовки данных и натренированы все участвующие нейронные сети в системе.
Следующие меры могут улучшить качество работы системы:
• Дальнейшее обучение модели сегментации должно улучшить ее работу.
• Использование ансамблевых методов для регрессии.
• Увеличение выборки данных с 19 снимков.
• Использование методов регуляризации и более сложных функций активаций может привести к росту точности нейронных сетей.
• Увеличение количества диапазонов населения и их более тщательный подбор.
• Использование более глубокого декодера в сети сегментации.