Тема: Применение методов машинного обучения в прогнозировании качества воздуха
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глоссарий
1. Обзор литературы
1.1. Множественная линейная регрессия
1.2. Регуляризация линейной регрессии
1.3. Нейронные сети
1.3.1. Многослойный персептрон
1.3.2. Сеть радиально-базисных функций
1.4. Оценка моделей
1.4.1. Перекрестная проверка ....
1.4.2. Среднеквадратическая ошибка
1.4.3. Коэффициент детерминации .
1.5. Методология исследования
1.6. Технологии
1.6.1. Язык программирования Python .
1.6.2. Библиотеки и инструменты Python
2. Данные
2.1. Обзор данных
2.2. Анализ данных .
3. Реализация моделей и подбор параметров
3.1. Множественная линейная регрессия .
3.2. Многослойный персептрон
3.3 Сетка RBF-функций по координатам
3.4 RBF-сеть по координатам с погодными данными
3.5. RBF-сеть с кластеризацией K-means
Заключение
Список литературы
Приложение
📖 Введение
Целью данной дипломной работы является реализация и тестирование моделей предсказания качества атмосферного воздуха города Москвы, использующих методы машинного обучения. Эти решения обладают высокой применимостью в экологических ведомствах и мэрии города.
Исходя из поставленной цели в работе выполняются следующие задачи:
1) сбор данных о загрязняющих веществах в атмосферном воздухе города
Москвы;
2) сбор дополнительных данных о погодных условиях;
3) обработка и анализ полученных данных;
4) построение моделей машинного обучения для предсказания концентраций загрязняющих веществ в атмосфере;
5) реализация моделей и подбор оптимальных параметров;
6) тестирование моделей на собранных данных.
Объектом диплома является процесс построения, реализации и оценки моделей предсказания качества атмосферного воздуха города Москвы.
Предметом работы являются модели предсказания качества атмосферного воздуха города Москвы.
Новизна исследования заключается в применении моделей с RBF-функциями, которые ранее не использовались для предсказаний загрязненности атмосферного воздуха города Москвы.
В работе используются реальные данные, предоставляемые лицензированными онлайн сервисами.
Обработка данных, предиктивные модели и их тестирование реализуются на скриптовом языке программирования Python.
Глоссарий
CRISP-DM (Cross-Industry Standard Process for Data Mining (англ.) — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространенная методология по исследованию данных.
ReLU — rectified linear unit.
Анализ данных — область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных данных.
АСКЗА — автоматическая станция контроля загрязнения атмосферы.
Искусственная нейронная сеть — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма.
Коэффициент детерминации — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными.
Линейная регрессия — метод восстановления зависимости между двумя переменными.
Машинное обучение — подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, для нахождения законов природы по наборам экспериментальных данных.
Многослойный персептрон — частный случай перцептрона Розен- блатта, в котором один алгоритм обратного распространения ошибки обучает все слои.
Множественная линейная регрессия — метод восстановления зависимости между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.
Обучающая выборка — выборка, по которой производится оптимизация параметров предсказательной модели.
Однослойный персептрон — простейшая модель нейронной сети, предназначенная для классификации линейно-разделимых данных.
Среднеквадратическая ошибка — мера различий между значениями (выборкой и значениями популяции), предсказанными моделью или оценкой, и фактически наблюдаемыми значениями.
Тестовая выборка — выборка, по которой оценивается качество построенной предсказательной модели.
✅ Заключение
Данная работа подтверждает эффективность использования радиальнобазисных функций при решении задач предсказания качества воздуха. Ограничениями в проведенном исследовании являлось количество известных данных. Получение данных о концентрациях веществ в атмосфере за более длительный период, а также погодных измерений в конкретных точках города Москвы позволит изучить более сложные взаимосвязи и построить более точные предиктивные модели.



