Тема: АНАЛИЗ И ПРОГНОЗИРОВАНИЕ ПАРАМЕТРОВ ВИРУСНЫХ ЗАБОЛЕВАНИЙ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДНИЕ 4
1. ОБЩИЕ ПОЛОЖЕНИЯ 8
1.1. Статистический анализ и статистические данные 8
1.2. Методы статистического анализа 9
1.3. Сравнение с аналогами 12
1.4. Выводы по первой главе 14
2. ОПИСАНИЕ МОДЕЛИ АНАЛИЗА СТАТИСТИЧЕСКИХ ДАННЫХ
РАСПРОСТРАНЕНИЯ КОРОНАВИРУСНОЙ ИНФЕКЦИИ 16
2.1. Описание используемой модели 17
2.2. Тестирование регрессионной модели 21
2.3. Выводы по второй главе 26
3. ПРОГНОЗИРОВАНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ
РАСПРОСТРАНЕНИЯ КОРОНАВИРУСНОЙ ИНФЕКЦИИ В РОССИИ 28
3.1. Описание модели прогнозирования 31
3.2. Тестирование модели прогнозирования 33
3.3. Выводы по третьей главе 39
ЗАКЛЮЧЕНИЕ 40
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 41
📖 Введение
За последнее время вспышки вирусов в мире стали происходить все чаще. Эпидемии инфекционных заболеваний, подобных коронавирусу, становятся чем-то обыденным. Связано это, по большому счету, с тем, что население земного шара в наше время больше, чем когда-либо. К тому же оно продолжает расти и уплотняться, а это значит, что вирусам легче передаваться между людьми.
Эффективное управление здравоохранением, в случае возникновения нового вирусного заболевания, возможна при наличии достаточного количества информации. Для того, чтобы обеспечить эту сферу необходимым количеством данных, необходимо своевременно получить анализ полной, достоверной, обоснованной статистической информации по уже известным инфекциям. Эта информация поможет выявить основные проблемы в распространении вируса и установить приоритеты в их решении.
Всемирная организация здравоохранения ежегодно проводит анализ данных, полученных из большей части стран мира, после чего публикует доклад с оценками болезней и смертности. Этот доклад является отчетом об успехах глобального здравоохранения. ВОЗ собирает статистические данные из различных источников, и при их оценке использует методы анализа, способствующие повышению качества данных и обеспечивающие прозрачность при внесении поправок, необходимых для большей сопоставимости данных, полученных из разных стран и за разные промежутки времени. Одним из таких методов является математическое моделирование инфекционных заболеваний компартментными моделями.
Следовательно, учитывая нынешнюю эпидемиологическую ситуацию, можно смело утверждать, что исследование, проведенное в рамках данной выпускной квалификационной работы, актуально.
Суть выпускной квалификационной работы заключается в предположении о том, что распространение коронавирусной инфекции в странах европы началось раньше, чем в России. Исходя из этого предположения строится гипотеза о том, что по исходным статистическим данным среди стран Европы можно найти такую, в которой распространение вируса похоже на его распространение в России, и по модели выбранной страны сделать вывод о будущем развитии коронавирусной инфекции в России. Исходные статистические данные для России и стран Европы будут взяты с разницей в 30 дней.
В данной выпускной квалификационной работе будет рассмотрена обработка статистических данных методом линейного регрессионного анализа. Данные, с которыми будут проводиться все работы, были собраны по 42-м странам, в числе которых Россия и 41 страна Европы, по каждому из трех параметров - заражения, смертность, выздоровления, начиная с 12 апреля 2020 года до 20 мая 2021 года для России, и с 12 марта 2020 года до 20 апреля 2021 года для стран Европы. В результате обработки полученных данных, будут сформированы модели регрессионного анализа, из числа которых будет выбрана одна, наиболее схожая с моделью распространения вируса в России.
Используя выбранную модель для прогнозирования будущего распространения COVID-19 на территории Российской Федерации, можно построить прогноз на некоторый период времени. Если принять прогноз как ожидаемый нормальный уровень распространения, то можно принять некоторые меры и установить приоритеты в действиях для того, чтобы реальные показатели по заражениям и смертям оказались ниже прогнозируемых, а по выздоровлениям, наоборот выше.
Целью исследования выпускной квалификационной работы является прогнозирование распространения COVID-19 на территории Российской Федерации на примере одной, из наиболее схожих, модели европейской страны.
Для достижения поставленной цели было необходимо решить следующие задачи:
1) формирование базы данных на основе собранных статистических данных по 42 странам;
2) проведение линейного регрессионного анализа для выявления наиболее подходящей модели;
3) проведение прогнозирования, и тестирование полученных результатов на точность.
Объект исследования - статистические данные распространения коронавирусного заболевания в РФ, система здравоохранения которой, так или иначе нуждается в улучшении.
Предметом исследования являются статистические данные стран Европы, из числа которых должна быть выбрана одна, для дальнейшего исследования.
Итоговые результаты исследования были получены с помощью использования методов математического моделирования, методов обработки и анализа статистических данных. Для выполнения поставленных задач и выполнения работ по математическому моделированию и анализу данных, был выбран функционал языка программирования Python, в котором были использованы Python-библиотеки, такие как Numpy, Math, Pandas, Scipy, Sklearn, Statsmodels, ориентированные на выполнение представленных задач. Для визуализации результатов работы использовалась библиотека Matplotlib. Так же для проведения анализа, а именно для формирования базы данных, использовался функционал программы MS Excel.
Работа состоит из трех глав, введения, заключения, библиографического списка, и одного приложения.
Во введении обоснована актуальность выпускной квалификационной работы, сформулированы цель и задачи работы, указаны объект и предмет исследования и приведено краткое содержание работы.
В главе 1 описываются особенности сбора, хранения и работы со статистическими данными, проводится обзор основных методов статистического анализа. Так же в главе рассматриваются два популярных метода математического моделирования инфекционных заболеваний компартментными моделями. В заключение главы приведены выводы, по рассмотренной информации.
В главе 2 описан метод сбора, хранения, структурирования и автоматизации работы с собранной статистической информацией, необходимой для выполнения выпускной квалификационной работы, подробно рассмотрен выбранный метод статистического анализа. Также рассмотрен алгоритм работы на конкретном примере, выбрана подходящая модель для выполнения последующего прогнозирования.
В главе 3 рассмотрен метод сглаживания исходной статистической информации, метод прогнозирования данных и метод оценки его точности. Рассмотренный метод прогнозирования был применен к статистическим данным России, получены необходимые результаты. Также была проверена исходная гипотеза, о которой были сделаны соответствующие выводы.
В заключении сформирован общий вывод по полученным результатам, рассмотрены достигнутые результаты.
✅ Заключение
В ходе выполнения работы был разработан алгоритм анализа имеющейся статистической информации, с целью нахождения двух максимально коррелированных переменных, для их дальнейшего прогнозирования. В результате выполнения работы было получено следующее:
1) собрана и структурирована исходная статистическая информация, работа с ней полностью автоматизирована;
2) разработан алгоритм регрессионного анализа;
3) разработана алгоритм прогнозирования значения будущего распространения вируса;
4) проверена гипотеза о возможности прогнозирования распространения вируса в России по модели его распространения в другой, высоко коррелированной с Россией, стране.





