Система прогнозирования на основе многокритериального анализа временных рядов
|
Введение
1. Модели и методы прогнозирования на основе временных рядов 8
1.1. Временные ряды 8
1.1.1. Определение временного ряда 8
1.1.2. Генезис наблюдений, образующих временной ряд 9
1.1.3. Основные задачи анализа временных рядов 10
1.1.4. Стационарные временные ряды и их основные характеристики 10
1.2. Обзор, математических моделей, применяемых при анализе временных рядов 11
1.2.1. Регрессионные модели 11
1.2.2. Модель авторегрессии (АР) 27
1.2.3. Модель скользящего среднего (СС) 29
1.2.4. Смешанные модели авторегрессии - скользящего среднего (АРСС) 30
1.2.5. Описание периодических процессов рядами Фурье 31
1.3. Модели и методы принятия решений 41
1.3.1. Постановки многокритериальных задач принятия решений 42
1.3.2. Характеристики приоритета критериев. Нормализация критериев 46
1.3.3. Принципы оптимальности в задачах принятия решений 48
1.3.4. Метод аналитической иерархии 55
1.3.5. Методы порогов несравнимости ЭЛЕКТРА 56
1.3.6. Диалоговые методы. Метод ограничений 57
1.4. Выводы к главе 1 59
2. Модели и метды многокритериального прогнозирования 60
2.1. Постановка задачи прогнозирования 60
2.2. Критерии оценки качества прогнозирования 63
2.3. Решение задачи прогнозирования как задачи оптимизации 64
2.4. Алгоритм построения множества конкурирующих прогнозов 66
2.5. Прогнозирование в диалоговом режиме с ЛПР 70
2
2.5.1. Особенности диалоговых методов принятия решений 70
2.5.2. Диалоговый алгоритм решения задачи прогнозирования 73
2.6. Аддитивные модели прогнозирования 79
2.6.1. Определение наличия неслучайной составляющей во временном ряду 79
2.6.2. Анализ тренда 81
2.6.3. Анализ сезонной компоненты 83
2.6.4. Анализ случайной компоненты 83
2.7. Выводы к главе 2 84
3. Программная реализация системы прогнозирования 85
3.1. Структура информационной системы «Эпиднадзор» 85
3.2. Объектная модель системы прогнозирования 86
3.2.1. Диаграммы классов 86
3.2.2. Описание классов подсистемы прогнозирования 89
3.3. Пользовательский интерфейс системы прогнозирования 98
3.3.1. Назначение основных элементов интерфейса пользователя 98
3.3.2. Настройка параметров прогнозирования 99
3.3.3. Настройка параметров отображения результатов прогнозирования 101
3.3.4. Выбор рационального прогноза в диалоговом режиме 103
3.4. Выводы к главе 3 104
4. Примеры построения прогнозов с помощью системы прогнозирования 105
4.1. Использование диалогового алгоритма решения задачи прогнозирования при построении прогноза 106
4.2. Влияние выбора формальной постановки задачи прогнозирования на результаты прогнозирования 115
4.3. Выводы к главе 4 126
Основные результаты работы 127
Список использованной литературы 128
Приложение 1. Акты о внедрении 135
3
1. Модели и методы прогнозирования на основе временных рядов 8
1.1. Временные ряды 8
1.1.1. Определение временного ряда 8
1.1.2. Генезис наблюдений, образующих временной ряд 9
1.1.3. Основные задачи анализа временных рядов 10
1.1.4. Стационарные временные ряды и их основные характеристики 10
1.2. Обзор, математических моделей, применяемых при анализе временных рядов 11
1.2.1. Регрессионные модели 11
1.2.2. Модель авторегрессии (АР) 27
1.2.3. Модель скользящего среднего (СС) 29
1.2.4. Смешанные модели авторегрессии - скользящего среднего (АРСС) 30
1.2.5. Описание периодических процессов рядами Фурье 31
1.3. Модели и методы принятия решений 41
1.3.1. Постановки многокритериальных задач принятия решений 42
1.3.2. Характеристики приоритета критериев. Нормализация критериев 46
1.3.3. Принципы оптимальности в задачах принятия решений 48
1.3.4. Метод аналитической иерархии 55
1.3.5. Методы порогов несравнимости ЭЛЕКТРА 56
1.3.6. Диалоговые методы. Метод ограничений 57
1.4. Выводы к главе 1 59
2. Модели и метды многокритериального прогнозирования 60
2.1. Постановка задачи прогнозирования 60
2.2. Критерии оценки качества прогнозирования 63
2.3. Решение задачи прогнозирования как задачи оптимизации 64
2.4. Алгоритм построения множества конкурирующих прогнозов 66
2.5. Прогнозирование в диалоговом режиме с ЛПР 70
2
2.5.1. Особенности диалоговых методов принятия решений 70
2.5.2. Диалоговый алгоритм решения задачи прогнозирования 73
2.6. Аддитивные модели прогнозирования 79
2.6.1. Определение наличия неслучайной составляющей во временном ряду 79
2.6.2. Анализ тренда 81
2.6.3. Анализ сезонной компоненты 83
2.6.4. Анализ случайной компоненты 83
2.7. Выводы к главе 2 84
3. Программная реализация системы прогнозирования 85
3.1. Структура информационной системы «Эпиднадзор» 85
3.2. Объектная модель системы прогнозирования 86
3.2.1. Диаграммы классов 86
3.2.2. Описание классов подсистемы прогнозирования 89
3.3. Пользовательский интерфейс системы прогнозирования 98
3.3.1. Назначение основных элементов интерфейса пользователя 98
3.3.2. Настройка параметров прогнозирования 99
3.3.3. Настройка параметров отображения результатов прогнозирования 101
3.3.4. Выбор рационального прогноза в диалоговом режиме 103
3.4. Выводы к главе 3 104
4. Примеры построения прогнозов с помощью системы прогнозирования 105
4.1. Использование диалогового алгоритма решения задачи прогнозирования при построении прогноза 106
4.2. Влияние выбора формальной постановки задачи прогнозирования на результаты прогнозирования 115
4.3. Выводы к главе 4 126
Основные результаты работы 127
Список использованной литературы 128
Приложение 1. Акты о внедрении 135
3
В 2001 году постановлением Правительства Российской Федерации утверждена Федеральная целевая программа «Предупреждение и борьба с заболеваниями социального характера (2002-2006 годы)». В подпрограмме «Вакцинопрофилактика» этой программы говорится о необходимости проведения работ по совершенствованию эпидемиологического надзора за инфекциями, управляемыми средствами специфической профилактики, и государственного контроля за проведением профилактических и противоэпидемических мероприятий.
В рамках решения задач подпрограммы «Вакцинопрофилактика» создана и постоянно совершенствуется «Компьютерная система эпидемиологического надзора за инфекционными заболеваниями (федеральный уровень)» (далее информационная система «Эпиднадзор»), предназначенная для автоматизации процедур сбора, хранения и обработки информации по мониторингу за инфекционными заболеваниями. Основу системы составляет интегрированная база данных, содержащая информацию, собираемую по формам федерального государственного и отраслевого статистического наблюдения /33, 49/.
Актуальность обуславливается необходимостью решения задач, возникающих перед государственной санитарно-эпидемиологической службой при осуществлении эпидемиологического надзора за инфекционными заболеваниями и связанных с обработкой и анализом поступающих статистических данных. Это задачи регламентированной обработки статистической отчетности, постоянного наблюдения за эпидемическим процессом во времени, оперативные ситуационные задачи, связанные с принятием управленческих решений, задачи анализа причинно-следственных связей в складывающейся обстановке, прогнозирования развития эпидемической ситуации /5/.
В работе содержатся теоретические положения, которые были положены в основу подсистемы «Прогноз» информационной системы «Эпиднадзор», предназначенной для поддержки принятия управленческих решений при эпидемиологическом надзоре за инфекционными заболеваниями, а также примеры использования и результаты внедрения этой системы в деятельность Департамента государственного санитарно¬эпидемиологического надзора Минздрава России и Федерального центра государственного санитарно-эпидемиологического надзора Минздрава России.
В диссертационной работе предлагается методика решения задачи прогнозирования на основе временных рядов с использованием стандартных методов, их комбинаций и
4
модификаций известных методов. Особенности предлагаемого подхода состоят в следующем:
• реализованы многокритериальное описание качества прогнозов, описание понятий «хороший» или «оптимальный» прогноз;
• для разных ситуаций содержательно описаны требования к качеству прогнозов, которые трансформированы в множество формальных постановок задач прогнозирования;
• сформировано множество прогнозных моделей, на основе ретроспективного анализа осуществляется выбор вида и параметров моделей;
• используются прогнозные модели аддитивной структуры, позволяющие проводить покомпонентный анализ составляющих временного ряда;
• система прогнозирования реализуется в диалоговом варианте.
Целью диссертационной работы являются разработка алгоритмов построения прогнозов на основе анализа временных рядов, разработка методов формализации оценки их качества, создание на основе этих методов и алгоритмов системы прогнозирования и ее последующая интеграция в информационную систему эпидемиологического надзора за инфекционными заболеваниями «Эпиднадзор».
Для достижения поставленной цели в работе поставлены и решены следующие задачи.
1. Анализ существующих методов прогнозирования на основе временных рядов.
2. Формулировка постановок многокритериальных задач прогнозирования.
3. Разработка методики оценки качества прогнозирования, учитывающей предпочтения эксперта.
4. Разработка диалогового алгоритма рационального выбора «лучших» прогнозов.
5. Решение задач построения прогнозов как задач оптимизации.
6. Реализация подсистемы прогнозирования для информационной системы «Эпиднадзор».
7. Оценка работоспособности системы при прогнозировании инфекционной заболеваемости.
Для решения поставленных задач исследования были использованы методы многокритериальной оптимизации, системного анализа и исследования операций, математической статистики, эконометрики, теории реляционных баз данных, объектно¬ориентированного проектирования и программирования.
5
На защиту выносятся.
1. Многокритериальный подход при формализации постановки задачи прогнозирования, включающий построение критериев оценки качества прогноза, постановку оптимизационных задач для настройки прогнозных моделей.
2. Диалоговый алгоритм решения задачи прогнозирования как многокритериальной задачи оптимизации на основе предложенных критериев оценки качества прогноза.
3. Предложенные в работе прогнозные модели, их структура и параметры.
4. Разработанная система прогнозирования на основе многокритериального анализа временных рядов
Научная новизна диссертации заключается в предложении многокритериального подхода при формализации постановки задачи прогнозирования. Множество предложенных критериев оценки качества прогнозов трансформировано в формальные постановки задач многокритериальной оптимизации, которые решаются на множестве конкурирующих прогнозов. Для решения поставленных задач построено множество прогнозных моделей. Разработан диалоговый алгоритм рационального выбора лучших прогнозов.
Практическая значимость работы состоит в том, что применение разработанной системы прогнозирования в деятельности госсанэпидслужбы с последующим принятием управленческих решений, направленных на профилактику и снижение инфекционной заболеваемости, позволяет повысить качество и эффективность эпидемиологического надзора за инфекционными заболеваниями в России.
Разработанная система прогнозирования на основе многокритериального анализа временных рядов реализована как подсистема прогнозирования в информационной системе эпидемиологического надзора за инфекционными заболеваниями «Эпиднадзор».
Информационная система «Эпиднадзор» находится в промышленной эксплуатации в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре государственного санитарно-эпидемиологического надзора Минздрава России.
Результаты диссертационной работы докладывались и обсуждались на:
• международной конференции «Идентификация систем и задачи управления» (SICPRO), Москва, 2004 г.;
6
• международном форуме «Информатизация процессов охраны здоровья населения - 2001», Кемер, Турция, 2001 г.;
• совещаниях в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре госсанэпиднадзора Минздрава России;
• семинарах на кафедре автоматизированных систем управления Московского государственного института стали и сплавов (технологического университета).
В рамках решения задач подпрограммы «Вакцинопрофилактика» создана и постоянно совершенствуется «Компьютерная система эпидемиологического надзора за инфекционными заболеваниями (федеральный уровень)» (далее информационная система «Эпиднадзор»), предназначенная для автоматизации процедур сбора, хранения и обработки информации по мониторингу за инфекционными заболеваниями. Основу системы составляет интегрированная база данных, содержащая информацию, собираемую по формам федерального государственного и отраслевого статистического наблюдения /33, 49/.
Актуальность обуславливается необходимостью решения задач, возникающих перед государственной санитарно-эпидемиологической службой при осуществлении эпидемиологического надзора за инфекционными заболеваниями и связанных с обработкой и анализом поступающих статистических данных. Это задачи регламентированной обработки статистической отчетности, постоянного наблюдения за эпидемическим процессом во времени, оперативные ситуационные задачи, связанные с принятием управленческих решений, задачи анализа причинно-следственных связей в складывающейся обстановке, прогнозирования развития эпидемической ситуации /5/.
В работе содержатся теоретические положения, которые были положены в основу подсистемы «Прогноз» информационной системы «Эпиднадзор», предназначенной для поддержки принятия управленческих решений при эпидемиологическом надзоре за инфекционными заболеваниями, а также примеры использования и результаты внедрения этой системы в деятельность Департамента государственного санитарно¬эпидемиологического надзора Минздрава России и Федерального центра государственного санитарно-эпидемиологического надзора Минздрава России.
В диссертационной работе предлагается методика решения задачи прогнозирования на основе временных рядов с использованием стандартных методов, их комбинаций и
4
модификаций известных методов. Особенности предлагаемого подхода состоят в следующем:
• реализованы многокритериальное описание качества прогнозов, описание понятий «хороший» или «оптимальный» прогноз;
• для разных ситуаций содержательно описаны требования к качеству прогнозов, которые трансформированы в множество формальных постановок задач прогнозирования;
• сформировано множество прогнозных моделей, на основе ретроспективного анализа осуществляется выбор вида и параметров моделей;
• используются прогнозные модели аддитивной структуры, позволяющие проводить покомпонентный анализ составляющих временного ряда;
• система прогнозирования реализуется в диалоговом варианте.
Целью диссертационной работы являются разработка алгоритмов построения прогнозов на основе анализа временных рядов, разработка методов формализации оценки их качества, создание на основе этих методов и алгоритмов системы прогнозирования и ее последующая интеграция в информационную систему эпидемиологического надзора за инфекционными заболеваниями «Эпиднадзор».
Для достижения поставленной цели в работе поставлены и решены следующие задачи.
1. Анализ существующих методов прогнозирования на основе временных рядов.
2. Формулировка постановок многокритериальных задач прогнозирования.
3. Разработка методики оценки качества прогнозирования, учитывающей предпочтения эксперта.
4. Разработка диалогового алгоритма рационального выбора «лучших» прогнозов.
5. Решение задач построения прогнозов как задач оптимизации.
6. Реализация подсистемы прогнозирования для информационной системы «Эпиднадзор».
7. Оценка работоспособности системы при прогнозировании инфекционной заболеваемости.
Для решения поставленных задач исследования были использованы методы многокритериальной оптимизации, системного анализа и исследования операций, математической статистики, эконометрики, теории реляционных баз данных, объектно¬ориентированного проектирования и программирования.
5
На защиту выносятся.
1. Многокритериальный подход при формализации постановки задачи прогнозирования, включающий построение критериев оценки качества прогноза, постановку оптимизационных задач для настройки прогнозных моделей.
2. Диалоговый алгоритм решения задачи прогнозирования как многокритериальной задачи оптимизации на основе предложенных критериев оценки качества прогноза.
3. Предложенные в работе прогнозные модели, их структура и параметры.
4. Разработанная система прогнозирования на основе многокритериального анализа временных рядов
Научная новизна диссертации заключается в предложении многокритериального подхода при формализации постановки задачи прогнозирования. Множество предложенных критериев оценки качества прогнозов трансформировано в формальные постановки задач многокритериальной оптимизации, которые решаются на множестве конкурирующих прогнозов. Для решения поставленных задач построено множество прогнозных моделей. Разработан диалоговый алгоритм рационального выбора лучших прогнозов.
Практическая значимость работы состоит в том, что применение разработанной системы прогнозирования в деятельности госсанэпидслужбы с последующим принятием управленческих решений, направленных на профилактику и снижение инфекционной заболеваемости, позволяет повысить качество и эффективность эпидемиологического надзора за инфекционными заболеваниями в России.
Разработанная система прогнозирования на основе многокритериального анализа временных рядов реализована как подсистема прогнозирования в информационной системе эпидемиологического надзора за инфекционными заболеваниями «Эпиднадзор».
Информационная система «Эпиднадзор» находится в промышленной эксплуатации в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре государственного санитарно-эпидемиологического надзора Минздрава России.
Результаты диссертационной работы докладывались и обсуждались на:
• международной конференции «Идентификация систем и задачи управления» (SICPRO), Москва, 2004 г.;
6
• международном форуме «Информатизация процессов охраны здоровья населения - 2001», Кемер, Турция, 2001 г.;
• совещаниях в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре госсанэпиднадзора Минздрава России;
• семинарах на кафедре автоматизированных систем управления Московского государственного института стали и сплавов (технологического университета).
В диссертации предложены, успешно апробированы и внедрены методика, математическое и программное обеспечение системы прогнозирования на основе многокритериального анализа временных рядов. Система предназначена для решения задачи прогнозирования с последующим принятием управленческих решений, направленных на профилактику и снижение инфекционной заболеваемости, что позволяет повысить качество и эффективность эпидемиологического надзора за инфекционными заболеваниями в России. Получены следующие основные научные и практические результаты.
1. Предложено многокритериальное описание качества прогнозов на основании сформированного множества критериев оценки их качества, учитывающих предпочтения эксперта. Для различных ситуаций сформулированы требования к качеству прогнозов как формальные постановки задачи прогнозирования.
2. Разработан алгоритм построения множества конкурирующих прогнозов, на котором задача прогнозирования решается как задача оптимизации, где целевой функцией является функция качества прогноза, сконструированная на основе критериев оценки качества прогнозирования.
3. Разработан диалоговый алгоритм решения задачи прогнозирования как многокритериальной задачи оптимизации на основе сформулированных критериев оценки качества прогноза.
4. Описаны и адаптированы под решаемую задачу многокритериальной оптимизации прогнозные модели аддитивной структуры, позволяющие проводить покомпонентный анализ составляющих временного ряда: тренда, сезонной и случайной компоненты.
5. Разработанные алгоритмы и методы составили основу подсистемы «Прогноз» информационной системы «Эпиднадзор», предназначенной для построения прогнозов на основании данных об инфекционной заболеваемости. Информационная система «Эпиднадзор» находится в промышленной эксплуатации в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре санитарно-эпидемиологического надзора Минздрава России.
1. Предложено многокритериальное описание качества прогнозов на основании сформированного множества критериев оценки их качества, учитывающих предпочтения эксперта. Для различных ситуаций сформулированы требования к качеству прогнозов как формальные постановки задачи прогнозирования.
2. Разработан алгоритм построения множества конкурирующих прогнозов, на котором задача прогнозирования решается как задача оптимизации, где целевой функцией является функция качества прогноза, сконструированная на основе критериев оценки качества прогнозирования.
3. Разработан диалоговый алгоритм решения задачи прогнозирования как многокритериальной задачи оптимизации на основе сформулированных критериев оценки качества прогноза.
4. Описаны и адаптированы под решаемую задачу многокритериальной оптимизации прогнозные модели аддитивной структуры, позволяющие проводить покомпонентный анализ составляющих временного ряда: тренда, сезонной и случайной компоненты.
5. Разработанные алгоритмы и методы составили основу подсистемы «Прогноз» информационной системы «Эпиднадзор», предназначенной для построения прогнозов на основании данных об инфекционной заболеваемости. Информационная система «Эпиднадзор» находится в промышленной эксплуатации в Департаменте государственного санитарно-эпидемиологического надзора Минздрава России и Федеральном центре санитарно-эпидемиологического надзора Минздрава России.



