Информационно-аналитические методы численной обработки данных в условиях неопределенности
|
Введение 7
1 Анализ проблемы исследования 9
1.1 Анализ способов представления неопределенных данных и численные операции над ними 9
1.2 Анализ неопределенностей в данных 9
1.3 Случайные данные. Арифметика над случайными величинами 10
1.4 Интервальные данные. Интервальная арифметика 13
1.5 Нечеткие данные. Нечеткая арифметика 14
1.6 Вывод по главе 1 18
2 Анализ методов и подходов к обработке неопределенностей 19
2.1 Ядерное восстановление функции плотности вероятности 19
2.2 Метод Монте -Карло 21
2.2 Численный вероятностный анализ 36
2.2.1 Определение и основные задачи численного вероятностного
анализа 36
2.2.3 Гистограммная арифметика 46
2.2.4 Вероятностные расширения и их свойства 48
2.2.5 Сглаживание эмпирических данных 49
2.3 Вывод по главе 2 51
3 Разработка модуля для численного моделирования эмпирических данных 52
3.1 Общая характеристика модуля 52
3.2 Структура и описание основных блоков 52
3.2.1 Постановка задачи 53
3.2.2 Алгоритм решения задачи 54
3.2.3 Результаты ядерного восстановления функции плотности
вероятности 55
3.3 Оценка функции плотности с помощью полиномиального
сглаживания 59
3.4 Сравнение рассмотренных методов на примере одной задачи 62
3.5 Вывод по главе 3 64
Заключение 65
Список использованных источников 67
Приложение А Плакаты презентации 66
1 Анализ проблемы исследования 9
1.1 Анализ способов представления неопределенных данных и численные операции над ними 9
1.2 Анализ неопределенностей в данных 9
1.3 Случайные данные. Арифметика над случайными величинами 10
1.4 Интервальные данные. Интервальная арифметика 13
1.5 Нечеткие данные. Нечеткая арифметика 14
1.6 Вывод по главе 1 18
2 Анализ методов и подходов к обработке неопределенностей 19
2.1 Ядерное восстановление функции плотности вероятности 19
2.2 Метод Монте -Карло 21
2.2 Численный вероятностный анализ 36
2.2.1 Определение и основные задачи численного вероятностного
анализа 36
2.2.3 Гистограммная арифметика 46
2.2.4 Вероятностные расширения и их свойства 48
2.2.5 Сглаживание эмпирических данных 49
2.3 Вывод по главе 2 51
3 Разработка модуля для численного моделирования эмпирических данных 52
3.1 Общая характеристика модуля 52
3.2 Структура и описание основных блоков 52
3.2.1 Постановка задачи 53
3.2.2 Алгоритм решения задачи 54
3.2.3 Результаты ядерного восстановления функции плотности
вероятности 55
3.3 Оценка функции плотности с помощью полиномиального
сглаживания 59
3.4 Сравнение рассмотренных методов на примере одной задачи 62
3.5 Вывод по главе 3 64
Заключение 65
Список использованных источников 67
Приложение А Плакаты презентации 66
Темой магистерской диссертации является информационно¬аналитические методы численной обработки данных в условиях неопределенности. При принятии управленческих решений в условиях, когда необходимая информация доступна, основная задача сводится к принятию рационального выбора оптимального варианта путем вычисления функции полезности. Однако, на практике чаще всего происходит, что получена только неопределенная информация, когда для принятия решений требуется применение более сложных методов представления и расчетов, при этом основой выбора оптимального решения в условиях неопределенностей могут стать функция полезности, функция плотности вероятности. На практике, при решении различных задач неопределенность в данных может препятствовать принятию оптимальных решений.
Для многих практических задач характерна, так называемая, неопределенность в данных, которая может существенно влиять на результаты вычисления различных показателей и характеристик, которые необходимо рассчитать в рамках исследуемой проблемы. В зависимости от предмета решаемой задачи неопределенности данных принимают отраслевой характер, например, экономическая неопределенность.
При решении различных задач, связанных с анализом экспериментальных данных, полученных в результате проведения каких-либо опытов и отображающих поведение параметров системы, перед аналитиками возникает вопрос, какой способ представления этих данных позволит провести наиболее эффективный анализ, который наглядно продемонстрирует возможные исходы и позволит принять правильные решения. Стоит отметить, что данные получаемые в ходе различных экспериментов, носят случайный характер.
Специфика сложности исследования таких систем обуславливается рядом факторов, которые сводятся к четырем группам: первая группа характеризуется внутренней сложностью системы; вторая - внешней сложностью явлений и процессов, влияющих на систему и взаимодействующих с ней; третья группа определяется недостаточностью информации и знаний о предыстории процесса функционирования системы; четвертая группа факторов связана с разрабатываемыми и применяемыми технологиями анализа систем, которые в настоящее время отличаются сложностью, расширением круга решаемых задач [8].
В связи с этим, целью магистерской диссертации является повышение эффективности обработки данных в условиях неопределенности на основе численных методов и алгоритмов.
Для достижения цели диссертации поставлены следующие задачи:
1) провести анализ проблемной области исследования;
2) провести анализ методов обработки неопределенных данных;
3) разработать программный модуль, предназначенный для обработки данных в условиях неопределенности.
Для многих практических задач характерна, так называемая, неопределенность в данных, которая может существенно влиять на результаты вычисления различных показателей и характеристик, которые необходимо рассчитать в рамках исследуемой проблемы. В зависимости от предмета решаемой задачи неопределенности данных принимают отраслевой характер, например, экономическая неопределенность.
При решении различных задач, связанных с анализом экспериментальных данных, полученных в результате проведения каких-либо опытов и отображающих поведение параметров системы, перед аналитиками возникает вопрос, какой способ представления этих данных позволит провести наиболее эффективный анализ, который наглядно продемонстрирует возможные исходы и позволит принять правильные решения. Стоит отметить, что данные получаемые в ходе различных экспериментов, носят случайный характер.
Специфика сложности исследования таких систем обуславливается рядом факторов, которые сводятся к четырем группам: первая группа характеризуется внутренней сложностью системы; вторая - внешней сложностью явлений и процессов, влияющих на систему и взаимодействующих с ней; третья группа определяется недостаточностью информации и знаний о предыстории процесса функционирования системы; четвертая группа факторов связана с разрабатываемыми и применяемыми технологиями анализа систем, которые в настоящее время отличаются сложностью, расширением круга решаемых задач [8].
В связи с этим, целью магистерской диссертации является повышение эффективности обработки данных в условиях неопределенности на основе численных методов и алгоритмов.
Для достижения цели диссертации поставлены следующие задачи:
1) провести анализ проблемной области исследования;
2) провести анализ методов обработки неопределенных данных;
3) разработать программный модуль, предназначенный для обработки данных в условиях неопределенности.
Неопределенность в данных можно классифицировать по нескольким признакам: по типу неопределенностей можно выделить элиторную неопределенность, которая характеризуется изменчивостью процессов и состояний систем, эпистемическую неопределенность, характеризующуюся неопределенностью самих вероятностных оценок и недостаточностью знаний о системе; по видам неопределенных данных выделяют случайные, нечеткие, интервальные данные. Данные, содержащие случайную неопределенность, задаются некоторыми вероятностными распределениями их возможных значений; «нечеткие» данные задаются лингвистически сформулированными распределениями их возможных значений; данные, содержащие интервальную неопределенность, задаются интервалами их возможных значений без указания какого-либо распределения возможных значений числа внутри заданного интервала. Следует отметить, что для каждого вида неопределенных данных разработана своя арифметика.
Анализ методов обработки данных позволил разделить этим методы на 2 группы, обрабатывающие данные с элиторной неопределенностью, и данные с эпистемической неопределенностью.
Однако, данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе, например, задачи в условиях малых объемов выборок.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием ядерных оценок. Данные эксперименты показали, что ядерное восстановление функции плотности вероятности с увеличением объема выборки данных дает более лучшие результаты. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки ядерные оценки показали достаточно точные результаты при объеме выборки n>20.
Проведен численный эксперимент восстановления функции плотности вероятности случайной величины Х в условиях малой выборки, объем выборки n=7. Восстановление функции плотности вероятности проводилось методом ядерного восстановления функции плотности вероятности, методом сглаживания случайной величины, представленной в виде полиграммы скользящим средним и методом полиномиального сглаживания. Результаты показали, что представление случайной величины с помощью полиграмм и последующая их обработка является перспективным направлением, и уже на первоначальных этапах исследования дает достаточно точные результаты. Эксперимент показал перспективность исследования по применению численных методов обработки данных, представленных на основе полиграмм.
В результате, по теме магистерской диссертации опубликованы две статьи:
1) арифметики и численный вероятностный анализ неопределенных данных;
2) полиграммы для представления случайных данных.
Анализ методов обработки данных позволил разделить этим методы на 2 группы, обрабатывающие данные с элиторной неопределенностью, и данные с эпистемической неопределенностью.
Однако, данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе, например, задачи в условиях малых объемов выборок.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием ядерных оценок. Данные эксперименты показали, что ядерное восстановление функции плотности вероятности с увеличением объема выборки данных дает более лучшие результаты. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки ядерные оценки показали достаточно точные результаты при объеме выборки n>20.
Проведен численный эксперимент восстановления функции плотности вероятности случайной величины Х в условиях малой выборки, объем выборки n=7. Восстановление функции плотности вероятности проводилось методом ядерного восстановления функции плотности вероятности, методом сглаживания случайной величины, представленной в виде полиграммы скользящим средним и методом полиномиального сглаживания. Результаты показали, что представление случайной величины с помощью полиграмм и последующая их обработка является перспективным направлением, и уже на первоначальных этапах исследования дает достаточно точные результаты. Эксперимент показал перспективность исследования по применению численных методов обработки данных, представленных на основе полиграмм.
В результате, по теме магистерской диссертации опубликованы две статьи:
1) арифметики и численный вероятностный анализ неопределенных данных;
2) полиграммы для представления случайных данных.
Подобные работы
- Информационно-аналитический подход к обработке экономической информации на основе численного вероятностного анализа
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2017 - Модели и методы оценки коммерческих банков в условиях неопределенности
Диссертация , экономика. Язык работы: Русский. Цена: 500 р. Год сдачи: 2002 - Модели и методы оценки коммерческих банков в условиях неопределенности
Диссертация , экономика. Язык работы: Русский. Цена: 500 р. Год сдачи: 2002 - Разработка информационно-аналитической системы для построения регрессионных моделей по эмпирическим данным
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2018 - Информационно-аналитический подход для обработки данных на основе «Bootstrap» метода
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2016 - Разработка модуля арифметических операций для работы с неопределенными данными
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2018 - Информационно-аналитический подход к моделированию принятия согласованных экономических решений
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2018 - Построение гарантированных оценок показателей функционирования сложных технических систем в условиях ограниченного объема информации
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2016 - ГИПЕРГРАФОВЫЕ МОДЕЛИ И МЕТОДЫ РЕШЕНИЯ ДИСКРЕТНЫХ ЗАДАЧ УПРАВЛЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
Диссертации (РГБ), физика. Язык работы: Русский. Цена: 500 р. Год сдачи: 2004



