Информационно-аналитический подход для обработки данных на основе «Bootstrap» метода
|
Введение 4
1 Анализ проблем и исследования 6
1.1 Математические основы для описания неопределенности 6
1.2 Случайность и нечеткость 8
1.3 Статистика и случайные процессы 9
1.4 Виды неопределенности 10
1.5 Анализ неопределенностей 11
1.6 Основные концепции управления неопределенностями 14
1.7 Распространение и анализ неопределенностей в параметрических моделях с недетерминированной связью «входы — выход» 16
1.8 Численные методы обработки данных 18
1.8.1 Численно вероятностный анализ 18
1.8.2 Типы неопределенностей 19
1.8.3 Построение функции плотности в условиях элиторной
неопределенности 20
1.8.4 Арифметика неопределенных данных на основе гистограмм второго
порядка 2 1
1.9 Апостериорная оценка погрешности численного моделирования 22
1.9.1 Теоретическая оценка погрешности приближения гистограммы к
функции плотности вероятности 25
1.9.2 Апостериорная оценка погрешности приближения гистограммы к
функции плотности вероятности 26
1.10 Bootstrap методы и построение случайных псевдовыборок 28
1.11 Концепции ресамплинга и общая схема его реализации и краткий
исторический экскурс 28
1.12 Параметрическая статистика и ресамплинг: принципиальные различия 29
1.13 Складной нож и бутстреп — механизмы генерации случайных
псевдовыборок 30
1.14 Вывод по главе 1 35
2 Проектирование программного модуля построения случайных выборок и их
анализа 36
2.1 Проектирование программного модуля построения случайных выборок
и их анализа 36
2.2 Используемые инструменты и технологии 37
2.3 Компонентная схема программного модуля построения случайных
выборок и их анализа для тестовых данных 38
2.3.1 Описание процессов работы программного модуля 39
2.3.2 Описание блоков программного модуля построения случайных выборок
и их анализа 39
2.4 Программно-компонентная схема программного модуля построения
случайных выборок и их анализа 42
2.5 Общая характеристика модуля 44
2.6 Вывод по главе 2 44
3 Разработка программного модуля построения случайных выборок и их анализа 45
3.1 Слой моделей 45
3.2 Промежуточный слой 47
3.3 Слой представления 49
3.4 Экспериментальная проверка на тестовых значениях 50
3.4.1 Генерация генеральной выборки и построение гистограммы второго
порядка и ее анализ 50
3.4.2 Преобразование генеральной выборки методом бутстреп, вычисление
математического ожидания, дисперсии и анализ результатов 52
3.5 Вывод по главе 3 52
Заключение 53
Список использованных источников 54
Приложение А 56
Приложение Б 64
1 Анализ проблем и исследования 6
1.1 Математические основы для описания неопределенности 6
1.2 Случайность и нечеткость 8
1.3 Статистика и случайные процессы 9
1.4 Виды неопределенности 10
1.5 Анализ неопределенностей 11
1.6 Основные концепции управления неопределенностями 14
1.7 Распространение и анализ неопределенностей в параметрических моделях с недетерминированной связью «входы — выход» 16
1.8 Численные методы обработки данных 18
1.8.1 Численно вероятностный анализ 18
1.8.2 Типы неопределенностей 19
1.8.3 Построение функции плотности в условиях элиторной
неопределенности 20
1.8.4 Арифметика неопределенных данных на основе гистограмм второго
порядка 2 1
1.9 Апостериорная оценка погрешности численного моделирования 22
1.9.1 Теоретическая оценка погрешности приближения гистограммы к
функции плотности вероятности 25
1.9.2 Апостериорная оценка погрешности приближения гистограммы к
функции плотности вероятности 26
1.10 Bootstrap методы и построение случайных псевдовыборок 28
1.11 Концепции ресамплинга и общая схема его реализации и краткий
исторический экскурс 28
1.12 Параметрическая статистика и ресамплинг: принципиальные различия 29
1.13 Складной нож и бутстреп — механизмы генерации случайных
псевдовыборок 30
1.14 Вывод по главе 1 35
2 Проектирование программного модуля построения случайных выборок и их
анализа 36
2.1 Проектирование программного модуля построения случайных выборок
и их анализа 36
2.2 Используемые инструменты и технологии 37
2.3 Компонентная схема программного модуля построения случайных
выборок и их анализа для тестовых данных 38
2.3.1 Описание процессов работы программного модуля 39
2.3.2 Описание блоков программного модуля построения случайных выборок
и их анализа 39
2.4 Программно-компонентная схема программного модуля построения
случайных выборок и их анализа 42
2.5 Общая характеристика модуля 44
2.6 Вывод по главе 2 44
3 Разработка программного модуля построения случайных выборок и их анализа 45
3.1 Слой моделей 45
3.2 Промежуточный слой 47
3.3 Слой представления 49
3.4 Экспериментальная проверка на тестовых значениях 50
3.4.1 Генерация генеральной выборки и построение гистограммы второго
порядка и ее анализ 50
3.4.2 Преобразование генеральной выборки методом бутстреп, вычисление
математического ожидания, дисперсии и анализ результатов 52
3.5 Вывод по главе 3 52
Заключение 53
Список использованных источников 54
Приложение А 56
Приложение Б 64
Современный мир — необычайно сложная система, обладающая высокой чувствительностью к изменению различных параметров и уязвимостью к внешним воздействиям, флуктуациям. Прогнозирование и измерение различного рода флуктуаций, внешних воздействий является неотъемлемой частью любой сферы деятельности, т. к. без этого навыка выживание в условиях современности ограничено.
Риски связаны с неоднозначностью и неопределенностью протекающих процессов. Ход исторического развития привел к тому, что риск и неопределенность стали реальностью, поэтому значение изучения и управления рисками возрастает из-за роста их количества и увеличения вероятности их наступления.
В современном мире роль оценки рисков в деятельности предприятия очень велика, а необходимость управления рисками является осознанной большинством компаний. Грамотная оценка и управление рисками гармонирует со всеми аспектами деятельности предприятия, позволяет продумывать стратегии снижения угроз, избегать лишних трат, а также предоставляет возможность углубить и детализировать процесс планирования. Анализ и оценка рисков проекта, в большинстве своем, заключается в качественном анализе, что не всегда является достаточным условием при управлении рисками. В последнее время широкое распространение получили количественные модели и методы получения информации и знаний, т. к. они дают прикладные результаты, опираясь на которые можно строить план реагирования.
Актуальность выбранной темы обусловлена тем, что для решения многих практических задач активно разрабатываются и применяются методы численного моделирования. Среди таких задач можно выделить задачи в области бизнес аналитики, дистанционного мониторинга технических систем. Информация, которая составляет основу подобных исследований, характеризуется большим объемом, неоднородностью, динамичностью, уровнем и различными видами неопределенности, недостаточностью.
Для анализа информации такого рода используется последовательности методов, включающие методы предобработки, обработки и постобработки данных. Многообразие применяемых на каждом этапе методов, актуализирует проблему оценки точности полученных результатов
Целью магистерской диссертации является повышение эффективности обработки данных на основе информационно аналитического подхода, в условиях неопределенности.
В рамках диссертации будут решены следующие задачи:
1) анализ методов бутстрапирования;
2) разработать алгоритм извлечения знаний на основе бутстреп подхода и разработать компонентную схему программного модуля построения случайных выборок и их анализа;
3) разработать программный модуль построения случайных выборок и их анализа на основе разработанного алгоритма.
Риски связаны с неоднозначностью и неопределенностью протекающих процессов. Ход исторического развития привел к тому, что риск и неопределенность стали реальностью, поэтому значение изучения и управления рисками возрастает из-за роста их количества и увеличения вероятности их наступления.
В современном мире роль оценки рисков в деятельности предприятия очень велика, а необходимость управления рисками является осознанной большинством компаний. Грамотная оценка и управление рисками гармонирует со всеми аспектами деятельности предприятия, позволяет продумывать стратегии снижения угроз, избегать лишних трат, а также предоставляет возможность углубить и детализировать процесс планирования. Анализ и оценка рисков проекта, в большинстве своем, заключается в качественном анализе, что не всегда является достаточным условием при управлении рисками. В последнее время широкое распространение получили количественные модели и методы получения информации и знаний, т. к. они дают прикладные результаты, опираясь на которые можно строить план реагирования.
Актуальность выбранной темы обусловлена тем, что для решения многих практических задач активно разрабатываются и применяются методы численного моделирования. Среди таких задач можно выделить задачи в области бизнес аналитики, дистанционного мониторинга технических систем. Информация, которая составляет основу подобных исследований, характеризуется большим объемом, неоднородностью, динамичностью, уровнем и различными видами неопределенности, недостаточностью.
Для анализа информации такого рода используется последовательности методов, включающие методы предобработки, обработки и постобработки данных. Многообразие применяемых на каждом этапе методов, актуализирует проблему оценки точности полученных результатов
Целью магистерской диссертации является повышение эффективности обработки данных на основе информационно аналитического подхода, в условиях неопределенности.
В рамках диссертации будут решены следующие задачи:
1) анализ методов бутстрапирования;
2) разработать алгоритм извлечения знаний на основе бутстреп подхода и разработать компонентную схему программного модуля построения случайных выборок и их анализа;
3) разработать программный модуль построения случайных выборок и их анализа на основе разработанного алгоритма.
Анализ публикаций показал, что неопределенность в данных можно классифицировать по нескольким признакам, а именно: по типу неопределенностей можно выделить элиторную неопределенность, которая характеризуется изменчивостью процессов и состояний систем, эпистемическую неопределенность, характеризующуюся неопределенностью самих вероятностных оценок и недостаточностью знаний о системе; по видам неопределенных данных выделяют случайные, нечеткие, интервальные данные. Данные, содержащие случайную неопределенность, задаются некоторыми вероятностными распределениями их возможных значений; «нечеткие» данные задаются лингвистически сформулированными распределениями их возможных значений; данные, содержащие интервальную неопределенность, задаются интервалами их возможных значений без указания какого-либо распределения возможных значений числа внутри заданного интервала [4; 19]. Следует отметить, что для каждого вида неопределенных данных разработана своя арифметика.
Анализ методов обработки данных показал, что данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием методов бутсрапирования. Эксперименты показали, что методы бутстрапирования повышает надежность апостериорных оценок. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки метод бутстрапирования показал достаточно точные результаты при объеме выборки n=10000.
Результаты показали, что обработка случайной величины с помощью гистограмм и последующая их обработка являются перспективным направлением, и уже на первоначальных этапах исследования, с применением простых методов, дает достаточно точные результаты.
Работа была опробована на международной молодежной научно - практической конференции «Научные исследования и разработки молодых ученых», в декабре 2015 г.
Анализ методов обработки данных показал, что данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием методов бутсрапирования. Эксперименты показали, что методы бутстрапирования повышает надежность апостериорных оценок. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки метод бутстрапирования показал достаточно точные результаты при объеме выборки n=10000.
Результаты показали, что обработка случайной величины с помощью гистограмм и последующая их обработка являются перспективным направлением, и уже на первоначальных этапах исследования, с применением простых методов, дает достаточно точные результаты.
Работа была опробована на международной молодежной научно - практической конференции «Научные исследования и разработки молодых ученых», в декабре 2015 г.
Подобные работы
- Модуль информационно-аналитической системы для анализа данных форм отчетности агропромышленного комплекса
Магистерская диссертация, программирование. Язык работы: Русский. Цена: 2200 р. Год сдачи: 2021 - Разработка подсистемы взаимодействия предприятия с клиентами на основе Интернет-сайта
Бакалаврская работа, информатика. Язык работы: Русский. Цена: 4370 р. Год сдачи: 2017 - Информационное сопровождение процесса тестирования.
Модуль контроля знаний студентов и анализа полученных
результатов
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 4760 р. Год сдачи: 2018 - Бюджетирование как инструмент финансового планирования (на примере предприятий полиграфической деятельности)
Магистерская диссертация, экономика. Язык работы: Русский. Цена: 4880 р. Год сдачи: 2021 - ИНТЕРАКТИВНАЯ СРЕДА КАК СРЕДСТВО ИНДИВИДУАЛИЗАЦИИ УЧЕБНОЙ ДЕЯТЕЛЬНОСТИ ОБУЧАЮЩИХСЯ СТАРШЕЙ ШКОЛЫ
Дипломные работы, ВКР, педагогика. Язык работы: Русский. Цена: 4225 р. Год сдачи: 2018



