Предоставляется в ознакомительных и исследовательских целях
Тема: Информационно-аналитический подход для обработки данных на основе «Bootstrap» метода
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Анализ проблем и исследования 6
1.1 Математические основы для описания неопределенности 6
1.2 Случайность и нечеткость 8
1.3 Статистика и случайные процессы 9
1.4 Виды неопределенности 10
1.5 Анализ неопределенностей 11
1.6 Основные концепции управления неопределенностями 14
1.7 Распространение и анализ неопределенностей в параметрических моделях с недетерминированной связью «входы — выход» 16
1.8 Численные методы обработки данных 18
1.8.1 Численно вероятностный анализ 18
1.8.2 Типы неопределенностей 19
1.8.3 Построение функции плотности в условиях элиторной
неопределенности 20
1.8.4 Арифметика неопределенных данных на основе гистограмм второго
порядка 2 1
1.9 Апостериорная оценка погрешности численного моделирования 22
1.9.1 Теоретическая оценка погрешности приближения гистограммы к
функции плотности вероятности 25
1.9.2 Апостериорная оценка погрешности приближения гистограммы к
функции плотности вероятности 26
1.10 Bootstrap методы и построение случайных псевдовыборок 28
1.11 Концепции ресамплинга и общая схема его реализации и краткий
исторический экскурс 28
1.12 Параметрическая статистика и ресамплинг: принципиальные различия 29
1.13 Складной нож и бутстреп — механизмы генерации случайных
псевдовыборок 30
1.14 Вывод по главе 1 35
2 Проектирование программного модуля построения случайных выборок и их
анализа 36
2.1 Проектирование программного модуля построения случайных выборок
и их анализа 36
2.2 Используемые инструменты и технологии 37
2.3 Компонентная схема программного модуля построения случайных
выборок и их анализа для тестовых данных 38
2.3.1 Описание процессов работы программного модуля 39
2.3.2 Описание блоков программного модуля построения случайных выборок
и их анализа 39
2.4 Программно-компонентная схема программного модуля построения
случайных выборок и их анализа 42
2.5 Общая характеристика модуля 44
2.6 Вывод по главе 2 44
3 Разработка программного модуля построения случайных выборок и их анализа 45
3.1 Слой моделей 45
3.2 Промежуточный слой 47
3.3 Слой представления 49
3.4 Экспериментальная проверка на тестовых значениях 50
3.4.1 Генерация генеральной выборки и построение гистограммы второго
порядка и ее анализ 50
3.4.2 Преобразование генеральной выборки методом бутстреп, вычисление
математического ожидания, дисперсии и анализ результатов 52
3.5 Вывод по главе 3 52
Заключение 53
Список использованных источников 54
Приложение А 56
Приложение Б 64
📖 Введение
Риски связаны с неоднозначностью и неопределенностью протекающих процессов. Ход исторического развития привел к тому, что риск и неопределенность стали реальностью, поэтому значение изучения и управления рисками возрастает из-за роста их количества и увеличения вероятности их наступления.
В современном мире роль оценки рисков в деятельности предприятия очень велика, а необходимость управления рисками является осознанной большинством компаний. Грамотная оценка и управление рисками гармонирует со всеми аспектами деятельности предприятия, позволяет продумывать стратегии снижения угроз, избегать лишних трат, а также предоставляет возможность углубить и детализировать процесс планирования. Анализ и оценка рисков проекта, в большинстве своем, заключается в качественном анализе, что не всегда является достаточным условием при управлении рисками. В последнее время широкое распространение получили количественные модели и методы получения информации и знаний, т. к. они дают прикладные результаты, опираясь на которые можно строить план реагирования.
Актуальность выбранной темы обусловлена тем, что для решения многих практических задач активно разрабатываются и применяются методы численного моделирования. Среди таких задач можно выделить задачи в области бизнес аналитики, дистанционного мониторинга технических систем. Информация, которая составляет основу подобных исследований, характеризуется большим объемом, неоднородностью, динамичностью, уровнем и различными видами неопределенности, недостаточностью.
Для анализа информации такого рода используется последовательности методов, включающие методы предобработки, обработки и постобработки данных. Многообразие применяемых на каждом этапе методов, актуализирует проблему оценки точности полученных результатов
Целью магистерской диссертации является повышение эффективности обработки данных на основе информационно аналитического подхода, в условиях неопределенности.
В рамках диссертации будут решены следующие задачи:
1) анализ методов бутстрапирования;
2) разработать алгоритм извлечения знаний на основе бутстреп подхода и разработать компонентную схему программного модуля построения случайных выборок и их анализа;
3) разработать программный модуль построения случайных выборок и их анализа на основе разработанного алгоритма.
✅ Заключение
Анализ методов обработки данных показал, что данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием методов бутсрапирования. Эксперименты показали, что методы бутстрапирования повышает надежность апостериорных оценок. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки метод бутстрапирования показал достаточно точные результаты при объеме выборки n=10000.
Результаты показали, что обработка случайной величины с помощью гистограмм и последующая их обработка являются перспективным направлением, и уже на первоначальных этапах исследования, с применением простых методов, дает достаточно точные результаты.
Работа была опробована на международной молодежной научно - практической конференции «Научные исследования и разработки молодых ученых», в декабре 2015 г.



