Тип работы:
Предмет:
Язык работы:


Информационно-аналитический подход для обработки данных на основе «Bootstrap» метода

Работа №20103

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы97
Год сдачи2016
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
758
Не подходит работа?

Узнай цену на написание


Введение 4
1 Анализ проблем и исследования 6
1.1 Математические основы для описания неопределенности 6
1.2 Случайность и нечеткость 8
1.3 Статистика и случайные процессы 9
1.4 Виды неопределенности 10
1.5 Анализ неопределенностей 11
1.6 Основные концепции управления неопределенностями 14
1.7 Распространение и анализ неопределенностей в параметрических моделях с недетерминированной связью «входы — выход» 16
1.8 Численные методы обработки данных 18
1.8.1 Численно вероятностный анализ 18
1.8.2 Типы неопределенностей 19
1.8.3 Построение функции плотности в условиях элиторной
неопределенности 20
1.8.4 Арифметика неопределенных данных на основе гистограмм второго
порядка 2 1
1.9 Апостериорная оценка погрешности численного моделирования 22
1.9.1 Теоретическая оценка погрешности приближения гистограммы к
функции плотности вероятности 25
1.9.2 Апостериорная оценка погрешности приближения гистограммы к
функции плотности вероятности 26
1.10 Bootstrap методы и построение случайных псевдовыборок 28
1.11 Концепции ресамплинга и общая схема его реализации и краткий
исторический экскурс 28
1.12 Параметрическая статистика и ресамплинг: принципиальные различия 29
1.13 Складной нож и бутстреп — механизмы генерации случайных
псевдовыборок 30
1.14 Вывод по главе 1 35
2 Проектирование программного модуля построения случайных выборок и их
анализа 36
2.1 Проектирование программного модуля построения случайных выборок
и их анализа 36
2.2 Используемые инструменты и технологии 37
2.3 Компонентная схема программного модуля построения случайных
выборок и их анализа для тестовых данных 38
2.3.1 Описание процессов работы программного модуля 39
2.3.2 Описание блоков программного модуля построения случайных выборок
и их анализа 39
2.4 Программно-компонентная схема программного модуля построения
случайных выборок и их анализа 42
2.5 Общая характеристика модуля 44
2.6 Вывод по главе 2 44
3 Разработка программного модуля построения случайных выборок и их анализа 45
3.1 Слой моделей 45
3.2 Промежуточный слой 47
3.3 Слой представления 49
3.4 Экспериментальная проверка на тестовых значениях 50
3.4.1 Генерация генеральной выборки и построение гистограммы второго
порядка и ее анализ 50
3.4.2 Преобразование генеральной выборки методом бутстреп, вычисление
математического ожидания, дисперсии и анализ результатов 52
3.5 Вывод по главе 3 52
Заключение 53
Список использованных источников 54
Приложение А 56
Приложение Б 64


Современный мир — необычайно сложная система, обладающая высокой чувствительностью к изменению различных параметров и уязвимостью к внешним воздействиям, флуктуациям. Прогнозирование и измерение различного рода флуктуаций, внешних воздействий является неотъемлемой частью любой сферы деятельности, т. к. без этого навыка выживание в условиях современности ограничено.
Риски связаны с неоднозначностью и неопределенностью протекающих процессов. Ход исторического развития привел к тому, что риск и неопределенность стали реальностью, поэтому значение изучения и управления рисками возрастает из-за роста их количества и увеличения вероятности их наступления.
В современном мире роль оценки рисков в деятельности предприятия очень велика, а необходимость управления рисками является осознанной большинством компаний. Грамотная оценка и управление рисками гармонирует со всеми аспектами деятельности предприятия, позволяет продумывать стратегии снижения угроз, избегать лишних трат, а также предоставляет возможность углубить и детализировать процесс планирования. Анализ и оценка рисков проекта, в большинстве своем, заключается в качественном анализе, что не всегда является достаточным условием при управлении рисками. В последнее время широкое распространение получили количественные модели и методы получения информации и знаний, т. к. они дают прикладные результаты, опираясь на которые можно строить план реагирования.
Актуальность выбранной темы обусловлена тем, что для решения многих практических задач активно разрабатываются и применяются методы численного моделирования. Среди таких задач можно выделить задачи в области бизнес аналитики, дистанционного мониторинга технических систем. Информация, которая составляет основу подобных исследований, характеризуется большим объемом, неоднородностью, динамичностью, уровнем и различными видами неопределенности, недостаточностью.
Для анализа информации такого рода используется последовательности методов, включающие методы предобработки, обработки и постобработки данных. Многообразие применяемых на каждом этапе методов, актуализирует проблему оценки точности полученных результатов
Целью магистерской диссертации является повышение эффективности обработки данных на основе информационно аналитического подхода, в условиях неопределенности.
В рамках диссертации будут решены следующие задачи:
1) анализ методов бутстрапирования;
2) разработать алгоритм извлечения знаний на основе бутстреп подхода и разработать компонентную схему программного модуля построения случайных выборок и их анализа;
3) разработать программный модуль построения случайных выборок и их анализа на основе разработанного алгоритма.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Анализ публикаций показал, что неопределенность в данных можно классифицировать по нескольким признакам, а именно: по типу неопределенностей можно выделить элиторную неопределенность, которая характеризуется изменчивостью процессов и состояний систем, эпистемическую неопределенность, характеризующуюся неопределенностью самих вероятностных оценок и недостаточностью знаний о системе; по видам неопределенных данных выделяют случайные, нечеткие, интервальные данные. Данные, содержащие случайную неопределенность, задаются некоторыми вероятностными распределениями их возможных значений; «нечеткие» данные задаются лингвистически сформулированными распределениями их возможных значений; данные, содержащие интервальную неопределенность, задаются интервалами их возможных значений без указания какого-либо распределения возможных значений числа внутри заданного интервала [4; 19]. Следует отметить, что для каждого вида неопределенных данных разработана своя арифметика.
Анализ методов обработки данных показал, что данные методы направлены на решение задач с эпистемической неопределенностью, обусловленной неопределенностью вероятностных оценок, а задачи с эпистемической неопределенностью, обусловленной недостатком знаний о системе.
Проведены численные эксперименты восстановления функции плотности вероятности с использованием методов бутсрапирования. Эксперименты показали, что методы бутстрапирования повышает надежность апостериорных оценок. Был проведен эксперимент на идеальных выборках, когда случайная величина была отобрана таким образом, что каждое значение лежало на функции распределения. В условиях идеальной выборки метод бутстрапирования показал достаточно точные результаты при объеме выборки n=10000.
Результаты показали, что обработка случайной величины с помощью гистограмм и последующая их обработка являются перспективным направлением, и уже на первоначальных этапах исследования, с применением простых методов, дает достаточно точные результаты.
Работа была опробована на международной молодежной научно - практической конференции «Научные исследования и разработки молодых ученых», в декабре 2015 г.



1) Anna Maria Gil-Lafuente, Basic Elements for the Treatment of Uncertainty / Springer-Verlag Berlin Heidelberg, 2005, ISBN 978-3-540-23213-1
2) Boos D. D. «Introduction to the Bootstrap World», / Statistical Science, Vol. 18, No. 2, Silver Anniversary of the Bootstrap, 2003 pp. с. 168-174
3) Davidson R. & J.G. MacKinnon. Bootstrap methods in econometrics. / Chapter 23 of Palgrave Handbook of Econometrics, Volume 1, Econometric Theory, eds T.C. Mills & K. Patterson. London: Palgrave-Macmillan, 2003.
4) Dobronets B.S. Software implementation of numerical operations on random variables / B.S. Dobronets, A.M. Krantsevich, N.M. Krantsevich / Журнал Сиб. фед. ун-та, Математика и физика. - 2013. - 6(2) - С. 168-173.
5) Davidson, A.C., Hinkley, D. V. And Worton, B.J. (1992). Bootstrap likelyhoods. Biometrica 79 с. 113-130
6) Davison A. C., Hinkley D. V., Bootstrap Methods and Their Applications / Cambridge Univ. Press, Cambridge, 1997, ISBN 0521574714
7) Schmitz Norbert, Franz, Matthias, A Bootstrap Method To Test If Study Dropouts Are Missing Randomly / Quality and Quantity, 2002, ISSN 0033-5177
8) Efron B., Gong G. «A Leisurely Look at the Bootstrap, the Jackknife, and Cross-Validation» / The American Statistician, 1983, Vol. 37, № 1, pp. 36-48
9) Efron, B., Better bootstrap confidence intervals. J. / Amer. Statist., 1979, Assoc. 82 171-200
10) Efron, B. And Tibshirani, R.. Bootstrap methods for standard errors, confidence intervals, and other measures of statical accuracy (with discussion). / Statist. Sci., 1986, 54-96
11) Efron Bradley, Tibshirani R.J., An Introduction to the Bootstrap / Chapman & Hall, New York, 2000, ISBN 0412042312
12) Efron, B. Bootstrap methods: Another look at the jackknife. / Ann. Statist. 7, 1979 с. 1-26
13) Zagdanski A, Using the Sieve Bootstrap Method in Time Series Analysis / Springer Berlin Heidelberg, 2000, ISBN 978-3-540-67094-0
14) Hall P, Theoretical Comparison of Bootstrap Confidence Intervals / Springer - Verlag New-York , 1997, ISBN: 9780387949895
15) Wehrens R., Putter H., Buydens M.C. The bootstrap: a tutorial / Chemometrics and Intelligent Laboratory Systems, 2000
16) Аверкин А.Н., Костерев В. В. Триангулярные нормы в системах искусственного интеллекта: научная статья / «Известия Академии наук. Теория и системы управления», 2000 г., №5, с. 106-109.
17) Анатольев С. А. Экономический ликбез: бутстрап. Основы бутстрапирования: научная статья / Анатольев С. А. - Журнал «Квантиль» №3, сентябрь 2007 г.
18) Брюханов О. В., Применение гистограмм второго порядка для обработки и моделирования неопределенных данных: научная статья: / О. В. Брюханов - Новосибирск: Научные исследования и разработки молодых ученых, 2015, с. 84 - 87.
19) Добронец Б.С. Интервальная математика: Учеб. пособие / Б.С. Добронец. - Красноярск: Краснояр. гос. ун-т, 2004. - 216с. УДК 519
20) Добронец Б. С., Попова О. А. Численный вероятностный анализ неопределенных данных: монография / Б. С. Добронец, О. А. Попова. - Красноярск: Сибирский федеральный университет, УДК: 519.24
21) Добронец Б.С., Попова О.А. Элементы численного вероятностного анализа / Б. С. Добронец., О. А. Попова - Красноярск: Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева, 2012, УДК: 519.24
22) Добронец Б.С. Численный вероятностный анализ для оценки инвестиционных проектов / Б.С. Добронец, О.А. Попова, Е.В. Головчанская / XI Межд. конф. ФАМЭБ - Красноярск, 2012.
23) Дэвидсон Рассел, Бутстрапирование эконометрических моделей: научная статья / Дэвидсон Рассел - Журнал «Квантиль», №3, сентябрь 2007, с. 14 - 36
24) Костерев В.В. Надежность технических систем и управление риском: учебное пособие / М.: МИФИ, 2008 - 280 с.
25) Костерев В.В. Агрегирование вероятностной и нечеткой информации в задачах оценки риска: научная статья / журнал «Инженерная физика», 2000, № 4, с.8-12.
26) Костерев В. В., Аунг Тхут Вин, А. А. Портнов, К. В. Станкевич - Оценка риска исследовательского реактора ИРТ МИФИ с использованием нечеткого подхода: научная статья / журнал «Ядерная физика и инжиниринг», 2010, том 1, № 1, с. 25 - 30.
27) Попова О. А., Гистограммы второго порядка для численного моделирования в задачах с информационной неопределенностью ГПЧ: научная статья / О. А. Попова. - Томск: Вестник Томского государственного университета, 2012. - 5 с.
28) Портал разработки продуктов Microsoft [Электронный ресурс]: введение в WPF. - Режим доступа: https://msdn.microsoft.com/ru- ru/library/aa970268(v=vs.100).aspx


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ