Тип работы:
Предмет:
Язык работы:


Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа

Работа №17834

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы74
Год сдачи2017
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
648
Не подходит работа?

Узнай цену на написание


Введение 14
1 Анализ предметной области 16
1.1 Проблема исследования 17
1.2 Объект и предмет исследования 18
1.3 Цели и задачи исследования 19
2 Численный вероятностный анализ 21
2.1 Функция плотности вероятности 22
2.2 Методы восстановления плотности вероятности 23
2.2.1 Метод гистограмм 25
2.2.2 Частотный полигон 26
2.2.3 Метод ядерных оценок 27
2.3 Метод осреднённых смещённых гистограмм Дэвида Скотта 28
2.4 Модифицированный метод осреднения смещённых гистограмм 36
2.5 Использование пакета Pascal для реализации алгоритма 39
2.6 Возможности пакета Matlab для аппроксимации 39
3 Экспериментальная часть 41
3.1 Использование возможностей среды PascalABC 41
3.2 Использование возможностей среды Matlab для аппроксимации 44
3.2.1 Метод скользящего среднего 47
3.2.2 Фильтр Савицкого-Голея 48
3.2.3 Полиномиальный подход 52
3.2.4 Сглаживающий сплайн 53
3.3 Оптимальные параметры для адекватной работы метода 55
Заключение 58
Список сокращений 61
Список использованных источников 62
Приложение А Листинг программы алгоритма 65
Приложение Б Плакаты презентации 70


Тема магистерской диссертации «Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа».
Анализ изучаемой области показал, что тема обработки эмпирических данных с получением максимально надёжных и достоверных результатов в настоящее время является актуальной и имеет применения в следующих областях: системы ответственного назначения, производство и эксплуатация дорогостоящих и высоконадежных технических изделий, медицинские исследования, повышение качества оценки состояния технических систем и др.
Основная проблема исследования — обработка эмпирических данных в условиях неопределённости. В качестве объекта исследования в работе выступают эмпирические данные. Доказано, что наиболее исчерпывающая информация об объекте исследования в условиях неопределённости на основе полученных эмпирических данных получается путём восстановления плотности вероятности неизвестной случайной величины. Следовательно, в роли предмета исследования выступают методы восстановления плотности вероятности. В настоящее время существует достаточное количество методов исследования, каждый из которых обладает как положительными, так и отрицательными сторонами: большие вычислительные затраты, потеря точности и т. д.
Главной целью исследования является повышение эффективности и качества оценки состояния технических систем, изделий и исследований в условиях неопределённости с использованием метода восстановления плотности вероятности.
Для достижения поставленной цели в ходе исследования необходимо решить следующие основные задачи:
1) анализ предметной области и выявление проблем исследования;
2) анализ существующих методов восстановления плотности вероятности случайных величин;
3) разработка метода восстановления плотности вероятности с учётом опыта исследователей;
4) анализ существующих методов сглаживания и применение оптимальных к полученным результатам;
5) выводы о проделанной работе, научно значимости и целесообразности дальнейших исследований.
С учётом опыта исследований и разработок в данной области в качестве решения поставленной проблемы предлагается один из методов восстановления плотности вероятности — метод осреднения смещённых гистограмм. Преимущества метода в сравнении с уже существующими методами заключаются в быстроте реализации, минимальных вычислительных затратах, графическом представлении обрабатываемых данных, хорошем качестве приближения данных.
Текст диссертации состоит из введения; трёх глав, содержащих теоретические сведения и практическую часть; заключения, списка сокращений, списка использованных источников, двух приложений.
В ходе экспериментального исследования был реализован метод осреднения смещённых гистограмм. В тексте диссертации представлен один из примеров и полученные результатов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Тема научно-исследовательской работы являлась «Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа». В ходе практического и теоретического исследования был реализован метод осреднения смещённых гистограмм, позволяющий извлекать максимум полезной информацию из определённого набора эмпирических данных. Данный результат позволит повысить эффективность и качество оценки состояния технических систем, изделий и исследований в условиях неопределённости.
Преимуществом данного реализованного метода являются быстрота реализации, минимальные вычислительные затраты, графическое представление обрабатываемых данных, хорошее качество приближения данных в сравнении с другими существующими методами оценки.
На определённых этапах исследования были решены следующие основные задачи:
1. В ходе теоретического исследования проведён анализ данной предметной области. Оказалось, что тема восстановления плотности вероятности весьма актуальна, поскольку имеет место быть во многих сферах деятельности.
2. Основной проблемой, с которой пришлось столкнуть, стала проблема отсутствия единого универсального метода для обработки данных в условиях неопределённости (точнее — восстановление плотности вероятности), дающего эффективные результаты.
3. Следующим этапом стало изучение и исследование уже существующих методов восстановления плотности вероятности. Каждый из рассмотренных методов имел как плюсы, так и минусы: точность получаемых результатов, сложность реализации метода, наличие необходимых исходных данных - при исследовании учитывались все эти факторы и не только.
4. Оценив достоинства и недостатки всех методов, в качестве дальнейшей работы для восстановления плотности вероятности был выбран метод осреднения смещённых гистограмм [29].
5. Изучив данный метод и модернизировав его, в ходе проведения экспериментов было выявлено, что использование середин гистограмм дают оценку такую же, как и метод ядерных оценок. Однако метод осреднённых смещённых гистограмм проще в реализации, следовательно, может исключать возникновение погрешностей.
6. Далее исследовались методы сглаживания полученных результатов. При проведении численного эксперимента оказалось, что наилучшие результаты при использовании данного метода восстановления плотности вероятности даёт метод сглаживающих сплайнов. Таким образом, результатом работы стало определение оптимальных методов восстановления плотности вероятности, методов сглаживания полученных данных и выявлены оптимальные параметры при работе алгоритма.
Метод, полученный в результате выполнения научно исследовательской работы, имеет место быть во многих областях, где приходится сталкиваться с обработкой эмпирических данных. В дальнейшем проводя исследования в данной области можно решить проблему обработки данных небольшого объёма в условиях неопределённости и повысить точность получаемых в ходе экспериментов результатов.
По результатам исследования было опубликовано 4 статьи:
1. Подходы к обработке экспериментальных данных в условиях ограниченной информации // Журнал «Научные исследования и разработки молодых учёных», 2015г. Стр. 136 - 140.
2. Методы восстановления плотности вероятности в условиях ограниченных объёмов данных // Международная научная конференция «Молодежь и наука: проспект Свободный». 2016. Стр. 127 - 129.
3. Модернизированный метод смещенных гистограмм для восстановления плотности вероятности // Журнал «Решетнёвские чтения», 2016 г. Стр. 237 - 238.
4. Построение функции плотности вероятности на основе сглаживания смещенных гистограмм // Международная научная конференция «Молодежь и наука: проспект Свободный», 2017.



1) Акимов С. С., Оценка методов восстановления законов распределения вероятности и обоснование предпочтения на основании некоторых свойств эмпирического массива данных // Актуальные вопросы современной науки, вып.№ 31 / 2014. С.139.
2) Антонов А. В., Зюляева Н. Г., Чепурко В. А., Исследование метода
ядерной оценки плотности распределения // Надёжность. - Москва:
Издательский дом «Технология», 2005. С. 3.
3) Бардасов С. А., Гистограммы. Критерии оптимальности // Монография. Тюмень, 2014. - 95 с.
4) Вапник В. Н., Восстановление зависимостей по эмпирическим данным // Москва, 1979 г. - 447 с.
5) Водолазская И. В., Введение в систему Matlab // Астрахань, 2004. -48 с.
6) Вовк А. А., Основы общей теории статистики. - Москва: Маршрут, 2006. - 240 с.
7) Воронцов К. В., Статистические алгоритмы классификации // 2008. - 39 с.
8) Глаголев М. В., Сабреков А. Ф., О восстановлении плотности вероятности методом гистограмм в почвоведении и экологии // 1998. С.48-57.
9) Деврой Л., Дьёрфи Л., Непараметрическое оценивание плотности. L1-nonxon. // Пер. с англ. - Москва: Мир. 1988. 408с.
10) Добронец Б. С., Попова О.А., Численный вероятностный анализ для исследования систем в условиях неопределенности // Красноярск, СФУ, 2014. - 169 с.
11) Мартынов Н. Н., Иванов A. A., Matlab: вычисления, визуализация, программирование // Москва, 2000. - 337 с.
12) Попова О. А., Гистограммы второго порядка для численного моделирования в задачах с информационной неопределённостью // Известия
Южного федерального университета. Технические науки. 2014. № 6 (155). С. 6-14.
13) Попова О. А., Технология извлечения и визуализации знаний на основе численного вероятностного анализа неопределенных данных // Информатизация и связь. 2013. № 2. С. 63-66.
14) Поршнев С. В., Колосов А. С., Использование аппроксимации Розенблатта-Парзена для восстановления функции распределения непрерывной случайной величины с ограниченным одномодальным законом распределения // Политематический сетевой электронный научный журнал, выпуск № 92, 2013.
15) Рубан А. И., Кузнецов А. В., Методы обработки экспериментальных данных // Красноярск, 2008.
16) Тарасенко Ф. П. Непараметрическая статистика // Томск, 1976. -293 с.
17) Ужга-Ребров О. И., Управление неопределенностями // 2004. 293 с.
18) Фастовец Н. О., Попов М. А., «Математическая статистика
примеры, задачи и типовые задания // Москва 2012.
19) Фастовец Н. О., Попов М. А., «Математическая статистика
примеры, задачи и типовые задания» Тюмень: Изд-во «ТюмГНГУ», 2007. - 202 с.
20) Хардле В., Прикладная непараметрическая регрессия: пер. С англ. М., Мир, 1993. - 349 с.
21) Dobronets B. S., Popova O. A., Improving the accuracy of the probability density function estimation // Journal of Siberian Federal University. Mathematics & Physics, 2016.
22) Dobronets B., Popova O., Numerical probabilistic approach for data nonparametric analysis // Applied methods of statistical analysis. nonparametric
approach proceedings of the international workshop. 2015. C. 376-384.
23) Dobronets B., Popova O., Numerical Probabilistic Approach for optimization Problems. Scientific Computing, Computer Arithmetic, and Validated
Numerics. Lecture Notes in Computer Science 9553. Springer International Publishing, Cham, 43 - 53 (2016).
24) Parsen E., On estimation of a probability density function and mode //AMS. 1962. 33. Pp. 1065-1076.
25) Pearson K., Contributions to the Mathematical Theory of Evolution, II: skew variation in homogeneous material // Philosophical Transactions of the Royal Society of London (A). 1895. Vol. 186. Pp. 343-414.
26) Popova O., Information approach to a posteriori error estimates of numerical modeling. Informatization and Communication. 2, 29-32 (2016).
27) Popova O. A., Optimization problems with random data // Журнал Сибирского федерального университета. Серия: Математика и физика. 2013. Т. 6. № 4. С. 506-515
28) Rosenblatt M., Remarks on some nonparametric estimates of a density functions // AMS. 1956. 27 Pp. 832-837
29) Scott R. W., Multivariate density estimation: theory, practice, and visualization. John Wiley & Sons. 2015. 381 p.
30) Uglev V. A., Popova O. A., Dobronets B. S., The accuracy calculation control of reliability indices for equipment responsible appointment // 2015 International Siberian Conference on Control and Communications, SIBCON 2015 - Proceedings 2015.
Электронные ресурсы
1) Сайт разработчика пакета прикладных программ Matlab [Электронный ресурс] - Режим доступа: http://www.mathworks.com, свободный.
2) Справочник по работе в среде MATLAB MathWorks [Электронный ресурс]. Режим доступа: http://www.mathworks.com, свободный.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ