Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа
|
Введение 14
1 Анализ предметной области 16
1.1 Проблема исследования 17
1.2 Объект и предмет исследования 18
1.3 Цели и задачи исследования 19
2 Численный вероятностный анализ 21
2.1 Функция плотности вероятности 22
2.2 Методы восстановления плотности вероятности 23
2.2.1 Метод гистограмм 25
2.2.2 Частотный полигон 26
2.2.3 Метод ядерных оценок 27
2.3 Метод осреднённых смещённых гистограмм Дэвида Скотта 28
2.4 Модифицированный метод осреднения смещённых гистограмм 36
2.5 Использование пакета Pascal для реализации алгоритма 39
2.6 Возможности пакета Matlab для аппроксимации 39
3 Экспериментальная часть 41
3.1 Использование возможностей среды PascalABC 41
3.2 Использование возможностей среды Matlab для аппроксимации 44
3.2.1 Метод скользящего среднего 47
3.2.2 Фильтр Савицкого-Голея 48
3.2.3 Полиномиальный подход 52
3.2.4 Сглаживающий сплайн 53
3.3 Оптимальные параметры для адекватной работы метода 55
Заключение 58
Список сокращений 61
Список использованных источников 62
Приложение А Листинг программы алгоритма 65
Приложение Б Плакаты презентации 70
1 Анализ предметной области 16
1.1 Проблема исследования 17
1.2 Объект и предмет исследования 18
1.3 Цели и задачи исследования 19
2 Численный вероятностный анализ 21
2.1 Функция плотности вероятности 22
2.2 Методы восстановления плотности вероятности 23
2.2.1 Метод гистограмм 25
2.2.2 Частотный полигон 26
2.2.3 Метод ядерных оценок 27
2.3 Метод осреднённых смещённых гистограмм Дэвида Скотта 28
2.4 Модифицированный метод осреднения смещённых гистограмм 36
2.5 Использование пакета Pascal для реализации алгоритма 39
2.6 Возможности пакета Matlab для аппроксимации 39
3 Экспериментальная часть 41
3.1 Использование возможностей среды PascalABC 41
3.2 Использование возможностей среды Matlab для аппроксимации 44
3.2.1 Метод скользящего среднего 47
3.2.2 Фильтр Савицкого-Голея 48
3.2.3 Полиномиальный подход 52
3.2.4 Сглаживающий сплайн 53
3.3 Оптимальные параметры для адекватной работы метода 55
Заключение 58
Список сокращений 61
Список использованных источников 62
Приложение А Листинг программы алгоритма 65
Приложение Б Плакаты презентации 70
Тема магистерской диссертации «Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа».
Анализ изучаемой области показал, что тема обработки эмпирических данных с получением максимально надёжных и достоверных результатов в настоящее время является актуальной и имеет применения в следующих областях: системы ответственного назначения, производство и эксплуатация дорогостоящих и высоконадежных технических изделий, медицинские исследования, повышение качества оценки состояния технических систем и др.
Основная проблема исследования — обработка эмпирических данных в условиях неопределённости. В качестве объекта исследования в работе выступают эмпирические данные. Доказано, что наиболее исчерпывающая информация об объекте исследования в условиях неопределённости на основе полученных эмпирических данных получается путём восстановления плотности вероятности неизвестной случайной величины. Следовательно, в роли предмета исследования выступают методы восстановления плотности вероятности. В настоящее время существует достаточное количество методов исследования, каждый из которых обладает как положительными, так и отрицательными сторонами: большие вычислительные затраты, потеря точности и т. д.
Главной целью исследования является повышение эффективности и качества оценки состояния технических систем, изделий и исследований в условиях неопределённости с использованием метода восстановления плотности вероятности.
Для достижения поставленной цели в ходе исследования необходимо решить следующие основные задачи:
1) анализ предметной области и выявление проблем исследования;
2) анализ существующих методов восстановления плотности вероятности случайных величин;
3) разработка метода восстановления плотности вероятности с учётом опыта исследователей;
4) анализ существующих методов сглаживания и применение оптимальных к полученным результатам;
5) выводы о проделанной работе, научно значимости и целесообразности дальнейших исследований.
С учётом опыта исследований и разработок в данной области в качестве решения поставленной проблемы предлагается один из методов восстановления плотности вероятности — метод осреднения смещённых гистограмм. Преимущества метода в сравнении с уже существующими методами заключаются в быстроте реализации, минимальных вычислительных затратах, графическом представлении обрабатываемых данных, хорошем качестве приближения данных.
Текст диссертации состоит из введения; трёх глав, содержащих теоретические сведения и практическую часть; заключения, списка сокращений, списка использованных источников, двух приложений.
В ходе экспериментального исследования был реализован метод осреднения смещённых гистограмм. В тексте диссертации представлен один из примеров и полученные результатов.
Анализ изучаемой области показал, что тема обработки эмпирических данных с получением максимально надёжных и достоверных результатов в настоящее время является актуальной и имеет применения в следующих областях: системы ответственного назначения, производство и эксплуатация дорогостоящих и высоконадежных технических изделий, медицинские исследования, повышение качества оценки состояния технических систем и др.
Основная проблема исследования — обработка эмпирических данных в условиях неопределённости. В качестве объекта исследования в работе выступают эмпирические данные. Доказано, что наиболее исчерпывающая информация об объекте исследования в условиях неопределённости на основе полученных эмпирических данных получается путём восстановления плотности вероятности неизвестной случайной величины. Следовательно, в роли предмета исследования выступают методы восстановления плотности вероятности. В настоящее время существует достаточное количество методов исследования, каждый из которых обладает как положительными, так и отрицательными сторонами: большие вычислительные затраты, потеря точности и т. д.
Главной целью исследования является повышение эффективности и качества оценки состояния технических систем, изделий и исследований в условиях неопределённости с использованием метода восстановления плотности вероятности.
Для достижения поставленной цели в ходе исследования необходимо решить следующие основные задачи:
1) анализ предметной области и выявление проблем исследования;
2) анализ существующих методов восстановления плотности вероятности случайных величин;
3) разработка метода восстановления плотности вероятности с учётом опыта исследователей;
4) анализ существующих методов сглаживания и применение оптимальных к полученным результатам;
5) выводы о проделанной работе, научно значимости и целесообразности дальнейших исследований.
С учётом опыта исследований и разработок в данной области в качестве решения поставленной проблемы предлагается один из методов восстановления плотности вероятности — метод осреднения смещённых гистограмм. Преимущества метода в сравнении с уже существующими методами заключаются в быстроте реализации, минимальных вычислительных затратах, графическом представлении обрабатываемых данных, хорошем качестве приближения данных.
Текст диссертации состоит из введения; трёх глав, содержащих теоретические сведения и практическую часть; заключения, списка сокращений, списка использованных источников, двух приложений.
В ходе экспериментального исследования был реализован метод осреднения смещённых гистограмм. В тексте диссертации представлен один из примеров и полученные результатов.
Тема научно-исследовательской работы являлась «Разработка моделей и алгоритмов обработки эмпирических данных на основе численного вероятностного анализа». В ходе практического и теоретического исследования был реализован метод осреднения смещённых гистограмм, позволяющий извлекать максимум полезной информацию из определённого набора эмпирических данных. Данный результат позволит повысить эффективность и качество оценки состояния технических систем, изделий и исследований в условиях неопределённости.
Преимуществом данного реализованного метода являются быстрота реализации, минимальные вычислительные затраты, графическое представление обрабатываемых данных, хорошее качество приближения данных в сравнении с другими существующими методами оценки.
На определённых этапах исследования были решены следующие основные задачи:
1. В ходе теоретического исследования проведён анализ данной предметной области. Оказалось, что тема восстановления плотности вероятности весьма актуальна, поскольку имеет место быть во многих сферах деятельности.
2. Основной проблемой, с которой пришлось столкнуть, стала проблема отсутствия единого универсального метода для обработки данных в условиях неопределённости (точнее — восстановление плотности вероятности), дающего эффективные результаты.
3. Следующим этапом стало изучение и исследование уже существующих методов восстановления плотности вероятности. Каждый из рассмотренных методов имел как плюсы, так и минусы: точность получаемых результатов, сложность реализации метода, наличие необходимых исходных данных - при исследовании учитывались все эти факторы и не только.
4. Оценив достоинства и недостатки всех методов, в качестве дальнейшей работы для восстановления плотности вероятности был выбран метод осреднения смещённых гистограмм [29].
5. Изучив данный метод и модернизировав его, в ходе проведения экспериментов было выявлено, что использование середин гистограмм дают оценку такую же, как и метод ядерных оценок. Однако метод осреднённых смещённых гистограмм проще в реализации, следовательно, может исключать возникновение погрешностей.
6. Далее исследовались методы сглаживания полученных результатов. При проведении численного эксперимента оказалось, что наилучшие результаты при использовании данного метода восстановления плотности вероятности даёт метод сглаживающих сплайнов. Таким образом, результатом работы стало определение оптимальных методов восстановления плотности вероятности, методов сглаживания полученных данных и выявлены оптимальные параметры при работе алгоритма.
Метод, полученный в результате выполнения научно исследовательской работы, имеет место быть во многих областях, где приходится сталкиваться с обработкой эмпирических данных. В дальнейшем проводя исследования в данной области можно решить проблему обработки данных небольшого объёма в условиях неопределённости и повысить точность получаемых в ходе экспериментов результатов.
По результатам исследования было опубликовано 4 статьи:
1. Подходы к обработке экспериментальных данных в условиях ограниченной информации // Журнал «Научные исследования и разработки молодых учёных», 2015г. Стр. 136 - 140.
2. Методы восстановления плотности вероятности в условиях ограниченных объёмов данных // Международная научная конференция «Молодежь и наука: проспект Свободный». 2016. Стр. 127 - 129.
3. Модернизированный метод смещенных гистограмм для восстановления плотности вероятности // Журнал «Решетнёвские чтения», 2016 г. Стр. 237 - 238.
4. Построение функции плотности вероятности на основе сглаживания смещенных гистограмм // Международная научная конференция «Молодежь и наука: проспект Свободный», 2017.
Преимуществом данного реализованного метода являются быстрота реализации, минимальные вычислительные затраты, графическое представление обрабатываемых данных, хорошее качество приближения данных в сравнении с другими существующими методами оценки.
На определённых этапах исследования были решены следующие основные задачи:
1. В ходе теоретического исследования проведён анализ данной предметной области. Оказалось, что тема восстановления плотности вероятности весьма актуальна, поскольку имеет место быть во многих сферах деятельности.
2. Основной проблемой, с которой пришлось столкнуть, стала проблема отсутствия единого универсального метода для обработки данных в условиях неопределённости (точнее — восстановление плотности вероятности), дающего эффективные результаты.
3. Следующим этапом стало изучение и исследование уже существующих методов восстановления плотности вероятности. Каждый из рассмотренных методов имел как плюсы, так и минусы: точность получаемых результатов, сложность реализации метода, наличие необходимых исходных данных - при исследовании учитывались все эти факторы и не только.
4. Оценив достоинства и недостатки всех методов, в качестве дальнейшей работы для восстановления плотности вероятности был выбран метод осреднения смещённых гистограмм [29].
5. Изучив данный метод и модернизировав его, в ходе проведения экспериментов было выявлено, что использование середин гистограмм дают оценку такую же, как и метод ядерных оценок. Однако метод осреднённых смещённых гистограмм проще в реализации, следовательно, может исключать возникновение погрешностей.
6. Далее исследовались методы сглаживания полученных результатов. При проведении численного эксперимента оказалось, что наилучшие результаты при использовании данного метода восстановления плотности вероятности даёт метод сглаживающих сплайнов. Таким образом, результатом работы стало определение оптимальных методов восстановления плотности вероятности, методов сглаживания полученных данных и выявлены оптимальные параметры при работе алгоритма.
Метод, полученный в результате выполнения научно исследовательской работы, имеет место быть во многих областях, где приходится сталкиваться с обработкой эмпирических данных. В дальнейшем проводя исследования в данной области можно решить проблему обработки данных небольшого объёма в условиях неопределённости и повысить точность получаемых в ходе экспериментов результатов.
По результатам исследования было опубликовано 4 статьи:
1. Подходы к обработке экспериментальных данных в условиях ограниченной информации // Журнал «Научные исследования и разработки молодых учёных», 2015г. Стр. 136 - 140.
2. Методы восстановления плотности вероятности в условиях ограниченных объёмов данных // Международная научная конференция «Молодежь и наука: проспект Свободный». 2016. Стр. 127 - 129.
3. Модернизированный метод смещенных гистограмм для восстановления плотности вероятности // Журнал «Решетнёвские чтения», 2016 г. Стр. 237 - 238.
4. Построение функции плотности вероятности на основе сглаживания смещенных гистограмм // Международная научная конференция «Молодежь и наука: проспект Свободный», 2017.
Подобные работы
- Визуальное представление многомерных эмпирических данных
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2017 - Построение гарантированных оценок показателей функционирования сложных технических систем в условиях ограниченного объема информации
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2016 - Информационно-аналитические методы численной обработки данных в условиях неопределенности
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2016 - Математическая модель оценки надёжности веб-сайтов
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2018 - УПРАВЛЕНИЕ ТОВАРНО-
МАТЕРИАЛЬНЫМИ ЦЕННОСТЯМИ ПАО «КАМАЗ» ЗАВОД ДВИГАТЕЛЕЙ
Дипломные работы, ВКР, анализ хозяйственной деятельности. Язык работы: Русский. Цена: 4940 р. Год сдачи: 2016 - Разработка системы управления пожарной безопасностью цеха по производству аммиака ПАО «Тольяттиазот»
Магистерская диссертация, техносферная безопасность. Язык работы: Русский. Цена: 4950 р. Год сдачи: 2020 - Вероятностный способ представления прогнозов экстремальных значений метеопараметров в долгосрочном прогнозе погоды
Магистерская диссертация, гидрология. Язык работы: Русский. Цена: 5000 р. Год сдачи: 2018 - БУТСТРАП МЕТОДЫ ДЛЯ АНАЛИЗА КАЧЕСТВА НЕЛИНЕЙНЫХ МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ
Магистерская диссертация, математика. Язык работы: Русский. Цена: 4810 р. Год сдачи: 2018 - ГИБРИДНАЯ ТАНДЕМНАЯ СИСТЕМА КАК МОДЕЛЬ СЕРВИСА ЧАТ-БОТА
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4955 р. Год сдачи: 2024



