Тип работы:
Предмет:
Язык работы:


Эффективное оценивание параметров смеси распределений

Работа №144979

Тип работы

Дипломные работы, ВКР

Предмет

программирование

Объем работы29
Год сдачи2024
Стоимость4700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
16
Не подходит работа?

Узнай цену на написание


1. Введение 4
1.1. Цель и задачи 5
2. Обзор 6
2.1. Смесь распределений 6
2.2. Задачи оценки параметров смеси распределений 6
2.3. EM-алгоритм 7
2.4. Существующие решения 8
3. Алгоритм для оценки параметров смесей распределений 9
3.1. Критерии останова 9
3.2. «Плохие» распределения 10
4. Проектирование и реализация библиотеки 11
4.1. Архитектура библиотеки 11
4.2. Особенности реализации 12
5. Эксперименты 14
5.1. Дизайн эксперимента 14
5.2. Рассматриваемые распределения 14
5.3. Эксперимент со смесями одного семейства распределений 15
5.3.1. Результаты 16
5.4. Эксперимент с разделением двух распределений в смеси 24
5.5. Результаты 25
6. Заключение 28
Список литературы 29

Во многих прикладных задачах, связанных с математической статистикой, воз­никает необходимость оценки параметров распределения случайной величины. Для решения такой задачи могут быть использованы известные для конкретного распре­деления оценки параметров, такие как математическое ожидание и дисперсия для нормального распределения. В том случае, если хороших известных оценок нет, мож­но воспользоваться математическими оптимизаторами, позволяющими находить ло­кальные экстремумы функции от вектора параметров.
Помимо задачи об оценке параметров для одного распределения случайной вели­чины, существует также задача оценки параметров для смеси распределений случай­ной величины — комбинации нескольких распределений. Такая задача возникает при наблюдении более сложных процессов, в которых участвуют случайные величи­ны более чем из одного распределения. При оценке смеси решается ряд задач: узнать, сколько различных распределений находится в смеси, определить вид и параметры каждого распределения, узнать соотношение распределений в смеси друг к другу (априорная вероятность).
Наиболее часто с оценкой параметров смеси распределений сталкиваются при ана­лизе смесей нормальных распределений . Однако бывают задачи, в которых необ­ходимо разделять и оценивать смеси в более общем виде. Например, смеси произволь­ных распределений, или смеси распределений из разных семейств.
Компания Huawei в октябре 2023 года опубликовала интернет-проект, посвящён­ный предсказанию задержек отправки пакетов через сеть, по наблюдаемым отправи­телем задержкам пакетов. Задержки пакетов в маршрутизаторе могут рассмат­риваться с помощью распределения Вейбулла, если исключить единичные выбросы, связанные с работой сетевого оборудования. Таким образом, определение компонент смеси распределений Вейбулла позволяет строить качественные модели задержек передачи пакетов в сетях.
Среди существующих статей и библиотек присутствует большое количество уз­конаправленных алгоритмов для анализа распределений и их смесей. Однако в ходе анализа предметной области не удалось найти универсальных инструментов для на­хождения параметров произвольных смесей распределений.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


• Был создан алгоритм для решения поставленной задачи (на основе EM-алгоритма в общем виде). Работа полученного алгоритма зависит от следующих парамет­ров:
о метод математической оптимизации;
о условие остановки;
о условие корректности рассматриваемых распределений в смеси.
• Спроектирована архитектура библиотеки, реализующей предложенный алго­ритм, которая отвечает требованиям по универсальности и расширяемости, поз­воляет работать со смесями распределений из различных семейств и дополнять библиотеку произвольными моделями распределений и различными реализаци­ями ключевых параметров алгоритма.
• Библиотека реализована на языке Python и опубликована.
• Выполнено экспериментальное исследование, получены следующие результа- ты/выводы:
о доказана корректность разработанного алгоритма;
о выявлено, что с увеличением количества распределений в смеси растёт вре­мя работы и падает точность алгоритма, а с увеличением размера выборки растёт время работы и точность алгоритма;
о показано, что методы оптимизации обладают разными характеристиками и для эффективного решения задачи они могут быть использованы в ком­бинации друг с другом;
о показана способность алгоритма разделять близкие распределения случай­ной величины.


[1] Brownlee Jason. A Gentle Introduction to Expectation-Maximization (EM Algorithm). — 2020. — Access mode: https://machinelearningmastery.com/ expectation-maximization-em-algorithm.
[2] Davenport J.W., Bezdek J.C., and Hataway R.J. Parameter estimation for finite mix­ture distributions. — 1988.—Access mode: https://core.ac.uk/download/pdf/ 82096497.pdf.
[3] E. Elmahdy Emad and W. Aboutahoun Abdallah. A new approach for param­eter estimation of finite Weibull mixture distributions for reliability modeling. — Applied Mathematical Modelling, 2013. — P. 1800—1810. — Access mode: https: //www.sciencedirect.com/science/article/pii/S0307904X12002545.
[4] Moskvitin Dmitriy, Onegin Evgeny, Huang Rachel, Luo Hanlin, and Chen Qichang.
Forward Erasure Correction for Short-Message Delay-Sensitive QUIC Con­nections. — 2023. — Access mode: https://datatracker.ietf.org/doc/
draft-dmoskvitin-quic-short-message-fec.
[5] Jannah Wardatul and Saputro Dewi R.S. Parameter estimation of Gaussian mix­ture models (GMM) with expectation maximization (EM) algorithm. — 2022. — Access mode: https://web.archive.org/web/20221201095213id_/https://aip. scitation.org/doi/pdf/10.1063/5.0117119.
[6] Lindsay Bruce G. Mixture Models: Theory, Geometry and Applications. — Hayward, CA, USA : NSF-CBMS Regional Conference Series in Probability and Statistics, 1995. — Access mode: https://www.jstor.org/stable/4153184.
[7] Numpy — the fundamental package for scientific computing with Python. — Access mode: https://numpy.org/.
[8] Reid Matthew. Reliability — a Python library for reliability engineering. — 2022. — Access mode: https://doi.org/10.5281/ZENODO.3938000.
[9] SciPy — an open-source software for mathematics, science, and engineering. — Access mode: https://docs.scipy.org/doc/scipy/.
[10] Макуха И.М. Оценка параметров смеси распределений Вейбулла, выпускная квалификационная работа Санкт-Петербургского государственного университета. — 2023. — Access mode: https://se.math.spbu.ru/thesis/ texts/Makuha_Il’ja_Mihajlovich_Bachelor_Thesis_2023_text.pdf.
[11] Реализация библиотеки. — Access mode: https://github.com/toxakaz/EM-algo.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ