Тема: Топологическая идентификация закона распределения вероятности одномерной выборки
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Теоретический обзор 8
1.1 Случайная величина 8
1.2 Закон распределения случайной величины 9
1.3 Функция распределения вероятностей и ее свойства 10
1.4 Плотность распределения вероятностей и ее свойства 14
1.5 Числовые характеристики случайных величин 15
1.5.1 Математическое ожидание случайной величины 17
1.6 Законы распределения дискретных случайных величин 25
1.6.1 Биномиальный закон распределения 25
1.6.2 Закон распределения Пуассона 26
1.6.3 Геометрический закон распределения 28
1.6.4 Равномерный закон распределения 30
1.6.5 Гипергеометрический закон распределения 31
1.7 Законы распределения непрерывных случайных величин 32
1.7.1 Нормальный закон распределения 33
1.7.2 Логарифмическое нормальное распределение 34
1.7.3 Гамма-распределение 36
1.7.4 Экспоненциальный закон 38
1.7.5 Распределение Вейбулла 40
1.7.6 Равномерное распределение 41
1.7.7 Распределение хи-квадрат 42
1.7.8 Распределение Стьюдента 45
1.7.9 Распределение Фишера 47
1.8 Выбор программной среды для статистических расчетов 48
2 Топологическая идентификация закона распределения вероятности 50
2.1 Алгоритм идентификации 50
2.2 Определение доверительного интервала 55
2.3 Отбраковка аномальных измерений 56
3.1 Определение минимального объема выборки 63
3.2 Логнормальное распределение случайной величины 67
3.2.1 Зашумление нормально распределенной случайной величиной 67
3.2.2 Зашумление равномерно распределенной случайной величиной 71
3.3 Нормальное распределение случайной величины 73
3.3.1 Зашумление равномерно распределенной случайной величиной 73
3.4 Равномерное распределение случайной величины 77
3.4.1 Зашумление нормально распределенной случайной величиной 77
ЗАКЛЮЧЕНИЕ 84
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 86
📖 Введение
Идентификация закона распределения вероятности представляет собой сложную, но необходимую задачу. Качество решения которой, напрямую зависит не только от применения конкретного метода, но и от объема имеющихся экспериментальных данных.
Для решения задачи определения закона распределения вероятности в основном применяются классические методы, основанные на математические статистики, и топологические методы.
Далее рассмотрим топологический и классический подходы.
При использовании классического метода обязательным условием является прохождение трех этапов: первое - определения модели закона распределения на основе имеющихся экспериментальных данных, нахождение оценок параметров этого закона и проверка этой модели на соответствие экспериментальным данным с помощью критериев согласия. Если критерий согласия дает отрицательный результат, то все начинается сначала, т.е. следует перейти на первый этап. Успех данного подхода определяется двумя факторами: множеством моделей законов распределения, которые рассматриваются в задаче, и используемых методов статистики. Следует отметить, что разные критерии согласия дают различные степени отклонения фактического закона распределения вероятности от теоретического. Поэтому целесообразно применять несколько критериев согласия одновременно. Это позволить получить наиболее достоверные результаты, т.е. достичь максимальный уровень правдоподобия и сократить вероятность ошибки. Однако для рассмотрения большого объема моделей закона распределения вероятности необходимо использовать определенное программное обеспечение.
Не следует забывать о выбросах, так как некоторые методы оценивания параметров распределения чувствительны к ним. Во избежание ошибочных результатов необходимо очищать выборку от аномальных измерений.
Топологический метод основан на использовании оценок моментов, например таких как: асимметрия и эксцесс. Эти оценки получаю по имеющимся экспериментальным данным. Если рассматривать значения асимметрии и эксцесса, как координаты точки, можно, исходя из близости ее к одной из линий, представляющих некоторые распределения, судить о принадлежности данной случайной величины этому закону. Данный метод следует применять при больших объемах исходной выборки, очищенной от аномальных измерений. Его можно использовать как предварительный, позволяющий выбрать из всего множества моделей закона распределения некоторую совокупность наиболее вероятных, которую в дальнейшем целесообразно обрабатывать классическим методом.
У большинства исследователей сложилось мнение, что топологический метод идентификации закона распределения случайной величины применять не следует. Это связано с тем, что данный подход требует большой вычислительной мощности, и ранее не было возможности проверить его работоспособность на практике. Сейчас же вычислительная способность компьютеров возросла, это позволяет создать программный продукт, реализующий топологический метод идентификации закона распределения случайной величины.
Объектом данной дипломной работы является закон распределения вероятностей.
Предмет представляет собой случайную выборку размера n.
Целью является идентификация закона распределения выборки по параметрам формы.
Задачи исследования.
1) Анализ теоретических источников об идентификации законов распределения.
2) Теоретически обосновать топологический метод для произвольного закона распределения случайной величины.
3) Выбор программной среды для выполнения статистических расчетов.
4) Разработка алгоритма топологической идентификации закона распределения вероятности случайной величины.
5) Разработка программной реализации алгоритма и апробация эффективности его работы.
✅ Заключение
Также проведен небольшой анализ существующих программных решений для статистических расчетов, на основании которого сделан вывод о том, что наиболее подходящим является язык и среда статистических расчетов R, который позволил генерировать выборку по закону распределения, преобразовывать ее согласно алгоритму. Для удобства проверки эффективности разработанного алгоритма создан программный продукт на языке C# в среде разработки Visual Studio 2017 Community. В процессе исследования выявлено, что в некоторых случая язык R не поддерживает векторного расчета. Это существенно замедляет работу программы.
Данный метод следует применять, когда объем выборки превышает пороговое значение в 60 - 70 измерений. В противном случае, алгоритм будет выдавать неверный результат.
Для повышения робастности сгенерированная выборка очищается от аномальных измерений с помощью критерия Грабса. Причем осуществляется одновременная проверка на три максимальный или минимальных выбраса. Благодаря чему удается существенно повысит качество правильно принятых гипотез.
смешиваются друг с другом, что по топологическому методу невозможно дать однозначный ответ в пользу того или иного закона распределения, в то время как критерий хи - квадрат дает однозначные результаты. При выборке большого объема и малой зашумлённости алгоритм работает эффективнее. Следует учесть, что разработанный алгоритм опробован не на всех законах распределения случайной величины, и возможны ситуации, когда данный метод будет лучше справляться с поставленной задачей для какого-либо другого распределения, чем классические критерии.
Также необходимо отметить, что данный метод может быть использован вместе с классическими критериями при большом наборе данных, что позволит точнее определить по полигону выборки закон, путём выделения определенной группы распределений, которую далее проверяют на каком-либо другом классическом методе.



