Введение 2
Постановка задачи 4
Обзор литературы 5
Глава 1. Двумерное распределение Пуассона 7
1.1. Двумерное распределение и моменты 7
1.2. Статистическая оценка неизвестных параметров 9
1.3. Тестирование моделей 13
Глава 2. Примеры применения двумерного распределения Пуассона 16
2.1. Использование двумерного распределения Пуассона в учебном процессе 16
2.2. Использование двумерного распределения Пуассона в футболе 19
2.3. Использование двумерного распределения Пуассона в медицине 22
Заключение 24
Список литературы 26
Приложение 28
Одномерные распределения появляются во многих реальных жизнен- HBix ситуациях, и одномерное распределение Пуассона часто исполвзуется для моделирования такого рода данных. Если в прикладной задаче рассматриваются две или болвшее число случайнвхх величин, то для того, чтобвх описатв совместное поведение этих случайнвхх величин часто ис- полвзуют гипотезу независимости и просто перемножают одномернвхе распределения, но такой подход во многих задачах дает неточнвхе результаты, так как гипотеза о независимости случайных величин на практике часто не выполняется. В таких случаях лучше всего использовать двумерное распределение, в том числе и двумерное распределение Пуассона, являющееся обобщением распределения Пуассона.
В последние годы большое внимание уделяется совместному моделированию двух или более переменных. Модели двумерных переменных используются в случаях, когда две переменные коррелируют и необходимо оценивать их совместно. В данной работе мы введем модель, которая учитывает как положительную, так и отрицательную корреляцию. Двумерное распределение Пуассона является широко используемой моделью для описания двух дискретных случайных величин с целочисленными значениями. Впервые двумерное распределение Пуассона было рассмотрено Кэмпбел- лом(в 1934 году) и Айткеном (в 1936 году). Оно представляет собой модель для исследования двумерных дискретных случайных величин, оценку параметра ковариации которого позже Холгейт (в 1964 году) построил в своей статье([5], стр.241-245).
Рассмотрим определение двумерного распределения Пуассона из работы Холгейта в [5]. Допустим, что
X = Xi + Х3и Y = X2 + Хз,
где X1, X2 и Х3 - взаимно независимые случайные величины с параметрами А1,А2,А3 > 0. Совместное распределение вектора (X, Y) называется двумерным распределение Пуассона с параметром А = (А1, А2, А3), или кратко: (X,Y) - BP1 (А).
В литературе большое внимание уделено проблеме оценки параметров двумерных Пуассоновских распределений. Проблемы, возникающие при оценке параметров довольно сложны, так как применение принципа максимального правдоподобия приводит к очень сложным вычислительным процедурам и труднореализуемо на практике. Кроме того, когда параметр Аз равен нулю, распределение является распределением двух независимых случайных величин Пуассона. В этом случае оценка оченв упрощена. Мы рассмотрим различнвхе аспектах методик, доступных для оценки параметров двумерного распределения Пуассона.
При выполнении работы использовались как оригинальные публикации, так и различная монографическая и учебная литература по теории вероятностей и математической статистике.
В данной дипломной работе были поставлены и решены следующие задачи:
1. Построены оценки параметров распределения с помощвю метода мак- сималвного правдоподобия и метода моментов;
2. Проведено тестирование полученных моделей с целвю оценки адекватности моделей реальным даннвхм;
3. Разработанвх практические методики, позволяющие применятв двумерное распределение Пуассона.
Хотелосв бы отметитв, что количество литературах по данному вопросу не велико, а которая присутствует на иностранном языке, в которой довольно кратко описано двумерное распределение Пуассона, что не позволяет читателю понять полный ход вычислений и шаги выведения формул. В данной же работе были проделаны подробные вычисления, представлены пошагово вывод формул и довольно подробно рассмотрена данная тема.
В первой главе представлены формула плотности двумерного распределения Пуассона для пары наблюдений и вывод этой формулы. Также были рассмотрены и получены статистические оценки неизвестных параметров. К сожалению, оценки с помощью метода максимального правдоподобия получены не для всех неизвестных параметров в связи со сложностью вычислений. Оценка же А3 была получена с помощью эмпирической (выборочной) ковариации. Далее был подробно изложен критерий согласия у1 Фишера для сложной гипотезы, который мы использовали для тестирования двух моделей без ковариат:
1. Модель 1: модель, в которой А3 = 0, которая соответствует случаю двух независимых экспоненциально распределенных случайных величин, одна с параметром А1, другая с параметром А2;
2. Модель 2: модель, в которой, вообще говоря, А1, A2, А3 не нулевые, то есть рассматривается случай зависимых пуассоновских случайных величин.
Во второй главе мы на практике показали применение двумерного распределения Пуассона в трех примерах. Первый пример применения двумерного распределения Пуассона в учебном процессе был придуман само- стоятелвно и осуществлен с помощвю статистики, собранной у студентов СПбГУ. В данном примере, исполвзуя формулах из главы 1, были получены численные оценки неизвестного параметра А = (А1, А2, Аз) и протестированы две модели. Получилось, что для второй модели при 5% уровне значимости нулевая гипотеза о согласии наблюдений с моделью 2 принимается, что говорит нам о том, что наши переменные X и Y зависимы, а конкретно в данном примере, что есть зависимость между количеством задолженностей, полученных на первом и втором курсе.
К сожалению, в примерах на применение двумерного распределения Пуассона в футболе и медицине не удалось получить каких-то точных результатов, а в следствии, не удалось установить зависимость или независимость параметров X и Y, но в примере про учебный процесс был получен точный результат, хорошо иллюстрирующий применение двумерного распределения Пуассона.
Таким образом, в нашей дипломной работе все поставленные задачи были решены в полном объеме, цель достигнута - мы изучили двумерное распределение Пуассона и особенности его применения в практических задачах.
[1] С.Д. Пуассон Исследования о вероятности приговоров в уголовных и гражданских делах, 1938.
[2] Aitken А. С. A further note on multivariate selection//Edinburgh Mathematical Society, 1936, 37-40 c.
[3] Aitken A.C., Gonin H.T On fourfold sampling with and without replacement//Royal Society of Edinburgh, 1935, 114-125 c.
[4] Campbell J.T. The Poisson correlation function//Edinburgh Mathematical Society, 1938, 18-26 c.
[5] P.Holgate Estimation for the bivariate Poisson distribution//Biometrika, 1964, 51, 241 c.
[6] Johnson N.L., Kotz S. Discrete Distributions, 1969.
[7] Kocherlakota S. and Kocherlakota K. Bivariate Discrete Distribution , 1992. 359 c.
[8] King G. A seemingly unrelated Poisson regression model//Sociological Methods and Research, 1989, 235-255 c.
[9] Jung R.C., Winkelmann R. Two aspects of labor mobility: a bivariate Poisson regression approach//Empirical Economics, 1993, 543-556 c.
[10] Ozuna T., Gomez LA. Estimating a system of recreation demand functions using a seemingly unrelated poisson regression approach//The Review of Economics and Statistics, 1994, 356-360 c.
[11] Bermudez L., Karlis D. A finite mixture of bivariate Poisson regression models with an application to insurance ratemaking//Elsevier, 2012, 3988-3999 c.
[12] Ghitany M.E., Karlis D.. Al-Mutairi D.K.. Al-Awadhi F.AAn EM algorithm for multivariate mixed Poisson regression models and its application//Elsevier, 2012, 6843-6856 c.
[13] Chib S., Winkelmann R. Markov chain Monte Carlo analysis of correlated count data//Journal of Business and Economic Statistics, 2001, 428-435 c.
[14] Van Ophem H. A general method to estimate correlated discrete random variables//Econometric Theory, 1999, 228-237 c.
[15] Karlis D., Meligkotsidou L. Finite mixtures of multivariate Poisson distributions with application//Journal of Statistical Planning and Inference, 2007, 1942-1960 c.
...