Заказать работу


Тип работы:
Предмет:
Язык работы:


Проверка гипотезы нормальности по большому числу малых выборок с заданным ограничением на FDR

Работа №33283
Тип работыДипломные работы
Предметматематика
Объем работы73
Год сдачи2019
Стоимость3700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено 7
Не подходит работа?

Узнай цену на написание
ВВЕДЕНИЕ
1 Метод множественного тестирования с гарантированным уровнем FDR (критерий множественного тестирования по Бенджамину - Хочбергу) .... 6
2 Описание выборочных данных 8
3 Вычисление выборочных коэффициентов асимметрии и эксцесса и их
p-значений 11
4 Тестирование гипотезы нормальности распределения для значений экспрессии генов 47
ЗАКЛЮЧЕНИЕ 51
СПИСОК ЛИТЕРАТУРЫ 52
ПРИЛОЖЕНИЕ 53
ЛИСТИНГ ПРОГРАММЫ 60

В последние десятилетия в силу большой практической важности получили большое продвижение способы одновременного тестирования большого числа гипотез в задачах генетики и доказательной медицины. Особой значимостью метода множественного тестирования является обнаружение генов, которые являются ответственными за патологию организма (болезнь), по данным наблюдения экспрессии генов у здоровых и больных особей. Как правило, сопоставляются средние значения экспрессии генов у подобных групп пациентов с помощью критерия Стьюдента, а потом используется процедура множественного тестирования Бенджамини - Хочберга [3] (см. также [4]). Важно то, что данная процедура гарантирует предписанное значение индекса FDR (False Discovery Rate - частота ложных открытий). Значение FDR равно относительной частоте генов, не ответственных за патологию среди тех, которые объявлены ответственными (нулевая гипотеза отвергнута).
Целью дипломной работы является применение этой методики множественного тестирования к проверке нормальности распределения экспрессии генов у здоровых и страдающих болезнью Альцгеймера особей. Решалась задача проверки предположения о том, что как у больных, так и у здоровых особей существуют гены, имеющие одно и то же распределение: нормальное или отличное от оного. Это предположение было отвергнуто по данным результатов множественного тестирования. Кроме того, эти же результаты тестирования показали, что порядка 99,5% генов обладают нормальным распределением их экспрессии. Это важный в практическом отношении результат, оправдывающий применение двух выборочного критерия Стьюдента при сравнении средних значений экспрессии у здоровых и больных особей.
В дипломной работе сначала развивается методика множественного тестирования гипотезы нормальности, которая используется на данных статистического моделирования. Использование методики к реальным генетическим данных планируется осуществить в следующих параграфах дипломной работы.
Содержание дипломной работы планируется следующим образом: в первом параграфе описывается процедура множественного тестирования Бенджамина -Хочберга. Во втором параграфе приводится описание баз данных, использованных в работе. В третьем параграфе содержатся формулы для вычисления выборочных коэффициентов асимметрии и эксцесса и предлагается метод статистического моделирования для реализации процедура множественного тестирования Бенджамина -Хочберга. Четвертый параграф содержит тестирование гипотезы нормальности распределения для значений в экспрессии ген для реальных генетических данных. Пятый параграф посвящен выводом и заключению по результатам исследования. Завершается курсовая работа списком литературы и листингом программ.
Таким образом в работе была применена методика множественного тестирования к проверке нормальности распределения экспрессии генов у здоровых и страдающих болезнью Альцгеймера особей. Была решена задача проверки предположения о том, что как у больных, так и у здоровых особей существуют гены, имеющие распределение, отличное от нормального.
Таким образом, полученные данные о числе совпадающих номеров генов оказались очень малыми из чего можно сделать вывод что отличное от нормального распределения экспрессии не является диагностическим фактором для гена. Кроме того, число генов, отклоненных от гипотезы нормальности так же оказалось очень маленьким. Этот факт может служить оправданием для использования двух выборочного критерия Стъюдента.
[1] Петров А.А., Проверка статистических гипотез о типе распределения по малым выборкам, Теория вероятности и ее применение., 1956., т.1, № 2.- 248271 с
[2] Г. Кромер Математические методы статистики - М.: Мир, 1975. - 391 с.
[3] Y. Benjamini and Y. Hochberg. Controlling the false discovery rate: A practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 1995. - 289-300 с
[4] S. Holm. A simple sequentially rejective multiple test procedure. Scandinavian
[5] Journal of Statistics, 1979, вып.6. - 65-70 с
[6] Володин И. Н. Лекции по теории вероятностей и математической статистики, Казань: Изд-во КГУ, 2006. - 272 с

Работу высылаем на протяжении 30 минут после оплаты.

Пожалуйста, укажите откуда вы узнали о сайте!




Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании студенческих
и аспирантских работ!



В последние десятилетия в силу большой практической важности получили большое продвижение способы одновременного тестирования большого числа гипотез в задачах генетики и доказательной медицины. Особой значимостью метода множественного тестирования является обнаружение генов, которые являются ответственными за патологию организма (болезнь), по данным наблюдения экспрессии генов у здоровых и больных особей. Как правило, сопоставляются средние значения экспрессии генов у подобных групп пациентов с помощью критерия Стьюдента, а потом используется процедура множественного тестирования Бенджамини - Хочберга [3] (см. также [4]). Важно то, что данная процедура гарантирует предписанное значение индекса FDR (False Discovery Rate - частота ложных открытий). Значение FDR равно относительной частоте генов, не ответственных за патологию среди тех, которые объявлены ответственными (нулевая гипотеза отвергнута).
Целью дипломной работы является применение этой методики множественного тестирования к проверке нормальности распределения экспрессии генов у здоровых и страдающих болезнью Альцгеймера особей. Решалась задача проверки предположения о том, что как у больных, так и у здоровых особей существуют гены, имеющие одно и то же распределение: нормальное или отличное от оного. Это предположение было отвергнуто по данным результатов множественного тестирования. Кроме того, эти же результаты тестирования показали, что порядка 99,5% генов обладают нормальным распределением их экспрессии. Это важный в практическом отношении результат, оправдывающий применение двух выборочного критерия Стьюдента при сравнении средних значений экспрессии у здоровых и больных особей.
В дипломной работе сначала развивается методика множественного тестирования гипотезы нормальности, которая используется на данных статистического моделирования. Использование методики к реальным генетическим данных планируется осуществить в следующих параграфах дипломной работы.
Содержание дипломной работы планируется следующим образом: в первом параграфе описывается процедура множественного тестирования Бенджамина -Хочберга. Во втором параграфе приводится описание баз данных, использованных в работе. В третьем параграфе содержатся формулы для вычисления выборочных коэффициентов асимметрии и эксцесса и предлагается метод статистического моделирования для реализации процедура множественного тестирования Бенджамина -Хочберга. Четвертый параграф содержит тестирование гипотезы нормальности распределения для значений в экспрессии ген для реальных генетических данных. Пятый параграф посвящен выводом и заключению по результатам исследования. Завершается курсовая работа списком литературы и листингом программ.


Таким образом в работе была применена методика множественного тестирования к проверке нормальности распределения экспрессии генов у здоровых и страдающих болезнью Альцгеймера особей. Была решена задача проверки предположения о том, что как у больных, так и у здоровых особей существуют гены, имеющие распределение, отличное от нормального.
Таким образом, полученные данные о числе совпадающих номеров генов оказались очень малыми из чего можно сделать вывод что отличное от нормального распределения экспрессии не является диагностическим фактором для гена. Кроме того, число генов, отклоненных от гипотезы нормальности так же оказалось очень маленьким. Этот факт может служить оправданием для использования двух выборочного критерия Стъюдента.


[1] Петров А.А., Проверка статистических гипотез о типе распределения по малым выборкам, Теория вероятности и ее применение., 1956., т.1, № 2.- 248271 с
[2] Г. Кромер Математические методы статистики - М.: Мир, 1975. - 391 с.
[3] Y. Benjamini and Y. Hochberg. Controlling the false discovery rate: A practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 1995. - 289-300 с
[4] S. Holm. A simple sequentially rejective multiple test procedure. Scandinavian
[5] Journal of Statistics, 1979, вып.6. - 65-70 с
[6] Володин И. Н. Лекции по теории вероятностей и математической статистики, Казань: Изд-во КГУ, 2006. - 272 с


Работу высылаем на протяжении 30 минут после оплаты.

Пожалуйста, укажите откуда вы узнали о сайте!



© 2008-2018 Сервис продажи готовых курсовых работ, дипломных проектов, рефератов, контрольных и прочих студенческих работ.