Тема: Применение статистических критериев в условиях отсутствия нормальности данных
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Основные понятия 5
Глава 2.Применение статистических критериев
для анализа данных в пакете Excel 12
Глава 3.Критерий Стьюдента в случае отсутствия
нормальности и малом количестве данных 19
Заключение 34
Литература
📖 Введение
В современной медицине и биологии выводы являются по - настоящему доказанными только после проведения их статистического и математического анализа.
В данной дипломной работе проведен анализ данных, предоставленных кафедрой пропедевтики и факультетской педиатрии с курсом детских болезней лечебного факультета Казанского медицинского университета. Перед нами стояла задача проверить влияние содержания определенных веществ в крови матери или плода на наличие угрозы выкидыша.
Стандартной процедурой статистического анализа является проверка данных на соответствие единицам измерения, разделение данных по признаку на наличие и отсутствие угрозы выкидыша, описательная статистика, исследование на нормальность распределения данных и их однородность.
В связи с тем, что пакет программ MS Excel наиболее часто используется для обработки данных, то актуальным является составление алгоритмов для применения различных статистических критериев.
Выбор статистического теста для такой проверки является важной задачей. Для проверки однородности используется параметрический t-критерий Стьюдента. В нем проводится проверка гипотезы о равенстве средних значений. Например, если при сравнении средних значений селена в крови матери в группе, где присутствует угроза выкидыша и в группе, где нет угрозы, нулевая гипотеза принимается, то, будем считать, что содержание селена одинаково в обеих группах, то есть содержание селена не связано с угрозой выкидыша. Обязательными условиями использования этого критерия являются нормальный характер распределения изучаемых данных и равенство дисперсий сравниваемых групп [13], [10]. Оценка соответствия распределения данных гауссовскому выполняется в статистических программах с помощью критериев нормальности (например, Колмогорова- Смирнова, Шапиро-Уилка).
А что произойдет с распределением статистики параметрического критерия в случае нарушения предположения о нормальности? Насколько будут оставаться корректными выводы, осуществляемые на основании классических результатов? В этой работе мы постараемся дать ответы на эти вопросы, а также корректно анализировать полученные данные и верно интерпретировать результаты анализа.
В случае большого объема данных поведение статистики Стьюдента известно, оно приближается к нормальному распределению [7], [15].В связи с этим целью данной работы является изучение распределения статистики Стьюдента при малом объеме выборки в условиях отсутствия нор-мальности данных. Эта задача является нетривиальной [4]. В качестве не нормального распределения берется экспоненциальное распределение.
В данной работе найдено распределение статистики Стьюдента в случае экспоненциального распределения случайных величин и малом объеме выборки N=4. Кроме того, в работе сравниваются значения ошибок 1-го рода в случае экспоненциального распределения выборки в статистике Стьюдента при N=4 и в классическом случае.
✅ Заключение
Для этого была проведена проверка данных на нормальность и однородность с помощью критериев Колмогорова-Смирнова, Шапиро-Уилка и Стьюдента. В пакете программ MS Excel составлен алгоритм применения этих методов. Кроме того, исследовано влияние нарушения нормальности на распределение статистики Стьюдента в случае малых и экспоненциально распределенных величин.
Исходя из собственных вычислений, осмелимся высказать мнение, что, в случае нарушения предположения о нормальности распределения статистики параметрического критерия, а именно критерия Стьюдента, выводы, осуществляемые на основании классических результатов, искажаются. Вероятность принять неверную гипотезу повышается.



