АННОТАЦИЯ 2
ВВЕДЕНИЕ 4
1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ МЕТОДОВ РЕШЕНИЯ ЗАДАЧИ
ФОРМИРОВАНИЯ ПРОГНОЗОВ В ЗАДАННОЙ ПРЕДМЕТНОЙ ОБЛАСТИ
1.1 Измеряемые параметры стабилометрии 6
1.2 Методика обработки стабилометрической информации 17
2 СОЗДАНИЕ ИНТЕРАКТИВНОЙ СРЕДЫ АНАЛИЗА ДАННЫХ
2.1 Интерактивная среда обработки и анализа данных 23
2.1.1 Документы Markdown 24
2.1.2 Возможности публикации приложения 25
2.1.3 Документы Shiny 25
2.1. Способы распространения приложений Shiny 27
2.2 Создание приложения в среде Rmarkdown 29
ЗАКЛЮЧЕНИЕ 51
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 52
ПРИЛОЖЕНИЕ А 54
ПРИЛОЖЕНИЕ Б 59
Актуальность темы. Тема получения прогнозов компонентного состава тела на основе измерений стабилометрии является особенно актуальной для функциональной диагностики организма. Исследование функции равновесия, статоди- намической устойчивости спортсменов может быть определяющим фактором для оценки содержания жира, жидкости и мышечной массы в различных частях организма. Данная методика является новой и разработана исследователями Центра спортивной науки ЮУрГУ. При соответствующим количестве статистических измерений для разных групп лиц (по полу, возрасту, уровню спортивной подготовки и здоровья) стабилометрия может являться альтернативой биоимпенданс- ному анализу, применение которого невозможно для лиц с кардиостимуляторами и прочими вживленными электронными приборами. Проведение подобных статистических исследований тесно связано с оценкой качества получаемых данных и с построением прогнозных моделей. Получение быстрого и статистически значимого результата даже в случае недостаточной статистической подготовки исследователя невозможно при использовании существующих пакетов прикладных программ для анализа данных.
Отсюда вытекает цель дипломной работы - создание интегрированной среды анализа и обработки данных, с помощью которой неспециалист в анализе данных сможет проверять качество данных, вносить необходимые корректировки и строить описательные и прогнозные модели для решения задач анализа данных. Указанная цель хорошо соотносится с предметной областью - получением прогноза состава тела на основе показателей стабилометрии. Следовательно, для достижения цели дипломной работы были определены следующие задачи:
1) рассмотреть особенности предметной области с точки зрения спортивной науки и с точки зрения анализа данных;
2) определить подходящее средство для создания интегрированной среды разработки;
3) определить инструментарий используемых методов анализа данных;
4) осуществить программную реализацию;
5) осуществить выгрузку готовой среды на web-сервер.
Объектом выпускной квалификационной работы методы анализа данных и построения статистических моделей. Предметом является разработка интегрированной среды анализа данных для заданной предметной области.
В процессе проведения исследования были использованы методы визуального анализа данных, критерий Граббса, Кайзера, варимакс вращение, метод главных компонент, метод построения множественной регрессии по главным компонентам, методы автоматического отбора факторов в уравнение регрессии, методы проверки качества уравнения регрессии, методы построения и выбора архитектуры нейронной сети, методы объектного программирования и создания веб-приложений, методы языков R, Rmarkdown, HTML, CSS, JavaScript.
Цель и задачи выпускной квалификационной работы предопределили ее структуру. Работа состоит из двух глав, заключения, библиографического списка и двух приложений. В первой главе ставится задача и описывается предметная область в терминах спортивной науки и в терминах прикладного анализа данных. Во второй главе представлен способ решения задачи с помощью создания интегрированной среды анализа данных. В заключении приведены результаты проделанной работы.
В ходе дипломной работы поставленные задачи успешно были решены. Создано приложение, которое было размещено на веб-сервере shinyapps.io. Доступ к приложению осуществляется по ссылке. Приложение разработано на языке Rmarkdown, представляющим собой сочетание HTML + JavaScript + R. Приложение отображается в любом браузере, позволяет пользоваться возможностями статистической обработки и анализа данных, упрощая процедуры анализа до выбора переменных и нажатия нескольких кнопок. Все расчеты выполняются приложением автоматически, в том числе - выбор числа компонент модели, подбор и оценка наилучшего уравнения регрессии, построения нейронной сети с оптимальной архитектурой. Приложение позволяет сохранять промежуточные результаты работы с остатками, допускает выгрузку результатов из браузера и сохранение формируемых графиков.
Данное приложение существенно облегчает проведение анализа данных и построение прогнозов по сравнению с коммерческими пакетами, поскольку представляет собой единую, интегрированную среду, реализующую необходимый функционал. Работа с приложением не требует знания языков программирования, оно не требует загрузки и установки на компьютер каких-либо программ. Применение разработанного приложения в Центре спортивной науки оказывает существенную помощь в ускорении обработки собираемых данных и служит основой для формирования научных гипотез и получения научных результатов.