Программные средства для решения задач случайно-множественного регрессионного анализа
|
Введение 3
1 Случайно-множественный регрессионный анализ 6
1.1 Конечные случайные множества и их распределения 6
1.2 Средние характеристики случайного множества 8
1.3 Задача сет-регрессии 10
1.4 Пример решения задачи сет-регрессии 12
1.5 Суперпозиция сет-регрессий 22
2 Алгоритмы и комплекс программ для сет-регрессионного анализа . . 24
2.1 Сведения о программном комплексе «SetRegression» 24
2.2 Описание разработанных алгоритмов 25
2.3 Анализ разработанных алгоритмов 33
3 Пример решения задачи построения сет-регрессии для анализа медицинских данных 39
3.1 Программное решение задачи суперпозиции сет-регрессий . . . 39
3.2 Предобработка исходной статистики для анализа медицинских данных 42
3.3 Апробация статистики медицинского исследования в программном комплексе «SetRegression» 47
Заключение 56
Список использованных источников 58
Приложение А 61
1 Случайно-множественный регрессионный анализ 6
1.1 Конечные случайные множества и их распределения 6
1.2 Средние характеристики случайного множества 8
1.3 Задача сет-регрессии 10
1.4 Пример решения задачи сет-регрессии 12
1.5 Суперпозиция сет-регрессий 22
2 Алгоритмы и комплекс программ для сет-регрессионного анализа . . 24
2.1 Сведения о программном комплексе «SetRegression» 24
2.2 Описание разработанных алгоритмов 25
2.3 Анализ разработанных алгоритмов 33
3 Пример решения задачи построения сет-регрессии для анализа медицинских данных 39
3.1 Программное решение задачи суперпозиции сет-регрессий . . . 39
3.2 Предобработка исходной статистики для анализа медицинских данных 42
3.3 Апробация статистики медицинского исследования в программном комплексе «SetRegression» 47
Заключение 56
Список использованных источников 58
Приложение А 61
Главная цель компьютерной обработки экспериментальных или статистических данных состоит в автоматическом обнаружении скрытых в них закономерностей. Эти закономерности или знания позволяют понять сущность изучаемого процесса и, опираясь на имеющиеся данные, предсказывать новые факты [8]. Использование технологий анализа данных становится необходимым при обработке результатов наблюдений, экспериментов, измерений. Существующее программное и алгоритмическое обеспечение, используемое в этой области, разнообразно по своему назначению и позволяет решать множество задач, как статистического анализа данных, так и анализа данных, в пони¬мании этого термина как совокупности статистических методов, не предполагающих вероятностной модели изучаемого явления. Оба этих подхода можно отнести к прикладной статистике, одним из важных разделов которой является статистика объектов нечисловой природы. Данные нечисловой природы встречаются в исследованиях крайне часто, и для их обработки следует привлекать корректные методы, основанные на соответствующих вероятностных моделях [13, 14].
Нередко при обработке данных возникает ситуация, когда исходная ин-формация об объекте исследования представлена нечисловыми признаками [3, 13]. В этом случае, адекватной математической моделью данных являются случайные множества, относящиеся к одному из объектов статистики нечисловой природы [13, 14]. Для выборочных данных, описываемых нечисловыми признаками, приходится решать те же самые задачи, что и в классических разделах математической статистики: классификация объектов без указания учителя, распознавание образов объектов, оценивание регрессионной зависимости и другие [3].
Цели и задачи. Целью исследования является разработка алгоритмов и программного обеспечения, основанных на теории конечных случайных множеств, и предназначенных для решения задач сет-регрессионного анализа, имеющих широкое приложение для анализа нечисловых данных в различных статистических системах. Для достижения поставленной цели необходимо решить следующие задачи:
1. Проанализировать теоретические основы решения задач случайно-множественного регрессионного анализа по работам профессора Воробьёва О.Ю., Фомина А.Ю., Семеновой Д.В., Лукьяновой Н.А., Ивановой А.И..
2. Разработать алгоритмы для программного решения задачи сет-регрессии и её модификации.
3. Оценить на практических примерах эффективность разработанных алгоритмов. Провести вычислительные эксперименты и сделать выводы по их результатам.
4. Разработать на основе полученных алгоритмов программное обеспечение для сет-регрессионного анализа бинарных данных.
5. Привести пример решения задачи на конкретном практическом приме¬ре. В качестве входных данных использовать реальные статистические данные.
Структура работы. Представленная работа состоит из введения, трех глав, заключения, списка использованной литературы (20 наименований) и приложений. Общий объем работы — 71 страница.
В главе 1 приведены используемые в бакалаврской работе основные определения и теоремы случайно-множественного регрессионного анализа. Рассмотрены постановки и методы решения задачи сет-регрессии и задачи суперпозиций сет-регрессий. Во второй главе описаны разработанные алгоритмы, техническое требования, рекомендации по использованию программного обеспечения, перечислены основные возможности ПО «SetRegression», при-ведены результаты вычислительных экспериментов и оценка эффективности полученных алгоритмов. В последней главе акцентируется внимание на практическом применении программного комплекса «SetRegression» на примере обработки статистической базы данных по результатам анкетирования двух
медицинских учреждений Красноярского края ККПТД №1 и ККПТД №2 за
2012-2013 годы. Личная информация пациентов медицинских учреждений засекречена в целях соблюдения ФЗ 152 «О персональных данных». Результаты расчетов представлены в виде графика функции регрессии одного случайного множества на другое. В заключении изложены основные результаты научной работы, приведен список публикаций и конференций, на которых были представлены некоторые части данной работы, также приведен список использованных источников, использованных при подготовке бакалаврской работы.
Нередко при обработке данных возникает ситуация, когда исходная ин-формация об объекте исследования представлена нечисловыми признаками [3, 13]. В этом случае, адекватной математической моделью данных являются случайные множества, относящиеся к одному из объектов статистики нечисловой природы [13, 14]. Для выборочных данных, описываемых нечисловыми признаками, приходится решать те же самые задачи, что и в классических разделах математической статистики: классификация объектов без указания учителя, распознавание образов объектов, оценивание регрессионной зависимости и другие [3].
Цели и задачи. Целью исследования является разработка алгоритмов и программного обеспечения, основанных на теории конечных случайных множеств, и предназначенных для решения задач сет-регрессионного анализа, имеющих широкое приложение для анализа нечисловых данных в различных статистических системах. Для достижения поставленной цели необходимо решить следующие задачи:
1. Проанализировать теоретические основы решения задач случайно-множественного регрессионного анализа по работам профессора Воробьёва О.Ю., Фомина А.Ю., Семеновой Д.В., Лукьяновой Н.А., Ивановой А.И..
2. Разработать алгоритмы для программного решения задачи сет-регрессии и её модификации.
3. Оценить на практических примерах эффективность разработанных алгоритмов. Провести вычислительные эксперименты и сделать выводы по их результатам.
4. Разработать на основе полученных алгоритмов программное обеспечение для сет-регрессионного анализа бинарных данных.
5. Привести пример решения задачи на конкретном практическом приме¬ре. В качестве входных данных использовать реальные статистические данные.
Структура работы. Представленная работа состоит из введения, трех глав, заключения, списка использованной литературы (20 наименований) и приложений. Общий объем работы — 71 страница.
В главе 1 приведены используемые в бакалаврской работе основные определения и теоремы случайно-множественного регрессионного анализа. Рассмотрены постановки и методы решения задачи сет-регрессии и задачи суперпозиций сет-регрессий. Во второй главе описаны разработанные алгоритмы, техническое требования, рекомендации по использованию программного обеспечения, перечислены основные возможности ПО «SetRegression», при-ведены результаты вычислительных экспериментов и оценка эффективности полученных алгоритмов. В последней главе акцентируется внимание на практическом применении программного комплекса «SetRegression» на примере обработки статистической базы данных по результатам анкетирования двух
медицинских учреждений Красноярского края ККПТД №1 и ККПТД №2 за
2012-2013 годы. Личная информация пациентов медицинских учреждений засекречена в целях соблюдения ФЗ 152 «О персональных данных». Результаты расчетов представлены в виде графика функции регрессии одного случайного множества на другое. В заключении изложены основные результаты научной работы, приведен список публикаций и конференций, на которых были представлены некоторые части данной работы, также приведен список использованных источников, использованных при подготовке бакалаврской работы.
Основные результаты. По итогу проделанной работы достигнуты следующие результаты:
1. Изучена теоретическая основа решения задачи случайно-множественного анализа по работам Воробьёва О.Ю., Фомина А.Ю., Семеновой Д.В., Лукьяновой Н.А., Ивановой А.И..
2. Построена модель решения задачи сет-регрессии.
3. Разработаны интуитивный интерфейс ПО и алгоритмы решения данной задачи. Проведен анализ созданных алгоритмов.
4. Обработана статистика по результатам медицинского исследования. Полученная таким образом статистика в виде совместного распределения апробирована в качестве входных данных в разработанном программном обеспечении. Таким образом исследована задача сет-регрессии в виде сет-средних на практическом примере.
Разработанное программное обеспечение «SetRegression» позволяющее пользователю наблюдать не только конечный, но и промежуточный результат построения модели решения задачи случайно-множественного регрессионного анализа, является инструментом для научных исследований в области математической статистики и смежных прикладных областях, связанных с об-работкой статистических данных нечисловой природы, также может быть полезна для учебных целей.
Апробация работы. Результаты научной деятельности и некоторые положения в рамках бакалаврского исследования, также спроектированное ПО «SetRegression» докладывались и обсуждались на научных и научно-практических конференциях:
1. XII Всероссийская научно-техническая конференция студентов, аспирантов и молодых ученых «МОЛОДЁЖЬ И НАУКА» (Красноярск, 2016);
2. XII Всероссийская научно-техническая конференция студентов, аспирантов и молодых ученых «МОЛОДЁЖЬ И НАУКА» (Красноярск, 2015);
3. XIV международная ФАМЭМС'2015 конференция (Красноярск, 2015).
Публикации. Имеются три публикации автора по теме данной бакалаврской работе. Публикации приведены в списке использованных источников под пунктами [1, 2, 9].
1. Изучена теоретическая основа решения задачи случайно-множественного анализа по работам Воробьёва О.Ю., Фомина А.Ю., Семеновой Д.В., Лукьяновой Н.А., Ивановой А.И..
2. Построена модель решения задачи сет-регрессии.
3. Разработаны интуитивный интерфейс ПО и алгоритмы решения данной задачи. Проведен анализ созданных алгоритмов.
4. Обработана статистика по результатам медицинского исследования. Полученная таким образом статистика в виде совместного распределения апробирована в качестве входных данных в разработанном программном обеспечении. Таким образом исследована задача сет-регрессии в виде сет-средних на практическом примере.
Разработанное программное обеспечение «SetRegression» позволяющее пользователю наблюдать не только конечный, но и промежуточный результат построения модели решения задачи случайно-множественного регрессионного анализа, является инструментом для научных исследований в области математической статистики и смежных прикладных областях, связанных с об-работкой статистических данных нечисловой природы, также может быть полезна для учебных целей.
Апробация работы. Результаты научной деятельности и некоторые положения в рамках бакалаврского исследования, также спроектированное ПО «SetRegression» докладывались и обсуждались на научных и научно-практических конференциях:
1. XII Всероссийская научно-техническая конференция студентов, аспирантов и молодых ученых «МОЛОДЁЖЬ И НАУКА» (Красноярск, 2016);
2. XII Всероссийская научно-техническая конференция студентов, аспирантов и молодых ученых «МОЛОДЁЖЬ И НАУКА» (Красноярск, 2015);
3. XIV международная ФАМЭМС'2015 конференция (Красноярск, 2015).
Публикации. Имеются три публикации автора по теме данной бакалаврской работе. Публикации приведены в списке использованных источников под пунктами [1, 2, 9].
Подобные работы
- МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ОРГАНИЗАЦИИ ВНУТРЕННЕГО КОНТРОЛЯ ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ ОСНОВНЫХ СРЕДСТВ СЕЛЬСКОХОЗЯЙСТВЕННОГО ПРОФИЛЯ
Магистерская диссертация, экономика. Язык работы: Русский. Цена: 4850 р. Год сдачи: 2018 - Статистический анализ и прогнозирование валового внутреннего продукта в Российской Федерации
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 4270 р. Год сдачи: 2018 - Разработка программного модуля для реализации формирования эффективных ключевых фраз для контекстной рекламы для ООО «Рудник»
Бакалаврская работа, информатика. Язык работы: Русский. Цена: 4220 р. Год сдачи: 2018 - Анализ и прогнозирование объемов реализации товарной продукции ООО «Fresco»
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 4940 р. Год сдачи: 2016 - БАНКОВСКОЕ РЕГУЛИРОВАНИЕ И НАДЗОР В СИСТЕМЕ
МЕРОПРИЯТИЙ ПО ПРЕДОТВРАЩЕНИЮ БАНКОВСКИХ КРИЗИСОВ
Дипломные работы, ВКР, банковское дело и кредитование. Язык работы: Русский. Цена: 4850 р. Год сдачи: 2016



