СЕТ-РЕГРЕССИОННЫЙ АНАЛИЗ ЗАВИСИМОСТЕЙ СЛУЧАЙНЫХ СОБЫТИЙ
|
Введение 3
1 Элементы теории конечных случайных множеств 7
1.1 Определение случайного множества событий и его характеристики 7
1.2 Средние характеристики случайного множества событий .... 10
1.3 Совместное распределение случайных множеств событий . . . 13
2 Сет-регрессионный анализ 16
2.1 Задача сет-регрессии 16
2.2 Суперпозиция сет-регрессий 24
2.3 Сет-регрессионная модель распределения потребительских предпочтений между фирмами 26
3 Предобработка данных для задачи сет-регрессии 32
3.1 Рекуррентный метод построения распределений случайных множеств событий с помощью аппарата ассоциативных функций . 33
3.2 Пример сет-регрессионного анализа медицинских данных ... 41
Заключение 45
Список использованных источников 46
1 Элементы теории конечных случайных множеств 7
1.1 Определение случайного множества событий и его характеристики 7
1.2 Средние характеристики случайного множества событий .... 10
1.3 Совместное распределение случайных множеств событий . . . 13
2 Сет-регрессионный анализ 16
2.1 Задача сет-регрессии 16
2.2 Суперпозиция сет-регрессий 24
2.3 Сет-регрессионная модель распределения потребительских предпочтений между фирмами 26
3 Предобработка данных для задачи сет-регрессии 32
3.1 Рекуррентный метод построения распределений случайных множеств событий с помощью аппарата ассоциативных функций . 33
3.2 Пример сет-регрессионного анализа медицинских данных ... 41
Заключение 45
Список использованных источников 46
Актуальность работы. В настоящее время практически любое исследование подразумевает при обработке результатов наблюдений, экспериментов и измерений использование технологий анализа данных. Их применение позволяет получить новое знание об объекте исследования, выявить скрытые закономерности. Данные нечисловой природы часто встречаются в мониторинге, прогнозировании и управлении в экологических, финансовых, медицинских исследованиях. И для их обработки следует привлекать корректные методы, основанные на соответствующих вероятностных моделях, что зачастую в реальных исследованиях, как в России, так и за рубежом игнорируется. Нередко при обработке данных возникает ситуация, когда исходная информация об объекте исследования представлена неколичественными признаками. В этом случае, адекватной математической моделью данных являются случайные множества, относящиеся к одному из объектов статистики нечисловой природы. Для выборочных данных, описываемых неколичественными признаками, приходится решать те же самые задачи, что и в классических разделах математической статистики: классификация объектов без указания учителя, распознавание образов объектов, оценивание регрессионной зависимости и другие.
Обзор литературы. Случайное множество событий — это случайный элемент со значениями из множества всех подмножеств конечного множества избранных событий X. Основная идея современной теории случайных множеств состоит в том, что структура статистических взаимозависимостей подмножества конечного множества полностью определяется распределением случайного множества, заданного на множестве всех его подмножеств. Распределение случайного множества — это удобный математический аппарат для описания всех способов взаимодействия элементов между собой. А зависимость среднего значения от какой-либо величины, от некоторой другой величины или от нескольких величин дает нам регрессия. Регрессия [2, 3] — это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Для исследования функциональной зависимости между случайными множествами событий в [2, 3, 18] было предложено искать решение задачи построения регрессионного отображения (функции сет-регрессии) в виде условных сет-средних случайных множеств событий. В [7, 8, 9, 14, 15] сет-регрессия использовалась для моделирования потребительских предпочтений и сегментации рынка. Входными данными для задачи является совместное распределение случайных множеств событий, которое было получено из имеющейся статистики. Однако, чтобы статистически оценить распределение случайного множества N событий на основе наблюдений, приходится сталкиваться с проблемой хронической недостаточности имеющегося количества наблюдений для надлежащей оценки всех 2N вероятностей p(X), образующее данное вероятностное распределение. Оптимизация данных, как элемент предобработки (препроцессинга), включает снижение размерности входных данных [22]. В [16, 13] предложен рекуррентный метод построения вероятностных распределений случайных множеств событий с помощью аппарата ассоциативных функций. Основная идея рекуррентного метода [16, 13] — выразить вероятности пересечений множества событий функционально через вероятности самих событий, что приводит к уменьшению числа параметров, необходимых для построения вероятностных распределений случайных множеств событий.
Объект и предмет исследования. Объектом исследования в представленной диссертации является моделирование сложных статистических систем. Предмет исследования — построение сет-регрессионных отображений конечных множеств событий.
Цели и задачи. Основной целью работы является разработка и исследование сет-регрессионных моделей для анализа зависимостей случайных событий в сложных статистических системах.
Данная цель достигается путем решения следующих задач:
1. разработать алгоритм для решения задачи сет-регрессии одного случайного множества на другое в классической постановке;
2. разработать алгоритм построения суперпозиции сет-регрессий;
3. разработать метод предобработки данных для задачи сет-регрессии;
4. построить примеры использования сет-регрессионных моделей для анализа данных в экономических и медицинских системах.
Методы исследования основаны на теории вероятностей, математической статистике, методах анализа данных и теории случайных множеств.
Теоретическая значимость работы заключается в том, что получен аналитический вид функции сет-регрессии для вероятностных распределений случайных множеств, рекуррентным методом.
Практическая ценность. Результаты, полученные в работе могут быть применены для модели разделения рынка на потребительские предпочтения, медицинского анализа данных.
Личное участие автора в получении результатов, изложенных в диссертации. Постановка изложенных в диссертации задач была сделана научным руководителем магистранта, к.ф.-м.н., доцентом Семеновой Д.В.. Доказательство и обоснование полученных в диссертации результатов, математические выкладки, численные расчеты выполнены лично автором.
Общая характеристика работы. Во введении раскрывается актуальность исследования по выбранному направлению, ставится проблема, цель и задачи исследования, определяются объект, предмет научных поисков, указывается методологическая база исследования, его теоретическая, практическая значимости. В первой главе изложены элементы теории конечных случайных множеств, даны определения, которые используются в дальнейшем исследовании. Разобраны числовые примеры, иллюстрирующие используемые инструменты теории случайных конечных множеств. Во второй главе рассмотрен алгоритм решения задачи сет-регрессии в классической постановке. Поставлена и решена задача суперпозиции регрессионных отображений. Построена сет-регрессионная модель распределения потребительских предпочтений между фирмами. В третьей главе для предобработки данных для задачи сетрегрессии предлагается использовать рекуррентный метод построения вероятностных распределений случайных множеств событий с помощью аппарата ассоциативных функций. Доказаны две теоремы о виде условного распределения случайного множества, полученного рекуррентным методом с помощью аппарата ассоциативных функций. Разработан алгоритм рекуррентного построения вероятностных распределений для случайных множеств событий. Рассмотрен пример сет-регрессионного анализа медицинских данных. Заключение посвящено основным выводам, приведены сведения об апробации работы.
Структура диссертации. Объём диссертационной работы 51 страниц, на которых размещены 13 рисунков и 20 таблиц. При написании диплома использовалось 25 источников.
Обзор литературы. Случайное множество событий — это случайный элемент со значениями из множества всех подмножеств конечного множества избранных событий X. Основная идея современной теории случайных множеств состоит в том, что структура статистических взаимозависимостей подмножества конечного множества полностью определяется распределением случайного множества, заданного на множестве всех его подмножеств. Распределение случайного множества — это удобный математический аппарат для описания всех способов взаимодействия элементов между собой. А зависимость среднего значения от какой-либо величины, от некоторой другой величины или от нескольких величин дает нам регрессия. Регрессия [2, 3] — это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Для исследования функциональной зависимости между случайными множествами событий в [2, 3, 18] было предложено искать решение задачи построения регрессионного отображения (функции сет-регрессии) в виде условных сет-средних случайных множеств событий. В [7, 8, 9, 14, 15] сет-регрессия использовалась для моделирования потребительских предпочтений и сегментации рынка. Входными данными для задачи является совместное распределение случайных множеств событий, которое было получено из имеющейся статистики. Однако, чтобы статистически оценить распределение случайного множества N событий на основе наблюдений, приходится сталкиваться с проблемой хронической недостаточности имеющегося количества наблюдений для надлежащей оценки всех 2N вероятностей p(X), образующее данное вероятностное распределение. Оптимизация данных, как элемент предобработки (препроцессинга), включает снижение размерности входных данных [22]. В [16, 13] предложен рекуррентный метод построения вероятностных распределений случайных множеств событий с помощью аппарата ассоциативных функций. Основная идея рекуррентного метода [16, 13] — выразить вероятности пересечений множества событий функционально через вероятности самих событий, что приводит к уменьшению числа параметров, необходимых для построения вероятностных распределений случайных множеств событий.
Объект и предмет исследования. Объектом исследования в представленной диссертации является моделирование сложных статистических систем. Предмет исследования — построение сет-регрессионных отображений конечных множеств событий.
Цели и задачи. Основной целью работы является разработка и исследование сет-регрессионных моделей для анализа зависимостей случайных событий в сложных статистических системах.
Данная цель достигается путем решения следующих задач:
1. разработать алгоритм для решения задачи сет-регрессии одного случайного множества на другое в классической постановке;
2. разработать алгоритм построения суперпозиции сет-регрессий;
3. разработать метод предобработки данных для задачи сет-регрессии;
4. построить примеры использования сет-регрессионных моделей для анализа данных в экономических и медицинских системах.
Методы исследования основаны на теории вероятностей, математической статистике, методах анализа данных и теории случайных множеств.
Теоретическая значимость работы заключается в том, что получен аналитический вид функции сет-регрессии для вероятностных распределений случайных множеств, рекуррентным методом.
Практическая ценность. Результаты, полученные в работе могут быть применены для модели разделения рынка на потребительские предпочтения, медицинского анализа данных.
Личное участие автора в получении результатов, изложенных в диссертации. Постановка изложенных в диссертации задач была сделана научным руководителем магистранта, к.ф.-м.н., доцентом Семеновой Д.В.. Доказательство и обоснование полученных в диссертации результатов, математические выкладки, численные расчеты выполнены лично автором.
Общая характеристика работы. Во введении раскрывается актуальность исследования по выбранному направлению, ставится проблема, цель и задачи исследования, определяются объект, предмет научных поисков, указывается методологическая база исследования, его теоретическая, практическая значимости. В первой главе изложены элементы теории конечных случайных множеств, даны определения, которые используются в дальнейшем исследовании. Разобраны числовые примеры, иллюстрирующие используемые инструменты теории случайных конечных множеств. Во второй главе рассмотрен алгоритм решения задачи сет-регрессии в классической постановке. Поставлена и решена задача суперпозиции регрессионных отображений. Построена сет-регрессионная модель распределения потребительских предпочтений между фирмами. В третьей главе для предобработки данных для задачи сетрегрессии предлагается использовать рекуррентный метод построения вероятностных распределений случайных множеств событий с помощью аппарата ассоциативных функций. Доказаны две теоремы о виде условного распределения случайного множества, полученного рекуррентным методом с помощью аппарата ассоциативных функций. Разработан алгоритм рекуррентного построения вероятностных распределений для случайных множеств событий. Рассмотрен пример сет-регрессионного анализа медицинских данных. Заключение посвящено основным выводам, приведены сведения об апробации работы.
Структура диссертации. Объём диссертационной работы 51 страниц, на которых размещены 13 рисунков и 20 таблиц. При написании диплома использовалось 25 источников.
Основные результаты. В результате проделанной работы были получены следующие результаты.
1. Разработан алгоритм решения задачи сет-регрессии случайных множеств в классической постановке.
2. Поставлена и решена задача построения суперпозиции сет-регрессий.
3. Для предобработки входных данных предложено использовать рекуррентный метод построения распределений случайных множеств событий ассоциативными функциями. Доказана теорема о виде условного распределения случайного множества событий с использованием ассоциативных функций. Исследовано решение задачи сет-регрессии с использованием ассоциативной функции Франка.
4. Приведены примеры использования сет-регрессионных моделей для анализа зависимостей в экономических и медицинских исследованиях.
Апробация работы. Основные результаты и отдельные положения диссертационных исследований докладывались и обсуждались на научных и научно-практических конференциях международного и всероссийского уровней.
Публикации. По результатам научных исследований имеются следующие публикации в трудах конференций
1. Разработан алгоритм решения задачи сет-регрессии случайных множеств в классической постановке.
2. Поставлена и решена задача построения суперпозиции сет-регрессий.
3. Для предобработки входных данных предложено использовать рекуррентный метод построения распределений случайных множеств событий ассоциативными функциями. Доказана теорема о виде условного распределения случайного множества событий с использованием ассоциативных функций. Исследовано решение задачи сет-регрессии с использованием ассоциативной функции Франка.
4. Приведены примеры использования сет-регрессионных моделей для анализа зависимостей в экономических и медицинских исследованиях.
Апробация работы. Основные результаты и отдельные положения диссертационных исследований докладывались и обсуждались на научных и научно-практических конференциях международного и всероссийского уровней.
Публикации. По результатам научных исследований имеются следующие публикации в трудах конференций



