Тип работы:
Предмет:
Язык работы:


АНАЛИЗ КАТЕГОРИАЛЬНЫХ ДАННЫХ С ПРИЛОЖЕНИЕМ В МАРКЕТИНГЕ

Работа №67841

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы60
Год сдачи2016
Стоимость4300 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
36
Не подходит работа?

Узнай цену на написание


Введение 5
1. Прикладная задача 5
2. Цель работы и постановка математической задачи 6
3. Исходные данные 8
Глава 1. Методы 13
1.1. Канонический анализ 13
1.2. Энтропия 14
1.3. Коэффициенты неопределенности 14
1.4. Факторный анализ 16
1.4.1. Метод главных компонент (к> 2) 17
1.5. Дисперсионный анализ 18
1.6. Алгоритм быстрого перечисления точек грассманиана 20
1.6.1. Векторная параметризация грассманиана 20
1.6.2. Отношение линейного порядка 21
1.6.3. Алгоритм быстрого перечисления точек грассманиана FGEA . . 22
Глава 2. Работа с данными 25
2.1. Множество признаков «До» и один «После» 25
2.1.1. Исследование оценок экспертов 25
2.1.2. Качество оценивания выживаемости экспертами 27
2.1.3. Изолированный анализ качественных признаков «До» 29
2.1.4. Поиск наилучшего подмножества с помощью коэффициента неопределенности 29
2.2. Множества признаков «До» и «После» 35
2.2.1. Перебор подмножеств и поиск наиболее связанных с помощью
коэффициента неопределенности 35
2.2.2. Частотный способ поиска номинативных представителей 36
2.2.3. Метод поиска номинативных представителей, основанный на удалении признаков
2.2.4. Факторный анализ для поиска номинативных представителей . . 54
2.3. Заключение 57
Литература

В данной работе рассматривается задача исследования зависимости между двумя множествами признаков, а именно: между различными комбинациями начальных и итоговых признаков базы данных, полученной от исследователя. Производится поиск связей между множествами, где в качестве меры зависимости рассматривается коэффициент неопределенности. Для расширения исходных множеств используются алгебраические методы: алгоритм быстрого перечисления точек грассманиана. Трудности анализа: сложная итоговая характеристика, задачу нельзя решить напрямую, интерпретация полученных связей. Отличие моей работы от других: поиск не только наибольших связей между множествами, но и самых устойчивых симптомов, в смысле уменьшения количества значимых связей и снижения уровней зависимости при их исключении из совокупностей, названных номинативными представителями. Задача нахождения «сильных» связей между наборами признаков важна в реальной жизни, потому что на основе полученных результатов принимаются решения в той или иной сфере жизни. Например, ежегодно проходит большое количество конкурсов для молодых ученых и жюри не должно ошибаться в выборе победителей.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Таким образом, были получены следующие результаты:
Для множества признаков «До» и одного признака «После»:
1. Проведен факторный анализ для секции, содержащей оценки экспертов. Получилось, что эксперты оценивают достаточно адекватно.
2. Итог (выжил проект или нет) не прогнозируется экспертами.
3. Получены признаки блока информации «До», каждый из которых (в одиночку) оказывает влияние на итог:
AGE,
WEB.SITE,
INDUSTRY,
FAMILY,
TEACHER, KINDERGARTEN.
4. Выделены подмножества признаков «До», наиболее связанные с выживаемостью проектов.
5. Выживают проекты, над которыми работали от 1 до 2 лет.
6. Найден номинативный представитель: признак AGE. При его добавлении к другим признакам, получаются подмножества, влияющие на итоговый признак.
Для множества признаков «До» и множества «После»:
1. Написана программа для оптимального поиска подмножеств признаков, основанная на алгоритме быстрого перечисления точек грассманиана.
2. Произведен канонический анализ. Получены наилучшие связи между подмножествами, в качестве меры зависимости рассматривается коэффициент неопределенности.
3. Сформулировано и доказано утверждение1.
4. Реализован частотный способ поиска номинативных представителей.
5. Реализован метод поиска номинативных представителей, основанный на удалении признаков.
6. Получены номинативные представители обоих множеств X и Yпри помощи методов многомерной статистики (табл.2.35 и табл.2.36):
X(1) —AGE1 (до 2 лет работают над проектом),
X(2)+X(3) — взаимодействие AGE2 и AGE3 (от 2 лет работают над проектом),
Y(1) — EVENTS.PUBLICATION(Публикации в СМИ о проекте),
Y(1)+Y(4) — взаимодействие EVENTS.PUBLICATIONи EVENTS.INVESTMENT (Публикации в СМИ о проекте + привлечены инвестиции).



1. Алексеева Н. П. Анализ медико-биологических систем. Реципрокность, эргодичность, синонимия. — Санкт-Петербург : Изд-во С.-Петерб. ун-та, 2012. — 184 с.
2. Ананьевская П. В. Исследование конечно-линейных статистических моделей. Оптимизация и избыточность : дис. на соискание ученой степени кандидата физико-математических наук / П. В. Ананьевская ; Санкт-Петербургский гос. университет. — Санкт-Петербург, 2013. — 142 с.
3. Рао С. Р. Линейные статистические методы и их применение. — М. : Наука, 1968.
4. Алексеева Н. П. Учебное пособие по прикладной статистике. Часть 2. Многомерные методы. — Санкт-Петербург, 2014.
5. Ермаков М. С., Сизова А. Ф., Товстик Т. М. Учебное пособие: Элементы математической статистики. — Санкт-Петербург : Изд-во С.-Петерб. ун-та, 2001. — 148 с.
6. Воробьев О. Ю. Эвентология. — Красноярск : Сиб. фед. ун-т, 2007.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ