Тип работы:
Предмет:
Язык работы:


Сравнение эффективности методов многомерной визуализации

Работа №92123

Тип работы

Бакалаврская работа

Предмет

математика

Объем работы21
Год сдачи2016
Стоимость4500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
46
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Статистический анализ данных ESS 7
1.1. Выбор исследуемого параметра 7
1.2. Выявление зависимости между параметрами 8
1.3. Построение регрессионных моделей 10
1.4. Снижение размерности данных 11
1.5. Выводы по первой главе 14
Глава 2. Визуализация многомерных данных в SPSS 15
2.1. Методы для данных произвольной размерности 15
2.1.1. Матрица диаграмм рассеяния 15
2.1.2. Перекрывающие диаграммы рассеяния 16
2.1.3. Метод параллельных координат 17
2.2. Методы для трехмерных данных 17
2.3. Выводы из второй главы 18
Заключение 19
Список литературы 20

Совершенствование методов, используемых в области
социологических, политических, экономических исследований непрерывно ведет к усложнению и увеличению количества полученных данных. В связи с этим возникает ряд проблем при анализе таких данных. Например, возникают трудности с однозначным определением распределения многомерных данных, которые могут быть распределены не нормально, а, допустим, фрактально. Данная работа посвящена решению одной из существующих проблем, а именно задаче сечения исходных данных большой размерности.
С точки зрения математической статистики, такие данные характеризуются большим количеством параметров. Вследствие чего, анализ требует большого количества вычислений и, следовательно, использования современных информационных технологий и специализированного программного обеспечения. Показательным примером «сложных инструментов» анализа являются многомерные методы. Многомерные методы - наиболее трудоемкие и ресурсозатратные (с точки зрения расчетов) методы в математической статистике. Однако, не редки случаи, когда исследователь не располагает необходимой материальной базой. Ввиду отсутствия значительных средств и доступа к большим вычислительным мощностям, ученый вынужден анализировать двухмерные сечения исходных данных как наиболее простые объекты исследования, т. е. попытаться установить зависимость конкретной переменной от одного из возможных параметров.
Целью работы является разработка некоторого алгоритма для исследования взаимосвязи интересующего нас явления с множеством всех параметров.
Кроме того, в работе рассматривается вопрос визуализации полученных результатов для возможности дальнейшей интерпретации.
Для решения этой задачи ресурсным центром «Вычислительный центр СПбГУ» была предоставлена исследовательская платформа в виде виртуального вычислительного сервера на одном из вычислительных кластеров центра, а также статистический пакет программ IBM SPSS Statistics версии 21 в качестве основного средства анализа [1].
В качестве исходных данных были взяты данные, предоставленные Европейским Социальным Исследованием (the ESS) [2]. Европейское социологическое исследование - это двухлетняя работа, цель которой слежение за изменениями в институтах, предпочтениях, уверениях и поведенческих моделях людей в Европе. Начатое в 2002 году исследование проводилось каждые два года во многих европейских странах. Были взяты результаты для Российской Федерации в 2012 году, полученные в ходе шестой волны исследования [2]. База данных ESS хорошо подходит для исследования в рамках поставленной задачи, так как содержит большое количество переменных. В изначальном варианте в ней насчитывается 626 переменных. После исключения пустых полей, отвечающих за граждан других стран, а также полей, содержащих незначительное количество информации, база содержит 241 переменных. Именно этот вариант был принят в качестве исходных данных.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе работы был выработан следующий алгоритм редукции многомерных данных.
1. Выделение параметров при помощи исследования корреляционных зависимостей переменных;
2. Построение многомерной регрессионной модели для прогнозирования значения исследуемого параметра;
3. Снижение размерности исходных данных при помощи метода главных компонент.
В работе рассмотрен пример применения алгоритма к базе данных Европейского Социального Исследования. В результате, был исследован вопрос об удовлетворенности граждан страны жизнью, построена регрессионная модель для предсказания значения «удовлетворенности», а также получены новые переменные, которые могут быть однозначно интерпретированы и использоваться вместо большего числа исходных параметров.
В заключении, можно сделать вывод о том, что использование сложных инструментов статистического анализа и дорогостоящего программного обеспечения оправдано лишь в том случае, когда важна высокая точность результата, оправдывающая все вычислительные затраты, или есть основания полагать, что существует некоторая сложная взаимосвязь между переменными. В противном же случае, разумно использовать более простые методы, предоставляющие достаточную степень точности.


1. Ресурсный центр «Вычислительный центр СПбГУ». http: //www.cc. spbu.ru
2. About ESS. http://www.europeansocialsurvey.org/about/
3. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб.: ДиаСофтЮп, 2005. 608 с.
4. Орлова И. В., Концевая Н. А. и др. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS / под ред. И.
В. Орловой. М.: Вузовский учебник, 2009. 320 с.
5. Сошникова Л. А., Тамашевич В. Н. и др. Многомерный статистический анализ в экономике: Учеб. пособие для вузов / под ред. проф. В. Н.
Тамашевича. М.: ЮНИТИ-ДАНА, 1999. 598 с.
6. Буре В. М., Парилина Е. М. Теория вероятностей и математическая статистика. СПб.: Изд-во Лань, 2013. 416 c.
7. LearnSPSS: Порядковая регрессия.
http://www.learnspss.ru/hndbook/glava16/cont11 .htm
8. LearnSPSS: Факторный анализ
http: //www.learnspss.ru/hndbook/ glava 19/cont3 .htm
9. Ким Дж., Мюллер Ч. и др. Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989. 216 с.
10. Зиновьев А.Ю. Визуализация многомерных данных. Красноярск: Изд-во КГТУ, 2000. 168 с.
11. Бондарев А.Е., Галактионов В.А. Анализ многомерных данных в задачах многопараметрической оптимизации с применением методов визуализации // Научная визуализация, 2012. Т. 4, № 2. С. 1-13.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ