Тип работы:
Предмет:
Язык работы:


Модификация алгоритма ZET для восстановления пропусков в порядковых шкалах

Работа №23483

Тип работы

Бакалаврская работа

Предмет

программирование

Объем работы70
Год сдачи2016
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
378
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
1 Теория оптимизации 5
1.1 Основные элементы теории оптимизации 5
1.1.1 Системы поддержки принятия решений 8
1.1.2 Классификация задач 10
1.1.3 Системы поддержки принятия решений 14
1.2 Пропуски в данных 19
1.3 Методы восстановления данных 20
1.4 Обзор современных методов восстановления данных 23
1.5 Преимущества и недостатки методов восстановления данных 26
1.6 Выводы по первой главе 30
2 Рейтинговая система 3 1
2.1 Основная идея системы 3 1
2.2 Алгоритм ZET 3 1
2.2.1 Основная идея алгоритма 31
2.2.2 Недостатки алгоритма 34
2.2.3 Модификация алгоритма ZET 36
2.3 Метод Чеботарева(обобщение метода строчных сумм) 38
2.3.1 Суммарные матрицы отношений 38
2.3.2 Основная идея метода 39
2.4 Выводы по второй главе 42
3 Результаты исследований 42
3.1 Программная реализация рейтинговой системы 43
3.2 Эффективность алгоритма ZET 45
3.3 Результаты моделирования 48
3.3.1 Работа с исходными данными 48
3.4 Выводы по третьей главе 49
ЗАКЛЮЧЕНИЕ 5 1
СПИСОК ИСПОЛЬЗОАВННЫХ ИСТОЧНИКОВ 52
ПРИЛОЖЕНИЕ


Проблема пропущенных значений достаточно актуальна, к примеру, для социологии. Причинами неполноты данных опроса могут служить множество факторов: невнимательность респондента, ошибки в анкете, различие в данных анкет (при опросах) и т.д. В результате на этапе анализа данных мы имеем неполный массив. В результате эти данные нельзя анализировать, так как из-за пропусков результаты неточны и не будут иметь особой ценности. Поэтому необходимо каким-то образом обработать эти данные, что бы в результате мы имели полных массив данных, который при обработке выдавал хорошие результаты, с допустимой погрешностью. Именно для таких случаев и предназначены методы восстановления данных с пропусками.
На данных момент существует множество методик, позволяющих восстанавливать пропуски в массивах данных, но каждая из них эффективна в каких-то определенных условиях и показывает плохие результаты в других. Рейтинговая система для бальных оценок с пропусками представляет собой методику, которая наиболее эффективно должна обрабатывать массивы данных, состоящих из бальных оценок, с пропусками. Во-первых, данная система должна эффективно восстанавливать пропуски в данных, с допустимой ошибкой. Это позволит эффективно ранжировать данные, с помощью одной из подходящих для этого случая методик. Во-вторых, восстановленные данные должны быть ранжированы и от точности восстановления зависит качество результатов работы данной системы.
Объектом исследования работы является анкетирование выпускников. То есть при завершении обучения и поступлении на работу, выпускников опрашивают с целью выяснения какие предметы наиболее необходимы в последующей работе, а какие менее. В результате в опросе мы имеем множество пропусков, вызванных различными факторами: различие в учебном плане на различных специальностях, невнимательность респондента. То есть для ранжирования сначала необходимо восстановить данные, для чего, и предназначена данная система.
Предметом исследования является методология восстановления данных, в нашем случае, при анкетировании. Различные подходы к анкетированию, степень необходимой точности восстановления и другие факторы, имеющие значение при выборе метода восстановления, все это необходимо учитывать для получения наиболее точного результата исследования.
Целью данной работы является создание эффективной системы оценки важности учебных предметов, в последующей работе, связанной со специальностью, выпускников после завершения обучения.
Задачи
1 Провести анализ существующих алгоритмов восстановления данных и выявить их недостатки и преимущества;
2 Разработать методику, эффективно справляющейся с целью данной работы;
3 Разработать автоматизированную рейтинговую систему для бальных оценок с пропускам.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной работы была создана и программно реализована автоматизированная система оценки. Для её эффективной работы были проведены следующие исследования:
1. анализ существующих методов восстановления пропусков в массивах данных и выбор наиболее подходящего;
2. модификация метода восстановления пропусков в данных для эффективной работы в случае, описываемом в данной работе;
3. анализ существующих методов ранжирования и выбор наиболее оптимального;
4. моделирование случаев и с различным количеством пропусков, а так с различными вариантами ранжирования и на основе итогов выбор оптимального способа ранжирования.
В ходе исследования в данной сфере была разработана эффективная система оценки, которая ранжирует данные с приемлемой точностью в условиях неполноты данных. Данная тема очень актуальна, ввиду многих факторов из-за которых возникают пропуски в данных, и данная проблема возникает во многих в сферах деятельности человека, например в социологии или в экономике. К тому же в настоящее время в России не существует доступных систем оценки важности учебных предметов.
В результате анализа существующих методов восстановления пропусков в данных и методов ранжирования были выбраны наиболее подходящие для нашего случая, а именно алгоритм ZET для восстановления пропусков и метод Чеботарева для ранжирования. На основе этих методов была разработана эффективная методика, отлично справляющаяся с целью данной работы.



1 Алгоритм Zet //Информационные интеллектуальные системы. Вып.40, 2008//http://iissvit.narod.ru/rass/vip40.htm
2 Загоруйко Н.Г. Методы распознавания и их применение. - М.: Советское Радио, 1972.
3 Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: ИМ СО РАН, 1999.
4 Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных // Computer Modeling & New Technologies.; Vol.6.2004.; Стр.55 - 56.
5 Королев В.Ю. ЕМ - алгоритм, его модификации и их применение к задаче разделелния смесей вероятностных распределений. Теоретический обзор. М.:2007. 102 стр.
6 Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS.:M. ГУ-ВШЭ. 2006. 263 стр.
7 Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. Финансы и статистика.: Москва, 1991; 430 стр.
8 Снитюк В.Е., Эволюционный метод восстановления пропусков в данных. 2008 //http://iissvit.narod.ru/index_a.htm;
9 Horton N. J; Lipsitz S.R. Multiple Imputation in Practice: Comparison of
Software Packages for Regression Models with Missing Variables. // The American Statistician, Vol. 55, No. 3. (Aug., 2001), Р. 244-254
//http://links.jstor.org/sici?sici=0003-
1305%28200108%2955%3A3%3C244%3AMIIPCO%3E2.0.CO%3B2-J
10 Kalton, G. , Kasprzyk, D. The treatment of missing survey data. // Survey Methodology, № 12, 1986. Р. 1-16.
11 Lipsitz S. R; Lue Ping Zhao; t Molenberghs G. A., Semiparametric Method of Multiple Imputation // Journal of the Royal Statistical Society. Series B (Statistical Methodology), Vol. 1460, No. 1.1998, Р. 127-144. // http://links.jstor.org/sici?sici=13697412%281998%2960%3A1%3C127%3AASMO MI%3E2.0.CO%3B2-5
12 Rubin, D.B. Multiple Imputation for Nonresponse in Surveys. Ney York: Willey, 1987. Р. 64-66;
13 Rubin, D.B. Multiple imputation after 18+ years. Journal of the American Statistical Association, № 91, 1996. Р. 473-489.
14 Schafer J.L.; Schenker N. Inference with Imputed Conditional Means // Journal of the American Statistical Association, Vol. 95, No. 449. 2000 Р.. 144-154.//
http://links.jstor.org/sici?sici=01621459%28200003%2995%3A449%3C144%3AIWI CM%3E2.0.CO%3B2-G
15 Schafer, J. L. Multiple Imputation: A Primer," Statistical Methods in Medical Research, Vol. 8, 1999. Р. 3-15.
16 Schulte Nordholt E. Imputation: Methods, Simulation Experiments and Practical Examples // International Statistical Review / Revue Internationale de Statistique, Vol. 66, No. 2. 1998, Р. 157-180. // http://links.jstor.org/sici?sici=0306- 7734%28199808%2966%3A2%3C157%3AIMSEAP%3E2.0.CO%3B2-W
17 SPSS Missing Value Analysis 12.0 // Заполнение пропущенных значений для повышения информативности данных и построения адекватных моделей // 2008. http://www.spss.ru/products/missing _value/mva12.pdf;


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ