ВВЕДЕНИЕ 3
1 Теория оптимизации 5
1.1 Основные элементы теории оптимизации 5
1.1.1 Системы поддержки принятия решений 8
1.1.2 Классификация задач 10
1.1.3 Системы поддержки принятия решений 14
1.2 Пропуски в данных 19
1.3 Методы восстановления данных 20
1.4 Обзор современных методов восстановления данных 23
1.5 Преимущества и недостатки методов восстановления данных 26
1.6 Выводы по первой главе 30
2 Рейтинговая система 3 1
2.1 Основная идея системы 3 1
2.2 Алгоритм ZET 3 1
2.2.1 Основная идея алгоритма 31
2.2.2 Недостатки алгоритма 34
2.2.3 Модификация алгоритма ZET 36
2.3 Метод Чеботарева(обобщение метода строчных сумм) 38
2.3.1 Суммарные матрицы отношений 38
2.3.2 Основная идея метода 39
2.4 Выводы по второй главе 42
3 Результаты исследований 42
3.1 Программная реализация рейтинговой системы 43
3.2 Эффективность алгоритма ZET 45
3.3 Результаты моделирования 48
3.3.1 Работа с исходными данными 48
3.4 Выводы по третьей главе 49
ЗАКЛЮЧЕНИЕ 5 1
СПИСОК ИСПОЛЬЗОАВННЫХ ИСТОЧНИКОВ 52
ПРИЛОЖЕНИЕ
Проблема пропущенных значений достаточно актуальна, к примеру, для социологии. Причинами неполноты данных опроса могут служить множество факторов: невнимательность респондента, ошибки в анкете, различие в данных анкет (при опросах) и т.д. В результате на этапе анализа данных мы имеем неполный массив. В результате эти данные нельзя анализировать, так как из-за пропусков результаты неточны и не будут иметь особой ценности. Поэтому необходимо каким-то образом обработать эти данные, что бы в результате мы имели полных массив данных, который при обработке выдавал хорошие результаты, с допустимой погрешностью. Именно для таких случаев и предназначены методы восстановления данных с пропусками.
На данных момент существует множество методик, позволяющих восстанавливать пропуски в массивах данных, но каждая из них эффективна в каких-то определенных условиях и показывает плохие результаты в других. Рейтинговая система для бальных оценок с пропусками представляет собой методику, которая наиболее эффективно должна обрабатывать массивы данных, состоящих из бальных оценок, с пропусками. Во-первых, данная система должна эффективно восстанавливать пропуски в данных, с допустимой ошибкой. Это позволит эффективно ранжировать данные, с помощью одной из подходящих для этого случая методик. Во-вторых, восстановленные данные должны быть ранжированы и от точности восстановления зависит качество результатов работы данной системы.
Объектом исследования работы является анкетирование выпускников. То есть при завершении обучения и поступлении на работу, выпускников опрашивают с целью выяснения какие предметы наиболее необходимы в последующей работе, а какие менее. В результате в опросе мы имеем множество пропусков, вызванных различными факторами: различие в учебном плане на различных специальностях, невнимательность респондента. То есть для ранжирования сначала необходимо восстановить данные, для чего, и предназначена данная система.
Предметом исследования является методология восстановления данных, в нашем случае, при анкетировании. Различные подходы к анкетированию, степень необходимой точности восстановления и другие факторы, имеющие значение при выборе метода восстановления, все это необходимо учитывать для получения наиболее точного результата исследования.
Целью данной работы является создание эффективной системы оценки важности учебных предметов, в последующей работе, связанной со специальностью, выпускников после завершения обучения.
Задачи
1 Провести анализ существующих алгоритмов восстановления данных и выявить их недостатки и преимущества;
2 Разработать методику, эффективно справляющейся с целью данной работы;
3 Разработать автоматизированную рейтинговую систему для бальных оценок с пропускам.
В рамках данной работы была создана и программно реализована автоматизированная система оценки. Для её эффективной работы были проведены следующие исследования:
1. анализ существующих методов восстановления пропусков в массивах данных и выбор наиболее подходящего;
2. модификация метода восстановления пропусков в данных для эффективной работы в случае, описываемом в данной работе;
3. анализ существующих методов ранжирования и выбор наиболее оптимального;
4. моделирование случаев и с различным количеством пропусков, а так с различными вариантами ранжирования и на основе итогов выбор оптимального способа ранжирования.
В ходе исследования в данной сфере была разработана эффективная система оценки, которая ранжирует данные с приемлемой точностью в условиях неполноты данных. Данная тема очень актуальна, ввиду многих факторов из-за которых возникают пропуски в данных, и данная проблема возникает во многих в сферах деятельности человека, например в социологии или в экономике. К тому же в настоящее время в России не существует доступных систем оценки важности учебных предметов.
В результате анализа существующих методов восстановления пропусков в данных и методов ранжирования были выбраны наиболее подходящие для нашего случая, а именно алгоритм ZET для восстановления пропусков и метод Чеботарева для ранжирования. На основе этих методов была разработана эффективная методика, отлично справляющаяся с целью данной работы.