ВВЕДЕНИЕ 3
1 Обзор методов и алгоритмов выявления зависимостей 5
1.1 Общая постановка задачи выявления зависимостей 5
1.2 Методы выявления зависимостей 7
1.3 Корреляционный анализ 7
1.4 Регрессионный анализ 10
1.5 Метод последовательного сокращения и метод последовательного
добавления параметров 11
1.5.1 Метод последовательного сокращения входных переменных модели
(алгоритм Del) 12
1.5.2 Метод последовательного добавления входных переменных модели
(алгоритм Add). 12
1.5.3 Алгоритм AddDel 13
2 Построение и обучение нейронной сети с помощью алгоритма NEAT 14
2.2 Нейронные сети 14
2.3 Применение нейронных сетей 16
2.4 Алгоритм NEAT 17
2.5 Применение алгоритма Neat, для выявления зависимостей. 22
3 Численные эксперименты 27
3.1 Апробация алгоритма на искусственных данных 27
3.2 Апробация алгоритма на данных с ТЭЦ-1 3 3
3.3 Вывод 36
ЗАКЛЮЧЕНИЕ 37
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 38
ПРИЛОЖЕНИЕ А 39
ПРИЛОЖЕНИЕ Б 40
ПРИЛОЖЕНИЕ В 41
ПРИЛОЖЕНИЕ Г 42
В нашу эпоху информации процесс моделирования играет важную роль в жизни человека. Этап построения моделей присутствует во всех сферах жизнедеятельности, без него не обходится ни одно исследование. Поэтому на сегодняшний день существует целый ряд запрограммированных пакетов моделирования, основанных на твердом теоретическом фундаменте.
Но большинство алгоритмов моделирования основаны на построении параметрических моделей. Такие модели требуют достаточной априорной информации об исследуемом объекте, которая в реальности не всегда доступна. В данном исследовании ставятся задачи по выявлению дополнительной информации об объекте из не обработанных данных.
В частности, рассматривается задача выявления зависимостей переменных в матрице наблюдений процесса дискретно-непрерывного типа. В рамках данного исследования будет проведено исследование по сравнению разных методов выявления зависимостей, таких как факторный анализ, регрессионный анализ, дисперсионный анализ.
Цель: выявление зависимостей в данных, для более качественного моделирования технологических процессов.
Задачи:
• Постановка задачи выявления зависимости между переменными;
• Обзор классических методов выявления зависимостей;
• Разработка метода применения нейронной сети для задачи выявления зависимости между переменными;
• Апробация алгоритма и анализ полученных результатов.
Объект исследования: матрица наблюдений технологических процессов с ТЭЦ-1.
Предмет исследования: методы выявления зависимостей в матрице наблюдений.
Для решения поставленных задач предлагается использовать следующие методы:
• Построение и анализ структуры нейронной сети используя алгоритмы нейроэволюции;
• Оценка степени влияния входных переменных на выходные переменные путем анализа полученного графа;
Данное исследование позволит применить алгоритм нейроэволюции нейронных сете для выявления зависимостей, выявить сильные и слабые стороны данного алгоритма, а также применить его к реальным данным с целью выявления скрытых зависимостей в технологическом процессе на ТЭЦ-1.
Перспективным развитием данной работы будет сравнения алгоритма на основе нейронных сетей с методом анализа параметра размытости в методе непараметрической регрессии Надарая-Ватсона[2].
В итоге работы стоит отметить, что поставленные задачи достигнуты, и по результатам исследования был сделан ряд выводов.
Было проведено исследование различных классических методов выявления зависимостей между переменными, а также представлено описание и работа метода основанного на анализе структуры нейронной сети построенной с применением алгоритма нейроэволюции.
В работе представлено описание работы алгоритма построения нейронных сетей, а также пример анализа полученных результатов. Данный алгоритм был реализован для ПК.
При проверке работы алгоритма на искусственных данных, он показал хорошие результаты при нахождении в ситуации, когда модель строится для одного выхода. При моделировании нейронной сети с несколькими выходами алгоритм допускал незначительные ошибки и мог не обнаруживать связи, между переменными, влияние которых не значительно велико.
В дальнейшем предполагается разработать алгоритм выявления зависимостей, основанный на методе анализа параметра размытости в методе непараметрической регрессии Надарая-Ватсона.
1. Тарасенко, Ф. П. Прикладной системный анализ (Наука и искусство решения проблем) : учебник / Ф. П. Тарасенко. - Томск: Изд-во Том. ун-та -2004. -224 с.
2. Надарая, Э. А. Непараметрические оценки кривой регрессии // Труды ВУ АН ГрССР.- Тбилиси: -1965. -№5. -С. 56-68.
3. Дармаев, Т. Г. Об одном эволюционном алгоритме настройки искусственных нейронных сетей / Т.Г. Дармаев, Ф.В. Хандаров // Вестник Бурятского Государственного Университета - Томск: -2012. -№SB. -С. 211-217
4. Филатова Т. В. Применение нейронных сетей для аппроксимации функций / Т. В. Филатова // Вестник: Вестник Томского государственного университета - Томск: -2004. -№284. - С. 121-125.
5. Kenneth, O. S. Efficient Evolution of Neural Networks Through Complexification / O. S. Kenneth. - Texas: The University of Texas at Austin, 2004. -180p.
6. Гмурман, В. Е. Теория вероятностей и математическая статистика: учебное пособие / В. Е. Гмурман. - Москва : 2003. - 479 c.