ВВЕДЕНИЕ 4
1 Техническая диагностика 6
1.1 Основные понятия и определения технической диагностики 6
1.2 Виды контроля качества 7
2 Задача распознавания образов 9
2.1. Постановка задачи 9
2.2 Задача классификации. Процесс классификации 9
2.2.1 Методы классификации 9
2.3 Задача кластеризации. Процесс кластеризации 11
2.3.1 Методы кластеризации 12
2.3.1.1 Алгоритм кластеризации FOREL. Модификации. Преимущества и недостатки 14
2.3.1.1.1 Алгоритм кластеризации FOREL 14
2.3.1.1.2 Алгоритм кластеризации FOREL-2 15
2.3.1.2 Алгоритм кластеризации K-MEANS. Модификации. Преимущества и недостатки 15
2.3.1.3 Нейронная сеть Кохонена 16
3 Реализация и исследование алгоритмов кластеризации 19
3.1 Входные данные 24
3.1.1 Модельные данные 24
3.1.2 Ирисы Фишера 25
3.2 Результаты исследований 26
3.2.1 Алгоритм FOREL 26
3.2.1.1 Модельные данные 26
3.2.1.1.1 Данные с явно выраженными кластерами 26
3.2.1.1.2 Данные, содержащие выбросы 29
3.2.1.1.3 Данные с неявно выраженными кластерами 31
3.2.1.2 Ирисы Фишера 34
3.2.2 Алгоритм K-MEANS 38
3.2.2.1 Модельные данные 38
3.2.2.1.1 Данные с явно выраженными кластерами 38
3.2.2.1.2 Данные, содержащие выбросы 39
3.2.2.1.3 Данные с неявно выраженными кластерами 42
3.2.2.2 Ирисы Фишера 43
3.2.2.3 Данные испытаний ЭРИ 44
3.2.3 Нейронные сети Кохонена 45
3.2.3.1 Модельные данные 46
3.2.3.1.1 Данные с явно выраженными кластерами 46
3.2.3.1.2 Данные, содержащие выбросы 48
3.2.3.1.3 Данные с неявно выраженными кластерами 51
3.2.3.2 Ирисы Фишера 53
ЗАКЛЮЧЕНИЕ 56
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 57
Распознавание - это способность живых организмов выделять из общего потока информации, поступающей от органов чувств,определенные объекты по различным признакам. Оно может осуществляться на основе зрительной, слуховой, тактильной информации. Задача распознавания образов - это самая распространенная задача, с которой приходится сталкиваться человеку каждый день в различных сферах нашей жизни. Так, мы без труда можем узнать знакомого нам человека по каким-либо признакам (по голосу, по внешнему виду и т.д.), понимаем речь, печатные и рукописные тексты и т.д. Таким образом, решение задач распознавания - это необходимый признак взаимосвязи живых организмов с окружающей средой.
Способность распознавать основывается на схожести однотипных объектов. Несмотря на то, что все предметы, в некоторой степени, уникальны, между ними всегда можно найти сходства по какому-либо признаку. То есть задачу распознавания образов также можно определить как распределение объектов по различным классам, элементы которых имеют схожие признаки и свойства, отличающиеся от элементов других классов. Отсюда возникают такие понятия, как классификация и кластеризация. Главное отличие между ними состоит в том что, при классификации, каждый объект относят к одному из заранее известных классов, при кластеризации, объекты распределяются по классам в процессе, то есть классы заранее не предопределены, а определяются результатом.
На сегодняшний день значительно возросла потребность в кластеризации объектов.Это связано с постоянным появлением новой техники и технологий,усложнением технических объектов, повышением требований производства и эксплуатации к ним.Например,чтобы обеспечить эффективное функционирование различных космических аппаратов необходимо предоставить требуемый уровень надежности, исправности и работоспособности, то есть регулярно проводить техническую диагностику как системы в целом, так и ее отдельных составляющих (деталей, механизмов и т.д.). Так как такого рода сложные системы зачастую не подлежат ремонту, либо выходят из строя при поломке даже одной составляющей.
Благодаря раннему обнаружению дефектов техническая диагностика позволяет предотвратить внезапные отказы оборудования, что повышает надежность, эффективность и безопасность промышленных производств, а также дает возможность эксплуатации сложных технических систем по фактическому техническому состоянию.
В работе, в качестве примера задачи технической диагностики, рассмотрены данные испытаний электрорадиоизделий (ЭРИ), предоставленные ОАО «Испытательный технический центр - НПО ПМ». Данная компания занимается проведением научно-исследовательских и опытно-конструкторских работ по обеспечению качества и надежности ЭРИ для комплектации аппаратуры космических аппаратов, проведение технической диагностики.
Однако, проведение некоторых испытаний (воздействие высокой температуры, напряжения и т.д.) могут привести к разрушению объекта, и дальнейшее его использование становится невозможным. Если предположить, что в партии изделий, подвергаемых испытаниям, можно выделить некоторые группы со схожими признаками, то целесообразно разбивать партию на кластеры и проводить испытания на одном, наиболее типичном представителе каждого кластера.
Существуют множество алгоритмов кластеризации, большинство из них были предложены в 60-е годы ХХ-го века. В качестве наиболее важных можно выделить работы следующих авторов: Г.Болла и Д.Холла, Дж.Маккуина - метод k-means, Р.Сокала и Дж.Снита, ГЛанса и У.Уильямса - иерархические алгоритмы, В.Н. Елкина и Н.Г. Загоруйко - алгоритм FORELи многие другие.
Целью дипломной работы является решение задачи технической диагностики для повышения ее точности с помощью методов распознавания образов, а именно алгоритмов кластеризации.
Для достижения поставленной цели необходимо решить следующие задачи:
• реализовать и исследовать алгоритмыFOREL, K-MEANS, а также алгоритм на основе нейронной сети Кохонена;
• провести сравнительный анализ полученных результатов;
• применить реализованные алгоритмы к задаче технической диагностики ЭРИ.
В ходе выполнения дипломной работы были реализованы алгоритмы кластеризацииFOREL, K-MEANS и нейронные сети Кохонена для решения задач технической диагностики, так же проведен сравнительный анализ, на основе которого, были получены следующие выводы:
• алгоритм FORELnоказал наихудшие результаты кластеризации. Для получения более точных результатов необходимо обеспечить выполнение гипотезы компактности. Это означает, что граница между классами имеет достаточно простую форму, и классы образуют компактно локализованные области в пространстве объектов;
• более точные результаты кластеризации модельных данных дал алгоритм K- MEANS. Однако его применение, как и предыдущего алгоритма, к реальным данным не привело к повышению точности работы кластеризации;
• алгоритм на основе нейронных сетей Кохонена показал наилучшие результаты в сравнении с другими рассмотренными алгоритмами. Однако данный алгоритм также не дал удовлетворительных результатов на данных испытаний ЭРИ.
Таким образом, все поставленные в начале работы задачи выполнены. В результате, можно сделать вывод о невозможности применения рассмотренных алгоритмов к исследуемым данным испытаний ЭРИ. Причиной этому является большая размерность данных, достаточно небольшой объем выборки, а также нелинейное расположение кластеров в пространстве. Следовательно, целесообразно исследовать другие алгоритмы для достижения поставленной цели.