Тема: Решение задачи классификации в условиях неполной информации
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Задача распознавания образов в технической диагностике 6
1.1 Задача интеллектуального анализа данных - Data Mining 6
1.2 Задачи классификации и кластеризации 8
1.3 Задача технической диагностики 10
1.4 Обзор решаемых задач 11
1.5 Выбор программных средств разработки 17
1.6 Выводы 21
2 Обзор методов классификации и кластеризации 22
2.1 Метод k ближайших соседей 22
2.2 Алгоритм FRiS-STOLP 23
2.3 Алгоритм FOREL 26
2.4 Метод k-средних 32
2.5 Кластеризатор на основе нейронной сети Кохонена 34
2.6 Выводы 40
3 Численные исследования 41
3.1 Задача 1 - «Ирисы Фишера» 41
3.2 Задача 2 - одна партия ЭРИ 44
3.3 Задача 3 - несколько партий ЭРИ 46
3.4 Выводы 50
ЗАКЛЮЧЕНИЕ 51
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 52
ПРИЛОЖЕНИЕ А Техническое задание 53
📖 Введение
Под технической диагностикой понимают определение технического состояния устройства. Актуальность выбранной темы обусловлена значимостью технической диагностики перед эксплуатацией каких-либо механизмов или микросхем. В работе рассматривался вопрос технической диагностики электрорадиоизделий (ЭРИ).
На сегодняшний день существует множество предприятий, осуществляющих анализ отказов и выявление скрытых дефектов ЭРИ и полупроводниковых приборов. Проведение контроля качества ЭРИ позволяет обнаружить изделия с отклонениями или обеспечить гарантию их работы.
На территории России имеется несколько испытательных центров ракетно-космической промышленности, занимающихся испытаниями ЭКБ для бортовой аппаратуры. Они взаимодействуют с производителями и поставщиками, а также участвуют при разработке методик входного контроля. Одним таких центров Красноярского края является Железногорское ОАО «ИТЦ - НПО ПМ».
В компьютерной диагностике большую роль играет обработка данных. В связи с большим количеством исследуемых данных их обработка становится все более затруднительной. Поэтому разрабатываются специальные методы, позволяющие работать с многомерными наблюдениями. К одним из таких способов относят задачи классификации и кластеризации.
Задача классификации относится к разделу обучения с учителем. Для задач данного типа характерно контролируемое обучение с присутствием обучающего множества с указанной принадлежностью объектов к классам. Задача кластеризации относится к разделу обучения без учителя. Для задач данного типа характерно неконтролируемое обучение, когда принадлежность объектов к каким-либо классам не указана. Множество объектов необходимо разделить на один или более кластеров данных.
Цель работы: повышение точности решения задачи распознавания образов при компьютерной диагностике электрорадиоизделий.
Задачи работы:
• реализовать и исследовать алгоритмы классификации: k-ближайших соседей, FRiS-STOLP;
• реализовать и исследовать алгоритмы кластеризации: FOREL, k-средних, кластеризатор на основе самоорганизующейся сети Кохонена;
• проанализировать особенности работы алгоритмов на модельных и реальных данных, сравнить полученные результаты;
• разработать автоматизированную систему для решения задачи распознавания образов.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения, списка используемых источников, приложения.
В первой главе раскрываются теоретические основы предметной области: определяются понятия и основные аспекты задач классификации и кластеризации, освящаются способы их решения. Также рассматриваются задачи, решаемые в ходе выполнения работы, приведены иллюстрации с распределениями массивов данных по различным срезам, обосновывается выбор программных средств разработки.
Во второй главе исследуются особенности разрабатываемых алгоритмов, дается краткое описание алгоритма, используемые параметры, коэффициенты и входные данные, описывается порядок выполнения алгоритма, приводятся примеры работы алгоритма на модельных данных с иллюстрациями, определяются основные достоинства и недостатки рассматриваемых методов.
В третьей главе приводится подробное решение исходных задач с иллюстрациями, таблицами результатов и сравнением полученных данных различными алгоритмами при использовании разработанной автоматизированной системы.
Данная работа является исследовательской и может быть полезна при решении задачи технической диагностики.
✅ Заключение
Алгоритм FOREL плохо работает на реальных данных, поскольку он позволяет выделять только те кластеры, которые расположены на большом расстоянии друг от друга. FRiS-STOLP на основе результатов работы по выборке «Ирисы Фишера» дает более высокую точность классификации объектов в сравнении с методом k-ближайших соседей. На предоставленных данных по ЭРИ было выделено 3 кластера алгоритмом k-средних и сетью Кохонена, что соответствует действительности. Состав кластеров не может быть сравнен с эталонным, поскольку известно лишь наличие кластерной структуры.
Оценить качество работы на многомерных данных сложно, так как размерность исследуемой выборки высока, а просмотреть срезы данных по всем наборам признаков является физически невозможным. Однако полученные результаты позволяют обозначить элементы определенных кластеров ЭРИ как надежные изделия и потенциально ненадежные.



