Тип работы:
Предмет:
Язык работы:


Решение задачи классификации в условиях неполной информации

Работа №21719

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы45
Год сдачи2016
Стоимость5600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
507
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 Задача распознавания образов в технической диагностике 6
1.1 Задача интеллектуального анализа данных - Data Mining 6
1.2 Задачи классификации и кластеризации 8
1.3 Задача технической диагностики 10
1.4 Обзор решаемых задач 11
1.5 Выбор программных средств разработки 17
1.6 Выводы 21
2 Обзор методов классификации и кластеризации 22
2.1 Метод k ближайших соседей 22
2.2 Алгоритм FRiS-STOLP 23
2.3 Алгоритм FOREL 26
2.4 Метод k-средних 32
2.5 Кластеризатор на основе нейронной сети Кохонена 34
2.6 Выводы 40
3 Численные исследования 41
3.1 Задача 1 - «Ирисы Фишера» 41
3.2 Задача 2 - одна партия ЭРИ 44
3.3 Задача 3 - несколько партий ЭРИ 46
3.4 Выводы 50
ЗАКЛЮЧЕНИЕ 51
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 52
ПРИЛОЖЕНИЕ А Техническое задание 53


В современном мире на первый план выходят компьютерные технологии, информационные системы, управление и прочие направления, важные для развития новых технологий. Быстрый ритм жизни способствует разработке многофункциональной продукции, которая значительно упрощает нашу жизнь. Именно поэтому наша повседневная жизнь сильно зависит от бытовых приборов, техники и прочих приспособлений, автоматизирующих трудоемкие процессы.
Под технической диагностикой понимают определение технического состояния устройства. Актуальность выбранной темы обусловлена значимостью технической диагностики перед эксплуатацией каких-либо механизмов или микросхем. В работе рассматривался вопрос технической диагностики электрорадиоизделий (ЭРИ).
На сегодняшний день существует множество предприятий, осуществляющих анализ отказов и выявление скрытых дефектов ЭРИ и полупроводниковых приборов. Проведение контроля качества ЭРИ позволяет обнаружить изделия с отклонениями или обеспечить гарантию их работы.
На территории России имеется несколько испытательных центров ракетно-космической промышленности, занимающихся испытаниями ЭКБ для бортовой аппаратуры. Они взаимодействуют с производителями и поставщиками, а также участвуют при разработке методик входного контроля. Одним таких центров Красноярского края является Железногорское ОАО «ИТЦ - НПО ПМ».
В компьютерной диагностике большую роль играет обработка данных. В связи с большим количеством исследуемых данных их обработка становится все более затруднительной. Поэтому разрабатываются специальные методы, позволяющие работать с многомерными наблюдениями. К одним из таких способов относят задачи классификации и кластеризации.
Задача классификации относится к разделу обучения с учителем. Для задач данного типа характерно контролируемое обучение с присутствием обучающего множества с указанной принадлежностью объектов к классам. Задача кластеризации относится к разделу обучения без учителя. Для задач данного типа характерно неконтролируемое обучение, когда принадлежность объектов к каким-либо классам не указана. Множество объектов необходимо разделить на один или более кластеров данных.
Цель работы: повышение точности решения задачи распознавания образов при компьютерной диагностике электрорадиоизделий.
Задачи работы:
• реализовать и исследовать алгоритмы классификации: k-ближайших соседей, FRiS-STOLP;
• реализовать и исследовать алгоритмы кластеризации: FOREL, k-средних, кластеризатор на основе самоорганизующейся сети Кохонена;
• проанализировать особенности работы алгоритмов на модельных и реальных данных, сравнить полученные результаты;
• разработать автоматизированную систему для решения задачи распознавания образов.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения, списка используемых источников, приложения.
В первой главе раскрываются теоретические основы предметной области: определяются понятия и основные аспекты задач классификации и кластеризации, освящаются способы их решения. Также рассматриваются задачи, решаемые в ходе выполнения работы, приведены иллюстрации с распределениями массивов данных по различным срезам, обосновывается выбор программных средств разработки.
Во второй главе исследуются особенности разрабатываемых алгоритмов, дается краткое описание алгоритма, используемые параметры, коэффициенты и входные данные, описывается порядок выполнения алгоритма, приводятся примеры работы алгоритма на модельных данных с иллюстрациями, определяются основные достоинства и недостатки рассматриваемых методов.
В третьей главе приводится подробное решение исходных задач с иллюстрациями, таблицами результатов и сравнением полученных данных различными алгоритмами при использовании разработанной автоматизированной системы.
Данная работа является исследовательской и может быть полезна при решении задачи технической диагностики.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В работе были исследованы следующие алгоритмы: k-ближайших соседей, FRiS-STOLP, FOREL, k-средних, кластеризатор на основе самоорганизующейся сети Кохонена, а также разработана автоматизированная система для решения задачи распознавания образов.
Алгоритм FOREL плохо работает на реальных данных, поскольку он позволяет выделять только те кластеры, которые расположены на большом расстоянии друг от друга. FRiS-STOLP на основе результатов работы по выборке «Ирисы Фишера» дает более высокую точность классификации объектов в сравнении с методом k-ближайших соседей. На предоставленных данных по ЭРИ было выделено 3 кластера алгоритмом k-средних и сетью Кохонена, что соответствует действительности. Состав кластеров не может быть сравнен с эталонным, поскольку известно лишь наличие кластерной структуры.
Оценить качество работы на многомерных данных сложно, так как размерность исследуемой выборки высока, а просмотреть срезы данных по всем наборам признаков является физически невозможным. Однако полученные результаты позволяют обозначить элементы определенных кластеров ЭРИ как надежные изделия и потенциально ненадежные.



1. СТО 4.2-07-2014 Система менеджмента качества. Общие требования к построению, изложению и оформлению документов учебной деятельности. - Введ. 09.01.2014. - Красноярск: СФУ, 2014. - 60 с.
2. Лафоре, Р. Объектно-ориентированное программирование в C++. Классика Computer Science. 4-е изд. / Р. Лафоре - СПб.: Питер, 2014. - 928 с.
3. Муравьев, А. С. Модифицированный алгоритм растущего нейронного газа применительно к задаче классификации / А. С. Муравьев, А. А. Белоусов // Вестник науки Сибири. - 2014. - №4(14). - С. 105-111.
4. Муртазаев, А. К. Фазовые переходы в антиферромагнитной модели Изинга на квадратной решетке с взаимодействиями вторых ближайших соседей / А. К. Муртазаев // Журнал экспериментальной и теоретической физики. - 2013. - Т. 144, вып. 6. - С. 1236-1245.
5. Павловская, Т. А. С/С++. Программирование на языке высокого уровня / Т. А. Павловская. - СПб.: Питер, 2012. - 461 с.
6. Попова, О. А. Модели и методы интеллектуального анализа данных: учебно-методическое пособие [Электронный курс] / О. А. Попова. - Красноярск: Сиб. федер. ун-т, 2012.
7. Сараев, В. Отдайтесь большой цифре / В. Сараев // Эксперт. - 2015. - №9. - С. 51-55.
8. Удалова, Ю. В. Математические и алгоритмические основы объектно-ориентированного программирования: [Электронный курс]: учеб.- метод. пособие / Ю. В. Удалова. - Красноярск: Сиб. федер. ун-т, 2013.
9. Фазылов, Ш. Х. Модель распознающих операторов, основанных на принципе ближайшего соседа, в условиях взаимосвязанности признаков / Ш. Х. Фазылов, Чье Ен Ун // Информатика и системы управления. - 2012. - №4(34). - С. 34-42.
10. Царев, Р. Ю. Алгоритмы и структуры данных: учеб. пособие / Р. Ю. Царев. - Красноярск: Сиб. федер. ун-т, 2013. - 160 с.
11. Шаграев, А. Г. Трансдуктивное обучение логистической регрессии в задаче классификации текстов / А. Г. Шаграев, И. А. Бочаров, В. Н. Фальк // Программные продукты и системы. - 2014. - №2. - С. 114-118.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ