Тип работы:
Предмет:
Язык работы:


ПОСТРОЕНИЕ КЛАССИФИКАТОРОВ ДАННЫХ МЕТОДАМИ РЕШЕНИЯ ЗАДАЧ КВАДРАТИЧНОГО ПРОГРАММИРОВАНИЯ И МИНИМАКСА

Работа №53329

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы74
Год сдачи2016
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
408
Не подходит работа?

Узнай цену на написание


Введение 3
Глава 1. Теоретическое описание оптимизационных методов классификации: .. .6
1.1. Критерий линейной отделимости множеств 9
1.1.1. Теоремы о линейной отделимости 10
1.1.2. Универсальная мера толщины сепаратора или псевдо - сепаратора 16
1.1.3. Сравнение толщины сепаратора для выпуклых многогранников 27
1.2. Решение задач методом минимакса 30
1.3. Квадратичное программирование 37
Глава 2. Классификация данных методом квадратичного программирования и минимакса
2.1. Решение задачи минимакса в пакете Matlab 45
2.2. Решение задачи квадратичного программирования в пакете Matlab 50
Заключение 57
Список использованной литературы 59
Приложения


В настоящее время в разных областях человеческой деятельности чрезвычайно широкое распространение получила проблема классификаций больших данных. Термин «большие данные» получил распространение совсем недавно, которая означает новую прикладную область — поиск способов автоматического быстрого анализа больших объёмов различной информации. Наука о больших данных ещё только вводится, но уже сейчас она очень нужна — и в будущем будет необходима еще больше.
С её помощью можно решать неимоверные задачи: оценивать электрокардиографию по кардиограмме, предсказывать рабочую плату по описанию должности, предлагать пользователю вид искусства на основании его анкеты.
Большими данными может оказаться что угодно: результаты научных исследований, прогнозы погоды, профили в социальных сетях — словом, всё, что может быть плодотворно проанализировано.
Самым многообещающим подходом к анализу больших данных считается применение машинного обучения — множество методов, благодаря которым компьютер может осуществлять поиск в массивах, заранее неизвестные взаимосвязи и закономерности.
Методы оптимизации применяются к решению большого диапазона вопросов по обработке данных. Одним из наиболее результативных методов решения обработки данных является классификация.
Сейчас существует два подхода к решению задач математической диагностики: статистический и оптимизационный. Первый подход использует вероятностные и статистические методы, второй - оптимизационный - использует методы математического программирования. Эти подходы взаимно дополняют друг друга и дают возможность проводить диагностику и прогнозирование.
Статистический подход к решению задач диагностики начал развиваться еще с середины XX века, а оптимизационный - с начала прошлого столетия, остается много нерешенных вопросов, актуальность которых не уменьшается. Данная работа относится ко второму (оптимизационному) направлению.
Теорию и методы решения задачи оптимизации изучает математическое программирование. Математическое программирование- это область математики, разрабатывающая теорию, численные методы решения многомерных задач с ограничениями. В отличие от классической математики, математическое программирование занимается математическими методами решения задач для нахождения наилучших вариантов из всех возможных.
Цель данной работы - получить программный продукт в пакете Matlab, позволяющий классифицировать реальные медицинские данные. Программа должна быть проверена как для малой, так и для большой выборки данных. Считаю, что достижение поставленной цели позволит научиться больше разбираться в задачах оптимизации, используя версии традиционных и новейших алгоритмов.
Задача, которая изучается в моей работе, ставится следующим образом. Имеется база с реальными данными больных мезотелиомой (324 пациента с 7 признаками). Она делится на два класса: больные и здоровые. Каждая из них представляет множество точек в многомерном пространстве. Необходимо построить классификатор, по которому любую точку пространства можно идентифицировать как точку того или иного класса.
Математически задача сводится к разделению двух множеств точек. Если выпуклые оболочки двух множеств не пересекаются, то задача решается с помощью теоремы отделимости: проводится разделяющая гиперплоскость, точки находящиеся по одну сторону гиперплоскости принадлежат одному множеству, а точки, находящиеся по другую ее сторону, принадлежат второму
множеству. Для разделения множеств применялись методы нелинейного программирования. Результаты выводятся на графике с помощью функции plot.
Одной из важных проблем при обработке баз данных является ранжирование параметров. Выбор наиболее значимых параметров позволяет ускорить обработку результатов эксперимента.
Задача диагностики в медицине является одновременно и весьма важным, и сложным. Им посвящены многие исследования.
Актуальность данной работы связана со значительным распространением практических применений оптимизационных задач, таких как минимакс, квадратичного программирования и определяется необходимостью нахождения сепаратора и псевдо - сепаратора данных, используя эффективные методы классификации с помощью программирования в пакете Matlab.
Объектом исследования дипломной работы является большая база данных с пациентами, которые делятся на две группы: больные и здоровые. Я провожу классифицирование множеств с помощью методов математического программирования.
Новизна диссертационной работы состоит в решении задач с помощью научного оптимизационного подхода посредством методов квадратичного программирования и минимакса с помощью Optimization Toolbox пакета Matlab. Optimization Toolbox включает программы широко известных методов минимизации и максимизации линейных и нелинейных функций. Эти программы могут быть использованы для решения сложных задач оптимизации для различных приложений.
MATLAB и Optimization Toolbox предоставляют финансовым аналитикам, инженерам и исследователям средства, необходимые для поиска оптимальных и компромиссных решений, позволяют настраивать и проводить диагностику задач оптимизации и быстро объединять стандартные алгоритмы оптимизации со своими собственными методами.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящее время новейшие достижения математики и современной вычислительной техники находят все более широкое использование как в математических исследованиях и планировании, так и в решении военных тактических задач. Этому способствует усовершенствование таких разделов математики как математическое программирование, теория игр, теория массового обслуживания, а также бурный прогресс быстродействующей электронно-вычислительной техники. К нынешнему времени уже накоплен большой опыт постановки и решения экономических и тактических задач с помощью математических методов. Особенно успешно развиваются методы оптимизации.
Нелинейное программирование считается одним из наиболее распространенных аппаратов математической теории оптимального принятия решения. Для решения задач нелинейного программирования выработано сложное программное обеспечение, дающее возможность эффективно и надежно решать практические задачи огромных объемов. Эти системы и программы обеспечены прогрессивными системами подготовки исходных данных, средствами их анализа и представления полученных результатов.
Современные методы нелинейного программирования в достаточной степени надежно решают задачи общего вида с несколькими тысячами ограничений и десятками тысяч переменных. Одними из таких методов являются методы квадратичного программирования и минимакса, задачи для которых в данной работе решались в мощном пакете Matlab с помощью научного оптимального подхода методами Optimization Toolbox.
В данной работе мною было решено две задачи, которые я свела к разделению двух множеств точек. Если выпуклые оболочки двух множеств не пересекались, то задача должна была решаться с помощью теоремы отделимости: проводилась разделяющая гиперплоскость, точки находящиеся по одну сторону
гиперплоскости принадлежали одному множеству, а точки, находящиеся по другую ее сторону, принадлежали второму множеству. Для разделения множеств применялись методы нелинейного программирования.
На основании проведенного исследования была решена задача минимакса, квадратичного программирования, также нахождение гиперплоскости, гамм для множеств, сепаратора, классификатора и определена необходимость решения задач, используя эффективные методы классификации с помощью программирования в пакете Matlab. В результате программы, для наглядности, изображены множества и их отделение в графике с помощью функции plot. Разработан программный продукт в пакете Matlab, позволяющий строить классификатор реальных медицинских данных. Программный продукт имеет удобный для пользователя интерфейс с предоставлением наглядных интерпретаций работы программы. Пользователю обеспечена возможность загрузки данных с экрана. Работа программного продукта проверена на тестовых задачах, графически проинтерпретированы результаты решения, проанализированы полученные результаты.
Умение решать задачи такого рода - это полезный инструмент в руках человека, способствующий наилучшему управлению процессами, который пригодится в любой сфере человеческой деятельности.



1. Z.R. Gabidullina. «А Linear Separability Criterion for Sets of Euclidean Space». Received: 6 May 2011/ Accepted: 8 August 2012.
2. В.Ф. Демьянов, B.H. Малоземов, «Введение в минимакс», Главная редакция физико - математической литературы издательства «Наука», 1972, стр.368.
3. А.Г.Трифонов “Optimization Toolbox”.
4. Методы и модели анализа данных: OLAP и Data Mining, стр.336
5. Дьяконов Александр Геннадьевич Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (Практикум на ЭВМ кафедры математических методов прогнозирования): Учебное пособие. - М.: Издательский отдел факультета ВМК МГУ имени М.В. Ломоносова, 2010.
6. В.Дьяконов MATLAB 6: УЧЕБНЫЙ КУРС СПб.: Питер, 2001. — 592 с.: ил.
7. Решение задач квадратичного программирования в среде Matlab. Н. А. Соловьёва, К. Чернэуцану, 12 февраля 2011 г.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ