Тема: СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ БИНАРНОЙ КЛАССИФИКАЦИИ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. Формулировка и методы решения задачи бинарной классификации 7
1.1. Задача бинарной классификации 7
1.2. Формулировка SVM 7
1.3. Обучение SVM 13
2. Экспериментальные исследования 20
2.1. Постановка экспериментов 20
2.2. Критерии качества модели 21
2.3. Статистический анализ 23
3. Детали имплементации 24
4. Результаты 31
4.1. Сравнение точности работы алгоритмов 31
4.2. Сравнение скорости сходимости алгоритмов 34
ЗАКЛЮЧЕНИЕ 35
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 37
СПИСОК ИЛЛЮСТРИРОВАННОГО МАТЕРИАЛА 39
СПИСОК ТАБЛИЦ 40
ПРИЛОЖЕНИЕ. Листинг
📖 Введение
Особую популярность ИИ имеют в области компьютерного зрения. Таким образом приложения ИИ получили особый стимул к развитию после запуска проекта ILSVRC (англ. ImageNet Large Scale Visual Recognition Challenge), в рамках которого сверточная нейронная сеть показала беспрецедентное улучшение качества классификации изображений в сравнении с существующими на тот момент методами машинного обучения.
Независимо от области, в которой они используются, множество приложений ИИ реализованы методами машинного обучения (см. Рис. 1). В частности, многие практические задачи, такие как обнаружение объекта на видеозаписи или прогнозирование реакции на лечение на основе генетической предрасположенности, сводятся к задаче классификации. В таком случае, для каждого интересующего нас объекта формируется вектор признаков, и каждому из них присваиваются метки класса. В большинстве случаев требуется решить задачу многоклассовой классификации, но бинарная классификация составляет базу для всех других видов классификации. Таким образом, задачу многоклассовой классификации можно свести к бинарной с использованием таких методов, как «один против всех».
Значительный вклад в теорию машинного обучения, в частности в классификацию объектов, внес Вапник В.М., который имел математический взгляд на задачу машинного обучения. Вапник предложил рассматривать обучение как задачу оптимизации [3], что дает возможность применить теорию оптимизации при разработке систем искусственного интеллекта. В данный момент машинное обучение включает в себя множество дисциплин, такие как математическая статистика, теория информации, теория алгоритмов, теория вероятностей и функциональный анализ.
В 1963 году Владимир Вапник и Алексей Червоненкис предложили метод построения оптимальной разделяющей гиперплоскости, который стал основой для разработки метода опорных векторов (англ. Support Vector Machine, SVM) [4]. Метод стал одним из самых популярных алгоритмов машинного обучения с учителем для классификации объектов. Реализовано множество успешных приложений, использующих в своей основе SVM и примененных в различных областях, как анализ изображений, распознавание символов, биоинформатика и классификация документов.
Часто, опираясь на регрессионный анализ или на свойства задачи регрессионного анализа, мы предполагаем для оценки отклонения при построении классификационной гиперплоскости использовать критерий минимизации суммы квадратов отклонений, то есть мы проводим гиперплоскость так, чтобы она на обучающей последовательности минимизировала сумму квадратов отклонений с двух сторон. Однако, стоит заметить, что это не единственный критерий, а также нам не известен тип и свойства данных, которые берутся для классификации.
Когда отклонения в обучающих данных небольшие, тогда метод наименьших квадратов дает улучшение при классификации. В том случае, когда есть достаточно большие выбросы, тогда используются другие критерии, например, негладкие или равномерные. Наша задача сравнить критерии разного типа, таким образом, наша задача состоит в том, чтобы сравнить известный традиционный критерий и новый нетрадиционный критерий. В данном случае мы берем критерий по минимизации максимального отклонения, который дает равномерное отклонение.
В данной работе были реализованы два линейных классификатора с наиболее распространенными критериями: базовый SVM, который использует минимизацию сумму квадратов отклонений, и модифицированный SVM с равномерными штрафами, то есть с критерием минимизации максимума отклонений. Для решения возникающих задач используются методы бикоординатного типа [5].
Одной из задач диссертационной работы является проведение сравнительного анализа двух реализованных нами алгоритмов бинарной классификации. В рамках наших экспериментов для обучения и тестирования моделей использовалась база данных «Ирисы Фишера», содержащая данные о трех видах ирисов (по 50 экземпляров каждый). В нашем случае перед нами стояла задача отделения вида «Ириса виргинского» (англ. Iris virginica) от двух других, «Ириса щетинистого» (англ. Iris setosa) и «Ириса разноцветного» (англ. Iris versicolor). Далее нами были сравнены точность и скорость схождения обученных классификаторов. Результаты наших экспериментов продемонстрировали статистически значимые улучшения нового классификатора как с точки зрения точности, так и скорости обучения, по сравнению с базовым алгоритмом SVM. Таким образом, этот метод может быть реализован в реальных приложениях, как более эффективный с точки
Цель нашей работы провести сравнительный анализ алгоритмов бинарной классификации.
В рамках нашей диссертационной работы получены следующие новые научные результаты:
- разработан алгоритм линейного SVM с равномерными штрафами;
- разработан алгоритм обучения для нового алгоритма SVM;
- проведен сравнительный анализ двух алгоритмов бинарной классификации.
Для решения поставленной задачи нами были применены методы теории оптимизации, машинного обучения и математической статистики. Для практической реализации были использованы современные методы программирования на языке Python в веб-оболочке Jupyter Notebook.
✅ Заключение
Наши эксперименты, проведенные на основе базы данных «Ирисы Фишера», демонстрируют, что новый алгоритм имеет статистически значимые улучшения показаний численных метрик качества классификации, таких как Accuracy, Precision и fl-score. Значение оценки Recall были на том же уровне, что и у стандартной модели SVM, то есть без существенных различий, что указывало на то, что источником значительного улучшения на 9,0% для показателя fl-score была метрика Precision (со статистически значимым улучшением на 14,0%). Данные результаты могут оказать положительное влияние на решение таких задач, как лабораторная диагностика по снимкам. Увеличение значения критерия Precision позволит снизить число ложной постановки диагноза, что в свою очередь поспособствует уменьшению числа пациентов, которым потребуются дальнейшие медицинские обследования. Это снизит как психологическое давление на них, так и финансовые затраты, связанные с проведением дополнительных тестов [13].
Количество итераций, необходимых для схождения метода, также оказывают влияние на выбор модели на практике. Как показывают результаты наших экспериментов, предлагаемый новый метод может уменьшить количество итераций со статистически значимой разницей. Таким образом, его имплементация в реальных приложениях и системах может потенциально снизить временные затраты на обучение. Для оценки качества работы алгоритмов был использован метод MCCV. Поскольку основной целью было сравнительное изучение двух алгоритмов, для того, чтобы сравнение было справедливым, оба метода были обучены и протестированы на одних и тех же наборах данных, а также были использованы одинаковые исходные параметры. Критерием оценки метрик качества методов послужил Т-критерий Вилкоксона.
В заключении нами была разработана и реализована новая модификация алгоритма линейного SVM: в предложенном методе используется новый способ регуляризации. Эксперименты с использованными данными продемонстрировали статистически значимые улучшения как с точки зрения точности, так и скорости обучения по сравнению с базовым алгоритмом SVM. Таким образом, этот метод может быть реализован в реальных приложениях.
Дальнейшая работа будет посвящена исследованию вопросов улучшения качества работы и реализации нового метода, формированию других критериев оценки отклонения классификатора SVM, а также анализу работы алгоритмов на разных типах распределения данных, определению случаев, когда проведение классификации предпочтительнее новым методом.



