Тема: ЗАДАЧА БИНАРНОЙ КЛАССИФИКАЦИИ С ПРИЛОЖЕНИЕМ К АНАЛИЗУ ИЗОБРАЖЕНИЙ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. ФОРМУЛИРОВКА И МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ БИНАРНОЙ
КЛАССИФИКАЦИИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ 6
1.1. Методы решения задачи бинарной классификации 7
1.2. Извлечения векторов характеристик 11
1.3. Метод скользящего окна для нахождения объектов на изображении 17
2. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ 21
2.1. Обучение классификатора 21
2.2. Детали реализации и результаты исследований 24
2.3. Пользовательский интерфейс 26
2.4. Состав и структура программной системы 28
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 31
ПРИЛОЖЕНИЕ: ПРОГРАММНЫЙ КОД 32
📖 Введение
Большой вклад в теорию машинного обучения, в частности, в теорию распознавания образов, был внесен советским и американским математиком Вапником В.М. [1]—[3]. Вапник рассматривает проблему обучения как проблему оптимизации, что позволяет нам использовать теорию оптимизации при разработке ИИ. В настоящее время машинное обучение представляет собой комбинацию нескольких дисциплин, таких как статистика, теория информации, алгоритмическая теория информации, теория вероятности и функциональный анализ.
В 1963 году Владимиром Вапником и Алексеем Червоненкисом был предложен метод построения оптимальной разделяющей гиперплоскости, на котором основан метод опорных векторов (англ. Support Vector Machine, SVM). Этот метод является одним из популярных алгоритмов машинного обучения с учителем для классификации объектов. Многие успешные приложения, основанные на SVM, были применены в разных областях знаний, таких как классификация документов, анализ цифровых изображений, распознавание символов и биоинформатика.
В данной работе рассматривается вопрос бинарной классификации изображений.
Пусть имеется некоторое число изображений, на каждом из которых присутствует объект определенного типа (например, кошка или треугольник, или жираф, или самолет, или конкретный человек) и некоторое количество изображений, на каждой из которых этот объект отсутствует. Необходимо реализовать метод машинного обучения с учителем, способный определить наличие и дополнительно положение определенного объекта на изображении.
В нашем случае для обучения и тестирования классификатора была использована база снимков «UIUC Image Database for Car Detection», содержащая 1050 изображений для обучения (550 снимков автомобилей и 500 снимков других объектов) и 170 изображений для тестирования [4]-[6]. Мы разработали систему, способную распознавать объект, т.е. автомобиль, при помощи метода обучения с учителем - метода опорных векторов (см. Рис. 1) и определять местоположение объекта, т.е. автомобиля, с помощью метода скользящего окна. Результирующая система, способная обнаруживать автомобили на изображениях, может быть использована как часть программы, определяющей множество классов, или же как самостоятельный классификатор в определенных сферах.
✅ Заключение
Вектора характеристик изображений объекта были вычислены с помощью алгоритма гистограмм направления градиента, HOG. Признаки, полученные на основе HOG, позволили достаточно точно обнаружить на снимках объекты и определить их форму.
Для того, чтобы найти на изображении объекты разных размеров, и имеющих любое расположение, поиск осуществлялся в различных масштабах изображения, и был применен метод скользящего окна. В случае обнаружения объекта на изображении, область, в которой он находится, выделяется прямоугольной рамкой. Разработанный алгоритм также способен устранять повторные обнаружения объектов с помощью метрики IoU.
Полученная система поиска объектов на тестовой выборке имела точность 0.94 и полноту 0.83. Данные результаты свидетельствуют о потенциале полученного алгоритма для распознавания объектов на цифровых изображениях. Также, в виду своей универсальности, система может быть использована для классификации любых объектов в случае доступности соответствующих данных для обучения.
Дальнейшая работа будет посвящена исследованию вопросов обнаружения и классификации объектов на цифровых изображениях или видео последовательностях другими методами машинного обучения с учителем, а также применению этих методов к решению практических задач, возникающих в таких областях, как медицина, системы поиска или системы безопасности, где задача классификации изображений наиболее востребована.



