Тема: Развитие методов обучения искусственных нейронных сетей для задач компьютерного зрения
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1.1 Постановка задачи 6
2 Обеливание 7
2.1 Свобода вращения при обеливании 8
2.2 PCA обеливание 10
2.3 ZCA обеливание 11
3 Свёрточные нейронные сети 13
3.1 Реализация СНС 14
3.1.1 Первая архитектура 14
3.1.2 Вторая архитектура 15
4 Результаты 16
5 Заключение 20
6 Список литературы 21
7 Приложение 23
📖 Введение
1. Малый размер набора данных.
2. Недостаток данных определенного типа [1], то есть ситуация, при которой модель не может обучиться качественно работать с некоторым признаком.
3. Несбалансированное обучающее множество [2], в котором доля примеров некоторого класса слишком мала.
4. Ложные корреляции исходных данных [3], когда не зависящие друг от друга признаки имеют схожее поведение. Это может подтолкнуть к ложным выводам о наличии причинно-следственной связи между явлениями.
5. Нерепрезентативность выборочных данных [4], то есть случай, при кото-рой обучающая выборка не отображает свойств генеральной совокупности.
6. Различные условия сбора данных для обучения и дальнейшего применения модели. Характерный пример — обучение и применение модели на двух датасетах с изображениями людей, но сформированных различным образом.
7. Ограниченность доступных для анализа параметров.
8. Присутствие шумов в наборе данных.
Использование таких данных при моделировании может приводить к неверным результатам. Поэтому важным этапом работы с данными является их предварительная обработка.
В 1998 году был представлен набор данных MNIST [5] — маркированный набор изображений рукописного написания цифр. Национальным институтом стандартов и технологий США было предложено использовать этот набор в качестве стандарта для сопоставления методов распознавания изображений с помощью машинного обучения. Распознавание рукописных цифр — сложная проблема, которая интенсивно изучалась в течение многих лет в области распознавания рукописного текста. Многочисленные результаты были достигнуты исследователями, которые использовали различные алгоритмы, такие как
• K-ближайшие соседи (KNNs) [6]
• машины опорных векторов (SVMs) [6]
• нейронные сети (NNs) [7]
• сверточные нейронные сети (CNNs) [8]
Задача распознавания рукописных цифр является важной во многих приложениях, включая автоматизированную сортировку почты по почтовому коду, автоматизированное чтение чеков и налоговых деклараций, а также ввод данных для портативных компьютеров. В этой области достигнут быстрый прогресс. Один из наилучших результатов точности распознавания 99,65% на датасете MNIST был достигнут с помощью 6-слойной свёрточной нейронной сети с предварительно обработанными данными [8].
Одного только усложнения архитектуры моделей CNN недостаточно для достижения лучших результатов точности классификации для любого набора данных. Методы предварительной обработки играют жизненно важную роль в достижении уровня техники в любом наборе данных. В данной работе рассмотрен метод обеливания данных, который является распространенным этапом предварительной обработки в статистическом анализе для преобразования случайных величин в ортогональные. Однако, как будет показано далее, благодаря вращательной свободе поворотов в пространстве признаков существует бесконечно много возможных процедур обеливания.
✅ Заключение
Из полученных графиков точности распознавания моделей обеих архитектур в течение 10 эпох обучения следует, что предварительная обработка изображений PCA-обеливанием значительно замедляет скорость обучения. Даже на случайно преобразованных данных обе модели обучаются лучше. Однако предварительная обработка ZCA-обеливанием, сохраняющая пространственную структуру изображений, улучшает точность распознавания и на обучающей, и на тестовой выборках.
Численные эксперименты, проведенные в рамках работы, показали, что даже при «искажении» исходных данных некоторым (неизвестным для нейронной сети) линейным преобразованием, в результате которого исходное изображение изменяется до неузнаваемости, нейронная сеть оказывается способной хорошо обучиться для распознавания классов. Это наблюдение может быть очень полезно для задач обучения нейронных сетей без разглашения обучающего дата- сета, что имеет большое практическое значение.



