Тема: Синтез изображений лиц с помощью глубоких нейронных сетей
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
1.1 Обзор существующих аналогичных решений 9
1.2 Анализ методов и алгоритмов 10
1.3 Аналитическое и математическое описание модели 16
Выводы по главе один 25
2 ПРОЕКТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
2.1 Выбор алгоритма для нейронной сети 26
2.2 Выбор среды программирования 32
2.3 Проектирование приложения 37
2.4 Аппаратное обеспечение 41
Выводы по главе два 44
3 РЕАЛИЗАЦИЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
3.1 Создание интерфейса 45
3.2 Тестирование приложения 49
3.3 Экономическое обоснование разработки 60
Выводы по главе три 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 66
ПРИЛОЖЕНИЯ
ПРИЛОЖЕНИЕ А. Листинг части ПО интерфейса Android 68
ПРИЛОЖЕНИЕ Б. Листинг части ПО доступа к камере Android 69
ПРИЛОЖЕНИЕ В. Листинг реализации нейронной сети 74
ПРИЛОЖЕНИЕ Г. Листинг алгоритма ПО распознавание лиц 76
ПРИЛОЖЕНИЕ Д. Листинг алгоритма ПО улучшение DPI 82
📖 Введение
Распознавание изображения - очень сложная задача с теоретической и практической точек зрения. Человек, например, задействует для этого весь комплекс знаний и опыта. Он определяет текст из совокупности сигналов органов чувств, выделяет каждый символ, выделяет характерные признаки символов и на основании своего опыта приходит к выводу о значении символа и всего текста в целом.
Распознавание изображений - это способность камеры распознавать и обнаруживать объекты или функции в цифровом изображении или видео. Это метод для захвата, обработки, изучения и обработки изображений. Для идентификации и обнаружения изображений компьютеры используют технологию машинного зрения, основанную на системе искусственного интеллекта. Типичный алгоритм распознавания изображений включает в себя следующее:
• оптическое распознавание символов;
• сопоставление с образцом и градиентное сопоставление;
• распознавание лица;
• соответствие знака;
• идентификация сцены.
Технология распознавания изображений работает путем обнаружения значимых областей, которые представляют собой большую часть информации об изображении или объекте. Это достигается путем выделения наиболее информативных частей или элементов в выбранном изображении и их локализации, игнорируя при этом остальные функции, которые могут не представлять особого интереса. Процесс использует алгоритм распознавания изображений, также известный как классификатор изображений, который принимает изображение в качестве входных данных и выводит то, что содержит изображение. Чтобы алгоритм знал, что содержит изображение, его необходимо обучить, чтобы узнать различия между классами. Например, если целью системы распознавания изображений является обнаружение и идентификация собак, алгоритм распознавания изображений должен быть обучен с тысячами изображений лиц и тысячами изображений фонов, которые не содержат лиц [15].
В коммерческом мире основными приложениями распознавания изображений являются распознавание лиц, безопасность и наблюдение, визуальная геолокация, распознавание объектов, распознавание жестов, распознавание кода, промышленная автоматизация, анализ изображений в медицинской помощи и помощь водителю. Эти приложения революционизируют мир бизнеса во многих отраслях.
Распознавание изображений широко применяется в электронной коммерции, включая поиск и рекламу. Сегодня мобильные приложения используют технологию для идентификации конкретных продуктов, предоставляя потенциальным клиентам более увлекательный опыт работы с окружающим миром. Он представляет более интерактивный взгляд на мир, делая все для поиска.
Технология распознавания изображений может помочь в процессе идентификации во время деловых операций. Примером этого может быть замена традиционных идентификационных карт на Face ID. На рабочем месте это может использоваться для определения, предоставляется ли человеку доступ к официальным рабочим документам или просто для регистрации. Другой пример, где распознавание изображений применимо для эффективных бизнес-операций, находится в производственном процессе. Машины с распознаванием изображений могут автоматически обнаруживать дефектные продукты в производственном конвейере.
Автомобили с самостоятельным вождением пользуются популярностью в автомобильной промышленности и уже проходят испытания в США и других частях мира. Эти достижения в автомобильном мире стали возможными благодаря технологии компьютерного зрения, которая использует распознавание изображений AI. Системы компьютерного зрения, основанные на глубоком обучении, обучаются с использованием тысяч изображений, таких как дорожные знаки, дорожки, движущиеся объекты, транспортные средства и люди, и передаются в нейронные сети системы. Системы становятся интеллектуальными, так как в систему поступает больше обучающих данных, и это обеспечивает автономное вождение.
Компьютер ошибается в процессе распознавания намного чаще человека. Сегодня не существует точного метода определения лица по их изображению. Многие разработанные коммерческие проекты используют свои запатентованные методы и не могут похвастаться идеальным решением задачи.
Тема работы: «Синтез изображений лиц с помощью глубоких нейронных сетей».
Актуальность темы исследования обусловлена тем, что существует большое количество практически важных задач, для решения которых необходимо распознавание лиц на фото- или видеоизображениях.
Объектом исследования является распознавание образов при помощи алгоритмов нейронных сетей.
Предмет исследования - разработка системы распознавания лиц на изображениях.
Исследование состоит в разработке аналога алгоритма распознавания изображения для слабовидящих людей. Алгоритм и созданное на его основе программное обеспечения используют технологию нейронной сети для поставленной задачи с применением нового метода обучения.
Целью данной работы является создание программного обеспечения для распознавания лиц с высокой скоростью на различных изображениях.
Поставлены следующие задачи:
• исследование и анализ существующих методов на предмет эффективного распознавания образов;
• разработка модели представления изображений;
• исследование применения нейронных сетей;
• разработка алгоритмов предварительной обработки и распознавания;
• выбор метода распознавания;
• создание и тестирование программного обеспечения.
✅ Заключение
Проведен обзор существующих аналогичных решений для распознавания и повышение качества лиц, разработана функциональная модель приложения, осуществлено проектирование приложения и выбрана среда программирования, создан интерфейс, написан код программы и проведено тестирование программного обеспечения.
Обучение модели нейронной сети:
• 211 тысяч итераций (эпох);
• dataset (набор данных) из 10 тысяч лиц.
Результат тестирования программного обеспечения:
• время итерации в среднем составило 0.709 миллисекунд;
• ошибка генератора 0.0955;
• ошибка дискриминатора 0.1292;
• обучение по распознаванию лиц достигает 95% точности.
По проведенному анализу можно утверждать, что разработанная система распознавания изображений для слабовидящих людей работает корректно. Хорошее качество выходных данных и визуальное подтверждение повышении DPI на изображении при его 8-ми кратном увеличении. Разрешение изображения после обучения преобразовалось из 610 на 552 пикселя в 3660 на 3312 пикселя с повышенным визуальным качеством.



