📄Работа №211461

Тема: Синтез изображений лиц с помощью глубоких нейронных сетей

📝
Тип работы Дипломные работы, ВКР
📚
Предмет информатика
📄
Объем: 84 листов
📅
Год: 2020
👁️
Просмотров: 23
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ВВЕДЕНИЕ 6
1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
1.1 Обзор существующих аналогичных решений 9
1.2 Анализ методов и алгоритмов 10
1.3 Аналитическое и математическое описание модели 16
Выводы по главе один 25
2 ПРОЕКТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
2.1 Выбор алгоритма для нейронной сети 26
2.2 Выбор среды программирования 32
2.3 Проектирование приложения 37
2.4 Аппаратное обеспечение 41
Выводы по главе два 44
3 РЕАЛИЗАЦИЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
3.1 Создание интерфейса 45
3.2 Тестирование приложения 49
3.3 Экономическое обоснование разработки 60
Выводы по главе три 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 66
ПРИЛОЖЕНИЯ
ПРИЛОЖЕНИЕ А. Листинг части ПО интерфейса Android 68
ПРИЛОЖЕНИЕ Б. Листинг части ПО доступа к камере Android 69
ПРИЛОЖЕНИЕ В. Листинг реализации нейронной сети 74
ПРИЛОЖЕНИЕ Г. Листинг алгоритма ПО распознавание лиц 76
ПРИЛОЖЕНИЕ Д. Листинг алгоритма ПО улучшение DPI 82

📖 Введение

Распознавание образов является одной из самых изученных задач в таких областях, как цифровая обработка изображений, компьютерное зрение, биометрия, создание интеллектуальных систем безопасности и контроля доступа и т. п. Тем не менее, в области распознавания образов продолжают представлять большой научный и практический интерес такие задачи как распознавание лиц, жестов, текстов, отпечатков пальцев, моделей помещений и другой графической информации. Широко исследуемой проблемой является распознавание образов (изображений).
Распознавание изображения - очень сложная задача с теоретической и практической точек зрения. Человек, например, задействует для этого весь комплекс знаний и опыта. Он определяет текст из совокупности сигналов органов чувств, выделяет каждый символ, выделяет характерные признаки символов и на основании своего опыта приходит к выводу о значении символа и всего текста в целом.
Распознавание изображений - это способность камеры распознавать и обнаруживать объекты или функции в цифровом изображении или видео. Это метод для захвата, обработки, изучения и обработки изображений. Для идентификации и обнаружения изображений компьютеры используют технологию машинного зрения, основанную на системе искусственного интеллекта. Типичный алгоритм распознавания изображений включает в себя следующее:
• оптическое распознавание символов;
• сопоставление с образцом и градиентное сопоставление;
• распознавание лица;
• соответствие знака;
• идентификация сцены.
Технология распознавания изображений работает путем обнаружения значимых областей, которые представляют собой большую часть информации об изображении или объекте. Это достигается путем выделения наиболее информативных частей или элементов в выбранном изображении и их локализации, игнорируя при этом остальные функции, которые могут не представлять особого интереса. Процесс использует алгоритм распознавания изображений, также известный как классификатор изображений, который принимает изображение в качестве входных данных и выводит то, что содержит изображение. Чтобы алгоритм знал, что содержит изображение, его необходимо обучить, чтобы узнать различия между классами. Например, если целью системы распознавания изображений является обнаружение и идентификация собак, алгоритм распознавания изображений должен быть обучен с тысячами изображений лиц и тысячами изображений фонов, которые не содержат лиц [15].
В коммерческом мире основными приложениями распознавания изображений являются распознавание лиц, безопасность и наблюдение, визуальная геолокация, распознавание объектов, распознавание жестов, распознавание кода, промышленная автоматизация, анализ изображений в медицинской помощи и помощь водителю. Эти приложения революционизируют мир бизнеса во многих отраслях.
Распознавание изображений широко применяется в электронной коммерции, включая поиск и рекламу. Сегодня мобильные приложения используют технологию для идентификации конкретных продуктов, предоставляя потенциальным клиентам более увлекательный опыт работы с окружающим миром. Он представляет более интерактивный взгляд на мир, делая все для поиска.
Технология распознавания изображений может помочь в процессе идентификации во время деловых операций. Примером этого может быть замена традиционных идентификационных карт на Face ID. На рабочем месте это может использоваться для определения, предоставляется ли человеку доступ к официальным рабочим документам или просто для регистрации. Другой пример, где распознавание изображений применимо для эффективных бизнес-операций, находится в производственном процессе. Машины с распознаванием изображений могут автоматически обнаруживать дефектные продукты в производственном конвейере.
Автомобили с самостоятельным вождением пользуются популярностью в автомобильной промышленности и уже проходят испытания в США и других частях мира. Эти достижения в автомобильном мире стали возможными благодаря технологии компьютерного зрения, которая использует распознавание изображений AI. Системы компьютерного зрения, основанные на глубоком обучении, обучаются с использованием тысяч изображений, таких как дорожные знаки, дорожки, движущиеся объекты, транспортные средства и люди, и передаются в нейронные сети системы. Системы становятся интеллектуальными, так как в систему поступает больше обучающих данных, и это обеспечивает автономное вождение.
Компьютер ошибается в процессе распознавания намного чаще человека. Сегодня не существует точного метода определения лица по их изображению. Многие разработанные коммерческие проекты используют свои запатентованные методы и не могут похвастаться идеальным решением задачи.
Тема работы: «Синтез изображений лиц с помощью глубоких нейронных сетей».
Актуальность темы исследования обусловлена тем, что существует большое количество практически важных задач, для решения которых необходимо распознавание лиц на фото- или видеоизображениях.
Объектом исследования является распознавание образов при помощи алгоритмов нейронных сетей.
Предмет исследования - разработка системы распознавания лиц на изображениях.
Исследование состоит в разработке аналога алгоритма распознавания изображения для слабовидящих людей. Алгоритм и созданное на его основе программное обеспечения используют технологию нейронной сети для поставленной задачи с применением нового метода обучения.
Целью данной работы является создание программного обеспечения для распознавания лиц с высокой скоростью на различных изображениях.
Поставлены следующие задачи:
• исследование и анализ существующих методов на предмет эффективного распознавания образов;
• разработка модели представления изображений;
• исследование применения нейронных сетей;
• разработка алгоритмов предварительной обработки и распознавания;
• выбор метода распознавания;
• создание и тестирование программного обеспечения.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Разработано программное обеспечение для носимых устройств, доступных слабовидящим людям (смартфоны и планшетные компьютеры), работающие на операционной системе Android. Разработка увеличивает качество снятого изображения с фото- и видеокамеры, что позволяет лучше разглядеть лицо человека людям, имеющим нарушение со зрением.
Проведен обзор существующих аналогичных решений для распознавания и повышение качества лиц, разработана функциональная модель приложения, осуществлено проектирование приложения и выбрана среда программирования, создан интерфейс, написан код программы и проведено тестирование программного обеспечения.
Обучение модели нейронной сети:
• 211 тысяч итераций (эпох);
• dataset (набор данных) из 10 тысяч лиц.
Результат тестирования программного обеспечения:
• время итерации в среднем составило 0.709 миллисекунд;
• ошибка генератора 0.0955;
• ошибка дискриминатора 0.1292;
• обучение по распознаванию лиц достигает 95% точности.
По проведенному анализу можно утверждать, что разработанная система распознавания изображений для слабовидящих людей работает корректно. Хорошее качество выходных данных и визуальное подтверждение повышении DPI на изображении при его 8-ми кратном увеличении. Разрешение изображения после обучения преобразовалось из 610 на 552 пикселя в 3660 на 3312 пикселя с повышенным визуальным качеством.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1 Форсайт, Д.А. Компьютерное зрение. Современный подход / Д.А. Форсайт, Д. Понс. - М.: Вильямс, 2004. - 928 с.
2 Русскоязычное IT-сообщество «Хабр» [Электронный ресурс]. - Режим
доступа: https://habr.com/ru/. - Загл. с экрана. Дата обращения: 04.06.2020.
3 Левитин, А.В. Алгоритмы: введение в разработку и анализ /
А.В. Левитин. - М.: «Вильямс», 2006. - 576 с.
4 Универсальная интернет-энциклопедия «Википедия» [Электронный ресурс]. - Режим доступа: https://ru.wikipedia.org/. - Загл. с экрана. Дата обращения: 04.06.2020.
5 Шолле, Ф. Глубокое обучение на Python / Ф. Шолле. - М.: Изд-во «Питер», 2018. - 400 с.
6 Библиотека программиста «ProgLib» [Электронный ресурс]. - Режим доступа: https://proglib.io/. - Загл. с экрана. Дата обращения: 04.06.2020.
7 Кучуганов, А.В. Распознавание изображения / А.В. Кучуганов, Г.В. Лапинская. - И.: Мир, 2006. - 514 с.
8 Нейронные сети «Neurohive» [Электронный ресурс]. - Режим доступа: https://neurohive.io/. - Загл. с экрана. Дата обращения: 04.06.2020.
9 Wiki ресурс «Техническое зрение» [Электронный ресурс]. - Режим доступа: http://wiki.technicalvision.ru/. - Загл. с экрана. Дата обращения: 04.06.2020.
10 Гудфеллоу, Я. Глубокое обучение / Я. Гудфеллоу, И. Бенджио, А. Курвилль. - М.: Изд-во ДМК Пресс, 2017. - 653 с.
11 Машинное зрение и распознавание образов «МИСиС» [Электронный ресурс]. - Режим доступа: http://science.misis.ru/ru/nauchnapravleniy/1035/10100/. - Загл. с экрана. Дата обращения: 04.06.2020.
12 Орловская, С.А. Проблемы принятия решений при нечетких данных / С.А. Орловская. - М.: Электронный журнал «Исследовано в России», 2015. - 208 с.
13 Machine Learning and Data Science Community «Kaggle» [Электронный
ресурс]. - Режим доступа: https://www.kaggle.com/. - Загл. с экрана. Дата
обращения: 04.06.2020.
14 Фурман, Я.А. Введение в контурный анализ и его приложения к обработке изображений и сигналов / Я.А. Фурман. - М.: ФИЗМАТЛИТ, 2002. - 592 с.
15 Образовательное IT-сообщество «КОРПУС» [Электронный ресурс]. - Режим доступа: https://korpus.everypixel.com/. - Загл. с экрана. Дата обращения: 04.06.2020.
16 An introduction to Neural Networks [Электронный ресурс]. - Режим доступа: http://www.explainthatstuff.com/introduction-to-neural-networks.html. - Загл. с экрана. Дата обращения: 04.06.2020.
17 Мандел, Т. Разработка пользовательского интерфейса / Т. Мандел - М.: ДМК Пресс, 2004. - 416 с.
18 Нильсен, Я.Н. Mobile Usability. Как создавать идеально удобные приложения для мобильных устройств / Я.Н. Нильсен, Р.П. Будиу. - М.: Изд-во «Эксмо», 2013. - 256 с.
19 Eclipse documentation [Электронный ресурс]. - Режим доступа: https://help.eclipse.org/2020-03/index.jsp. - Загл. с экрана. Дата обращения: 04.06.2020.
20 Wikitude JS Android SDK [Электронный ресурс]. - Режим доступа: https://www.wikitude.com/. - Загл. с экрана. Дата обращения: 04.06.2020.
21 Мик, Б.Г. Программирование под Android / Б.Г. Мик, З.С. Медникс, М.Н. Накамура. - М.: Изд-во «Питер», 2013. - 560 с.
22 Общие сведения о платформе Android [Электронный ресурс]. - Режим доступа: https://developer.android.com/guide. - Загл. с экрана. Дата обращения: 04.06.2020.
23 Progressive Face Super-Resolution [Электронный ресурс]. - Режим доступа: https://github.com/DeokyunKim/Progressive-Face-Super-Resolution. - Загл. с экрана. Дата обращения: 04.06.2020.
24 Gigapixel AI - Topaz Labs [Электронный ресурс]. - Режим доступа: https://topazlabs.com/. - Загл. с экрана. Дата обращения: 04.06.2020.
25 DeepFaceLab [Электронный ресурс]. - Режим доступа: https://github.com/iperov/DeepFaceLab. - Загл. с экрана. Дата обращения: 04.06.2020.
26 Вендров, А.М. Проектирование программного обеспечения экономических информационных систем / А.М. Вендров. - М.: Финансы и статистика, 2006 - 352 с.
27 Notebook Google Colab [Электронный ресурс]. - Режим доступа: https://colab.research.google.com/notebooks/io.ipynb. - Загл. с экрана. Дата обращения: 04.06.2020.

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ