📄Работа №212163

Тема: Распознавание действий водителя с помощью нейронной сети

📝
Тип работы Дипломные работы, ВКР
📚
Предмет математика и информатика
📄
Объем: 55 листов
📅
Год: 2021
👁️
Просмотров: 15
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Аннотация
ВВЕДЕНИЕ 7
1. ПОДХОДЫ К РАСПОЗНАВАНИЮ ДЕЙСТВИЙ ЧЕЛОВЕКА 9
1.1 Алгоритмы обработки информации и действиях человека 9
1.1.1 Метод Лукаса-Канаде для оптического потока 9
1.1.2 Алгоритм Local SVM (Локального метода опорных векторов) .. 11
1.1.3 Алгоритм SMILE SVM (Имитация отжига алгоритма обучения
множественных состояний алгоритма опорных векторов) 14
1.2 Подходы распознавания действий на основе нейронных сетей 19
1.2.1 Нейросетевая модель Two-Stream I3D 19
1.2.2 Нейросетевая модель Temporal Shift Module (TSM) 21
1.2.3 Нейросетевая модель SlowFast 23
1.2.4 Модель CSN (Channel Separate Network) 25
1.3 Выводы по разделу 26
2. ЗАДАЧА РАСПОЗНАВАНИЯ ДЕЙСТВИЙ ЧЕЛОВЕКА 28
2.1 Постановка задачи распознавания действий человека и исходные
данные 28
2.2 Операции свертки и субдискретизации 30
2.3 Функция активации 32
2.4 Функция потерь 33
2.5 Метрики качества 35
2.6 Архитектура нейронной сети R(2+1)D 36
2.7 Модель оптимизации функции потерь 39
2.8 Обучение нейронной сети с помощью метода обратного
распространения ошибки 40
2.9 Выводы по разделу 43
3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АРХИТЕКТУРЫ R(2+1)D 44
3.1 Конфигурация нейронной сети 44
3.2 Алгоритм классификации действий водителя 46
3.3 Процесс обучения нейронной сети R(2+1)D 49
3.4 Результат работы нейронной сети 51
3.5 Выводы по разделу 52
ЗАКЛЮЧЕНИЕ 54
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 55
ПРИЛОЖЕНИЕ 1 Получение видеофайлов и их сжатие 58
ПРИЛОЖЕНИЕ 2 Построение модели и ее тестирование 60
ПРИЛОЖЕНИЕ 3 Подробное тестирование данных 62
ПРИЛОЖЕНИЕ 4 Обработчик данных 65
ПРИЛОЖЕНИЕ 5 Получение данных и процесс обучения модели 76

📖 Введение

В настоящее время подавляющее количество дорожно-транспортных происшествий происходит по причине невнимательности, отвлеченности водителя от дороги. В силу этого разрабатываются системы умных помощников для помощи водителю, помощник собирает множество информации как из внутренней части автомобиля: положение рук, взгляд, совершаемые действия (разговор по телефону, еда в салоне, питье и т.д.), так и с внешней стороны: стиль вождения, погодные условия и многое другое. Важной характеристикой отвлеченности водителя служит то, где находятся его руки с сконцентрирован взгляд, иными словами какие действия он совершает, насколько сильно его действия отвлекают его от вождения транспорта. Умный помощник может позволить предотвратить возникновение опасных ситуаций информированием водителя об опасности и акцентировании его внимания на управлении транспортным средством
Нынешний уровень развития автопилота не позволяет машине автоматически доехать из пункта А в пункт Б самостоятельно, это сопряжено с большими рисками и поэтому пользователь должен быть сконцентрирован на дороге, о чем забывают некоторые пользователи. Примером вышесказанного может служить Tesla. Tesla - один из крупнейших игроков на рынке электромобилей и автопилота для них, в своих автомобилях. Tesla использует 2-й уровень автопилота по версии организации SAE International (Society of Automotive Engineers - общество автомобильных инженеров) (из 6 возможных от 0 до 5). На данном уровне автоматизации система, в идеальных условиях, способна контролировать движение машины, но сам пользователь должен все время держать руки на руле, чтобы иметь возможность вмешаться в случае непредвиденных обстоятельств. Из-за потенциальной угрозы при предоставлении машины автопилоту необходим контроль над пользователями; необходимы системы, наблюдающие за тем, насколько пользователь сконцентрирован на дороге. Это стало одной из причин того, что Tesla в 2021 году начала встраивать камеру для наблюдения за водителем в свои автомобили «Tesla Model S»», «Tesla Model X» и «Tesla Model 3».
Помимо обозначенной выше задачи распознавания действий существует огромное количество иных задач. Отслеживание информации с камер для человека непосильная задача, при помощи компьютерных мощностей полиция сможет обнаружить потенциально опасные моменты на видео, а магазины смогут находить кражу товара в режиме онлайн, что существенно сократит расходы на безопасность. Использование моделей распознавания действия в стриминговых платформах (Twitch.tv, goodgame.ru), в платформах хранящих и записывающих видеоинформацию (YouTube.com, vk.com) позволит ускорить модерацию контента на предмет нарушения правил площадки или законодательства РФ, что позволит сократить издержки.
Целью данной работы является построение нейросетевой модели, способной распознавать действия водителя. Для достижения поставленной цели необходимо решить набор задач, представленных ниже.
1. Провести анализ предметной области.
2. Изучить возможные подходы к распознаванию действий человека.
3. Подобрать данные для обучения сети.
4. Построить и обучить нейросетевую модель.
5. Протестировать модель и проанализировать ее качество.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Целью данной работы являлась разработка модели искусственной нейронной сети, которая решает задачу предсказания действий водителя.
В первом разделе был проведен анализ существующих алгоритмов и методов распознавания действий, их достоинства и недостатки.
Во втором разделе была сформирована задача распознавания действий, описаны входные данные(набор данных и его предобработка), была рассмотрена архитектура нейронной сети, а так же были проанализированы структуры, используемые в выбранной архитектуре такие как: операция субдискретезации, операция свертки, функция активации ReLU, метод оптимизации стохастического градиента и функция потерь кросс-валидации, функции для вычисления точности обучаемой модели.
Был рассмотрен метод обратного распространения ошибки, где, в качестве ошибки использовалась кросс-энтропия. Для оценки качества работы модели использовались метрики Топ-1, Топ-5.
В третьем пункте была выбрана и реализована модель на языке Python 3.6.9 с использованием библиотеки машинного обучения TensorFlow и среды разработки PyCharm. Модель была обучена, провалидирована. Была выбрана наиболее удачная модель и обучена на тестовом наборе данных.
В ходе работы были решены следующие задачи:
1) проведен анализ предметной области;
2) изучены возможные подходы к распознаванию действий человека;
3) подобраны данные для обучения сети;
4) построена и обучена нейросетевая модель;
5) протестирована модель и проанализировано ее качество.
Таким образом, все поставленные задачи полностью решены и цель достигнута. В дальнейшем можно будет увеличить набор данных и количество изучаемых классов.
Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Sanchez, J. TV-L1 Optical Flow Estimation / J. Sanchez, G. Facciolo
[и др.] // IPOL Journal. - Режим доступа: https://pdfs.semanticscholar.
org/4300/9b83d691ff6cc8973e701081176b388c355f.pdf - 2013. - 14 p.
2. Вычисление оптического потока методом Лукаса-Канаде. Теория. - Дата обновления: 13.02.2013. URL: https://habr.com/ru/post/169055/ (дата обращения: 22.02.2021).
3. Wang, H. Dense Trajectories and Motion Boundary Descriptors for Action Recognition / H. Wang, C. Schmid [и др.] // Режим доступа: https://www.researchgate.net/publication/257672334_Dense_Trajectories_and_ Motion_Boundary_Descriptors_for_Action_Recognition. - International Journal of Computer Vision. - 2013. - 21 p.
4. Laptev, I. Recognizing Human Actions: A Local SVM Approach / I. Laptev, B. Caputo [и др.] // ICPR. - Режим доступа: https://www.csd.uwo.ca/ ~oveksler/Courses/Fall2011/9840/StudentPapers/icpr04actions.pdf. - 2004. - 5 p.
5. SVM. Объяснение с нуля и реализация на python. Подробный
разбор метода опорных векторов. - Дата обновления: 23.01.2020. URL: https://habr.com/ru/company/ods/blog/484148/ (дата обращения:
03.03.2021).
6. Laptev, I. Space-time Interest Points / I. Laptev, T. Lindeberg // IJCV. - Режим доступа: https://www.irisa.fr/vista/Papers/2003_iccv_laptev.pdf. - 2003. - 8 p.
7. Метод k-средних. - Дата обновления: 08.05.2016. URL: http://datascientist.one/k-means-algorithm/ (дата обращения: 25.02.2021).
8. Hu, Y. Action detection in complex scenes with spatial and temporal
ambiguities / Y. Hu, S. Yan [и др.] // IEEE International Conference on Computer Vision (ICCV). - Режим доступа: https://core.ac.uk/download/pdf/
193220071.pdf. - 2009. - 8 p.
9. Davis, J.W. The recognition of human movement using temporal templates / J.W. Davis, A. Bobick // CVPR. - Режим доступа: https: //www.researchgate.net/publication/3703122_The_recognition_of_human_ movement_using_temporal_templates. - 1997. - 8 p.
10. Kim, K. Real-time foreground-background segmentation using
codebook model / K. Kim, D. Harwood [и др.] // Real Time Imaging - Режим доступа: https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.403.9209
&rep=rep1&type=pdf. - 2005. - 8 p.
11. Feature Engineering for Images: A Valuable Introduction to the HOG
Feature Descriptor. - Дата обновления: 04.09.2019. URL:
https://www. analyticsvidhya. com/blog/2019/09/feature-engineering-images- introduction-hog-feature-descriptor/ (Дата обращения 15.02.2021).
12. Histogram of Oriented Gradients explained using OpenCV. - Дата обновления: 06.11.2016. URL: https https://learnopencv.com/histogram-of- oriented-gradients/ (дата обращения: 04.03.2021).
13. Zisserman, A. Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset / J. Carreira, A Zisserman // CoRR. - Режим доступа: https://arxiv.org/pdf/1705.07750.pdf. - 2018. - 10 p.
14. Lin, J. Temporal shift module for efficient video understanding / J. Lin, C. Gan [и др.] // CoRR. - Режим доступа: https://arxiv.org/pdf/1811. 08383.pdf. - 2018. - 13 p.
15. Wang, L. Temporal Segment Networks: Towards Good Practices for Deep Action Recognition / L. Wang, Y. Xiong [и др.] // CoRR. - Режим доступа: https://arxiv.org/pdf/1608.00859v1.pdf. - 2016. - 16 p...25

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ