Тема: Распознавание действий водителя с помощью нейронной сети
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 7
1. ПОДХОДЫ К РАСПОЗНАВАНИЮ ДЕЙСТВИЙ ЧЕЛОВЕКА 9
1.1 Алгоритмы обработки информации и действиях человека 9
1.1.1 Метод Лукаса-Канаде для оптического потока 9
1.1.2 Алгоритм Local SVM (Локального метода опорных векторов) .. 11
1.1.3 Алгоритм SMILE SVM (Имитация отжига алгоритма обучения
множественных состояний алгоритма опорных векторов) 14
1.2 Подходы распознавания действий на основе нейронных сетей 19
1.2.1 Нейросетевая модель Two-Stream I3D 19
1.2.2 Нейросетевая модель Temporal Shift Module (TSM) 21
1.2.3 Нейросетевая модель SlowFast 23
1.2.4 Модель CSN (Channel Separate Network) 25
1.3 Выводы по разделу 26
2. ЗАДАЧА РАСПОЗНАВАНИЯ ДЕЙСТВИЙ ЧЕЛОВЕКА 28
2.1 Постановка задачи распознавания действий человека и исходные
данные 28
2.2 Операции свертки и субдискретизации 30
2.3 Функция активации 32
2.4 Функция потерь 33
2.5 Метрики качества 35
2.6 Архитектура нейронной сети R(2+1)D 36
2.7 Модель оптимизации функции потерь 39
2.8 Обучение нейронной сети с помощью метода обратного
распространения ошибки 40
2.9 Выводы по разделу 43
3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АРХИТЕКТУРЫ R(2+1)D 44
3.1 Конфигурация нейронной сети 44
3.2 Алгоритм классификации действий водителя 46
3.3 Процесс обучения нейронной сети R(2+1)D 49
3.4 Результат работы нейронной сети 51
3.5 Выводы по разделу 52
ЗАКЛЮЧЕНИЕ 54
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 55
ПРИЛОЖЕНИЕ 1 Получение видеофайлов и их сжатие 58
ПРИЛОЖЕНИЕ 2 Построение модели и ее тестирование 60
ПРИЛОЖЕНИЕ 3 Подробное тестирование данных 62
ПРИЛОЖЕНИЕ 4 Обработчик данных 65
ПРИЛОЖЕНИЕ 5 Получение данных и процесс обучения модели 76
📖 Введение
Нынешний уровень развития автопилота не позволяет машине автоматически доехать из пункта А в пункт Б самостоятельно, это сопряжено с большими рисками и поэтому пользователь должен быть сконцентрирован на дороге, о чем забывают некоторые пользователи. Примером вышесказанного может служить Tesla. Tesla - один из крупнейших игроков на рынке электромобилей и автопилота для них, в своих автомобилях. Tesla использует 2-й уровень автопилота по версии организации SAE International (Society of Automotive Engineers - общество автомобильных инженеров) (из 6 возможных от 0 до 5). На данном уровне автоматизации система, в идеальных условиях, способна контролировать движение машины, но сам пользователь должен все время держать руки на руле, чтобы иметь возможность вмешаться в случае непредвиденных обстоятельств. Из-за потенциальной угрозы при предоставлении машины автопилоту необходим контроль над пользователями; необходимы системы, наблюдающие за тем, насколько пользователь сконцентрирован на дороге. Это стало одной из причин того, что Tesla в 2021 году начала встраивать камеру для наблюдения за водителем в свои автомобили «Tesla Model S»», «Tesla Model X» и «Tesla Model 3».
Помимо обозначенной выше задачи распознавания действий существует огромное количество иных задач. Отслеживание информации с камер для человека непосильная задача, при помощи компьютерных мощностей полиция сможет обнаружить потенциально опасные моменты на видео, а магазины смогут находить кражу товара в режиме онлайн, что существенно сократит расходы на безопасность. Использование моделей распознавания действия в стриминговых платформах (Twitch.tv, goodgame.ru), в платформах хранящих и записывающих видеоинформацию (YouTube.com, vk.com) позволит ускорить модерацию контента на предмет нарушения правил площадки или законодательства РФ, что позволит сократить издержки.
Целью данной работы является построение нейросетевой модели, способной распознавать действия водителя. Для достижения поставленной цели необходимо решить набор задач, представленных ниже.
1. Провести анализ предметной области.
2. Изучить возможные подходы к распознаванию действий человека.
3. Подобрать данные для обучения сети.
4. Построить и обучить нейросетевую модель.
5. Протестировать модель и проанализировать ее качество.
✅ Заключение
В первом разделе был проведен анализ существующих алгоритмов и методов распознавания действий, их достоинства и недостатки.
Во втором разделе была сформирована задача распознавания действий, описаны входные данные(набор данных и его предобработка), была рассмотрена архитектура нейронной сети, а так же были проанализированы структуры, используемые в выбранной архитектуре такие как: операция субдискретезации, операция свертки, функция активации ReLU, метод оптимизации стохастического градиента и функция потерь кросс-валидации, функции для вычисления точности обучаемой модели.
Был рассмотрен метод обратного распространения ошибки, где, в качестве ошибки использовалась кросс-энтропия. Для оценки качества работы модели использовались метрики Топ-1, Топ-5.
В третьем пункте была выбрана и реализована модель на языке Python 3.6.9 с использованием библиотеки машинного обучения TensorFlow и среды разработки PyCharm. Модель была обучена, провалидирована. Была выбрана наиболее удачная модель и обучена на тестовом наборе данных.
В ходе работы были решены следующие задачи:
1) проведен анализ предметной области;
2) изучены возможные подходы к распознаванию действий человека;
3) подобраны данные для обучения сети;
4) построена и обучена нейросетевая модель;
5) протестирована модель и проанализировано ее качество.
Таким образом, все поставленные задачи полностью решены и цель достигнута. В дальнейшем можно будет увеличить набор данных и количество изучаемых классов.





