📄Работа №187557

Тема: Разработка системы распознавания речи с использованием методов машинного обучения

Характеристики работы

Тип работы Дипломные работы, ВКР
Робототехника
Предмет Робототехника
📄
Объем: 43 листов
📅
Год: 2023
👁️
Просмотров: 77
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Аннотация 2
Введение 5
1. Постановка задачи 6
2. База данных 7
2.1. Вектор признаков 7
2.2. Вектор меток 13
3. Определение искусственной нейронной сети 14
4. Нейронная сеть 18
5. Оптимизация 24
6. Метрики точности классификации 29
7. Результаты работы алгоритма 31
Заключение 33
Список использованных источников и литературы 34
Приложение А Результаты работы первой модели без слоев исключения 35
Приложение Б Результаты работы первой модели со слоями исключения 37
Приложение В Результаты работы итоговой модели с оптимизатором SGD 39
Приложение Г Результаты работы итоговой модели с оптимизатором Adam 40
Приложение Д Результаты работы итоговой модели с оптимизатором Adadelta 41

📖 Аннотация

Работа посвящена разработке системы чтения по губам на основе методов машинного обучения. Актуальность исследования обусловлена необходимостью создания вспомогательных технологий для людей с нарушениями слуха, а также задачами улучшения распознавания речи в условиях шума или при низком качестве аудиозаписи, что критично для систем видеохостинга, образовательной среды и публичных пространств. В ходе исследования была создана и размечена собственная база видеозаписей, реализованы методы извлечения признаков из изображений и построены нейронные сети с использованием фреймворка PyTorch. Для борьбы с переобучением применялись слои исключения, а процесс обучения оптимизировался различными методами. В результате была достигнута 100% точность модели в задаче классификации букв и минимальная ошибка в определении очертаний губ, что подтверждено качественным и сравнительным анализом. Практическая значимость работы заключается в возможности применения разработанных алгоритмов для создания программных модулей, интегрируемых в слуховые аппараты, системы скрытого субтитрирования и платформы для обработки видео. Реализованный код доступен в репозитории и может служить основой для дальнейших исследований в области компьютерного зрения и обработки естественного языка.

📖 Введение

Машинное обучение уже применяется практически во всех сферах деятельности человека (робототехника, маркетинг, безопасность, медицина т.д.). Сегодня человек работает бок о бок с компьютером, который делает жизнь первого, намного комфортнее и безопаснее.
Чтение по губам— понимание речи через наблюдение за артикуляцией говорящего. Это - полезный навык, а для людей с нарушением слуха необходимый. Полезный навык в решении проблем, когда окружающий шум или расстояние не дает расслышать речь собеседника. А тратить время на обучение человек не хочет или не может. Например лекции в аудиториях рассчитанных на большое количество студентов, в публичных местах, экскурсии и т.д. Для людей с нарушением слуха - необходимы медицинские слуховые аппараты. Для видео хостингов чтение по губам вкупе с распознаванием речи по аудиозаписи, поможет лучше определять произносимые человеком слова при плохой записи звука. Также стоит отметить, что человек, как бы хорошо обучен не был, будет уступать в точности и скорости машине.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В ходе работы были рассмотрены и реализованы наиболее популярные методы извлечения признаков из изображений и составлены нейронные сети работающие с допустимой ошибкой. Создана и размечена собственная малая база видеозаписей, достаточная для разработки всех компонентов алгоритмов, но не для полноценного обучения. Подготовлены данные для обучения и тестирования модели, с помощью функции разделения видеозаписи на кадры. Определены наиболее эффективные методы оптимизации процесса обучения. В результате удалось достичь 100% точности у модели по определению букв и достаточно минимальной ошибки у модели определения очертаний губ. Изучен способ борьбы с переобучением (слои исключения) и опробован на одной из моделей. Проведен качественный и сравнительный анализ полученных результатов. Ссылка на код приведен в списке использованной литературы [5].
В этой работе для написании нейронной модели и её обучения мне понадобились такие дисциплины как теория вероятностей и математическая статистика, математический анализ и дифференциальные уравнения, а также изучена дополнительная литература.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

[1] Yannis M Assael, Brendan Shillingford, Shimon Whiteson, Nando de Freitas. LipNet: End-to-end sentence-level lipreading // GPU Technology Conference, 2017.
[2] Image Filtering - OpenCV 3.4.19 documentation [Электронный ресурс]. -URL: https://docs.opencv.org/3.4/d4/d86/group imgproc filter.html (дата обращения: 02.11.2022).
[3] torch.nn — PyTorch 1.6.0 documentation. [Электронный ресурс]. - 2020. - URL: https://pytorch.org/docs/stable/nn.html#non-linear-activations-weighted-sumnonlinearity (дата обращения: 13.02.2023)
[4] Гудфеллоу Я. Глубокое обучение. / Я. Гудфеллоу, И. Бенджио, А. Курвилль // М.: ДМК Пресс, 2018 - С. 653.
[5] Алгоритм для решения задачи чтения по губам [Электронный ресурс]. -URL: https://github.com/AleksandraFalke/final qualifying work/blob/main/next.ipynb 

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ