Тип работы:
Предмет:
Язык работы:


Архитектура приложения для передачи компактного представления видеоконтента

Работа №144314

Тип работы

Курсовые работы

Предмет

информационные системы

Объем работы43
Год сдачи2024
Стоимость5500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
16
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 5
Обзор литературы 6
Обзор существующих архитектурных подходов 15
1. Предлагаемая архитектура 22
2. Реализация прототипа 24
2.1. Описание архитектуры использованной нейросети 24
2.2. Описание Open source решения 27
2.3. Описание реализованной системы 29
3. Анализ работы прототипа 34
Выводы 39
Заключение 41
Список использованных источников 42


Популярность видеоконференций для виртуальных рабочих встреч, дистанционного обучения или общения резко выросла с началом пандемии коронавируса. Некоторые эксперты предполагают, что зависимость от виртуальных собраний станет частью повседневной жизни во многих сферах. Если это так, то высокий спрос на пропускную способность сетей, который повсеместная видеоконференцсвязь навязывает Интернету, никуда не денется и станет существенной проблемой.
Даже при использовании современных видеокодеков видеоконференция может потребовать пропускной способности: от 1-го до 2-х Мбит / с на участника только для того, чтобы изображения с небольшим разрешением оставались на экране. Кроме того, появляется все больше свидетельств того, что с опытом пользователи становятся более критичными к качеству изображения, стремясь увидеть мельчайшие детали мимики, жесты и позы, которые несут так много информации при личной встрече. Эта тенденция ограничивает возможность приложений использовать более высокие коэффициенты сжатия для уменьшения потребностей в пропускной способности сети. Мелкие детали, которые убирает алгоритм сжатия, содержат как раз те подсказки, которые больше всего нужны опытному переговорщику.
В связи с этим сейчас появляется все больше работ, посвященных организации видеоконференций с уменьшенной нагрузкой на сеть. Для этих целей все чаще применяются технологии машинного обучения, в том числе нейронные сети.
Подобные системы могут оказаться очень полезными в сфере обучения, так как позволяют поддерживать большее количество пользователей с включенными камерами. Также такие инструменты будут полезны в местах, где связь затруднена, а скорость интернет соединения ограничена.
В данной выпускной работе будет предложена архитектура системы для организации видеоконференций с низкой нагрузкой на сеть, а также реализация прототипа такой системы.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе проведения исследования получены следующие результаты.
1. Проведен обзор существующих архитектурных подходов к реализации систем видеоконференцсвязи.
2. Проведен обзор различных нейросетевых подходов к сжатию изображений, содержащих человеческое лицо.
3. Предложена архитектура для передачи видео, содержащего человеческое лицо в рамках видеоконференции, позволяющая минимизировать нагрузку на сеть на стороне клиента.
4. Реализован прототип, следующий предложенной архитектуре и позволяющий легкое встраивание различных нейросетевых решений в качестве инструментов сжатия данных.
5. Проведен анализ работы прототипа, позволивший оценить перспективы развития данного направления, а также выявить преимущества и недо статки предложенного подхода.
В заключение отметим, что проведенная работа открывает новые перспективы в развитии систем видеоконференцсвязи и может служить основой для дальнейших экспериментов в этой области.



[1] One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing / Ting-Chun Wang, Arun Mallya, Ming-Yu Liu - 2020г.
[2] Comparison of Popular Video Conferencing Apps Using Client-side Measurements on Different Backhaul Networks / Rohan Kumar, Vinayak Naik, Dipanjan Chakraborty, Dhruv Nagpal - 2022г.
[3] Enabling video conferencing in low bandwidth / Muzzafer Ali, Suchetana Chakraborty. : Department of Computer Science and Engineering
Indian Institute of Technology Jodhpur, India - 2022г.
[4] Ultra-low bitrate video conferencing using deep image animation / Goluck Konuko, Giuseppe Valenzise, Stephane Lathuiliere. - 2021г.
[5] First order motion model for image animation / A. Siarohin, S. Lathuiliere, S. Tulyakov, E. Ricci, and ' N. Sebe. -2019г.
[6] Generative adversarial networks for extreme learned image compression / E. Agustsson, M. Tschannen, F. Mentzer, R. Timofte, and L. V. Gool. - 2019г.
[7] Deepfovea: Neural reconstruction for foveated rendering and video compression using learned statistics of natural videos / A. S. Kaplanyan, A. Sochenov, T. Leimkuhler," M. Okunev, T. Goodall, and G. Rufo - 2019г.
[8] Region-of-interest-based rate control scheme for highefficiency video coding, / M. Meddeb, M. Cagnazzo, and B. Pesquet-Popescu - 2014г.
[9] Comparison of Popular Video Conferencing Apps Using Client-side Measurements on Different Backhaul Networks / Rohan Kumar, Vinayak Naik, Dipanjan Chakraborty, Dhruv Nagpal - 2022г.
[10] Video Conferencing Systems Architecture: P2P vs MCU vs SFU
[Электронный ресурс]. URL:
https://dev.to/forasoft/video-conferencing-systems-architecture-p2p-vs-mcu-vs-sfu- 5elp (Дата обращения: 20.05.2024).
[11] One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing / Ting-Chun Wang, Arun Mallya, Ming-Yu Liu : IEEE/CVF Conference on Computer Vision and Pattern Recognition. - 2021г.
[12] First Order Motion Model for Image Animation / Aliaksandr Siarohin, Stephane Lathuiliere, Sergey Tulyakov, Elisa Ricci, Nicu Sebe : 33rd Conference on Neural Information Processing Systems (NeurlPS 2019). - 2019г.
[13] Реализация метода, описанного в статье “One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing” [Электронный ресурс]. URL: https://github. com/zhanglonghao 1992/One- Shot_Free-View_Neural_Talking_Head _Synthesis (Дата обращения: 20.05.2025).
[14] Датасет VoxCeleb-v1 [Электронный ресурс]. URL: https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1 .html (Дата обращения: 23.05.2024).
[15] WebSocket vs. Traditional HTTP: Choosing the Right Protocol for Your App
[Электронный ресурс]. URL:
https://appmaster.io/blog/websocket-vs-traditional-http#websocket (Дата
обращения: 20.05.2024).



Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ