Аннотация
Перечень условных обозначений, сокращений 3
Введение 4
1 Теоретические основы обработки медиаконтента 9
2 Нейронные сети и их применение в обработке медиаконтента 24
2.1 Основы нейронных сетей 24
2.2 Применение нейронных сетей в обработке медиаконтента 33
2.2.1 Применение нейронных сетей в обработке изображений 33
2.2.2 Применение нейронных сетей в обработке видео 36
2.2.3 Применение нейронных сетей в обработке аудио 39
3 Разработка инструмента для обработки медиаконтента с применением
языковой модели нейронной сети 44
3.1 Основной файл программы 46
3.2 Загрузчик материала 47
3.3 Обработчик медиафайла 50
3.4 Блок извлечения транскрипции 52
3.5 Блок извлечения основных моментов (хайлайтов) из транскрипции 54
3.6 Блок поиска спикера 57
3.8 Блок обрезки видео 62
4 Анализ и оценка разработанного инструмента и его перспектив 65
4.1 Оценка работоспособности инструмента 65
4.2 Преимущества и недостатки инструмента 67
4.3 Анализ перспектив развития инструмента 68
4.4 Анализ направлений реализации инструмента 69
Заключение 71
Список использованной литературы
Актуальность темы.
Настоящее время можно с уверенностью назвать развитым в технологическом плане и, более того, даже зависимым от технологий. От строительства до медицины, от искусства до фундаментальных наук - общество старается максимально реализовать необходимость упрощения работы человека, сделать жизнь как можно более комфортной и интуитивно понятной для людей, а также менее зависимой от специфических навыков [1].
Не обошла данная тенденция и информационную сферу жизни общества. Новости и научные открытия, религия и шоу, развлекательный контент и информационные обучающие программы - все эти и многие другие категории информации нашли свое применение и реализацию в Интернете [2]. Терабайты контента в различных форматах ежегодно появляется на специальных медиа-площадках и хостингах, и при необходимости теперь в сети можно найти практически любую информацию за пару минут. Разумеется, таких условий можно добиться только при условии огромного потребительского спроса на контент. И такой спрос уже есть. Миллионы авторов медиаконтента, тратящие ежедневно часы на обработку отснятых или записанных материалов, нуждаются в ускорении и упрощении технологического процесса. Кроме того, немалая доля людей готова производить контент, однако ограничена во времени, навыках или технических ресурсах. На рис. 1 представлен охват крупнейших социальных медиа-площадок и хостингов в Российской Федерации по состоянию на март- май 2024 года.
Исходя из данной информации, легко понять, что сфера медиаконтента крайне востребована в современном обществе, а значит, может приносить существенную прибыль. Уже сейчас для материальной реализации контента предусмотрено множество вариантов, от рекламы до партнерских соглашений с самими площадками и хостингами. В качестве примера приведен рис. 2, на котором представлен график доходов от глобального рынка видеорекламы за период с 2015 по 2024 годы [3].С подобным ростом и востребованностью медиасферы среди населения люди, производящие контент, заинтересованы в том, чтобы затрачивать на обработку и редактирование материалов минимальное количество личного времени и сил, а также в сокращении технических и технологических требований к обработке контента и специфических навыков, таких как монтаж видеороликов, сведение звуковых дорожек и т.п., так как для получения качественного контента из входного материала, будь то звуковая дорожка или видеоряд, необходимо выделить наиболее важные и интересные части материала. Кроме того, необходимо выявить и свести к минимуму различные визуальные и звуковые искажения материала, посторонние элементы, даже контент, который может быть запрещенным в тех или иных ситуациях. Этот процесс требует профессионализма, внимательности, большого количества затраченного времени. Однако в любом случае необходимо понимать, что качество полученного продукта определяет человеческая деятельность. Ввиду присутствия человеческого фактора результат обработки медиаконтента может серьезно терять уровень качества [4].
В данной работе предлагается решение поставленной проблемы путем разработки и реализации программного инструмента для обработки медиаконтента, использующего нейронную сеть с языковой моделью. Такое технологическое решение позволит минимизировать влияние человеческого фактора на качество конечного медиапродукта, ускорить и упростить процесс обработки контента, а также существенно уменьшить требования к аппаратному обеспечению и специальным навыкам пользователя.
Цели и задачи исследования.
Итак, целью исследования является разработка базовой версии интеллектуальной системы - инструмента обработки медиаконтента с внедрением в него нейронной сети (лингвистической модели).
Для выполнения данной цели необходимо выполнить ряд задач:
1) изучение существующих на сегодняшний день методов обработки медиаконтента (аудио, видео);
2) разработка архитектуры инструмента для обработки
медиаконтента;
3) разработка инструмента для обработки медиаконтента;
4) оценка качества работы разработанного инструмента;
5) анализ вариантов усовершенствования инструмента;
6) анализ способов реализации разработанного инструмента.
Объект и предмет исследования.
В рамках данного исследования, с учетом цели и задач, в качестве объекта исследования был принят медиаконтент в видеоформате, поскольку целевая группа пользователей инструмента - авторы контента, реализуемого на медиаплощадках и хостингах в Интернете [5].
Предметом исследования выбран инструмент для обработки видеоконтента с внедрением языковой модели нейронной сети, использующий метод получения транскрипции тайм-кодов видео и обработки контента в соответствии с указаниями нейронной сети.
Методология и подходы.
В ходе исследования применялся комплексный подход, который подразумевает разбиение работы на этапы, такие как анализ литературы, эксперименты и оценка эффективности.
Для разработки использован язык программирования Python и его библиотеки. Это обеспечило гибкость и эффективность разработки, а также простоту исправления ошибок и более простое понимание работы.
В качестве среды разработки выбрана IDE PyCharm Community Edition в виду доступности и удобства использования.
Для анализа эффективности разработанного инструмента используются методы сравнительного анализа и пользовательского тестирования. Таким образом увеличивается вероятность выявления проблем и слабых мест инструмента, а также учитывается обратная связь непосредственно от потребителя разработки.
Структура работы.
Данная работа состоит из четырех глав, каждая из них затрагивает определенные аспекты разработки инструмента для обработки медиаконтента с использованием языковой модели нейронной сети.
Первая глава касается теории обработки медиаконтента. В ней подробно рассмотрены существующие на данный момент методы обработки изображений, видео и аудио, перечислены наиболее известные и распространенные инструменты обработки, а также затронут вопрос роли нейронных сетей в инструментах для обработки контента. Кроме того, введены понятия и классификации объекта исследования - медиаконтента.
Вторая глава раскрывает понятие нейронных сетей, их архитектуры, процесса обучения искусственных нейронных сетей (ИНС), варианты их применения для обработки изображений, аудио и видео.
Третья глава посвящена разработке инструмента для обработки медиаконтента с применением языковой модели. В ней описана последовательность действий, представлены методы и программное обеспечение (ПО), выбранное для реализации проекта.
Наконец, четвертая глава заключает в себе анализ разработанного инструмента, оценку его эффективности и качества обработки медиаконтента, сравнение с другими инструментами, а также рассуждения о том, кому и для чего потенциально может понадобиться такой инструмент, о способах усовершенствования готового программного продукта. Помимо прочего, в данной главе поднимается вопрос об этической стороне разработки и внедрения такого инструмента, о возможных последствиях его применения.
В ходе исследования был разработан инструмент для обработки медиаконтента с внедрением языковой модели нейронной сети. Основные результаты работы, а также анализ эффективности инструмента выявили значительные успехи в применении разработанного инструмента. Кроме того, визуальный анализ результатов обработки и обратная связь пользователя указывают на удовлетворительное качество работы инструмента, однако также показали, что разработка требует усовершенствований и дополнений, которые повысят универсальность, эффективность и прикладное удобство пользования продуктом.
Реализованный инструмент для обработки медиаконтента может иметь применение в сфере медиаиндустрии, где он будет использоваться для ускорения технологического процесса обработки материалов и его упрощения. Кроме того, по мере усовершенствования, инструмент может внедряться в обучающие программы, где будет применяться для генерации выжимок лекций и других обучающих материалов, способствуя более глубокому вовлечению обучающихся в учебный процесс, а также использоваться для генерации таргетированных рекламных роликов. Внедрение такого инструмента медиасферу человеческой деятельности в свободном доступе, особенно сделав его доступным в варианте вебприложения, имеет потенциал к расширению рынка медиаконтента и увеличению количества активных авторов, поскольку снизит требования к профессиональным и специфическим навыкам, уменьшит аппаратные ограничения и ускорит процесс обработки, поэтому даже новичок в ремесле авторства контента сможет получить приемлемый уровень качества итогового продукта на основе своих материалов.
Говоря о недостатках и ограничениях, необходимо выделить зависимость от входных данных. Качество материалов, наличие транскрипции тайм-кодов, употребление крылатых выражений и других специфических 71
речевых оборотов - все это непосредственно влияет на качество и точность работы языковой модели. Кроме того, существуют требования и технические ограничения, связанные с вычислительными ресурсами, а значит, с аппаратным обеспечением, необходимым для обработки контента. С ростом объема материалов эти требования возрастают, в противном случае процесс существенно теряет быстродействие.
Наиболее перспективные направления улучшения инструмента - улучшение существующих алгоритмов обработки и дополнение их новыми, внедрение новых функциональных модулей и решений, таких как замена транскрипций тайм-кодов на полноценную расшифровку текста с помощью специальных библиотек Python, таких как, например, Vosk. Кроме того, актуальным являются направления развития механизмов коррекции посторонних шумов и искажений, а также алгоритмы фильтрации устойчивых выражений на разных языках.
В заключение следует еще раз подчеркнуть важность разработки и внедрения в общественную деятельность интеллектуальных систем, использующих нейронные сети для обработки медиаконтента, поскольку подобные инструменты существенно упрощают и ускоряют процесс обработки материалов, открывая новые горизонты для инноваций в сфере медиапроизводства.
Разработанный инструмент является одним из многих, призванных улучшать качество медиасреды общества и предоставляющим новые возможности как потенциальным пользователям, так и акторам бизнес- секторов различного уровня.
1. Торкунова Ю. В. Формирование цифровых навыков в электронной информационнообразовательной среде с использованием нейросетевых технологий / Ю. В. Торкунова, Д. М. Коростелева, А. Е. Кривоногова // Современное педагогическое образование. - 2020. - №. 5. - С. 107-110. - URL: https://cyberleninka.ruZarticle/n/formirovanie-tsifrovyh-navykov-v-elektronnoy- informatsionnoobrazovatelnoy-srede-s-ispolzovaniem-neyrosetevyh-tehnologiy (дата обращения: 10.03.2025).
2. Вартанова Е. Л. К вопросу о последствиях цифровой трансформации медиасреды // Меди@льманах. - 2022. - №. 2 (109). - С. 8-14.
3. Липатова А. В. Медиапотребление молодежи в социальных сетях: обзор мировых и российских практик // Казанский социально-гуманитарный вестник. - 2023. - №. 2 (59). - С. 20-24.
4. Шимолин В. И. Человеческий фактор в эпоху цифровизации,
конвергенции и трансформации СМИ // Журналистика - медиалогия - наставничество : материалы междунар. науч.-практ. конф., посвящ. памяти проф. Б. В. Стрельцова, Минск, 1 марта 2023 г. - Минск., 2023. - С. 262-265. - URL: https://elib.bsu.by/handle/123456789/296155 (дата обращения:
11.03.2025).
5. Мельник Г. С. Новые технологии медиапроизводства: достижения и издержки // Челябинский гуманитарий. - 2020. - №. 4 (53). - С. 48-56.
6. Каминская Т. Л. Экспертный медиаконтент: создание и использование в современных медиа / Т. Л. Каминская, О. В. Ерохина // Вопросы теории и практики журналистики. - 2023. - Т. 12. - №. 1. - С. 24-40.
7. Соловьева Д. В. и др. Стратегический подход к разработке медиаконтента бренда //Практический маркетинг. - 2020. - №. 6 (280). - С. 1020.
8. Гурьянов Е. Н. Использование медиаконтента как инструмента рекламы и PR // Научные труды Северо-Западного института управления РАНХиГС. - 2019. - Т. 10. - №. 4. - С. 159-168.
9. Зубков И. Г. Информационный медиаконтент в интернете современная специфика и ключевые характеристики : автореф. дис. ... канд. филол. наук / И. Г. Зубков. - Москва, 2014. - 17 с.
10. Карпенко В. А. Критерии креативности и форматы подачи медиаконтента в гражданской журналистике // Медиасреда. - 2020. - №. 2. - С. 31-37.
11. Ткаченко Ю. В. Визуализация медиаконтента: форматы и возможности // Новые тренды журналистики и медиакоммуникаций. - 2022. - С. 37-41.
12. Болотова Л. Д. Взаимодействие радио и телевидения как способ совершенствования распространения медиаконтента / Л. Д. Болотова, А. А. Морозов // Средства массовой коммуникации в многополярном мире: проблемы и перспективы : Материалы V Всероссийской научно-практической конф., Москва, 05 ноября 2014 г. - М., 2014. - С. 37-44.
13. Анучина О. В., Вафина Ю. А., Юсупова А. С. Мем как механизм социального регулирования и управления практиками вовлеченности молодежи в общественную жизнь //Вестник экономики, права и социологии. - 2024. - №. 2. - С. 177-182.
14. Гурьянов Е. Н. Трансформация мотивов потребления медиаконтента // Неделя науки СПбПУ. - 2020. - С. 91-94.
15. Бирюков В. А. Преимущества и недостатки монетизации медиаконтента на основе использования кликбейт-заголовков / В. А. Бирюков, О. В. Дмитриева, М. В. Ливсон // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. - 2020. - №. 4. - С. 73-79....66