Как правило, библиотеки звуковых эффектов состоят из множества засэмплированных звуков, хранящихся в виде несжатых wave файлов. Сэмплы в библиотеке между собой немного отличаются по звуку, чтобы у звукового дизайнера был широкий выбор, поэтому в библиотеке может находиться больше 100 сэмплов. На сегодняшний день существует огромное множество библиотек сэмплов, однако, у звуковых дизайнеров не всегда получается найти подходящий сэмпл для получения необходимого звука, и им приходится записывать собственный. Следует отметить, что процесс записи, например, реальных криков животных, соответствующих множеству ситуаций в видеоиграх, может оказаться очень непростым. Это ведет к потере большого количества ценного времени, а библиотеки сэмплов со временем становятся слишком большими и неорганизованными. Поэтому в видеоиграх крики животных обычно синтезируются и часто адаптируются для производства криков вымышленных существ, открывая широкие возможности в этой области.
В индустрии кино и видеоигр растет спрос на адаптируемые интерактивные звуковые эффекты, характеристики которых могут задаваться звуковыми дизайнерами, которые создают эффекты для фильма, и действиями пользователей, таких как игроки видеоигр. Это мотивировало множество исследований моделей синтеза на основе процедурного аудио.
Звуковые эффекты могут быть синтезированы из небольшого количества стартовых блоков, например, генератора случайных чисел и генератора синусоидальной волны. Таким образом можно создавать огромное количество контрастных звуков, изменяя различные параметры, предоставленные пользователю в физической модели. В статье [1], например, были предприняты попытки воссоздать и тиражировать большое количество сэмплов из библиотеки звуковых эффектов, используя небольшое количество физических моделей синтеза.
В последние годы процедурное аудио разрабатывалось в основном для использования в индустрии компьютерных игр, где память для хранения сэмплов ограничена, а повторение сэмпла, такого, как звук выстрела из оружия, вскоре становится утомительным и нереалистичным. Субъективные тесты, проведенные в статье [2], показали, что 64% пользователей предпочли синтезированные эффекты записанным звукам в простой игре, специально разработанной для теста. С помощью субъективных тестов в статье [3] показано, что физические модели могут быть эффективны при воспроизведении грубых, спектрально плотных звуков, таких как рёв льва, и могут воссоздать реалистичную артикуляцию. На сегодняшний день наиболее полная коллекция физических моделей содержится в книге [4]. Данная работа построена на одной из этих моделей.
Объектом исследования является создание модели синтеза звуковых эффектов вокализации млекопитающих. Предметом является синтез звуковых эффектов вокализации млекопитающих.
Цель данной диссертационной работы заключается в том, чтобы выяснить, является ли синтез достойной альтернативой библиотекам звуковых эффектов, основанным на сэмплах.
Для достижения поставленной цели были сформулированы следующие задачи:
1. Изучение предметной области.
2. Изучение средств синтеза звука.
3. Разработка модели синтеза звука.
4. Оценка и сравнение результативности методов.
В результате выполнения данной диссертационной работы было выяснено, что синтез может являться достойной альтернативой библиотекам звуковых эффектов, основанным на сэмплах.
Для достижения поставленной цели были выполнены следующие задачи:
1. Изучена предметная область.
2. Изучены средства синтеза звука.
3. Разработана модель синтеза звука.
4. Произведены оценка и сравнение результативности методов.