Тип работы:	Предмет:	Язык работы:

ИСПОЛЬЗОВАНИЕ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ОБРАБОТКИ И ВОССТАНОВЛЕНИЯ МУЗЫКАЛЬНЫХ СИГНАЛОВ

Работа №	28815
Тип работы	Диссертации (РГБ)
Предмет	радиотехника
Объем работы	180
Год сдачи	2003
Стоимость	500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено	551

Не подходит работа?

Узнай цену на написание

Содержание

1. ВВЕДЕНИЕ 5
2. ЦЕЛИ И ЗАДАЧИ п
2.1. АКТУАЛЬНОСТЬ ТЕМАТИКИ и
2.2. ЦЕЛИ и ЗАДАЧИ 13
3. ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ РАСПОЗНАВАНИЯ ОБРАЗОВ 15
3.1. ОБЩАЯ ТЕОРИЯ РАСПОЗНАВАНИЯ ОБРАЗОВ 15
3.1.1. Основные определения 15
3.1.2. Классификация систем распознавания 17
3.1.3. Цели и задачи систем распознавания образов 22
3.1.4. Последовательность распознавания образов в общем виде 24
3.1.5. Определение полного перечня признаков, характеризующих
объекты 25
3.2. РАСПОЗНАВАНИЕ ОБРАЗОВ С ИНФОРМАЦИОННОЙ ТОЧКИ ЗРЕНИЯ 27
3.2.1. Информативность музыкальных произведений 27
3.2.2. Преобразование информации при распознавании музыкального
сигнала 31
3.3. РАСПОЗНАВАНИЕ ЗВУКОВЫХ ОБРАЗОВ 34
3.4. СТАТИСТИЧЕСКИЙ ПОДХОД К РАСПОЗНАВАНИЮ ОБРАЗОВ 38
3.4.1. Реализации и признаки 38
3.4.2. Процедуры принятия решения 42
3.5. СИСТЕМЫ РАСПОЗНАВАНИЯ МУЗЫКАЛЬНЫХ СИГНАЛОВ 45
3.5.1. Развитие систем распознавания музыкальных сигналов 45
3.5.2. Задачи распознавания музыкальных сигналов 50
3.6. Сложности РАСПОЗНАВАНИЯ МНОГОГОЛОСНЫХ МЕЛОДИЙ 56
3.6.1. Общие соображения 56
3.6.2. Созвучия тональных звуков 58
3-7- СОВРЕМЕННЫЕ ПОДХОДЫ К РАСПОЗНАВАНИЮ ПОЛИФОНИЧЕСКИХ
МЕЛОДИЙ 61
3.7.1. Представление данных в системах распознавания музыкальных
сигналов 61
3.7.2. Методология «классной доски» 68
3.7.3. Недостатки современных систем распознавания музыкальных
сигналов 72
3.8. Выводы 74
4. СОВРЕМЕННАЯ ТЕХНИКА ВОССТАНОВЛЕНИЯ МУЗЫКАЛЬНЫХ СИГНАЛОВ 75
4.1. КОМПЬЮТЕРИЗИРОВАННЫЕ СИСТЕМЫ ВОССТАНОВЛЕНИЯ 75
4.1.1. Система "NoNoise" 75
4.1.2. Система «Канонъ» 76
4.2. ПСИХОАКУСТИЧЕСКИЕ ПРОЦЕССОРЫ 77
4.2.1. Эксайтер (Exciter) 78
4.2.2. Энхэнсер (Enhanser) 80
4.2.3. Максимайзер (Maximizer) 81
4.2.4. Виталайзер (Vitalizer) 83
4.3. ОБЩАЯ ХАРАКТЕРИСТИКА СОВРЕМЕННОЙ ТЕХНИКИ ВОССТАНОВЛЕНИЯ И
ОБОСНОВАНИЕ ПРЕДЛАГАЕМОГО ПОДХОДА 85
4.4. Выводы 90
5. ИССЛЕДОВАНИЕ СТРУКТУРЫ ЗВУКОВЫХ ОБЪЕКТОВ 91
5.1. СТРУКТУРА ЗВУКОВОГО ОБЪЕКТА И ТЕМБР 91
5.2. ОПИСАНИЕ ИССЛЕДОВАНИЯ 92
5.2.1. Цели и задачи исследования 92
5.2.2. Объект исследования 93
5.2.3. Методика и последовательность исследования 93
5.2.4. Инструменты исследования 95
5.3.1. Классификация музыкальных инструментов 99
5.3.2. Гармоничность музыкальных звуков. Модель синтеза звукового
объекта 108
5.3.3. Узнавание тембра: что важно и что нет? Модель анализа звукового
объекта 114
5.4. выводы 118
6. РАЗРАБОТКА .АЛГОРИТМА РАСПОЗНАВАНИЯ МНОГОГОЛОСНЫХ МУЗЫКАЛЬНЫХ СИГНАЛОВ 118
6.1. РАЗРАБОТКА АЛГОРИТМА СЕГМЕНТАЦИИ 118
6.1.1. Современные подходы к сегментации музыкальных сигналов ....120
6.1.2. Сегментация музыкального сигнала с использованием априорной
информации 125
6.2. РАЗРАБОТКА АЛГОРИТМА ОПРЕДЕЛЕНИЯ ОСНОВНЫХ ТОНОВ ЗВУКОВЫХ
ОБЪЕКТОВ ПЕРЕКРЫВАЮЩИХСЯ ВО ВРЕМЕНИ 137
6.3. Выводы 144
7. РАЗРАБОТКА АЛГОРИТМА ОБРАБОТКИ СИГНАЛА НА ОСНОВЕ РАСПОЗНАВАНИЯ 145
8. ЗАКЛЮЧЕНИЕ 155
9. Список ЛИТЕРАТУРЫ 159
ю. Список ПУБЛИКАЦИЙ СОИСКАТЕЛЯ 167
ПРИЛОЖЕНИЕ 1. ПРОТОКОЛ ИСПЫТАНИЙ ПО ОЦЕНКЕ ЭФФЕКТИВНОСТИ
РАЗРАБОТАННОГО АЛГОРИТМА ПОДАВЛЕНИЯ шумов 168

Введение

Процесс реставрации фонограмм длителен и трудоёмок. Начинается он почти всегда с обработки носителя записи — механического или магнитного, затем проводится обработка сигнала. Обработка носителя записи — процесс не менее важный, чем обработка сигнала, однако именно работа с сигналом, точнее проблемы, возникающие в её ходе, требуют разработки новых методов. Субъективные оценки качества восстановленных сигналов заставили всерьёз задуматься о целесообразности реставрации фонограмм на современном этапе развития техники. Нередко организации, занимающиеся хранением и реставрацией фонограмм, представляющих художественную ценность, для продления срока хранения фондов «консервируют» копии «до лучших времён». Для этого сигналы преобразуются в цифровую форму с использованием высококачественных АЦП (например, 24-битное квантование и дискретизация с часто¬той 192 кГц) и переносятся на долговечный носитель (например, компакт-диск)
Как правило, восстановления требуют сигналы, некоторые технические параметры которых деградировали: ограничена полоса частот, утрачены фрагменты фонограммы, уменьшено отношение сигнал/шум за счёт шумов, например, магнитного носителя и старения магнитного слоя, присутствуют нелинейные искажения. Задачи реставрации фонограмм можно сформулировать следующим образом:
1. устранение «лишних» спектральных составляющих, т.е. компонентов спектра, не содержавшихся в исходной фонограмме по окончании процесса её формирования, — продуктов нелинейных искажений, всевозможных помех и шумов и т.п.
2. восстановление компонент спектра, утраченных из-за линейных искажений — ограничение полосы частот сигнала, «провалы» АЧХ тракта запись-воспроизведение, и т.п.
Очевидно, исходная форма сигнала неизвестна и потому достижима с некоторой вероятностью. Поэтому процесс реставрации фонограммы — такой же творческий, как и процесс её создания.
Реставрация — понятие универсальное, используемое различными областями человеческих знаний. Не разумно ли сформулировать и общие подходы, принципы и задачи реставрации? Восстановлению подлежат и памятники письменности, и живописные полотна, и уникальные звукозаписи, материалы кинохроники. В любом случае, имеют дело с носителями звуковой или визуальной информаций. Восстановление становится возможным при условии достаточности информации, содержащейся в носителе, требующем реставрации, а также информации, полученной об объекте реставрации из разных источников.
Утрата частей физического носителя информации или части информации, переносимой носителем не всегда исключает достоверную передачу этой информации. Очевидно, существует такое количество информации (предел), при утрате которого делается невозможным восприятие остальной части. Обратимся к рисунку 1. Допустим, нам предлагают восстановить исходное изображение по одному из фрагментов — большему или меньшему. Априорная информация в данном случае состоит в том, что восстановлению подлежат фрагменты симметричного изображения (человеческого лица). Чтобы решить поставленную задачу, мы должны, прежде всего, понять, что изображено на предложенной нам части листа, т.е. узнать (распознать) часть объекта и, согласно своим представлениям домыслить недостающие части. Распознать — значит принять решение о принадлежности изучаемого объекта к одному из известных классов. Таким образом, мы приходим к мысли о том, что достоверность восстановления зависит от достоверности распознавания, достоверность распознавания (т.е. вероятность принятия верного решения о принадлежности рас¬познаваемого объекта к тому или иному классу) зависит, в частности:
1. от количества информации, содержащейся в исследуемом фрагменте носителя информации,
2. от количества априорной информации, которой располагает распознающий субъект о распознаваемом объекте, т.е. от набора разнородных знаний., которыми обладает человек.
Реставратор, восстанавливающий живописное полотно, прежде всего, решает задачу распознавания образов, которые он восстанавливает — он принимает решение о том, что изображено на полотне и, только исходя из этих сведений, устраняет ненужные фрагменты изображения и добавляет недостающие. При этом «недостачу» и «ненужность» фрагментов определяет сам реставратор в зависимости от того, как он распознал восстанавливаемые образы и насколько он себе представляет то, что было изображено на полотне.
Первым этапом восстановления сигнала является фильтрация, по¬скольку проще сначала подавить шум, а затем провести синтез спектральных составляющих, чем наоборот. Какие сведения необходимо получить при распознавании сигнала и как сформировать АЧХ фильтра на основе этих данных? Очевидно, необходимо локализовать в частотной области полезные составляющие — основные тоны и обертоны. Соответственно, при таком подходе считается, что область частот, не занятая полезным сигналом, занята шумом.
После фильтрации можно переходить непосредственно к восстановлению утраченных компонентов спектра - синтезу обертонов. Известны приблизительные частоты недостающих обертонов, а их амплитуды должны либо назначаться пользователем, либо определяться в результате анализа спектра (предсказание, интерполяция, экстраполяция), либо определяться в соответствии с априорными сведениями об обрабатываемом сигнале.
Важно отметить, что применение распознавания образов предоставляет возможность обрабатывать отдельный звуковой объект (реализацию отдельной ноты). По сути, отдельный звуковой объект является минимальным элементом - «кирпичиком» восприятия звукового сигнала, и возможность работать со звуковым сигналом на «элементарном» уровне пока не предоставляет ни один подход к обработке сигнала.
Теперь можно изобразить схему действий и управления процессами при восстановлении музыкального сигнала с использованием распознавания образов (рис. 2).
В схеме выделим ветвь управления и ветвь обработки. Процессы, входящие в ветвь управления формируют данные, управляющие процессами ветви обработки. Процесс распознавания сигнала — наиболее важный, эффективность восстановления почти полностью зависит от его результатов. Остальные процессы управления, действуя по намного более простым алгоритмам, механически исполняют указания процесса распознавания. Процесс распознавания формирует информацию, необходимую для работы остальных процессов.
Распознавание — задача статистическая, и достоверность распознавания современных систем не превышает 80%. Ошибки распознавания (неверное определение высоты тона, ошибочная сегментация), вообще говоря, приведут к непредсказуемым последствиям, как на стадии фильтрации, так и на стадии синтеза обертонов. Поэтому внедрение любых устройств обработки на основе распознавания станет возможным лишь при условии создания устойчивых систем распознавания. Современные системы распознавания звуковых сигналов не универсальны, создание и использование же универсальных систем распознавания, отличающих речь от музыки и, тем более, распознающих смесь речевого и музыкального сигналов значительно удорожат устройства обработки.
Научная новизна работы
1. Дня управления обработкой сигнала в процессе реставрации используется информация, полученная при предварительном распознавании сигнала. Т.е. к решению задачи восстановления музыкальных сигналов по неполной или искажённой информации применены методы распознавания образов.
2. Алгоритмы сегментации и распознавания музыкального сигнала построены с учётом априорной информации о распознаваемых реализациях образов. Априорная информация о музыкальном сигнале состоит в заранее известном соотношении ОТ звуковых объектов, подлежащих распознаванию. В европейской музыке частоты основных тонов звуков составляют множество f, зная один из членов которого (например, эталонный тон /э, по которому настраиваются инструменты), можно с незначительными отклонениями восстановить все остальные.
Апробация результатов работы
Основные результаты и предложения, полученные в ходе работы над диссертацией, докладывались и опубликованы в виде тезисов докладов 55-ой студенческой НТК МТуСИ, профессорско-преподавательских конференций МТуСИ 2001-2003 гт., 10-ой межрегиональной конференции МНТОРЭС им А. С. Попова, 4-ой международной НТК «Перспективные технологии в средствах передачи информации» (Владимир). Также результаты опубликованы в стать¬ях, депонированных ЦНТИ «Информсвязь», докладывались на заседаниях кафедры РВ и ЭА, НТС МТУСИ.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

КУРСОВЫЕ СТАТЬИ ВКР

Заключение

Разработанные алгоритмы сегментации и определения основных тонов реализованы в программном обеспечении. С помощью этого программного обеспечения и получены примеры работы разработанных алгоритмов. Система обработки сигнала реализована лишь в части подавления шумов. Реализация синтезатора обертонов по разработанному алгоритму составляет предмет дальнейших исследований.
Значительным недостатком разработанной системы является её неприспособленность к детонации. При детонации происходит отклонение основных тонов звуковых объектов от того строя, на который настроена система сегментации. Происходят серьёзные ошибки при определении высот тонов, и, как следствие, снижается эффективность шумоподавления.
Проведённые субъективно-статистические экспертизы показали, что более половины слушателей предпочли звучания, обработанные с помощью разработанной системы фильтрации, звучаниям, обработанным с помощью программного средства восстановления сигналов DART, а также подключаемых модулей (Plug In) программы Steinberg WaveLab. Экспертам были предъявлены различные несложные (количество голосов не более двух-трёх) звучания, средний процент экспертов, отдавших предпочтение звучаниям, полученным с по¬мощью разработанной системы составляет 65%. Таким образом, достигнута цель исследования — повышено качество (по субъективным критериям) восстановления сигналов.
Полностью выполнены и задачи исследования: разработана система распознавания музыкальных сигналов, способная автоматически управлять восстановлением сигнала. Разработан и атгоритм обработки музыкального сигнала на уровне структуры отдельного звукового объекта, полностью управляемый и контролируемый пользователем. Алгоритм фильтрации реализован в программном обеспечении.
Сформулируем ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ:
1. Повышено качество восстановления музыкальных сигналов. Проведённые субъективно-статистические экспертизы показали, что при сравнении результатов работы двух систем: разработанной и одной из существующих, 65% экспертов отдали предпочтение звучанию, восстановленному с помощью разработанной системы
2. Оператору системы реставрации предоставлена возможность осуществлять ранее невыполнимые операции: с минимальными искажениями тембра изменять баланс громкостей звуковых объектов, по-отдельности обрабатывать звуковые объекты, перекрывающиеся во времени.
3. Процесс реставрации фонограмм — процесс творческий. Реставратору предоставлен инструмент творческой работы, инструмент, для овладения которым не требуются специальной технической подготовки.
4. Сокращено время обучения неподготовленных или неопытных пользователей систем восстановления музыкальных сигналов за счёт интуитивно более понятных функций, выполняемых системой, например, регулировка амплитуд отдельных обертонов и мощности отдельных звуковых объектов вместо регуляторов АЧХ эквалайзера.
ЗАЩИЩАЕМЫЕ ПОЛОЖЕНИЯ:
1. Целью реставрации является повышение качества сигнала по субъективным критериям путём устранения нежелательных последствий прохождения сигнала через тракты формирования, записи и воспроизведения, а также последствий длительного и/или неправильного хранения фонограмм.
2. Для повышения эффективности реставрации фонограмм необходимо применение распознавания образов.
3. Использование для автоматической сегментации априорной информации в виде распределения значений одного из признаков потенциально эффективнее обучения и самообучения без предоставления этой информации.
4. В задачах автоматического распознавания музыкальных сигналов целесообразно использовать предлагаемую в работе классификацию музыкальных инструментов, основанную на типе возбуждаемых колебаний (автоколебания или свободные затухающие колебания).
5. Натуральность звучания сигналов, получаемых при воссоздании звуков музыкальных инструментов и вокализованных звуков речи аддитивным синтезом, достигается при наличии информации о каждом полном цикле колебаний.
— Автоматическое распознавание музыкальных сигналов с расширением множества распознаваемых сигналов найдёт своё применение в современной звукозаписи. Автоматическое распознавание музыкального сигнала позволяет звукозапись музыкального произведения поставить в соответствие с его нотной записью. Такая возможность используется: при создании электронных архивов партитур музыкальных произведений, а также аранжировщиками и композиторами для сокращения рутинной работы по написанию партитур. Соответственно, практическую значимость представляет разработанный алгоритм распознавания музыкальных сигналов.
— Развитие систем распознавания слуховых и зрительных образов и их объединение в единые комплексы приведёт к тому, что наиболее эффективная обработка и видео-, и звуковых сигналов будет проводиться именно на основе распознавания. Результаты работы разработанной системы восстановления не¬сложных звучаний — подтверждение целесообразности и реализуемости рас¬познающих систем обработки, один из первых шагов в данном направлении.
— Использование для автоматической сегментации априорной информации в виде распределения значений одного из признаков потенциально эффективнее обучения и самообучения без предоставления этой информации.
— Предложенная методика определения параметров основного тона и обертонов звуковых объектов позволяет повысить качество аддитивного синтеза музыки и речи по критерию натуральности звучания.
— Разработанное для анализа квазипериодических сигналов программное обеспечение (ПО) может быть использовано для объективной оценки качества звучания музыкальных инструментов.
В работе предложен новый подход к решению задачи восстановления сигнала по неполной или искажённой информации. Выявлены недостатки подхода, предложены пути устранения этих недостатков, а также расширения возможностей обработки музыкального сигнала и использованием распознавания образов.

Литература

1. Алдошина И. Основы психоакустики часть 14. Тембр часть 1 // Звукорежиссёр N° 2, 2001.
2. Алдошина И. Основы психоакустики часть 14. Тембр часть 2 // Звукорежиссёр N° 3, 2001.
3. Баскаков С. И. Радиотехнические цепи и сигналы: Учеб для вузов по спец. «Радиотехника» — 4-е изд., перераб. и доп. — М.: Высш, шк., 2003. — 462 с.
4. Вахромеев В. А. Элементарная теория музыки. - М.: Музыка, 1999. — 173 с.
5. Волков А.Л. Адаптивный алгоритм цифровой обработки звуковых сигналов для реставрации фонограмм: Автореферат диссертации на соискание ученой степени канд. техн, наук: 05.09.08. -СПб., 2000. -23 с.
6. Гольденберг Л. М., Матюшкин Б. Д., Поляк М. Н. Цифровая обработка сигналов: справочник. — М.: Радио и связь, 1985. — 312 с.
7. Горон Е. И. Радиовещание: Учебник для вузов. — М.: Связь, 1979. — 368 с.
8. Дворянкин С. Взаимосвязь цифры и графики, звука и изображения // Открытые системы №3, 2000.
9. Иванченко Г. В. Психология восприятия музыки: подходы, проблемы, перспективы. — М.: Смысл, 2001. — 264 с.
10. Ковалгин Ю. А. Стереофония. — М.: Радио и связь, 1989. — 272 с.
11. Лейтес Р. Д., Соболев В. Н., Цифровое моделирование систем синтетической телефонии. — М.: Связь, 1969. — 208 с.
12. Маркел Дж. Д., Грэй А. X. Линейное предсказание речи, пер. с англ. / Под ред. Ю. Н. Прохорова и В. С. Звездина. — М.: Связь, 1980. — 308 с.
13. Моль А. Теория информации и эстетическое восприятие — М.: Мир, 1966. - 312 с.
14. Мясников Л. Л., Мясникова Е. М. Распознавание звуковых образов. — М.: Наука, 1984. — 158 с.
15. Назаров М. В., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. — М.: Радио и связь, 1985. — 148 с.
16. Некоторые проблемы обнаружения сигнала, маскируемого флюктуационной помехой. Сборник статей: Пер с англ. Под ред. Н. И. Шнер. — М.: Советское радио, 1965. — 263 с.
17. Никамин В. А. Форматы цифровой звукозаписи. — С.-Пб.: ЗАО «Элби», 1998. - 264 с.
18. Павленко А. Реставрация фонограмм с помощью программы DART Pro. // Мир ПК, №11,1997.
19. Потапова Р. К. Речь: коммуникация, информация, кибернетика: Учеб, пособие для вузов. — М.: Радио и связь, 1997. — 528 с.
20. Применение цифровой обработки сигналов под ред. Э. Оппенгейма, пер. с англ. — М.: Мир, 1980. — 552 с.
21. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов, пер. с англ. — М.: Мир, 1978. — 848 с.
22. Рабинер Р., Шафер Р. Цифровая обработка речевых сигналов, пер. с. англ. — М.: Мир, 1981. — 496 с.
23. Радиовещание и электроакустика: Учебное пособие для вузов / С. И. Алябьев, А. В. Выходец, Р. Гермер и др.; Под ред. Ю. А. Ковалгина. — М.: Радио и связь, 1999. — 792 с.
24. Римский-Корсаков А. В. Электроакустика. — М.: Связь, 1973. — 272 с.
25. Сапожков М. А. Электроакустика. Учебник для вузов. — М.: Связь, 1978. - 272 с.
26. Система цифровой реставрации и ремастеринга фонограмм «Канонъ» http:// ru.ecomstation.ru/showarticle. php?id=68
27. Станции ТРЕК от фирмы «Тракт» / / 625, №7,1998.
28. Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов. — М.: Радио и связь, 1986. — 264 с.
29. Фу К. Последовательные методы в распознавании образов и обучении машин, пер. с англ. — М.: Наука, 1971. — 256 с.
30. Харкевич А. А. Автоколебания. — М.: Государственное издательство технико-теоретической литературы, 1954. — 212 с.
31. Харкевич А. А. Спектры и анализ. — М.: Государственное издательство технико-теоретической литературы, 1962. — 236 с.
32. Чернецкий М. Психоакустические процессоры - что это такое? / / Звукорежиссёр, №8,1999.
33. Чулаки М. Инструменты симфонического оркестра. — Л.: Союз советских композиторов СССР Ленинградское отделение Музфонда, 1950. — 94 с.
34. Шелухин О. И., Лукьянцев Н. Ф. Цифровая обработка и передача речи / Под ред. О. И. Шелухина. — М.: Радио и связь, 2000. — 456 с.
35. Blauert J. Spatial Hearing. MIT Press, 1983.
36. Bregman A. Auditory Scene Analysis. Bradford Books MIT Press, 1990.
37. Cooke M. Modelling auditory processing and organization. / / PhD thesis, University of Sheffield Dept of Computer Science, 1991.
38. Dolson M. The phase vocoder : a tutorial. // Computer Music Journal №10(4), 1986.
39. Dove Webster P. Knowledge-based pitch detection. // PhD thesis, EECS dept, MIT, 1986.
40. Duda R., Lyon R., Slaney M. Correlograms and the separation of sounds. // Proc Asilomar Conf on Sigs, Sys & Computers, 1990.
41. Ellis D. Mid-level representations for Computational Auditory Scene Analysis. // Proceedings of the International Joint Conference on AI, Workshop on Computational Auditory Scene Analysis, Aug. 1995.
42. Ellis. D. Prediction-driven computational auditory scene analysis. // Ph.D. thesis, Massachusetts Institute of Technology, 1996.
43. Forsberg J. Automatic Conversion of Sound to the MIDI Forma // Computer Music Journal №12(10), 1999.
44. Fujinaga I. Machine recognition of Timbre Using Steady-State tone of Acoustic musical Instruments // International Computer Music Conference, 2003, P. 89-
96.
45. Fujinaga I., Moore S., Davad S. Sullivan Jr. Implementation of Exemplar¬based Learning Model for Music Cognition.
46. Ghitza O. Auditory nerve representation criteria for speech analysis/synthesis. / / IEEE Tr ASSP 35(6), 1987.
47. Glasberg B., Moore B. Derivation of auditory filter shapes from notched-noise data. // Hearing Research №4(7), 1990.
48. Goto M., Muraoka Y. A Real-time Beat Tracking System for Audio Signals. // Proceedings of the 1995 International Computer Music Conference, pp.171-174, September 1995.
49. Goto M., Muraoka Y. Beat Tracking based on Multiple-agent Architecture - A Real-time Beat Tracking System for Audio Signals. // Proceedings of The Sec¬ond International Conference on Multiagent Systems, pp.103-110,1996.
50. Greimas A. -J. Semantique structural. Recherche de methode. Paris: Seuil, 1977.
51. Gromko J.-E. Perceptual differences between expert and novice music listeners: A multidimensional scaling analysis//Psychology of Music. 1993. Vol. 21 (1). P. 34-47.
52. Gurney E. The Power of Sound. London, 1880.
53. Habermas J. Identitat // Zur Rekonstruktion des Historischen Materialismus. Frankfurt, 1976.
54. Halam S. The development of memorisation strategies in musicians. Paper pre¬sented at the VII European Conference on Developmental Psychology, August. Krakow, 1995.
55. Halpern A.R. Organization in memory for familiar songs // Journal of Experi¬mental Psychology. Learning, Memory and Cognition. 1984 a. Vol. 10 (3). P. 496-512.
56. Halpern A.R. Perception of structure in novel music // Memory and Cogni¬tion. 1984 6. Vol. 12(2). P. 163-170.
57. Handel St. Listening.//Bradford Books MIT Press, 1989.
58. Handel St. Listening: An introduction to the perception of auditory events. Cambridge (Ma): MIT Press, 1993.
59. Hansen Ch.-H., Hansen R.-D. Constructing personality and social reality through music: Individual differences among fans of punk and heavy metal music // Journal of Broadcasting and Electronic Media, Sum. 1991. Vol. 35 (3). P. 335-350.
60. Hargreaves D.J. Verbal and behavioral responses to familiar and unfamiliar music // Current Psychology Research and Rewies, Winter 1987 — 1988. Vol. 6 (4). P. 323-330.
61. Hargreaves D.J., Colman A.M. The dimensions of aesthetic reactions to music // Psychology of Music. 1981. Vol. 9 (1). P. 15 — 20.
62. Hawley S. Structure out of Sound. // Ph.D. thesis, Massachusetts Institute of Technology, 1998.
63. Hebert S., Peretz I. Recognition of music in long-term memory: Are melodic and temporal patterns equal partners? // Memory & Cognition, Jul. 1997. Vol. 25 (4). P. 518-533.
64. Hester V. The Meaning of Poetic Metaphor. London: The Hague, 1967.
65. Hindemith P. A Composer's World. Horizons and Limitations. Cambridge, 1953.
66. Hirsch E.D. Cultural literacy. Boston: Houghton Miffin, 1987.
67. Holleran S., Jones M.-R., Butler D. Perceiving implied harmony: The influence of melodic and harmonic context // Journal of Experimental Psychology. Learning, Memory, and Cognition, May. 1995. Vol. 21(3). P. 737 —753.
68. Hoover D.-M., Cullari S. Perception of loudness and musical preference: Com¬parison of musicians and nonmusicians / / Perceptual and Motor Skills, Jun. 1992. Vol. 74(3). P. 1149-1150.
69. Howell P., Cross I., West R. (Eds.). Musical Structure and Cognition. London: Academic Press, 1985.
70. Introduction to Audio Restoration, http://www.cedar-audio.com/
71. Kashino G., Tanaka T. A sound source separation system with the ability of automatic tone modeling. // Proceedings of the International Computer Music Conference, 1993.
72. Katayose Y., Inokuchi D. The Kansei music system. // Computer Music Jour¬nal, 13(4), 1989.
73. Klapuri A. Automatic transcription of music. // Master of science's thesis. Tampere University of Technology, Department of Information Technology, 1998.
74. Klapuri A. Conventional and periodic N-grams in the transcription of drum se¬quences. // IEEE International Conferences on Multimedia and Expo, Balti¬more, USA, 2003.
75. Klapuri A. Multipitch estimation and sound separation by the spectral smooth¬ness principle. / / IEEE International Conference on Acoustics, Speech and Sig¬nal Processing, Salt Lake City, USA, 2001.
76. Klapuri A. Number theoretical means of resolving a mixture of several har¬monic sounds. // Proc. EUSIPCO, 1998.
77. Klapuri A. Pitch estimation using multiple independent time-frequency win¬dows. // Proc. EUSIPCO 1999.
78. Klapuri A. Sound onset detection by applying psychoacoustic knowledge IEEE // International Conference on Acoustics, Speech and Signal Processing, ICASSP 1999.
79. Klapuri A., Eronen, A. Musical instrument recognition using cepstral coeffi¬cients and temporal features. // Proc, of the ICASSP. 2000.
80. Klapuri A., Peltonen V., Eronen A., Parviainen A. Recognition of everyday auditory scenes: Potential, latencies and cues. // Proc, of 110th AES Conven¬tion, May 2001.
81. Klapuri A., Sillanp J., Seppnen J., Virtanen T. Recognition of Acoustic Noise Mixtures by Combined Bottom-up and Top-down Processing. European Signal Processing Conference, Tampere, Finland 2000.
82. Klapuri A., Virtanen T. Separation of Harmonic Sounds Using Multipitch Analysis and Iterative Parameter Estimation. // Proc, of IEEE WASPAA, 2001.
83. Maher R. An approach to the separation of voices in composite musical signals. // PhD thesis, University of Illinois, Urbana-Champaign, 1989.
84. Martin K. D. A Blackboard System for Automatic Transcription of Simple Poly¬phonic Music // International Computer Music Conference, 1993, P. 100-112.
85. Martin К. D. Automatic Transcription of Simple Polyphonic Music // Com¬puter Music Journal №1(7), 2002.
86. McAdams S. Audition: Cognitive Psychology of Music // Proc, of the ICASSP. 2001.
87. McAdams S., Marin C. Auditory Processing of Frequency Modulation Coher¬ence/ J. Acous. Soc. Am. №86(12), 2001, P. 776-823.
88. McAdams S., Marin C. Segregation of Concurrent Sounds II: Effects of Spectral envelope Tracing, Frequency Modulation Coherence and Frequency Modula¬tion Width // International Computer Music Conference, 2002, P. 145-168.
89. McAdams S., Bigand E. Introduction a la cognition auditive If International Computer Music Conference, 2001, P. 19-67.
90. McAdams S., Bregman A. Hearing Musical Streams. // Computer Music Jour¬nal №3 (4), 1979 : P. 26-43.
91. McAdams S., Cunibile J.-C. Perception Of Timbral Analogies //J. Acous. Soc. Am. №94(3), 2000, P. 918-954.
92. McAdams S., Donnadieu S., Winsberg S. Context Effects in Timbre Space // Proc, of the ICASSP. 2000.
93. McAdams S., Spectral Fusion, Spectral parsing and the Formation of Auditory Images. // Ph.D. dissertation, Stanford University, CCRMA, 1984.
94. McAdams S., Winsberg S. A meta-analysis of timbre space. I: Multidimen¬sional scaling of group data with common dimensions, specificities, and latent subject classes. //J. Acous. Soc. Am. №18(1), 1996, P. 332-342.
95. McAdams. S. Segregation of concurrent sounds. I: Effects of frequency modula¬tion coherence. //J. Acoust. Soc. Am., Dec. 1989.
96. McAulay R., Quatieri J. Speech analysis/synthesis based on a sinusoidal repre¬sentation. // IEEE Trans, on Acoustics, Speech and Signal Processing, 34(4), pp. 744-754,1986.
97. McAulay R., Quatieri J. Speech analysis/resynthesis based on a sinusoidal rep¬resentation. I/IEEE Tr ASSP 34,1986.
98. Mellinger D. Event formation and separation in musical sound. // PhD thesis, CCRMA, Stanford University, 1991.
99. Moore B., Glasberg B., Baer T. A model for the prediction of thresholds, loud¬ness and partial loudness. // Journal AES, Vol. 45, No. 4, pp. 224-240. April 1997.
100. Redden S.K. Musik listening responses of groups differing in listening achievment// Psychomusicology. 1982. № 1 — 2. P. 52 — 59.
101. Saleh F. A la decouverte de l'ancienne gamme musicale egyptienne. — http: / / egyptsound.f ree.fr/ fathiVF.htm#
102. Scheirer Eric D. Music-Listening Systems. // PhD Thesis, Massachusetts Insti¬tute of Technology, 2000.
103. Sheldon D.A., Gregory D. Perception of tempo modulation by listeners of dif¬ferent levels of educational experience // Journal of Research in Music Educa¬tion, Fall 1997. Vol. 45 (3). P. 367-379.
104. Shoen M. The Psychology of MUsic. New York: Free Press, 1940.
105. Siegel J.-A., Siegel W. Categorical perception of tonal intervals: Musicians can't tell sharp from flat I/ Perception and Psychophysics, May. 1977. Vol. 21 (5). P. 399-407.
106. Simonton O.K. Thematic fame and melodic originality: A multivariate com¬puter content analysis//Journal of Personality. 1980 a. Vol. 48. P. 206 — 219.
107. Slaney B. A critique of pure audition. // Joint International Conference on AI, CASA workshop, Aug. 1995.
108. Slaney B. An efficient implementation of the Patterson-Holdsworth auditory filter bank. I/ Apple Computer Technical Report 35,1993.
109. Sloboda J.A. Parker D.H. Immediate recall of melodies // Musical Structure and Cognition. London: Academic press, 1985. P. 143 — 167.
110. Sloboda J.A. The music mind: a cognitive psychology of music. Oxford: Clar¬endon Press, 1985.
111. Smith E., Serra A. PARSHL: an analysis/synthesis program for non-harmonic sounds based on a sinusoidal representation. // International Computer Music Conference, 1987.
112. Smith P.S., Curnow R. Arousal Hyphotheses and the Effects of Music on Pur¬chasing Bechavior//Journal of Applied Psychology. 1986. Vol. 50. N° 3. P. 255 — 256.
113. Smith, L. S. Sound segmentation using onsets and offsets. // Interface Journal of New Music Research, №18(6), 2000.
114. Soede, W., Berkhout, A. J., Bilsen, F. A. Development of a directional hearing instrument based on array technology. // J. Acous. Soc. Am. 94(2), P. 785-798.
115. SonicStudio 1.8 NoNoise Guide.
ftp:// ftp.sonicstudio.com/PDFs/NoNoise_Guide_l .8.pdf
116. Stadler, R. W., Rabinowitz, W. M. On the potential of fixed arrays for hearing aids. // J. Acous. Soc. Am. 94(3), P. 1332-1342.
117. Stautner A. The auditory transform, if MSc. thesis, Massachusetts Institute of Technology, 1995.
118. Stautner, J. P. Analysis and synthesis of music using the auditory transform. //
S.M. thesis, Dept, of EECS, Massachusetts Institute of Technology.
119. Steiger, H,, Bregman, A. S. Competition among auditory streaming, dichotic fusion and diotic fusion. Perception & Psychophysics 32, P. 153-162.
120. Stubbs, R. J., Summerfield, Q. Effects of signal-to-noise ratio, signal periodic¬ity, and degree of hearing impairment on the performance of voice-separation algorithms. //J. Acous. Soc. Am. №89(3), 1998, P. 1383-1393.
121. Stumpf C. Tonpsychologie.2 Bande. Leipzig, 1890.
122. Suga, N. Cortical computational maps for auditory imaging. // Neural Net¬works №3,1997, P 3-21.
123. Sundberg J. The Science of Singing Voice. Decalb (111): North Illinois Univer¬sity Press, 1987.
124. Taylor K., Greenhough L. An object oriented ARTMAP system for classifying pitch. // International Computer Music Conference, 1993, pp. 244-247.
125. Terhardt E. Gestalt principles and music perception // Auditory processing of complex sounds / W.A.Yost, C.S.Watson (Eds.). Hillsdale (NJ): Lawrence Erl- baum Associates, Inc., 1987. P. 157 — 166.
126. Thomassen R. Melodic Accent: Experiments and a Tentative Model. // J. Acoust. Soc. Am., №71(6), 1982.
127. Tillmann B., Bigand E. Influence of global structure on musical target detection and recognition // International Journal of Psychology, Apr. 1998. Vol. 33 (2). P. 107-122.
128. Trehub S.E. Auditory pattern perception in infancy // Auditory development in infancy / S.E.Trehub & BASchneider (Eds.). New York: Plenum Press, 1985. P. 185-195.
129. Wendt C., Athina P. Petropulu. Pitch Determination and Speech Segmenta¬tion Using the Discrete Wavelet Transform. / [ Computer Music Journal №5(8), 1996.
130. Wessel D. Timbre as a Musical Control Structure // International Computer Music Conference, 1998, P. 211-242.

КУПИТЬ

Работу высылаем на протяжении 30 минут после оплаты.

Логин
Пароль

ИСПОЛЬЗОВАНИЕ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ОБРАБОТКИ И ВОССТАНОВЛЕНИЯ МУЗЫКАЛЬНЫХ СИГНАЛОВ

Тип работы

Диссертации (РГБ)

Предмет

радиотехника

ПУБЛИКУЕТСЯ ВПЕРВЫЕ

Просмотрено

551