🔍 Поиск работ

РАЗРАБОТКА ЛОКАЛЬНОГО РАБОЧЕГО МЕСТА ИССЛЕДОВАТЕЛЯ ИНТОНАЦИОННЫХ КОНСТРУКЦИЙ РУССКОГО ЯЗЫКА

Работа №207162

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы149
Год сдачи2020
Стоимость4300 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
13
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 9
1 ОБЗОР СУЩЕСТВУЮЩИХ СИСТЕМ ПО РАСПОЗНАВАНИЮ
РЕЧИ, ИХ ХАРАКТЕРИСТИК И МЕТОДОВ РАБОТЫ 11
1.1 Системы распознавания речи с закрытым исходным кодом 13
1.2 Системы распознавания речи с открытым исходным кодом 19
1.3 Распознавание речи 24
1.4 Цифровая обработка сигналов 27
1.5 Анализ метода мел-частотных кепстральных коэффициентов
применительно к процедуре голосовой аутентификации 29
2 УСТАНОВЛЕНИЕ ОПТИМАЛЬНОГО РЕШЕНИЯ НА ОСНОВЕ СУЩЕСТВУЮЩИХ АЛГОРИТМОВ И МЕТОДИК РАСПОЗНАВАНИЯ РЕЧИ 37
2.1 Энергия 38
2.2 Форманты 39
2.3 Просодические особенности при классификации акцентов 41
2.4 Распознавание акцентированной речи на основе знания родного языка 43
2.5 Обработка речевого сигнала 47
2.6 Использование формант в речевом образце 49
2.7 Спектральные характеристики речевого сигнала 49
2.8 Анализ речевого сигнала с использованием корреляционной
функции 50
2.9 Кепстральный анализ речевого сигнала 51
2.10 Анализ с использованием нейронных сетей 54
2.11 Анализ с использованием скрытых марковских моделей 56
2.12 Анализ с использованием динамического трансформирования
времени 57
2.13 Многокомпонентная информация, заложенная в речевом образце 59
2.14 Алгоритмы пофонемного распознавания речи в амплитудно¬временной области 62
2.14.1 Представление речевого сигнала во временной области 63
2.14.2 Классификация шипящих и пауз 64
2.15 Выбор языка и среды программирования 65
2.16 Мел-частотные кепстральные коэффициенты 65
3 РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 67
3.1 Программная реализация алгоритмов 69
3.1.1 Алгоритм обнаружения речевой активности 69
3.1.2 Кадрирование входного сигнала во временной области 72
3.1.3 Алгоритм динамической трансформации временной шкалы 73
3.1.4 Разложение в ряд Фурье 75
3.1.5 Применение оконной функции Хэмминга 75
3.1.6 Расчет mel-фильтров 77
3.1.7 Применение фильтров и логарифмирование энергии спектра ... 79
3.1.8 Косинусное преобразование 79
3.1.9 Мел-частотные кепстральные коэффициенты 79
3.2 Формирование проектной библиотеки образцов произношения 81
3.2.1 Группы пользователей проекта 81
3.2.2 Группы звуковых образцов проекта 81
3.2.3 Основные требования к записи образцов 82
3.2.4 Основная информация записанных образцов 82
3.3 Разработка программного кода обработки речи 83
4 РАЗРАБОТКА МОДУЛЯ ПОДБОРА ОПТИМАЛЬНЫХ
ПАРАМЕТРОВ ДЛЯ ЛОКАЛЬНОГО РАБОЧЕГО МЕСТА
ИССЛЕДОВАТЕЛЯ ИНТОНАЦИОННЫХ КОНСТРУКЦИЙ.
ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА И ТЕСТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 89
4.1 Создание библиотеки речевых образцов 90
4.2 Установление частотного диапазона входного сигнала 91
4.3 Применение алгоритма динамической трансформации
временной шкалы 92
4.4 Применение алгоритма обнаружения речевой активности 93
4.5 Применение оконной функции Хэмминга 94
4.6 Установление размера ширины кадра 95
4.7 Установление размера кадрового перекрытия 99
4.8 Использование мел-частотных кепстральных коэффициентов в
корреляции Пирсона 100
4.9 Результаты программной разработки локального рабочего места
исследователя интонационных конструкций русского языка 103
ЗАКЛЮЧЕНИЕ 107
БИЛИОГРАФИЧЕСКИЙ СПИСОК 109
ПРИЛОЖЕНИЯ 122
ПРИЛОЖЕНИЕ А Листинг программы 122


Разработка программного обеспечения для изучения различий в произношении носителей русского языка и дикторов, для которых он не является родным - актуальная задача на сегодняшний день. Это подтверждается распоряжением руководства от 3.09.2018 № 308/92 об организации проектного образования на тему «Интеллектуальная система анализа интонационных конструкций русского языка», грантовой поддержкой по постановлению правительства РФ № 1642 от 26.12.2017: Государственная программа РФ «Развитие образования». И связано с необходимостью популяризации русского языка за рубежом, примером тому можно считать открытие 8 центров по его изучению в Китае.
Требуется составить новые алгоритмы обработки речевых образцов с целью выявления интонационных признаков, сформировать и выполнить новые методики обучения с последующей возможностью разработки нейронных сетей для их реализации, подобных аналогов наборов данных для нейронных сетей на данный момент не существует. Вместо преобладающего в исследованиях акцента формантного анализа предлагается использование мелкепстральных коэффициентов и оценка распределения коэффициентов корреляции по частоте их появления между носителями русского и китайского языков.
В настоящий момент существует большое множество образовательных ресурсов, у которых в наличии имеется обучение с родного языка на необходимый пользователю иностранный. Однако, как правило, практика верного произношения на них не в приоритете, либо совершенно отсутствует. В лучшем случае используется распознавание речи по типу google translate, и подход нацелен лишь на распознавание сказанного, вне зависимости было ли произношение правильным. Стоит заметить, что почти каждое используемое для этих целей ПО закрыто, т.е. каким образом оно работает, с помощью чего и на что опирается - остается неизвестным. Также в этом имеется минимум пользы при изучении вариации между языками, однако некоторые платформы все же собирают речевые образцы, но что с ними происходит в дальнейшем - не разглашается.
С другой стороны, есть большое количество высокоспециализированного и многофункционального ПО (Praat, WaveSurfer, Speech Analyser и пр.), предназначенного для решения исследовательских задач в области обработки речи. Проблема состоит в том, что все они предоставлены на английском языке, требуют от филолога очень высокую подготовку по технической части, в том числе в умении написания кода, обладают очень неочевидным интерфейсом, недостаточно развернутой инструкцией. Также ставится под сомнение их эффективность, т.к. в статьях, в которых сравниваются эффективность и производительность формантного анализа по нескольким ПО, обнаруживается множество различий в точности.
Стоит упомянуть, что с интонациями работают лишь в узкоспециализированных областях, таких как, например, криминалистика и фонология в медицине, но всё же и они взаимодействуют лишь с языком, без особенностей межязыкового взаимодействия, потому что в паре языков «родной и изучаемый» сразу же возникает очень высокое количество отличий, которые необходимо фиксировать и впоследствии с ними работать.
На основе вышесказанного перед нами стоит цель создать подобный ресурс.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе данной работы были рассмотрены системы распознавания речи с закрытым и открытым системным кодом, их принципы работы, выявлены достоинства и недостатки каждой из них. Разобраны термины, классификации, методы и алгоритмы, связанные с преобразованием речи. Рассмотрены достоинства и недостатки формантного анализа и предложена альтернатива существующим методам - использование мел-частотных кепстральных коэффициентов.
Была проведена классификация существующих методов обработки речевых сигналов, применяемых в системах распознавания речи на основе аналитического обзора. Представленные классификации систем, характеристик и методов обработки позволяют на их основании дать оценку возможности применения новых математических аппаратов в задачах обработки речевых сигналов в системах распознавания речи.
На основе изучения реализованных принципов работы и исследований существующих методов обработки речевых сигналов, применяемых в системах распознавания речи, был сформирован алгоритм обработки речи и разработано программное обеспечение на его основе. Определены требования к образцам- эталонам носителей целевого языка. Проведена экспериментальная проверка, последующие доработка и модернизация программного комплекса анализа речи.
Для участия в эксперименте по тестированию программного обеспечения сформирована библиотека речевых образцов. В ходе эксперимента проведен подбор оптимальных параметров входных характеристик сигнала, таких как: звуковой диапазон, ширина кадра, перекрытие кадра, количество мел-частотных кепстральных коэффициентов и применяемая оконная функция. На выходе программы полученные мел-частотные кепстральные коэффициенты использованы в корреляции Пирсона для сопоставления входных образцов и визуального представления результата. Разработанное программное обеспечение позволяет экспериментальным образом подобрать оптимальные параметры, которые впоследствии будут использованы в автоматическом режиме работы основной системы.
По данной разработке были выполнены две научные публикации в рамках 63ей международной научной конференции Евразийского Научного Объединения.



1. Zwass, V. Speech recognition technology / V. Zwass // Encyclopedia Britannica. - 2016. -V.8, № 2. - P. 112-113.
2 Liwicki, M. A novel approach to on-line handwriting recognition based on bidirec-tional long short-term memory networks / M. Liwicki, A. Graves, J. Schmidhuber // Pattern Recognition Research. -2006. - V.1, №1 - P. 54-87.
3 Роженцева, М.А. Алгоритмы распознавания речи в мобильных приложениях для OS Android / М.А. Роженцева, Э.М. Вихтенко // Информативные технологии и высокопроизводительные вычисления. - 2019. - Вып. 2. - №5 (14). - С. 271-277.
4 Abenova, Z.S. Research into the methods of software product developing and maintaining / Z.S. Abenova, M.N. Petrov // Siberian Journal of Science and Technolo¬gy. - 2017. - V. 18, №. 4. - P. 706-710.
5. Baciu, A. System and method for performing an action on a phone in response to a user initiating an outbound call to one or more select phone numbers / A Baciu, S. Bhojwani, J. Billa, C. Berner. - Burlington, MA: Nuance Communications Inc., 2013. - 16 p.
6. Calder, D. SpeechKit: a multimedia speech tool / D. Calder // Proc. of the 10th In-ternational Conference on Information Integration and Web-based Applications & Ser-vices. - 2008. - V. 10. - P. 647-650.
7. Rai, R. Fragmentary shape recognition: A BCI study / Computer-Aided Design. -
2016. - V. 71. - P. 51-64.
8. Kumarage, C.J. Voice Driven Email Client / C.J. Kumarage. - LAP Lambert Ac-ademic Publishing, 2019 -176 p.
9. Jeon Y. A multimodal ubiquitous interface system using smart phone for human-robot interaction / Y. Jeon, H. Ahn // Proc. of the 2011 8th International Conference on Ubiquitous Robots and Ambient Intelligence (URAI). - 2011. - V. 21. - P. 183-192.
10. Kretschmer, F. Persistent data backend for OPC UA namespaces in IT infra-structures / F. Kretschmer, C. Arnim, A. Lechler, A. Verl //Procedia CIRP. - 2018. - V.72. - P. 174-178.
11. Lange, P. Tuning Sphinx to outperform Google’s speech recognition API / P. Lange, D. Suendermann // Proc. of the Conference on Electronic Speech Signal Pro¬cessing (ESSV), 2014. - 2014. - V.42. - P. 32-41.
12. Gutierrez, R.T. Understanding the role of digital commons in the web. The mak¬ing of HTML5 / R.T. Gutierrez // Telematics and Informatics. - 2018. - V. 35, №5. - P. 1438-1449.
13. Windrum, P. Leveraging technological externalities in complex technologies: Microsoft’s exploitation of standards in the browser wars / P. Windrum // Research Pol¬icy. - 2004. -V. 33, №3. - P. 385-394.
14. Matarneh, R. Speech recognition systems: a comparative review / R. Matarneh, S. Maksymova, V. Lyashenko, N. Belova // Journal of Computer Engineering (IOSR- JCE). - 2017. - V. 19, №5. - P. 71-79.
15 Gaida, C. Comparing open-source speech recognition toolkits / C. Gaida // Tech-nical report of the Project Oasis. - 2017. - V. 65, №2. - 117-123.
16 El Moubtahij, H. Using features of local densities, statistics and HMM toolkit (HTK) for offline Arabic handwriting text recognition / H. El Moubtahij, A. Halli, K. Satori // Journal of Electrical Systems and Information Technology - 2016. - V. 3. №3. - P. 99-110.
17 Lujan-Mares, M. iATROS: A speech and handwriting recognition system / M. Lujan-Mares, V. Tamarit, V. Alabau // V Journadas en Technologia del Habla - 2008. - P. 75-58.
18 El Amrania, M.Y. Building CMU Sphinx language model for the Holy Quran us¬ing simplified Arabic phonemes / M.Y. El Amrania, M.M. Hafizur Rahmanb, M.R. Wahiddinb, A. Shahb // Egyptian Informatics Journal - 2016. - V. 17. №3. - P. 305¬314.
19 Ogata, K. Analysis of articulatory timing based on a superposition model for VCV sequences / K. Ogata, K. Nakashima // Proceedings of IEEE International Confer¬ence on Systems, Man and Cybernetics - 2014. - January ed. - P. 3720-3725.
20 Алимурадов, А.К. Адаптивный метод повышения эффективности голосового управления / А.К. Алимурадов, П.П. Чураков // Труды международной научно - технической конференции «Перспективные информационные технологии» - 2016. - С. 196-200.
21. Бакаленко В.С. Интеллектуализация ввода-вывода кода программы с помощью речевых технологий: дис. ... магистра техники и технологии. - ДонНТУ, Донецк, 2016.
22 Балакшин П.В. Функция плотности длительности состояний СММ. Преимущества и недостатки / П.В. Балакшин // Современные проблемы науки и образования. - 2011. - № 1. - С. 36-39.
23 Беленко М.В. Сравнительный анализ систем распознавания речи с открытым кодом / М.В. Беленко // Сборник трудов V Всероссийского конгресса молодых ученых. Т. 2. - СПб.: Университет ИТМО, 2016. - С. 45-49.
24. Telmem, M. Estimation of the Optimal HMM Parameters for Amazigh Speech Recognition System Using CMU-Sphinx / M. Telmem, Y. Ghanou // Procedia Computer Science. - 2018. - V. 127. - Pages 92-101.
25. Thompson N.C. University licensing and the flow of scientific knowledge / N.C. Thompson, A.A. Ziedonis, D.C. Mowery // Research Policy. - 2018. - V. 47, №6. - P. 1060-1069.
26. Li, X. A fast and memory-efficient N-gram language model lookup method for large vocabulary continuous speech recognition / X. Li, Y. Zhao // Computer Speech & Language. - 2007. - V. 21, №1. - P. 1-25.
27. Polig, R. A hardware compilation framework for text analytics queries / R. Polig, K. Atasu, H. Giefers, C. Hagleitner // Journal of Parallel and Distributed Compu¬ting. - 2018. - V. 111. - P. 260-272.
28. Lee, A. Julius - An Open Source Real-Time Large Vocabulary Recognition En¬gine / A. Lee, T. Kawahara, K. Shikano // European Conference on Speech Communication and Technology. - 2001. - V. 7. - P. 167-170.
29. Lee, A. An Efficient Two-Pass Search Algorithm using Word Trellis Index / A. Lee, T. Kawahara, S. Doshita. // In Proc. International Conference on Speech and Lan-guage Processing. - 1998. - P. 1831-1834.
30. Fernau, H. A multi-parameter analysis of hard problems on deterministic finite automata / H. Fernau, P. Heggernes, Y. Villanger // Journal of Computer and System Sciences. - 2015. - V. 81, №4. - P. 747-765.
31. Моисеева, Е.В. Реализация гласных после мягких согласных на стыках слов в современном русском языке: дис. ... кан. филол. наук / Е.В. Моисеева. - М.: Изд. МГУ им. М. В. Ломоносова, 2015. - 217 с.
32. Mattheyses, W. Audiovisual speech synthesis: An overview of the state-of-the- art / W. Mattheyses, W. Verhelst // Speech Communication. - 2015. - V. 66 - P. 182-217.
33. Mas, M. Modus ponens and modus tollens in discrete implications / M. Mas, M. Monserrat, J. Torrens // International Journal of Approximate Reasoning. - 2008. - V. 49, № 2. - P. 422-435.
34. Abbott, D. Hot plug and hot swap / D. Abbott // PCI Bus Demystified. - 2004. -
- V. 41 - P. 153-169.
35. Beyerlein, P. Large vocabulary continuous speech recognition of Broadcast News - The Philips/RWTH approach / P. Beyerlein, X. Aubert, R. Haeb-Umbach, M. Harris // Speech Communication. - 2002. - V. 37, №1 - P. 109-131.
36. Swetapadma, A. An innovative finite state automata-based approach for fault di-rection estimation in transmission lines / A. Swetapadma, A. Yadav // Measurement. -
2017. - V. 99. -P. 13-22.
37. Huang, С. A geometry based efficient decoder for underdetermined MIMO sys-tems / C. Huang, C. Lee, W. Chung, T. Lee // Digital Signal Processing. - 2015. - V. 41- P. 60-69.
38. Wiesler, S. RASR/NN: The RWTH neural network toolkit for speech recogni¬tion / S. Wiesler, A. Richard, P. Golik, R. Schluter // 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - 2014. - P. 1-5.
39. Povey, D. The Kaldi Speech Recognition Toolkit / D. Povey, A. Ghoshal, G. Boulianne // Computer Speech & Language. - 2014. - V. 28, № 4. - P. 888-902.
40. Bergner, R. The IATROS study — ibandronate for treatment of renal osteo-dystrophy / R. Bergner, M. Hoffmann, M. Uppenkamp // Bone. - 2008. - V. 42. - P. 45-46.
41. Li, J. Multivariate time series anomaly detection: A framework of Hidden Mar¬kov Models / J. Li, W. Pedrycz, I. Jamal // Applied Soft Computing. - 2017. - V. 60. - P. 229-240.
42. Alaylioglu, H. ALSA: A Hybrid Stress Finite Element Program / H. Alaylioglu // Structural Analysis Systems. - 1986 - P. 1-10.
43. Беленко, М.В. Сравнительный анализ систем распознавания речи с открытым кодом / М.В. Беленко, П.В. Балакшин // Международный научно¬исследовательский журнал. -2017. - Вып. 4, №58. - С. 13-18.
44. Hu, G. Mid-to-high frequency piecewise modelling of an acoustic system with varying coupling strength / G. Hu, L. Tang, X. Cui // Mechanical Systems and Signal Processing. - 2019. - V. 1321 - P. 595-608.
45. Duineveld, K. Hierarchical Bayesian analysis of true discrimination rates in rep-licated triangle tests / K. Duineveld, M. Meyners // Food Quality and Preference. - 2008. - V. 19, №3. -P. 292-305.
46. Оппенгейм, А. Цифровая обработка сигналов / А. Оппенгейм, Р. Шафер. - М.: Техносфера, 2006. - 856 с.
47. Сергиенко, А.Б. Цифровая обработка сигналов / А.Б. Сергиенко. - СПб.: Питер, 2002. - 608 с.
48. Nower, N. Restoration scheme of instantaneous amplitude and phase using Kal¬man filter with efficient linear prediction for speech enhancement / N. Nower, Y. Liu, M. Unoki // Speech Communication/ - 2015. - V. 70. - P. 13-27.
49. Афанасьев, А.А. Аутентификация. Теория и практика обеспечения безопасного доступа к информационным ресурсам: учебное пособие для вузов / А.А. Афанасьев - М.: Горячая линия - Телеком, 2009. - 564 с.
50. Высоцкий, Г.Я. Алгоритм выделения основного тона спектральными методами для ЭВМ среднего класса / Г.А. Высоцкий, Н.В. Сомин // Дискретная обработка речевых сигналов. - М.: ВЦ АН СССР, 1979. - С. 36-66.
51. Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток / Г. Нуссбаумер: - М.: Радио и связь, 1985. - 248с.
52. Питерсон, Дж. Теория Петри и моделирование систем / Дж. Питерсон - М.: Мир, 1984. - 264 с.
53. Харкевич, А. А. Спектры и анализ / А.А. Харкевич - М.: Государственное издательство технико-теоретической литературы, 1953. - 213 с.
54. Huang, X. Spoken Language Processing. Guide to Algorithms and System De-velopment / X. Huang, A. Acero, H.W. Hon. - Prentice Hall, 2001. - 980 p.
55. Гоноровский, И.С. Радиотехнические цепи и сигналы / И.С. Гоноровский, М.П, Демин - М.: Радио и связь, 1994. - 480с.
56. Дворянкин, С. В. Взаимосвязь цифры и графики, звука и изображения / С.В. Дворянкин // Открытые системы. - 2000. - Вып.1. - №3(14). - С. 34-40.
57. Дворянкин, С.В. Голосовые признаки индивидуальной информативности в речевых системах управления доступом / С.В. Дворянкин, В.В. Кханг // Тезисы докладов научно-технической конференции профессорско-преподавательского состава. - М.: МТУСИ. - 2001. - С. 11-12.
58. Chandaka, S. Support vector machines employing cross-correlation for emotion¬al speech recognition / S. Chandaka, A. Chatterjee, S. Munshi // Measurement. - 2009. - V. 42, № 4. - P. 611-618.
59. Becchetti, С. Speech Recognition. Theory and С++ Implementation / C. Becchetti, L.P. Ricoili - John Wiley and Sons Ltd, 1999. - 428 p.
60. Rabiner L. Fundamentals of speech recognition / L. Rabiner, B.H. Juang - Pren-tice-Hall Inc., 1993 - 507 p.
61. Rabiner, L. A tutorial on hidden Markov models and selected applications in speech recognition / L. Rabiner // Institute of electrical engineering and radio electron¬ics. - 1989. - V. 2. - P. 86-120.
62. Koolagudi, S.G. Identification of Language using Mel-Frequency Cepstral Coef-ficients (MFCC) / S.G. Koolagudia, D. Rastogi, K.S. Rao // Procedia Engineering. - 2012. - V. 38. - P. 3391-3398.
63. Иванов, И.И. Анализ метода мел-частотных кепстральных коэффициентов применительно к процедуре голосовой аутентификации / И.И. Иванов // Актуаль¬ные проблемы гуманитарных и естественных наук. - 2015. - Вып. 10, №1. - С. 106-114.
64. Trancoso, I. Accent identification / I. Trancoso, C. Teixeira, A. Serralheiro // Institute of electrical engineering and radio electronics. - 1996. - P. 1784-1787.
65. Arslan, L.M. Frequency characteristics of foreign accented speech / L.M. Arslan, H.L. Hansen // In Proc. 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing. - Institute of electrical engineering and radio electronics. - 1997. - P. 1123-1126.
66. Kumpf, K. Foreign speaker accent classification using phoneme-dependent ac¬cent discrimination models and comparisons with human perception benchmarks / K. Kumpf, R.W. King // In Proc. European Conference on Speech Communication and Technology 1997. - 1997 - P. 2323-2326.
67. Кодзасов, С.В. Общая фонетика. / С.В. Кодзасов, О.Ф. Кривнова. -
М.: РГГУ, 2001. - 592 с.
68. Fung, P. Fast accent identification and accented speech recognition / P. Fung, W.K. Liu // Proceedings. 1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. - 1997. - V. 1. - P. 93-97.
69. Herring, P. BEEP: A Python library for Battery Evaluation and Early Prediction / P. Herring, C. B. Gopal, M. Aykol // SoftwareX. - 2018. - V. 11. - P. 81-86.
70. Johansson, S. Spectral analysis of time domain induced polarization waveforms / S. Johansson, P. Hedblom, T. Dahlin // Journal of Applied Geophysics. - 2018. - V. 159. - P. 446-452.
71. Wu, B. Audio signal separation via a combination procedure of time-reversal and deconvolution process / B. Wu, G. Too, S. Lee // Mechanical Systems and Signal Processing. - 2010. - V. 24, № 5. - P. 1431-1443.
72. Trethewey M.W. Window and overlap processing effects on power estimates from spectra / M.W. Trethewey // Mechanical Systems and Signal Processing. - 2000. - V. 12, № 2. - P. 267-278.
73. Archila-Suerte, P. Central processing of speech sounds and non-speech sounds with similar spectral distribution: An auditory evoked potential study / P. Archila- Suerte, J. Zevin, A.E. Hernandez // Brain and Language. - 2015 - V. 141. - P. 35-49
74. Герман, Д. Я. Конспект лекций по курсу «Цифровая обработка сигналов» / Д. Я. Герман. - М.: МГТУ им. Н. Э. Баумана, 2009. - 174 с.
75. Peeters, C. A comparison of cepstral editing methods as signal pre-processing techniques for vibration-based bearing fault detection / C. Peeters, P. Guillaume, J. Hel- sen // Mechanical Systems and Signal Processing. - 2017. - V 91. - P. 354-381.
76. Lantz, E. Subpixel signal centering and shift measurement using a recursive spectral phase algorithm / E. Lantz // Signal Processing. - 1989 - V. 17, № 4. - P. 365-372.
77. Miller, D.G. Comparison of vocal tract formants in singing and nonperiodic phonation / D.G. Miller, A.M. Sulter, H.K. Schutte, R.F. Wolf // Journal of Voice. - V. 11, №1. - P. 1-11.
78. Баскаков, С. И. Радиотехнические цепи и сигналы / С. И. Баскаков. - М.: Высшая школа, 2001. - 214 с.
79. Козлов, А.С. Кепстральный анализ в задачах слепой оценки скорости пере-дачи цифровых данных / А.С. Козлов, В.Н. Малышев // Радиотехника. - 2012. - № 7. - С. 67-71.
80. Любимов, А.Ю. Линейное предсказание речи - это просто / А. Любимов, М.М. Евсиков // Монитор. - 1995. - № 4. - С. 30-35.
81. Huang, X. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development / X. Huang, A. Acero, H. Hon. - Prentice Hall, 2001. - 980 p.
82. Чураков П.П. Современные методы обработки речевых сигналов / П.П. Чу-раков, А.Ю. Тычков, А.К. Алимурадов. - Пенза: Изд-во ПГУ, 2014. - 72 с.
83 Огнев, И. В. Распознавание речи методами скрытых марковских моделей в ассоциативной осцилляторной среде / И. В. Огнев, П. А. Парамонов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2013. - № 3 (27). - С. 115-126.
84 Моттль, В. Скрытые марковские модели в структурном анализе сигналов / В. Моттль, И. Мучник. - М.: Физматлит, 1999. - 352 с.
85 Goldenstein, S. Time warping of audio signals / S. Goldenstein, J. Gomes // Computer Graphics International, 1999. Proceedings. - 1999. - P. 52-57.
86. Sundberg J. Objective Characterization of Phonation Type Using Amplitude of Flow Glottogram Pulse and of Voice Source Fundamental / J. Sundberg // Journal of Voice. - 2020. - P. 16-24.
87. Потапова, Р.К Основы многоаспектного исследования «электронной личности» по голосу и речи в информационно-коммуникационной среде Интернета / Р.К. Потапова, В.В. Потапов // Человек: Образ и сущность. Гуманитарные аспекты. - 2017. - С. 87-111.
88. Карабалаева, М.Х. Алгоритмы пофонемного распознавания речи в амплитудно-временном пространстве / М.Х. Карабалаева., А.А. Шарипбаев // Знания- Онтологии-Теории. - 2009. - Т. 1, №4. - 245-252.
89. Шелепов, В.Ю. Амплитудная сегментация речевого сигнала, использующая фильтрацию и известный фонетический состав / В.Ю. Шелепов, А.В. Ниценко А. // Искусственный интеллект. - 2003. - № 3. - С. 421-426.
90. Свидетельство № 2018612612. Программа анализа речевых образцов: свидетельство о государственной регистрации программы для ЭВМ № 201861261
Рос. Федерация / Кацай Д.А., Исупова Т.Д.; заявитель и правообладатель ФГАОУ ВО «ЮУрГУ» (НИУ), - № 2017663963; заявл. 28.12.2017; зарегистрировано в Реестре программ для ЭВМ 20.02.2018. - 4 с.
91. Свидетельство № 2017663709. Тренажёр речевых образцов для лингафонного кабинета: свидетельство об офиц. регистрации программы для ЭВМ № 2017663709 Рос. Федерация / Филиппов Д.С., Бирюков А.Д., Кацай Д.А., Исупова Т.Д., Анисимов Я.О.; заявитель и правообладатель ФГАОУ ВО «ЮУрГУ» (НИУ), - № 2017660272; заявл. 12.10.2017; зарегистрировано в реестре программ для ЭВМ 11.12.2017. - 4 с.
92. Свидетельство № 2017663710. Сервер для тренажёра речевых образцов лингафонного кабинета: свидетельство об офиц. регистрации программы для ЭВМ № 2017663710 Рос. Федерация / Анисимов Я.О., Кацай Д.А., Исупова Т.Д., Бирюков А.Д., Филиппов Д.С.; заявитель и правообладатель ФГАОУ ВО «ЮУр- ГУ» (НИУ), - № 2017660277; заявл. 12.10.2017; зарегистрировано в реестре программ для ЭВМ 11.12.2017. - 4 с.
93. Свидетельство № 2018620324. Речевые образцы представителей разных национальностей для программы изучения русского языка: свидетельство о государственной регистрации базы данных № 2018620324 Рос. Федерация / Кацай Д.А., Исупова Т.Д., Филиппов Д.С., Шестакова Л.И., Харченко Е.В., Березовская Я.Л., Казакова Ю.В., Доронина Е.Г., Валеева Д.М., Панова Р.С.; заявитель и правообладатель ФГАОУ ВО «ЮУрГУ» (НИУ), - № 2017621601; заявл. 28.12.2017; зарегистрировано в Реестре баз данных 11.12.2017. - 8 с.
94. D. A. Katsay. Analysis of Speech Samples as a Means of Intensification of
Teaching Phonetics of a Foreign Lanuage / D.A. Katsay, E.G. Doronina, Yu.V. Ka¬zakova, E.V. Kharchenko, T.D. Isupova, // ICERI2017 Proceedings. - 2017. - P. 2771-2778.
95. Y. L. Beresovskaya. An Intelligent System of Analysis of Intonation structures: Application in Teaching the Russian Language to the Chinse Language Native Speakers / Y.L. Beresovskaya, T.D. Isupova, D.A. Katsay, O.I. Sharafutdinova, L.I. Shestakova,
O. B. Elagina, // Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. - 2018. - V. 7. - № 4. - P. 105-121.
96. Т. Д. Исупова. Программа идентификации речевых образцов с использованием метода кепстрального анализа / Т.Д. Исупова, Д.А. Кацай // Материалы XX конференции молодых ученых с международным участием. Под общей редакцией В.Г. Пешехонова. - СПб., 2018. - С. 142-143.


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ