ВВЕДЕНИЕ 4
ГЛАВА 1 Многоагентные интеллектуальные системы 6
1.1 Виды многоагентных систем 6
1.2 Нейронные сети 18
ГЛАВА 2 Программы по созданию визуальных и виртуальных цифровых
помощников 38
2.1 Программы для создания визуальных моделей 38
2.2 Программы для создания виртуальных цифровых помощников .... 49
ЗАКЛЮЧЕНИЕ 65
БИБИЛИОГРАФИЧЕСКИЙ СПИСОК 66
Исследования в области создания визуального виртуального цифрового помощника для маркетинговых, рекламных агентств и для СМИ являются актуальными, так как данное направление находится на подъеме в связи с усовершенствованием технологий по созданию визуальных агентов. Исследования в этой области нуждаются в разработке необходимых рекомендаций для того, чтобы совершенствовать практические знания в данной области.
Цель исследования: разработать предложения по внедрению в информационную среду визуального виртуального цифрового помощника.
Для достижения поставленной цели, были поставлены следующие задачи исследования:
• изучить теоретические основы многоагентных систем;
• описать работу нейронных сетей, интеллектуальных агентов и рассмотреть принципы их работы;
• исследовать программы по созданию визуальных и виртуальных цифровых помощников и определить возможность появления последних на сегодняшний день;
• сформулировать и предложить рекомендации по использованию визуальных виртуальных помощников в информационной среде.
Разработанность темы исследования.
Подходы к определению понятия «виртуальный помощник» отражены в работах ученых, работающих в Apple, IBM, Microsoft, Amazon и др.
История появления многоагентных систем и нейронных сетей описана в работах В. Лессера, К. Хьюитта и Д. Лената, Л. Эрмана и Ф. Хэйс-Рота и др.
Вышеназванные обстоятельства предопределили тему магистерской диссертации: «Эффективное управление контентом на основе многоагентных интеллектуальных систем».
Объект исследования - многоагентные интеллектуальные системы.
Предмет исследования - визуальные и виртуальные цифровые помощники-агенты.
Методы исследования: основными методами в ходе нашего исследования являются сравнительный и концептуальный подход к анализу визуальных и виртуальных цифровых помощников.
Выпускная квалификационная работа состоит из двух частей, каждая из которых поделена на два раздела. В первой части работы, в первом разделе рассматриваются многоагентные интеллектуальные системы. Была обобщена информация о работе многоагентных интеллектуальных систем, дано определение и составлена общая характеристика их деятельности, а во втором разделе рассмотрены интеллектуальные агенты и нейронные сети.
Во второй части работы, в первом разделе были исследованы программы по аудио-управляемому синтезу видео лица, а также проведен их сравнительный анализ. Второй раздел посвящен проблеме создания и взаимодействия визуальных и виртуальных помощников.
На основании проведенного исследования в соответствии поставленной целью были сделаны следующие выводы:
Рассмотрев программы и технологии по созданию аудио, видео контента можно прийти к убеждению, что появление визуального виртуального цифрового помощника уже практически решённая задача. И на примере Китая, мы видим появление робота телеведущего, который может работать по 24 часа, есть так же другие модели, использующиеся в других областях. Но проблема в том, что дальнейшее участие в повседневной жизни прорисованных человекоподобных моделей пока под вопросом. Эффект «зловещей долины», когда чем сильнее похожесть на человека нарисованной модели или робота, тем больше ужаса и дискомфорта испытывает тот, кто за ним наблюдает. Это происходит на подсознательном уровне у человека.
Поэтому, предлагаю для создания аватара визуального помощника, ис-пользовать видео реального человека, а не прорисовывать с его фотографий и не создавать человекоподобных роботов.
Для небольших ТРК можно использовать для работы согласно должностной инструкции реального представителя компании, (менеджер по продажам, журналист, телеведущий и т.д.). Этот аватар будет общаться при помощи программ, то есть он будет понимать речь и произносить своим (обученным через нейросеть) синтезируемым голосом заранее загруженный диалоговый текст, либо можно при помощи API подключить любой из существующих голосовых помощников.
1. Минский М., Пейперт С. Персептроны. - М.: Мир, 1971. - 261 с.
2. Agiomyrgiannakis Y. Vocaine the vocoder and applications in speech synthesis // Acoustics, Speech and Signal Processing (ICASSP), - 2015.
3. Alexa Amazon [Электронный ресурс]. - Режим доступа: https://de- veloper.amazon.com/en-US/docs/alexa/alexa-voice-service/api-over- view.html(дата обращения: 04.05.2020).
4. Apple [Электронный ресурс]. - Режим доступа: https://www.apple.com/ru/siri(дата обращения: 04.05.2020).
5. Association for Computing Machinery [Электронный ресурс]. - Ре-жим доступа:
https ://www.youtube. com/watch?time_continue=99&v=PJs3rlCBk1E &feature=emb_logo (дата обращения: 06.05.2020).
6. Bowling M.H. Convergence and no-regret in multiagent learning // NIPS, 2004.
7. Cao C, Qiming Hou, and Kun Zhou. Displaced dynamic expression re-gression for real-time facial tracking and animation // TOG, 2014.
8. Chavez A. D. Dreilinger, R. Guttman and P. Maes. A Real-Life Exper-iment in Creating an Agent Marketplace /In Proceedings of the Second Conference on Practical Applications of Agents and Multi-Agent Sys-tems, 1997.
9. Deepmind [Электронный ресурс]. - Режим доступа https://deepmind.com/blog/article/wavenet-generative-model-raw- audio(дата обращения: 05.05.2020).
10. Fisher M., J. Muller, M. Schroeder, G. Staniford, and G. Wagner. Meth¬odological Foundations for Agent-Based Systems // The Knowledge Engineering Review ,1997. - P. 323-329.
11. Fxtraders [Электронный ресурс]. - Режим доступа: https://fxtraders.info/news/forex-trading/view/1699/obzor- neyrosetevih-tehnologiy-i-terminalov-na- foreks/?utm_referrer=https%3A%2F%2Fyandex.ru%2Fclck%2Fjsredi r (дата обращения: 03.05.2020).
12. Garrido P. L. Valgaerts, H. Sarmadi, I. Steiner, K. Varanasi, P. Perez
and C. Theobalt. Modifying face video of actors for plausible visual alignment to a dubbed audio track // (Proceedings of EU¬
ROGRAPHICS), 2015.
13. Github [Электронный ресурс]. - Режим доступа:
https://aiiaksandrsiarohin.github.io/first-order-model-website (дата
обращения: 04.05.2020).
14. Github [Электронный ресурс]. - Режим доступа: https://github.com/Rayhane-mamah/Tacotron-2(дата обращения: 05.05.2020).
15. Goodfellow, Ian J.; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron & Bengio, Yoshua Generative Adversarial Networks, 2014 // arXiv: 1406.2661.
16. Google Assistant [Электронный ресурс]. - Режим доступа: https://support.google.com/assistant/answer/7126196?p=assistant_priv acy&hl ru (дата обращения: 04.05.2020).
17. GoPro [Электронный ресурс]. - Режим доступа https://gopro.ru/blogs/rezhimy-i-nastroyki-kamer-gopro/funktsiya- quikstories-v-prilozhenii-gopro(дата обращения: 05.05.2020).
18. Iknigi [Электронный ресурс]. - Режим доступа: https://iknigi.net/avtor-kollektiv-avtorov/118658-zvezdnye-voyny- psihologiya-kinovselennoy-kollektiv-avtorovZreadZpage-5.html (дата обращения: 08.05.2020).
19. Instagram.com[Электронный ресурс]. - Режим доступа: https: ZZwww.instagram.com/lilmiquelaZ(дата обращения: 08.05.2020)
20. Jennings and Campos. Towards a Social Level Characterisation of So-cially Agents ZZ IEE Proceedings on Software Engineering, 1997.
21. Jennings N. R. Controlling Cooperative Problem Solving in Industrial Multi-Agent Systems using Joint Intentions ZArtificial Intelligence, 1995.
22. Jennings N. R., P. Faratin, M. J. Johnson, T. J. Norman, P. O’Brien, M. E. Wiegand. Agentbased business pro-cess management ZZ International Journal of Cooperative Information Systems, 1996.
23. Lombardi S., J. Saragih, T. Simon and Y. Sheikh. Deep appearance models for face rendering. ACM Trans. on Graph ZZ (Proceedings of SIGGRAPH), 2018.
24. Lumen5 [Электронный ресурс]. - Режим доступа
https:ZZlumen5.comZcase-studiesZdnvgl (дата обращения: 05.05.2020).
25. Magisto [Электронный ресурс]. - Режим доступа
https:ZZwww.magisto. comZpromotional- video?prev_path=Z&via=top_menu (дата обращения: 05.05.2020).
26. McCulloch Warren STUICI Walter Pitts. A logical calculus of the ideas immanent in nervous activity ZZ Bulletin of Mathematical Biology. — New York: Springer New York, 1943. - Vol. 5, No 4. - P. 115-133.
27. Microsoft [Электронный ресурс]. - Режим доступа:
https:ZZwww.microsoft.comZen-usZcortana (дата обращения:
04.05.2020).
28. Minaee S, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu Deep Learning Based Text Clas-sification: A Comprehen-sive Review ZZ arXiv:2004.03705.
29. Minsky M. The Society of Mind. NY.: Simon and Schuster, 1986.
30. New China TV [Электронный ресурс]. - Режим доступа: https://youtu.be/GAfiATTQufk(дата обращения: 04.05.2020).
31. Newell A. The Knowledge Level /| Artificial Intelligence Vol 18, No 1, 1982.
32. Nwana H. S, D. T. Ndumu and L. C. Lee. ZEUS: An advanced toolkit for engineering distributed multi-agent systems / In Proc. 3rd Int. Conf. Practical Appl // Intelligent Agents and Multi-Agent Technology, 1998.
33. Panait L., S. Luke. Cooperative Multi-Agent Learning: The State of the Art. / Panait L., S. Luke // Autonomous Agents and Multi-Agent Sys-tems, No11, 2005.
34. Paperspace [Электронный ресурс]. - Режим доступа: https://blog.paperspace.com/2020-guide-to-synthetic-media(дата об-ращения: 02.05.2020).
35. Perficent [Электронный ресурс]. - Режим доступа: https://www.per- ficient.com/industries/life-sciences(дата обращения: 03.05.2020).
36. Phonearena [Электронный ресурс]. - Режим доступа: https://www.phonearena.com/(дата обращения: 03.05.2020).
37. Polly Amazon [Электронный ресурс]. - Режим доступа https: https://aws.amazon.com/ru/polly(дата обращения: 05.05.2020).
38. Qi J, R. Vazquez, and M. Krstic. Multi-agent deployment in 3-d via pde
39. Rawshorts [Электронный ресурс]. - Режим доступа https://rawshorts.zendesk.com/hc/en-us/articles/360002316574- Explainer-Videos(дата обращения: 06.05.2020).
40. Rezaee H. and F. Abdollahi. Average consensus over high-order mul-tiagent systems /| IEEE Transactions on Automatic Control, vol. 60, No.
11.
41. Rosenblatt F.. Perceptron: a probabilistic model for storing and organ-izing information in the brain / Cornell Aviation laboratory Psycho-logical review, Vol. 65, No. 6, (1958), P. 386-408.
42. Russell, P. Norvig, and A. Intelligence. A modern approach /Artificial Intelligence // Prentice-Hall, Egnlewood Cliffs.
43. Schild, K. and Bussmann, S. Self-Organization in Manufacturing Op-erations / Communications of the ACM.
44. Schmidhuber J.. Deep learning in neural networks: An overview // Neu¬ral Networks. 61: (2015).
45. South China Morning Post [Электронный ресурс]. - Режим доступа: https://www. scmp. com/tech/innovation/article/2172235/xinhua-news- agency-debuts-ai-anchors-partnership-search-engine-sogou (дата об-ращения: 05.05.2020).
46. Speech parameter generation algorithms for HMM-based speech syn-thesis / in Proc. ICASSP, 2000.
47. Techcrunch [Электронный ресурс]. - Режим доступа: https://techcrunch. com/2018/04/23/the-makers-of-the-virtual- influencer-lil-miquela-snag-real-money-from-silicon-valley (дата об-ращения: 08.05.2020).
48. TheHUB [Электронный ресурс]. - Режим доступа
https: //www.youtube. com/watch?v=brOWALdRC5U Disney
Revolutionizes The Future Freepng (дата обращения: 03.05.2020)
49. Thepresentation.ru[Электронный ресурс]. - Режим доступа: https://thepresentation.ru/uncategorized/intellektualnye-sistemy-dlya- modelirovaniya-slozhnyh-proizvodstvennyh-protsessov-i- avtomaticheskogo-raspoznavaniya-lits-i-ustnoy-rechi-lyudey(дата об-ращения: 02.05.2020).
50. Tokuda K., T. Yoshimura, T. Masuko, T. Kobayashi, and T. Kitamura,
51. Two Minute Papers[Электронный ресурс]. - Режим доступа: https://www.youtube.com/watch?v=(дата обращения: 04.05.2020). Vougioukas K., S. Petridis and M. Pantic. End-to-end speech-driven facial animation with temporal gans // BMVC, 2018.
52. Vougioukas K., S. Petridis and M. Pantic . Realistic speech-driven fa-cial animation with gans // (IJCV). 2019.
53. Wooldridge M. An Introduction to MultiAgent Systems / Wooldridge M. - Chichester, England: John Wiley & Sons Ltd, 2002.
54. Young T, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. Recent Trends in Deep Learning Based Natural Language Processing // arXiv:1708.02709.
55. Zollhöfer , M. J. Thies, P. Garrido, D. Bradley, T. Beeler, P. Pérez, M. Stamminger, M. Nießner and C. Theobalt /State of the Art on Monocu-lar 3D Face Reconstruction, Tracking, and Applications. Computer Graphics Forum //(Eurographics State of the Art Reports), 2018.