Введение 4
Постановка задачи 6
Обзор Литературы 7
Глава 1. Обзор методов 11
1.1 Методы машинного обучения 11
1.2 Нейронные Сети 12
1.3 Метрики качества 18
Глава 2. Работа с данными и анализ 19
2.1 Формирование данных и постобработка 19
2.2 Анализ данных 23
2.3 Сравнение моделей глубокого обучения 33
Глава 3. Реализация 36
3.1 Математическая модель 36
2.2 Приложения для прогнозирования рейтинга 42
2.3 Реализация Android приложения 47
Выводы 51
Заключение 53
Список литературы 54
Рейтинг - это основной критерий, по которому судят практически любое произведение. Ожидаемый рейтинг показывает окупаемость товара и, следственно, необходимость его производства. Именно поэтому так важно уметь прогнозировать популярность будущего продукта. Продукт с высоким прогнозируемым рейтингом стоит производить в первую очередь, потому что на него будет спрос.
Чаще всего рейтинг встречается у кинофильмов, сериалов, шоу и анимационных произведений. В данной работе будет представлена модель, прогнозирующая оценку японских мультипликационных шоу - аниме. Этот вид анимации было решено выбрать из-за особенностей выпуска работ. Каждый квартал почти одновременно выходят около 30 произведений, в то время как у других кинолент нет такого строгого графика. Также японская анимация не имеет такую же освещенность в СМИ, как фильмы. Предполагается, что рейтинги аниме более корректные, так как на них не влияют общественное мнение и рецензии именитых критиков. Наконец, популярность аниме зависит от меньшего количества параметров.
Известность японской мультипликации во всем мире растет с каждым годом. И так как эта ниша стремительно развивается заграницей, а не только в родной Японии, то она стала одной из значимых категорий во внешней экономике родной страны. Международный рынок в 2021 улучшился на 109,4% в сравнении с 2019 годом . Популярность аниме продолжает расти с 2000-х годов, когда такой контент, как «Pokemon», распространился за границу. После этого индустрия пережила немало трудностей, таких как крах рынка видео, повальное интернет-пиратство, ограничения на вещание в Китае, финансовый кризис 2008 года и рост курса иены. Тем не менее, с улучшением качества интернет-услуг в середине 2010-х годов, китайской массовостью покупок легального контента под руководством правительства и быстрым развитием американских стриминговых платформ международное поле стало стремительно развиваться. Кроме того, этот импульс сохранялся даже во время пандемии COVID-19, поскольку количество людей, остающихся дома, стало стимулом для дальнейшего роста, и в 2020 году он обогнал внутренний рынок. Международный рынок вырос в три раза за период с 2015 по 2017 год и продолжает расти. Все больше популярных западных стриминговых сервисов лицензируют аниме, а также спонсируют свои собственные производства. С таким успехом аниме привлекает огромное количество международного внимание, что заставляет аниме- студии пересмотреть свои взгляды на то, как обратиться к более глобальному рынку, если они хотят добиться международного успеха.
В данной работе представлена математическая модель с 4 -мя входными параметрами и 3-мя дополнительными параметрами, которая предсказывает рейтинг произведения по десятибалльной шкале, основываясь на средних значениях параметров в предыдущем сезоне, со среднеквадратическим отклонением 0.3 (на момент 21.04.24). Эту модель можно экстраполировать на другие типы прогнозов, для которых известны исходные данные до выхода продукта, заданные дискретно в некотором временном интервале и имеющие либо категориальные, либо числовые значения.
Это исследование может быть полезно, как и для создателей, так и для целевой аудитории. Аниме-студиям необходимо понять, какими признаками должна обладать их продукция, чтобы в будущем привлекать международную аудиторию, а не только японскую. Командам,
занимающимся локализацией, также необходимо предсказать, какие аниме, вышедшие недавно, будут достаточно успешными, чтобы их стоило локализовать на свой язык. Зрители, скорее всего, сначала проверят описание аниме, прежде чем решат его посмотреть, поэтому понимание того, какие параметры наиболее привлекательны для аудитории, принесет этим группам наибольшую пользу.
В данной выпускной квалификационной работе были достигнуты следующие результаты:
• Сделан обзор предметной области
• Сделан обзор и сравнение различных подходов глубокого обучения
• Разработана программа для создания набора данных
• Проведен анализ данных и важности признаков
• Разработана и реализована математическая модель
• Разработано android приложение для прогнозирования рейтинга по введенным пользователем параметрам
В математической модели использовалась нейронная сеть и методы математической статистики. Модель показывает хорошие результаты. Предложенная формула для прогноза может быть расширена на большее количество параметров. В функции, отвечающей за создание набора данных, также можно настраивать временные интервалы для сбора данных и указывать виды параметров. Реализовано интуитивное понятное android приложение, с помощью которого можно легко узнать ожидаемый рейтинг произведения по введенным данным.
1. Report 2022 Summary // URL: https://aja.gr.jp/english/japan-anime-data
2. Carter L. Marketing anime to a global audience: A paratextual analysis of promotional materials from Spirited Away //East Asian Journal of Popular Culture. - 2018. - Т. 4. - №. 1. - С. 47-59
3. Mihara R. A Coming of Age in the Anthropological Study of Anime?: Introductory Thoughts Envisioning the Business Anthropology of Japanese Animation //Journal of Business Anthropology. - 2020. - Т. 9. - №. 1. - С. 88-110
4. AlSulaim S. M., Qamar A. M. Prediction of Anime Series' Success using Sentiment Analysis and Deep Learning //2021 International Conference of Women in Data Science at Taif University (WiDSTaif). - IEEE, 2021. - С. 1-6
5. Setiawan N. et al. Time Series Model to Predict Future Popular Animes Genres in 2025 //E3S Web of Conferences. - EDP Sciences, 2023. - Т. 388. - С. 02002
6. Armenta-Segura J., Sidorov G. Anime Success Prediction Based on Synopsis Using Traditional Classifiers //Proceedings of Congreso Mexicano de Inteligencia Artificial, COMIA. - 2023
7. Fu X. Multiple Linear Regression Analysis of the Animation Score //Highlights in Science, Engineering and Technology. - 2023. - Т. 49. - С. 183188
8. Manav Agarwal, Shreya Venugopal, Rishab Kashyap. Movie Success Prediction and Performance Comparison using Various Statistical Approaches / // International Journal of Artificial Intelligence and Applications (IJAIA), Vol.13, No.1, January 2022
9. Gandasari R. A. et al. Predicting Over the Top Services Movies and Shows Success Using Machine Learning //2023 International Conference on Information Management and Technology (ICIMTech). - IEEE, 2023. - С. 89-94
10. e Souza T. L. D., Nishijima M., Pires R. Revisiting predictions of movie economic success: random Forest applied to profits //Multimedia tools and applications. - 2023. - Т. 82. - №. 25. - С. 38397-38420
11. Зимин И. В., Мироненко А. О., Агаев Ш. САМОАДАПТИРУЕМАЯ НЕЙРОСЕТЕВАЯ СИСТЕМА ОЦЕНКИ И ПРОГНОЗИРОВАНИЯ МИРОВЫХ КАССОВЫХ СБОРОВ ФИЛЬМА //Интеллектуальные системы в науке и технике. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века. - 2020. - С. 569-581
12. Поселенцева Д. Ю., Миков Р. О. НЕЙРОСЕТЕВОЕ ПРОГНОЗИРОВАНИЕ МИРОВОГО РЕЙТИНГА ФИЛЬМА И ЗАВИСИМОСТЬ ЭТОГО РЕЙТИНГА ОТ ПОПУЛЯРНОСТИ КИНОЛЕНТЫ В СОЦИАЛЬНЫХ СЕТЯХ //Интеллектуальные системы в науке и технике. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века. - 2020. - С. 582-587
13. Yu H., Fu M. DbRMP: Predicting Douban Rating of Movies with highdimensional Features by Comprehensive Machine Learning Algorithms //2022 IEEE International Conference on Artificial Intelligence and Computer Applications (ICAICA). - IEEE, 2022. - С. 540-544
14. Abidi S. M. R. et al. Popularity prediction of movies: from statistical modeling to machine learning techniques //Multimedia Tools and Applications. - 2020. - Т. 79. - С. 35583-35617
15. Qin M. et al. MAMRP: Multi-modal Data Aware Movie Rating Prediction //International Conference on Advanced Data Mining and Applications. - Cham : Springer Nature Switzerland, 2023. - С. 660-675
... всего 35 источников