Введение 4
Постановка задачи 6
Обзор Литературы 7
Глава 1. Обзор методов 11
1.1 Методы машинного обучения 11
1.2 Нейронные Сети 12
1.3 Метрики качества 18
Глава 2. Работа с данными и анализ 19
2.1 Формирование данных и постобработка 19
2.2 Анализ данных 23
2.3 Сравнение моделей глубокого обучения 33
Глава 3. Реализация 36
3.1 Математическая модель 36
2.2 Приложения для прогнозирования рейтинга 42
2.3 Реализация Android приложения 47
Выводы 51
Заключение 53
Список литературы 54
Рейтинг - это основной критерий, по которому судят практически любое произведение. Ожидаемый рейтинг показывает окупаемость товара и, следственно, необходимость его производства. Именно поэтому так важно уметь прогнозировать популярность будущего продукта. Продукт с высоким прогнозируемым рейтингом стоит производить в первую очередь, потому что на него будет спрос.
Чаще всего рейтинг встречается у кинофильмов, сериалов, шоу и анимационных произведений. В данной работе будет представлена модель, прогнозирующая оценку японских мультипликационных шоу - аниме. Этот вид анимации было решено выбрать из-за особенностей выпуска работ. Каждый квартал почти одновременно выходят около 30 произведений, в то время как у других кинолент нет такого строгого графика. Также японская анимация не имеет такую же освещенность в СМИ, как фильмы. Предполагается, что рейтинги аниме более корректные, так как на них не влияют общественное мнение и рецензии именитых критиков. Наконец, популярность аниме зависит от меньшего количества параметров.
Известность японской мультипликации во всем мире растет с каждым годом. И так как эта ниша стремительно развивается заграницей, а не только в родной Японии, то она стала одной из значимых категорий во внешней экономике родной страны. Международный рынок в 2021 улучшился на 109,4% в сравнении с 2019 годом . Популярность аниме продолжает расти с 2000-х годов, когда такой контент, как «Pokemon», распространился за границу. После этого индустрия пережила немало трудностей, таких как крах рынка видео, повальное интернет-пиратство, ограничения на вещание в Китае, финансовый кризис 2008 года и рост курса иены. Тем не менее, с улучшением качества интернет-услуг в середине 2010-х годов, китайской массовостью покупок легального контента под руководством правительства и быстрым развитием американских стриминговых платформ международное поле стало стремительно развиваться. Кроме того, этот импульс сохранялся даже во время пандемии COVID-19, поскольку количество людей, остающихся дома, стало стимулом для дальнейшего роста, и в 2020 году он обогнал внутренний рынок. Международный рынок вырос в три раза за период с 2015 по 2017 год и продолжает расти. Все больше популярных западных стриминговых сервисов лицензируют аниме, а также спонсируют свои собственные производства. С таким успехом аниме привлекает огромное количество международного внимание, что заставляет аниме- студии пересмотреть свои взгляды на то, как обратиться к более глобальному рынку, если они хотят добиться международного успеха.
В данной работе представлена математическая модель с 4 -мя входными параметрами и 3-мя дополнительными параметрами, которая предсказывает рейтинг произведения по десятибалльной шкале, основываясь на средних значениях параметров в предыдущем сезоне, со среднеквадратическим отклонением 0.3 (на момент 21.04.24). Эту модель можно экстраполировать на другие типы прогнозов, для которых известны исходные данные до выхода продукта, заданные дискретно в некотором временном интервале и имеющие либо категориальные, либо числовые значения.
Это исследование может быть полезно, как и для создателей, так и для целевой аудитории. Аниме-студиям необходимо понять, какими признаками должна обладать их продукция, чтобы в будущем привлекать международную аудиторию, а не только японскую. Командам,
занимающимся локализацией, также необходимо предсказать, какие аниме, вышедшие недавно, будут достаточно успешными, чтобы их стоило локализовать на свой язык. Зрители, скорее всего, сначала проверят описание аниме, прежде чем решат его посмотреть, поэтому понимание того, какие параметры наиболее привлекательны для аудитории, принесет этим группам наибольшую пользу.
В данной выпускной квалификационной работе были достигнуты следующие результаты:
• Сделан обзор предметной области
• Сделан обзор и сравнение различных подходов глубокого обучения
• Разработана программа для создания набора данных
• Проведен анализ данных и важности признаков
• Разработана и реализована математическая модель
• Разработано android приложение для прогнозирования рейтинга по введенным пользователем параметрам
В математической модели использовалась нейронная сеть и методы математической статистики. Модель показывает хорошие результаты. Предложенная формула для прогноза может быть расширена на большее количество параметров. В функции, отвечающей за создание набора данных, также можно настраивать временные интервалы для сбора данных и указывать виды параметров. Реализовано интуитивное понятное android приложение, с помощью которого можно легко узнать ожидаемый рейтинг произведения по введенным данным.