ВВЕДЕНИЕ 2
1. МАШИННОЕ ОБУЧЕНИЕ И ТЕХНИЧЕСКИЙ АНАЛИЗ ПРИ
ПРОГНОЗИРОВАНИИ ФОНДОВОГО РЫНКА 4
1.1. Современные методы машинного обучения 4
1.2. Технический анализ фондового рынка 13
1.3. Возможности применения машинного обучения при распознавании
фигур разворота на рынке 16
2. СБОР И АНАЛИЗ ДАННЫХ ДЛЯ ПРОВЕДЕНИЯ МАШИННОГО
ОБУЧЕНИЯ НА ФОНДОВОМ РЫНКЕ 18
2.1. Приведение задач прогнозирования к задачам распознавания
образов 18
2.2. Предобучение сети на фигурах ТАР 26
2.3. Преобразование сети для прогнозирования цены определённой
бумаги 28
2.4. Повторное обучение на конкретной бумаге 29
3. РЕАЛИЗАЦИЯ ИНФОРМАЦИОННОЙ СИСТЕМЫ ДЛЯ
ТЕСТИРОВАНИЯ РАЗРАБОТАННОГО АЛГОРИТМА ПРОГНОЗИРОВАНИЯ РЫНКА 31
3.1. Создание информационной системы для прогнозирования рынка .... 31
3.2. Анализ процесса создания и оценка затрат при создании системы
анализа фондового рынка и их эффективности 32
3.3. Тестирование информационной системы на основе разработанного
алгоритма 37
ЗАКЛЮЧЕНИЕ 41
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 43
Выпускная квалификационная работа посвящена исследованию возможности прогнозирования изменения цен на рынке ценных бумаг при помощи одного из методов машинного обучения - нейронных сетей, а также технического анализа.
В выпускной квалификационной работе кратко раскрыты различные методы, используемые в машинном обучении, представлен алгоритм, основанный на принципах машинного обучения и методах технического анализа. В качестве практической части работы разработан комплекс программного обеспечения для прогнозирования изменения цен на рынке ценных бумаг, с помощью которого алгоритм протестирован на корректность.
Актуальность темы выпускной квалификационной работы связана в первую очередь с необходимостью и актуальностью развития систем прогнозирования в целом. Фондовый рынок - неотъемлемая часть экономики любой страны. Становление рынка ценных бумаг в РФ уже давно достигло значений, при которых его участники безусловно сталкиваются со сложностью определения подходящих методик анализа рыночной истории, а также объема и направленности личных вложений. Отечественные брокеры ведут бизнес в условиях подъема конкуренции, а также значительных колебаний котировок.
Поэтому очень важно искать и разрабатывать научные методы прогнозирования рынка. Заниматься разработкой экономико-математических способов, которые включают в себя статистические способы анализа и прогнозирования состояния фондового рынка.
Нужно подметить, что в связи с существующими тенденциями при операциях на отечественном рынке ценных бумаг, неразвитостью инфраструктуры и недостаточной ликвидностью всего рынка почти всем трейдерам будет необходимо ориентироваться на развитые мировые рынки ценных бумаг. Для благополучной работы необходимо применять методы и средства анализа и прогнозирования, используемые на данных рынках.
Задачами работы являются:
1. Анализ частоты появления и реализации наиболее используемых фигур технического анализа.
2. Подготовка и нормализация данных для обучающей выборки.
3. Разработка модели для прогнозирования рынка ценных бумаг.
4. Создание информационной системы для прогнозирования рынка.
5. Тестирование корректности алгоритма при помощи разработанной информационной системы.
В первой главе "Машинное обучение и технический анализ при прогнозировании фондового рынка" будут проанализированы основные понятия, задачи и методы машинного обучения и технического анализа. Также будет проанализировано что лучше подходит для задачи прогнозирования цен на фондовом рынке.
Во второй главе «Сбор и анализ данных для проведения машинного обучения на фондовом рынке» будет объяснён принцип алгоритма, который будет прогнозировать цены. Также будет представлен процесс предобработки данных.
В третьей главе «Реализация информационной системы для тестирования разработанного алгоритма прогнозирования рынка» будет представлен процесс создания информационной системы для прогнозирования рынка на основе описанного алгоритма. Также будут представлены результаты тестирования информационной системы для прогнозирования рынка разработанной на основе разработанного алгоритма.
Прогнозирование фондового рынка является достаточно сложной и комплексной задачей, которая требует знаний и умений не только в областях компьютерный наук, но и в экономике и некоторых других смежных областях. Однако все заявленные цели были выполнены.
По результатам выпускной квалификационной работы можно сделать следующие выводы.
Был проведён анализ частоты появления и реализации наиболее используемых фигур технического анализа. Изучив множество материалов по техническому анализу, было выявлено 6 наиболее перспективных для поиска и предсказания фигур. Были выявлены их самые явные характеристики и были выведены формальные способы их нахождения, в соответствии с классической литературой по теме. Были использованы фигуры:
- Двойная вершина;
- Двойное дно;
- Г олова и плечи;
- Развернутые голова и плечи;
- Медвежий прямоугольник;
- Бычий прямоугольник;
Была проведена подготовка и нормализация данных для обучающей выборки. Был найден оптимальный ресурс для поиска исторических данных о ценах на рынке за несколько последних лет. Этим ресурсом стал сервис Quandl. Был выявлен оптимальный способ хранения и анализа данных для их преобразования в обучающую выборку.
Была проведена разработка модели для прогнозирования рынка ценных бумаг. Был выбран оптимальный алгоритм для классифицирования фигур, для этого была выбрана свёрточная сеть. А позже был найден способ дальнейшего преобразования сети для прогнозирования цены конкретной акции. Это было сделано путём добавления новых слоёв в уже обученную сеть, и её переобучения.
Была создана информационная система для прогнозирования рынка, состоящая из комплекса программ для:
- Скачивания данных для обучающей выборки их преобразования в обучающую выборку;
- Создания искусственной нейронной сети и обучения искусственной нейронной сети;
- Переобучения искусственной нейронной сети;
- Использования искусственной нейронной сети;
Было проведено тестирование корректности алгоритма при помощи разработанной информационной системы. Были построены графики, показывающие рост числа правильных ответов с ростом количества данных, что доказывает корректность алгоритма. Итоговый результат точности составил примерно 63 процента, что является приемлемым результатом в раках работы.