Тип работы:
Предмет:
Язык работы:


Применение технологий анализа «Big data» для временных рядов финансовых данных (Кубанский Государственный Университет)

Работа №149699

Тип работы

Курсовые работы

Предмет

математические методы в экономике

Объем работы42
Год сдачи2024
Стоимость700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
66
Не подходит работа?

Узнай цену на написание


Есть приложение.

Введение 3
1 Технологии Big Data и сферы применения 5
2 Алгоритмы прогнозирования временных рядов финансовых данных 17
2.2 Логистическая регрессия 17
2.3 Линейный дискриминантный анализ 21
2.4 Квадратичный дискриминантный анализ 27
3 Прогнозирование курса акций с использованием библиотеки Scikit-Learn языка программирования Python 29
Заключение 36
Список использованных источников 37
Приложение А Код реализации статистических методов в Python 39

В XXI веке самым ценным ресурсом стала информация, использование которой позволяет достичь новых в1ысот во всех областях человеческой деятельности. Информации стало настолько много, что хранить и обрабатывать ее традиционными способами стало очень сложно, к тому же данные, обработанные традиционно, появляются, как правило, с опозданием, следовательно будут уже не актуальны. Кроме того, что различные организации создают огромые объемы данных, большая часть которых представлена в различных форматах (текстовые документы, видеофайлы, машинные коды и т.д.), локализованных в разнообразных хранилищах, эти данные весьма часто обновляются.
Термин «большие данные» (Big Data) существует уже почти двадцать лет, став за это время всемирно обсуждаемым. За историю своего недолгого существования он успел получить широкую популярность – с одной стороны эти технологии вызывают некоторый скепсис, с другой стороны большое число компаний уже внедрили Big Data в свою деятельность, что позволило оптимизировать работу с данными.
Цель данной работы изучение технологий Big Data и статистических методик для анализа одномерных временных рядов курсов ценных бумаг.
Для достижения поставленной цели необходимо решить следующие задачи:
– сделать обзор сфер применимости технологий «больших данных»;
– рассмотреть инструменты Data Science;
– изучить некоторые алгоритмы машинного обучения, используемые для моделирования временных рядов;
– протестировать изученные алгоритмы на реальных данных и построить прогнозы.
В качестве одномерных рядов финансовых данных использовались курсы акций ПАО «Сбербанк» и ПАО «Норникель», которые были взяты с интернет-ресурса Финам [1].
Наиболее распространенными инструментами для работы с «большими данными», а именно, их обработкой и анализом (Data Science) на сегодняшний день являются язык программирования для обработки статистических данных R и высокоуровневый язык Phyton. Поскольку существует библиотека Scikit-Learn, в которой реализовано достаточное количество алгоритмов машинного обучения, то в качестве среды реализации был выбран Phyton.
Курсовая работа состоит из введения, трех глав, заключения и списка использованных источников.
В первой главе курсовой работы описывается определения Big Data и обзор технологии обработки больших данных.
Вторая глава содержит описание статистических методов прогнозирования Big Data логистической регрессии и дискриминантного анализа.
Результаты логистического и дискриминантных анализов на примере ПАО «Сбербанк» и ПАО «Норникель» представлены в третьей главе.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения курсовой работы были разработана статистические модели прогнозирования тенденции временного ряда на основе логистической регрессии, линейного и квадратичного дискриминантного анализа с помощью библиотеки Scikit-Learn языка программирования Python.
В результате анализа результатов изученных и построенных методов статистических анализа временного ряда были выявлены следующие задачи, требующие дальнейшего изучения:
 более точных методов статистического анализа временных рядов;
 построение нейронных сетей для анализа и прогнозирования временных рядов.



1 Финам.ru – инвестиционная компания, брокер, Фондовая биржа ММВБ и РТС, стоимость, котировки, курс акций URL: http://finam.ru/ (дата обращения 10.06.2018)
2 Douglas, L. 3D Data Management: Controlling Data Volume, Velocity and Variety, L. Douglas, – Gartner, 2001.
3 Christy Pettey, Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of Data / Christy Pettey, Laurence Goasduff, – Gartner, 2011.
4 Data Age 2025: The Evolution of Data to Life-Critical URL: https://www.seagate.com/www-content/our-story/trends/files/Seagate-WP-DataAge2025-March-2017.pdf (дата обращения 10.06.2018)
5 Натан Марц, Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени / Натан Марц, Джеймс Уоррен, – М.: Вильямс. -2016. -292 c.
6 Haihong, E., Survey on NoSQL database, Pervasive Computing and Applications (ICPCA) / E. Haihong, Le Guan, Du Jian, – 2011 6th International Conference on 26-28 Oct. 2011, p. 363-366
7 Ghemawat, S., MapReduce: Simplified Data Processing on Large Clusters Proc. of the Sixth Symposium on Operating System Design and Implementation / S. Ghemawat, J. Dean, – San Francisco, USA, 2004. Vol. 6, N 10. P. 137-150.
8 White, T., Hadoop: The definitive guide / T. White, – 3rd -O’Reilly Media, 2012. 688 p.
9 Цыплаков, А.А., Некоторые эконометрические методы. Метод максимального правдоподобия в эконометрии / А.А. Цыплаков, – Учебное пособие. - Новосибирск: НГУ, 1997, 129 с.
10 Дубров, А.М., Многомерные статистические методы / А.М. Дубров, В.С. Мхитарян, Л.И. Трошин, – Москва. 2003г., 352 с.
11 Linear and Quadratic Discriminant Analysis URL: http://scikit-learn.org/stable/modules/lda_qda.html#id1 (дата обращения 10.06.2018)
12 Hastie, T., The Elements of Statistical Learning / T. Hastie, R. Tibshirani, J. Friedman, – Section 4.3, 2008, p.106-119.

Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ