Введение
1. Задача снижения размерности при составлении оптимального инвестиционного портфеля 5
1.1. Постановка задачи 5
1.2. Понижение размерности при составлении инвестиционного портфеля 8
1.3. Существующие подходы к применению кластеризации в составлении оптимальных портфелей 10
2. Предлагаемый алгоритм для снижения размерности 14
2.1. Основные этапы алгоритма 14
2.2. Разделение ценных бумаг на кластеры 17
2.3. Пересчёт цен и доходностей 23
2.4. Получение долей кластеров 27
2.5. Расчёт итоговых долей ценных бумаг 28
3. Применение предлагаемого алгоритма 31
3.1. Программная реализация предлагаемого алгоритма 31
3.2. Влияние предлагаемого алгоритма на составление инвестиционного
портфеля 34
3.2.1. Методология изучения влияния алгоритма на составление
инвестиционного портфеля 34
3.2.2. Набор данных для проведения экспериментов 36
3.2.3. Влияние предлагаемого алгоритма при кластеризации по методу одиночной связи 40
3.2.4. Влияние предлагаемого алгоритма при кластеризации по методу полной связи 43
3.2.5. Влияние предлагаемого алгоритма при кластеризации по методу средней связи 45
Заключение 49
Список литературы 50
Приложение
Составление оптимального портфеля ценных бумаг является важным и
частым случаем решения задачи оптимизации. Практическое применение существующих методов составления оптимального портфеля часто затруднено или
экономически не обосновано из-за большого числа доступных для инвестирования ценных бумаг (и, как следствие, большой размерности исходных данных).
Следовательно, необходимо исследовать возможность сокращения размерности
данных о ценных бумагах за счёт кластеризации — объединения ценных бумаг в
группы — кластеры.
В первой части данной работы приводится обзор предпринимавшихся ранее
попыток использовать кластеризацию для составления инвестиционных портфелей и даётся краткая справка по алгоритмам кластеризации.
Во второй части данной работы предлагается алгоритм снижения размерности исходных данных при составлении инвестиционного портфеля, основанный
на иерархической кластеризации доступных для инвестирования ценных бумаг.
В качестве меры близости ценных бумаг для иерархической кластеризации используется мера расстояния, основанная на коэффициенте парной корреляции
Пирсона.
В третьей части работы описывается программная реализация предложенного алгоритма на языке программирования Python; далее исследуется влияние предложенного метода на качество получаемого оптимального решения
на нескольких примерах составления оптимального портфеля ценных бумаг по
модели Марковица. Также исследуется влияние параметров иерархической кластеризации (метрики межкластерного расстояния и порогового значения кластеризации) на изменение качества получаемого оптимального решения. Исследуется
зависимость между целевой доходностью портфеля и возможностью снижения
размерности с помощью предложенного метода. Для каждого рассмотренного
примера приводятся графики и таблицы с основными полученными результатами
применения метода — понижением размерности и падением доходности (снижением качества оптимального решения) у портфеля, построенного с применением
предложенного метода по сравнению с портфелем, построенным без применения
предложенного метода.
В результате проведённого исследования было выявлено, что наилучшим
способом сокращения размерности в задаче составления оптимального инвестиционного портфеля является иерархическая кластеризация. Вычислять расстояние
между отдельными ценными бумагами необходимо с использованием меры расстояния на основе коэффициента парной корреляции между ними. Полученный
в результате алгоритм можно применять на практике. В дальнейшем исследования стоит направить на совершенствование методов кластеризации (как самих
алгоритмов, так и способов вычисления расстояний), чтобы сделать результаты
более предсказуемыми. Также стоит обратить внимание на гладкие алгоритмы
кластеризации, использование которых сейчас затруднено из-за отсутствия меры
расстояния между ценными бумагами, которая являлась бы метрикой. Другой
важной будущей задачей является обобщение алгоритма на задачу оптимизации
«в целом», чтобы расширить сферу возможного будущего применения алгоритма.
Markowitz H. Portfolio Selection. // The Journal of Finance. 1952. vol. 7:1. p. 77–91
[2] Diebold, F., Doherty N. Hering R. The known, the unknown, and the unknowable in
financial risk management: Measurement and theory advancing practice. Princeton :
Princeton University Press, 2010. 347 p.
[3] Дубровин В. И. Оськив О. И. Модели и методы оптимизации выбора инвестиционного портфеля // Радиоэлектроника, информатика, управление. 2008. Т. 1,
C. 49–60
[4] Chaitanya J. Markowitz Portfolio Optimization [Электронный ресурс]. URL: https:
//chaitjo.github.io/markowitz/ (дата доступа: 29.05.2020).
[5] Вишневер В. Я. Некоторые особенности конкуренции на российском фондовом
рынке // Вестник Самарского государственного экономического университета
2016. № 140. С. 13–15.
[6] Музыкантов Д. С какой суммы начинать торговать на бирже [Электронный ресурс]. URL: https://vc.ru/finance/
63970-s-kakoy-summy-nachinat-torgovat-na-birzhe (дата доступа: 30.05.2020).
[7] Орлов А. И. Прикладная статистика. Учебник. М. : Издательство «Экзамен»,
2004. 656 с.
[8] Прикладная статистика: классификация и снижение размерности: Справочное
издание. Айвазян С. А, Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Под ред.
С. А. Айвазяна. М. : Финансы и статистика, 1989. 607 с.
[9] Воронцов К. В. Лекции по алгоритмам кластеризации и многомерного шкалирования [Электронный ресурс]. URL: http://www.machinelearning.ru/
wiki/images/c/ca/Voron-ML-Clustering.pdf (дата доступа: 31.05.2020).
[10] Бронштейн Е. М., Ишманов И. Н. Формирование портфеля ценных бумаг на
основе распознавания образов // Финансовая аналитика: проблемы и решения.
2010. №. 11(35). С. 35–39.
[11] Тюхова Е. М., Сизых Д. С. Использование кластерного анализа для формирования портфеля ценных бумаг в инвестиционных системах (робоэдвайзерах)
// Управление развитием крупномасштабных систем MLSD’2019 М., 2019 г.
/ отв. ред. С.Н. Васильев. М., 2019. С. 300–303.
50[12] Tola V., et. al. Cluster analysis for portfolio optimization Journal of Economic
Dynamics and Control. 2008. Vol. 32(1). P. 235–258
[13] Leon D., et. al. Clustering algorithms for Risk-Adjusted Portfolio Construction. ´
// Procedia Computer Science 2017. Vol. 108. P. 1334–1343
[14] Lopez de Prado, M. A robust estimator of the efficient frontier. [Электрон- ´
ный ресурс] URL: https://ssrn.com/abstract=3469961 (дата доступа:
30.05.2020).
[15] Falcone J.-L., Albuquerque P. A Correlation-Based Distance. [Электронный
ресурс] URL:http://www.arxiv.org/abs/cs.IR/0402061 (дата доступа:
31.05.2020).
[16] Полетаев А. Ю., Спиридонова Е. М. Иерархическая кластеризация как метод
снижения размерности в задаче оптимизации инвестиционного портфеля
Марковица // Моделирование и анализ информационных систем 2020. №. 1(27).
С. 62–71.
[17] Diamond S., Boyd S. CVXPY: A Python-embedded modeling language for convex
optimization // Journal of Machine Learning Research 2016. Vol. 17(83). P. 1–5
[18] Agrawal A., Verschueren R., Diamond S., Boyd S. A rewriting system for convex
optimization problems // Journal of Control and Decision 2018. Vol. 5(1).P. 42–60
[19] Virtanen P., et. al. SciPy 1.0: Fundamental Algorithms for Scientific Computing in
Python // Nature Methods 2020. Vol. 17. P. 261–272
[20] Behnel S., Bradshaw R., Citro C. Dalcin L. Seljebotn D. S. Smith K. Cython: The
Best of Both Worlds // Computing in Science Engineering 2011. Vol. 13(2). P. 31–39
[21] van der Walt S, Colbert S. C., Varoquaux G. The NumPy Array: A Structure for
Efficient Numerical Computation // Computing in Science & Engineering 2011. Vol.
13(2). P. 22–30