Глава 1. Введение 4
1.1. Общее описание задачи 4
1.2. Результаты работы 8
Глава 2. Достаточное условие разложения Като 11
2.1. Асимптотика Дт;п и Цтах 11
2.2. Асимптотика B(5)/^min 14
Глава 3. О скорости сходимости ||P^-(5) — P^-|| и асимптотике | |V01)| | . . 16
3.1. Оценка теоремы 1.1.2 16
3.2. Асимптотика нормы матрицы V01) 24
Глава 4. Ошибки восстановления 28
4.1. Общие описание задачи и метода решения 28
4.2. Ошибка восстановления последнего элемента сигнала 29
Заключение 34
Список литературы 35
Приложение А. Численная иллюстрация полученных результатов . . 36
А.1. Асимптотики собственных чисел 37
А.2. Асимптотики Oj 38
А.3. Асимптотика ||S0B(5)P0|| 39
А.4. Асимптотика || V01) || 40
А.5. Ошибки восстановления последнего элемента 41
А.6. Значения г^ 43
А.7. Поведение нормы разности проекторов 44
А.8. Главный член разности проекторов 46
1.1. Общее описание задачи.
Существует семейство методов анализа временных рядов, основанных на Signal Subspace подходе. Для них, в частности, точность оценки незашумленного временного ряда зависит от близости некоторых пространств. Следуя [1], рассмотрим следующую задачу.
Пусть имеется исходный ряд («сигнал») F^ = (f0,/I,...,/N-I), «помеха» Е^ = (е0,е1,... ,6N-i), и наблюдается ряд F^(5) = F^ + 5Е^. Задача состоит в том, чтобы получить приемлемое приближение F^ (5) к сигналу F^.
Прежде чем формально описать рассматриваемый способ решения этой задачи, введем нужные обозначения.
Будем считать, что ряд F^ можно задать с помощью рекуррентной формулы
d
fn = ^2bk$п-к, п —d.
k=i
с минимально возможным для данного ряда d. Преобразуем временной ряд F^, удовле-творяющий формуле (1.1.1), в матрицу H размерности L х К, где L + К = N — 1 и min (L, К) — d:
1 fo fi • • • fK -1 '
H = fi '•■ fK .
• • •
fL-1 fL ••• fL+K-1J
Такая матрица называется траекторной. Она содержит много важной информации о ряде. Например, rank H = d где d — количество начальных элементов, задающих рекуррентную последовательность (1.1.1). Аналогичную матрицу для ряда Е^ будем обозначать E.
Траекторную матрицу для F^(5) будем обозначать H(5) = H + 5E. Но нам больше интересна симметричная матрица A размера L х L, задаваемая равенством A = HHT. Заметим, что её собственные числа вещественные и неотрицательные. Пусть Uo — под-пространство, порожденное собственными векторами матрицы A с собственным числом
0, a U^ — его ортогональное дополнение. Тогда Ро и Р^ — соответственно операторы ортогонального проектирования на эти подпространства.
Обозначим U^-(5) подпространство, образованное d собственными векторами мат-рицы A (5) = H(5)HT(5), соответствующими её наибольшим собственным числам, а Ро"(5) — оператор ортогонального проектирования на это подпространство. U^ и U^(5) и есть интересующие нас пространства. Их близость будем оценивать как близость их операторов проектирования ||Р^(5) — Р^||, причем рассматриваться будет асимптоти-ческий случай N ^ то.
Один из главных результатов, с помощью которого делаются оценки ||Р^(5) — Р^~ ||, основан на классическом разложении Т Като [2] и имеет (см. [1, th.2.1]) следующий вид.
Теорема 1.1.1 (Разложение Като). Если существует такое 50 , что при любом 5 G
(—50,50) выполнено неравенство ||B(5)|| < ^min/2, то
где
Wp(5) = (—1)p Е W,(i1,...,lp+l)
11 _ -lp—i=p, 1^ >0
и
WP((1,... ,/"+1) = SQ1 B(5)SQ2... SQ'B(5)SQ'+1.
Также имеет место ещё одно разложение:
где
V01) = PoEHTSo + SoHETPo.
В настоящей работе рассматривается один из Signal Subspace методов, называемый SSA (Singular Spectrum Аnalysis). Он используется для разделения исходного ряда на несколько различных интерпретируемых аддитивных компонент. Подробное описание метода можно найти в [3] или в [4].
В статье [1] рассматривается вариант SSA, посвященный уже описанной задаче отделения сигнала F^ = (fo,..., fN-1) от аддитивной помехи E^ = (eo,... , е^-1) при больших N.
В рассматриваемой ситуации процедуру SSA можно описать следующим образом.
1. производится сингулярное разложение матрицы H(5);
2. элементарные матрицы этого разложения, соответствующие d наибольшим сингу-лярным числам, суммируются. В результате получается матрица H;
3. производится ганкелизация матрицы H, то есть строится ганкелева матрица, наи-более близкая к H по норме Фробениуса;
4. наконец, эта матрица взаимно-однозначным образом преобразуется во временной ряд F^ (5), который объявляется приближением к F^ .В дальнейшем оператор перехода от произвольной матрицы G к порождаемому ею временному ряду G обозначается 5, так что G = 5(G).
В [1] показано, что ряд F^ (5) — F^ (то есть ряд из погрешностей полученной ап-проксимации сигнала F^) имеет следующий вид;
Fw(5) — Fw = 5((P^(5) — Po±) H(5) + 5Po±E) . (1.1.6)
Формула (1.1.6) подчеркивает роль близости пространств U^ и U^(5) в методе SSA.
Представление (1.1.6), в частности, было применено в [1] для растущего экспонен-циального сигнала fn = ап с а > 1 и постоянной помехи еп =1. При этом оказалось, что максимальная по модулю погрешность аппроксимации элементов сигнала F^ не будет стремиться к нулю, если L ~ aN с a G (0,1) при N ^ то. Такой же результат имеет место для “пилообразной” помехи еп = (—1)п (см. [5]).
Основной целью настоящей работы является исследование точности метода SSA для сигнала /п = а'П + саП с простейшей постоянной помехой при условии п1 > а2 > 1 и N ^ то. Для этого понадобятся точные выражения (и их асимптотики) собственных чисел цтах и ^min матрицы HHT.
При отыскании этих собственных чисел будут использоваться следующие общие утверждения, доказательство которых можно найти в [6].
Пусть матрица G размера L х К ранга d < min L, К представлена в виде
d
G = £ PkQT, Рк G RL,Qk G RK,
k=1
где P1,... , Pd (и Q1,... , Qd) — линейно независимые вектора. Введем следующие обо-значения.
• ai = || Pi ЦК Qi ||. Не умаляя общности, будем считать, что а1 > а2 > ... > ad.
• Xi = Pi/|Pi|, Y = Qi/|Qi|.
• X = [X1,X2,... ,Xd], Y = [Y1, Y2,..., Yd].
• Amax — максимальное собственное число GGT.
• U =[P1 : ... : Pd], V =[Q1 : ... : Qd].
• C = XTXnpQYTYHpQ,
• C = UTUVTV.
Лемма 1.1.1. [6, lem. 2.1]
Если A — положительное собственное число GGT с собственным вектором Z, то
1. A — собственное число C с собственным вектором XTZ.
2. A является собственным числом C' с собственным вектором UTZ.
Теорема 1.1.4. [6, prop. 2.1]
Пусть вектора Pk ,Qk меняются так, что
XTX ^ Bi, YTY ^ B2, где матрицы B1, B2 обратимы.
1. Пусть а1 ' 'м и &j/а1 ^ Cj. Обозначим
1 0 • •• 0
д„ =
max = 0
.
.
. C2 •
.. .
. • 0
.
.. ..
0 0 • • Cd)
Если матрица M1 = B1 AmaxB2Amax не нильпотентная, то Amax/a2 ^ 0 > 0, где 01 — максимальное собственное число M1.
2. Пусть аа ' ^ и ad/aj ^ dj. Обозначим
di 0 • • 0'
. =
min = 0
.
.
. d2 •
.. .
. • 0
.
.. ..
0 0 • • 1}
Если матрица M2 = AminB2 1AminB11 не нильпотенная, то Amin/ad ^ 02 > 0, где 1/02 — максимальное собственное число M2.
1.2. Результаты работы
Как уже говорилось, в работе проводилось изучение метода SSA для частного слу-чая сигнала fn = а™ + ш2 и постоянной помехи еп = 1. Приведем описание полученных результатов по разделам.
В главе 2 изучается асимптотика нормы ||B(5)||.
Условие ||B(5) || < ^min/2 при грубой оценке порождает неестественное ограничение а1 < а2> на исследуемый сигнал, как, например, в предложении [1, prop.3.3]. Первой це¬лью работы является попытка ослабления этого условия с помощью нахождения точной асимптотики ||B(5) ||/p.min. В теореме 2.2.1 раздела 2.2 показано, что таким образом осла-бить условие не удается. Для получения этого результата понадобился анализ асимп-тотического поведения собственных чисел матрицы HHT, что составляет содержание раздела 2.1. Эти асимптотики неоднократно используются и в дальнейших разделах.
Существует оценка нормы разности проекторов [1, prop.3.3], полученная с помо-щью (1.1.4), которая при условиях а1/а2 < 1 и L,K ^ ж, в рассматриваемом случае имеет вид
limsup (LK)-1/2(щ/а^) N||P^(5) — P^|| < С|5|, (1.2.1)
N
где С — некоторая константа. В теореме 3.1.1 раздела 3.1 доказана (в тех же услови¬ях, что и (1.2.1)) более точная оценка сверху нормы разности проекторов, она имеет порядок y/La^N. Эта теорема является одним из двух основных результатов главы 3.
Второй основной результат главы связан с асимптотикой нормы оператора V0,1), который определяет линейный (по параметру возмущения 5) член разложения (1.1.3). В разделе 3.2 (см. теорему 3.2.1) найден вид этой асимптотики, и, кроме того, показано, что V01) является главным членом разности P^(5) — P^ при дополнительном условии 3/2 а1 < а<2 .
Последняя глава 4 работы посвящена ошибкам восстановления в методе Анализа Сингулярного Спектра. В разделе 4.1 описывается (следуя [1, Ch. 5. 3]) общая схема на-хождения таких ошибок, а в разделе 4.2 исследуется ошибка восстановления последнего элемента сигнала. Оказывается (теорема 4.2.1), что эта ошибка, при дополнительном условии а1 < а4/3, имеет конечный предел гк, который, вообще говоря, не совпадает с нулем. В этом случае, конечно, максимальная по модулю ошибка метода Анализа Син-гулярного Спектра тоже не будет стремиться к нулю при длине ряда, стремящемся к бесконечности.
В Приложении помещены графические иллюстрации к доказанным результатам. Кроме того, графики, помещенные в разделы А.7 и А.8 (см. рисунки А.12, А.14 и А.15) позволяют высказать предположение, что условие а1/а2 < 1, при котором доказывались многие перечисленные результаты работы, является излишне сильным.
Наконец, из рис. А.9, А.10 в разделе А.6 следует, что предельная ошибка г^ вос-становления последнего элемента сигнала действительно, вообще говоря, не является нулевой.
В работе рассматривалась задача исследования асимптотического поведения нор-мы разности проекторов в случае, когда исходный сигнал является суммой двух экспо-нент fn = а™ + са'П, 1 < а/ < а1, с = 0, а помеха — константой еп = 1. Также проводилось исследование ошибок восстановления в методе SSA в этом случае.
В рамках этих задач получены следующие результаты.
1. Найдены точные условия, при которых ||B(5)||/^min стремится к нулю. Эти усло¬вия оказались не слабее тех, что получены при грубых оценках.
2. Уточнена оценка сверху нормы разности возмущенного и невозмущенного проек-торот ЦР^(^) - Ро“||;
3. В случае а1 < а’/ доказано, что полученная оценка точна.
4. Доказано и численно проверено, что ошибка восстановления в последней точке ряда, вообще говоря, не стремится к нулю при .^ то то, а значит и максимальная по модулю ошибка восстановления не стремится к нулю.
5. Основные результаты проиллюстрированы с помощью вычислительных экспери-ментов, причем некоторые из этих экспериментов приводят к предположению, что условия нескольких доказанных утверждений могут быть ослаблены.
1. Nekrutkin V. Perturbation expansions of signal subspaces for long signals // Statistics and Its Interface. — 2010. — P. 297-319.
2. Като Т Теория возмущения линейных операторов. — М. : Мир, 1972. — С. 740.
3. Golyandina N., Nekrutkin V., Zhigljavsky A. Analysis of Time Series Structure: SSA and related techniques.— Chapman and Hall/CRC, 2001.— Vol. 90 of Monographs on Statistics and Applied Probability. — P. 320.
4. Golyandina N., Zhigljavsky A. Singular Spectrum Analysis for Time Series.— Berlin- Heidelberg : Springer Briefs in Statistics, Springer, 2013.
5. Иванова Е. Об одном примере, относящемуся к анализу сингулярного спектра вре-менных рядов. Бакалаврская работа. — СПб : СПбГУ, 2015.
6. Nekrutkin V., Vasilinetz I. Asymptotic extraction of common signal subspaces from perturbed signals (in press) // Statistics and Its Interface.