ČASOVÉ ŘADY
Univerzita Palackého v Olomouci
RNDr. Mgr. Ivo Müller, Ph.D.
I. Základní pojmy
Definice:
Náhodným procesem(NP) je systém náhodných veličin, definovaných na témž pravděpodobnostním
prostoru.
Poznámka:
Náhodný proces značíme y t , t∈T . T je indexová množina (většinou čas).
Poznámka:
Na náhodný proces lze nahlížet dvěma způsoby:
y t  při pevnémt dostaneme náhodnou veličinuℝ 
při pevném dostaneme nenáhodnou funkciT ℝ
{
Dělení náhodných procesů:
a) náhodná posloupnost, pakliže T je spočetná množina, např. T =ℤ
speciálně náhodný proces s diskrétním časem, jestliže T =ℕ (čas běží po krocích)
b) náhodný proces (v užším smyslu), pakliže T je interval, např. T =〈 a , b〉
speciálně náhodný proces se spojitým časem, jestliže T =〈 0 ,∞ 
c) náhodná funkce, pakliže T je vícerozměrná množina, např. T =ℝk , k ≥2
Definice:
Nechť T indexuje čas. Potom časovou řadou (ČŘ) rozumíme:
a) náhodnou posloupnost, tj. náhodný proces s diskrétním časem, nebo
b) diskretizaci náhodného procesu se spojitým časem, tj. náhodný proces v okamžicích
t 1t 2 t 3 ... , nebo
c) konečnou verzi a) nebo b)
Poznámka:
Prakticky lze časovou řadu chápat jako posloupnost srovnatelných pozorování.
1
Terminologie:
časová = chronologická, dynamická
náhodný = stochastický, pravděpodobnostní
data = pozorování, měření, hodnoty, údaje
Dělení časových řad:
a) neekvidistantní (NED) - intervaly mezi okamžiky pozorování nejsou stejně dlouhé
(okamžiky pozorování t 1 , t 2 , t 3 ,... )
b) ekvidistantní (ED) - intervaly mezi okamžiky pozorování jsou stejně dlouhé (okamžiky
pozorování t=1 , 2 , 3 , ...
a) intervalová
- vzniká akumulací za dané časové období a tudíž hodnoty závisí na délce intervalu
- odpovídá na otázku, kolik čeho vzniklo nebo zaniklo během tohoto období
- je možno tvořit součty
- když máme neekvidistantní časovou řadu, pak jsou hodnoty nesrovnatelné (toto lze řešit
přepočtem na jednotkový interval)
- např. produkce, tržby, dešťové srážky...
b) okamžiková
- vzniká diskretizací spojité veličiny nebo je diskrétní z podstaty
- hodnoty se většinou vztahují k počátku nebo konci období
- ptáme se, kolik čeho existuje
- součty nedávají smysl
- např. počet pracovníků, měnový kurs, teplota, úroda obilí
a) absolutních (extenzivních) ukazatelů - původní naměřené hodnoty v původních jednotkách
b) odvozených charakteristik - součty, podíly, průměry atd.
a) dlouhodobá - roční
b) krátkodobá - hodinová, denní, měsíční, čtvrtletní
Určuje se dle frekvence pozorování
a) naturálních ukazatelů
b) peněžních ukazatelů
Práce s časovými řadami:
– analýza - snaha sestavit model (rozumné zjednodušení)
– prognóza (předpověď) - předpověď počasí, chování zákazníků na trhu...
– řízení a optimalizace - nelze vždy provést, řeší jak zvolit vstup, abychom dostali optimální
výstup
Dělení předpovědí:
a) kvalitativní
- subjektivní, expertní
- používá se tam, kde neznáme minulý vývoj
b) kvantitativní
- objektivní, na základě minulých pozorování
- regresní metody
2
a) bodová
- jediná hodnota
- y PTh - předpověď v čase T o h kroků dopředu
b) intervalová
- interval, oblast
- y PTh±d T 
- náročnější, ale dostaneme lepší informaci
- šířka intervalu udává míru nejistoty (širší  nejistější)
-  - řídí hladinu spolehlivosti (menší   větší spolehlivost  užší interval)
- interval pokryje budoucí skutečnou hodnotu s danou pravděpodobností 1−
Základní charakteristiky časových řad:
a) vizuální
- grafy průběhu
b) číselné
- součty (úhrny, klouzavé)
- rozdíly (diference, přírůstky)
- podíly (indexy, koeficienty, poměry)
- průměry
Druhy průměrů:
a) aritmetický
b) geometrický - vhodný pro bezrozměrné indexy
c) harmonický
a) prostý
b) vážený
a) „obyčejný“
b) chronologický - vhodný pro okamžikové časové řady
3
II. Přístupy k modelování časových řad
y t ... pozorování v čase t
model je tvaru y t =f t , 
t ... čas
–
f ... funkce známá až na parametry
–
nenáhodná, deterministická složka modelu

–
... náhodná složka (neznámá)
A) Dekompoziční (klasický) přístup
– základem je modelování nenáhodné složky f , předpokládá se nekorelovanost chyb
– nástrojem je regresní analýza
– provádí se rozkladem na složky ve snaze najít jejich pravidelné chování
4 složky modelu:
T - trendová složka
S - sezónní složka
C - cyklická složka
 - náhodná složka (stochastická, chybová...)
S a C se občas dohromady značí P - periodická složka
T , S a C dohromady tvoří deterministickou, modelovou, systematickou složku
rozklad (dekompozice)
: y=T SC
{aditivní
multiplikativní : y =T⋅S⋅C⋅
Trend - hlavní tendence dlouhodobého vývoje
- zachycuje dlouhodobé změny a průměrné chování (růst, pokles, zvrat ve vývoji)
Sezónnost - pravidelné odchylky od trendu s periodou ne delší, než 1 rok
- souvisí s kalendářem a střídáním ročních období
- sezónní čas (den, týden, měsíc)
- délka periody i amplituda jsou víceméně stálé
Cyklus - dlouhodobé kolísání s proměnlivou periodou a amplitudou
- perioda delší než rok
- nejproblematičtější složka při modelování
- těžko se hledají příčiny
- příklady: hospodářský cyklus, demografický cyklus (rození dětí), inovační cyklus,
sluneční cykly, klimatický cyklus
4
Náhodná složka - vlivy nezahrnuté do modelu
- ideálně zůstanou drobné, vzájemně nezávislé vlivy, chyby měření a
zaokrouhlování
- je možné je nějak popsat, např. rozdělením pravděpodobností
Naším úkolem je izolace nebo eliminace složek pro oddělené zkoumání jednotlivých vlivů, pro
sestavení předpovědí pro každou složku zvlášť, pro očištění řady od některých vlivů.
B) Boxův a Jenkinsův přístup
– základem je modelování náhodné složky jako systému korelovaných náhodných veličin v
čase
– nástrojem je korelační analýza
– je zde typická flexibilní tvorba modelů z dat a schopnost rychle reagovat na změny v
průběhu časové řady
– je zde potřeba větší počet pozorování, nejméně 50
– tato metoda se poprvé objevila v 70tých letech
ARMA-model
y t =0
1 y t −1... p y t − p
t 1  t−1...q  t−q


AR  p
MA q
 , - parametry
AR p - autoregresní část ( p je parametr)
MA q - klouzavý průměr ( q je parametr)
Značí se ARMA p , q
Lze popsat i trend a sezónnost:
ARIMA - integrované, popisuje trend
SARMA - sezónní, popisuje sezónnost
C) Spektrální analýza
– základem je modelování periodické složky jako směs sinusovek a kosinusovek s různou
frekvencí a amplitudou
– nástrojem je Fourierova transformace, čili přechod z časové domény do frekvenční
– hledáme významné frekvence pomocí periodogramů a spektrální analýzy
D) Příčinné modely
– též kauzální, faktorové, vícerozměrné
y t = f t , x 1 , ... , x n ,
x i - faktorové proměnné (vysvětlující časové řady)
- často vystupují se zpožděním (dynamické modely)
- aplikace zejména v ekonometrii
Volba přístupu:
– Podle účelu analýzy
– konstrukce modelu
– předpověď
– řízení a optimalizace
5
– Podle typu časové řady
– délka
– struktura
– Podle zkušeností a možností statistika
Nyní se budeme věnovat klasickému dekompozičnímu přístupu A).
6
III. Trend v časové řadě
y t =T t t - neperiodická časová řada
t=1 , ... , n - ekvidistantní časová řada
t=t 1 , ... , t n - neekvidistantní časová řada
T t - trendová funkce (analytická)
- funkce spojité proměnné T t  , t∈ℝ
- funkce známá až na parametry 
T t =T t ,  ,  může být vektor ⇒ více parametrů
Při linearitě v parametrech (lineární model) používáme k odhadu parametrů metodu nejmenších
čtverců (MNČ) z důvodů jednoduchosti a kvůli dobrým vlastnostem odhadů.

T t  T t  - zde už máme odhadnuté parametry ⇒ jde o náhodnou veličinu T t =T t , 
Vyhlazení (vyrovnání) časové řady: y t  y t=T t , t=1 , ... , n nebo t=t 1 , ... , t n
III.1. Lineární model - obecně
Teorie lineární regrese
y = X   
 n×1 
n× p  p ×1 

y1
y= ⋮
yn
n ×1 
- vektor pozorování,

1
= ⋮
n
- vektor chyb

0
= 1 , k = p−1 - pro případ, že v modelu je absolutní člen
⋮
k


1
= ⋮ , k = p - pro případ, že v modelu není absolutní člen
k
1 x 11 ⋯ x 1 k
X= ⋮ ⋮ ⋱ ⋮
1 xn 1 ⋯ xn k

designová (datová) matice, matice konstant
Sloupec jedniček je zde pouze v případě, že v modelu je absolutní člen.
k - počet vlastních regresorů
p - počet parametrů
n - počet pozorování
7
Úmluva:
Samostatný vektor budeme vždy chápat jako sloupcový.
zápis po složkách: y i= xTi⋅  i , i=1 , ... , n
x i⋅ - i-tý řádek matice X
y i=01 x i 1...k x i k  i
X - regresory
y - vysvětlovaná (závislá) proměnná
Předpoklady regulárního lineárního modelu:
1.) n p - více pozorování než parametrů
2.) h  X = p - matice má plnou hodnost
3.) E i =0, var  i= 2 , i=1 ,... , n
cov  i , j =0 , i≠ j - nekorelovanost chyb
 tvoří bílý šum ( ~WN 0 ,  2  , kde WN znamená white noise)
Pokud ~N , tak dostáváme normální lineární model
Platí: E y= X  , var y= 2 I n ⇒ y~N  X  ,  2 I n
Metoda nejmenších čtverců:
n
min  y− X   y− X =min ∑  y i− x Ti⋅2
T


i =1
!
∂  y− X T  y− X =−2 X T  y− X =−2 X T y2 X T X =
0
∂
X T X = X T y - normální rovnice (NR)
 X T X −1 X T y - odhad metodou nejmenších čtverců
=
Vlastnosti  :

- nestrannost (nevychýlenost) parametru 
E =
var  = 2  X T X −1
 - nejlepší nestranný lineární odhad (NNLO, BLUE) parametru 
- je lineární vzhledem k y
- nejlepší se vztahuje k rozptylu (je nejmenší pro libovolný nestranný lineární odhad (NLO))
~ N p  ,  2  X T X −1  - lineární transformace zachovává normalitu
y = X  =
X  X T X −1 X T y - vyrovnané hodnoty
P n×n
T
−1
T
e = y− y = I − X  X X  X  y - rezidua
P = X  X T X −1 X T - projekční matice
 n×n
Projekční matice:
– symetrická
– idempotentní  P 2=P 
h  P=h X = p
–
8
Je to projekční matice do L  X  - lineární prostor tvořený regresory (sloupci matice X ).
y =P y
e = I −P y=Q y , Q je opět projekční matice (symetrická, idempotentní a h Q=n− p )
Q je projekční maticí do L  X  ⊥
y ⊥ e , tj. y T e =0 - kolmost
y= y  e
Reziduální součet čtverců (RSČ):
RSČ = eT e
1
2
 =
RSČ - nevychýlený odhad, tj. E 
 2= 2
n− p
Index determinace R2 :
RSČ
R2 =1− 2
ST
2
S T - celková variabilita v datech
n
S = y y =∑ y 2i - model bez absolutního členu
2
T
2
T
T
i=1
T
S = y− y   y− y  - model s absolutním členem
n
1
y = y ,... , y , y= ∑ y i
n i=1
 n×1 
Čím je hodnota větší, tím lépe.
Předpovědi:
x n h - nový vektor regresorů
 p ×1
Bodová předpověď:
y Pnh= x Tnh 
Intervalová předpověď:
předpoklady - normální model (normální rozdělení)
- skutečná hodnota y nh nezávisí na y 1 , ... , y n
I =〈 y nPh±  2 f nh t n− p  〉 - symetrický interval
T
T
−1
f nh=1x n h  X X  x nh
t n− p  - (oboustranná) kritická hodnota studentova rozdělení
 - zvolená hladina, interval I pokryje skutečnou hodnotu y nh s pravděpodobností 1−
Centrování regresorů:
x⋅ j - j-tý sloupec matice X , j=1 , ... , k (vlastní regresory)
předpoklady: - model s absolutním členem
n
1
- centrované regresory, tj. x⋅ j = ∑ x i j=0, j=1 ,... , k
n i =1
9

XT X =
 p× p 
n
∑ xi 1
⋯
i
∑ xi 1
∑ xik
i
∑ x i j x il
i
⋮
∑ xi k
i
i
 
n 0 ⋯ 0
=0
⋮
0
B
 
1
0 ⋯ 0
n
 X T X −1 = 0
−1
⋮
0
B

0
2
T
−1

Víme, že var =var ⋮ =  X X  , tedy cov  0 ,  j =0, j=1 ,... , k , tj. 0 je
k
nekorelovaný s 1 , ... , k (při normalitě je nezávislý).
III.2. Lineární modely v časových řadách
i t (index i zaměníme za t )
designová matice závisí na čase X = X t
parametry  nezávisí na čase
X = x t j  , x t j = f j t  , j=1 , ... , k
 n× p
Trend: T t = X t 
Model: y= X t 
Po složkách: y t =x Tt⋅t =0 1 f 1 t ...k f k t t , kde t=1 ,... , n nebo t=t 1 ,... , t n

lineární v parametrech
Nekorelovanost chyb - v časových řadách často neplatí!
n - přítomnost (aktuální okamžik)
h - horizont předpovědi
P
y nh
- předpověď do budoucna
Centrování času:
n
}
1
t :=t−t , t= ∑ t
n 1
⇒
n
1
'
t i :=t i−t ,t= ∑ t i
n i=1
'
t ' =0
n
∑ t' =0
1
10
Speciální případy trendových funkcí:
a) Konstantní trend
T t =0

1
, X =⋮
 n×1 
1
, y t =0 t ,
n
1
0 = y= ∑ yt , y t =0= y ∀ t=1 ,... , n
n t =1
n
1
 2 =
 y t − y 2
∑
n−1 t =1
bodová předpověď: y Pnh= y ∀ h=1 , 2 , ...
intervalová předpověď:

 
1
y±  2 1 t n−1 
n
b) Lineární trend
 
 
1 t1
1 1
T t =01 t , X = ⋮ ⋮ respektive X = ⋮ ⋮
 n×2
 n×2
1 tn
1 n
budeme se zabývat ekvidistantní časovou řadou
y t =01 t  t , t=1 ,... , n
∑ t y t −n t y ,  = y− t
 1=
0
1
∑ t 2−n t 2
y t =0 1 t
n
1
 2 =
∑  y − y t 2
n−2 t =1 t
P
bodová předpověď: y nh
= 0 1 nh
p
intervalová předpověď: y nh
±
 2 f nh t n−2 
T
−1
kde f nh=11 , nh X X 
 
n
pro centrovaný čas t ' =t−t , kde t=
2
1 =1 1   nh−t
n ∑ t 2−n t 2
nh
1
∑ t , platí t ' =0
n t =1
∑ t ' y t ' ,  '= y . Pozor  '= ,  ' ≠ 
 1=
0
1
1
0
0
∑t'2
yt ' =0 ' 1 ' t ' = y t jsou stejné.
 2 je stejné.
Předpovědi jsou stejné, ale je zde jiný vzorec
P
bodová předpověď: y nh
= 0 ' 1 ' nh−t
p
intervalová předpověď: y nh
±
 2 f ' n h t n−2 
T
−1
kde f ' nh=11 , nh−t  X X 
11

2
1 nh−t 
1
=1 
n
nh−t
∑t'2

c) Kvadratický trend
T t =01 t2 t 2 ,
 
1 1 1
X =⋮ ⋮ ⋮
 n×3 
1 n n2

0
  = X T X −1 X T y . Vzorce pro jednotlivé složky jsou příliš složité.
=
1

2
n
1
 =
 y t − y t 2
∑
n−3 t=1
P
2
bodová předpověď: y nh
= 0 1 nh2 nh
p
intervalová předpověď: y nh
±
 2 f nh t n−3 
2
2
T
−1
kde f nh=11 , nh ,nh  X X 
pro centrovaný čas dostáváme f ' nh=1 1 
n
nh−t2

∑t'2
[
 
1
nh
 nh2
nh−t2−
1
∑t'2
n
]
2
∑ t ' 4− 1n  ∑ t ' 2 
poznámka: jsou zde konstantní 2. diference
d) Exponenciální trend
T t = t , 0
- jsou zde konstantní podíly sousedních hodnot a konstantní podíly sousedních diferencí
Jestliže je =1 , dostáváme konstantní trend.
Není lineární v parametrech, proto se místo MNČ používá linearizující transformace:
Logaritmická lineární transformace
ln T t =ln ln  t=01 t , což je lineární trend
Pomocí MNČ určíme 0 , 1
Nyní provedeme inverzní transformaci - exponenciální


=e

=e

ln T  t 
y t =e
0
1
12
e) Posunutý exponenciální trend
T t = t , 0
nejde linearizovat
odhad parametrů se provádí buď pomocí metody částečných součtů nebo následující
metodou:
Považujeme  za známé:   g
T t = g t = f g t , kde funkci f g t  známe. Tím dostáváme lineární trend,
na který aplikujeme MNČ. Problémem ovšem je volba vhodného  . Proto postupujeme
takto. Volíme různé hodnoty g = a vybereme   ,  , 
 s minimálním RSČ.
1 g
X= ⋮ ⋮
1 gn
 
f) Logistický trend

T t =
, 0
1 t
0 ... exponenciála
0 ... dostáváme tvar S-křivky, která je symetrická
t infl=−
ln 
... inflexní bod
ln 
Tuto funkci nelze linearizovat. Proto se používá metoda inverzní transformace:
1
1 t 1  t ∗ ∗ t
=
=   =   - posunutý exponenciální trend

 
T t
nebo metoda diferenčního odhadu parametrů
g) Gompertzova křivka
T t =  , 0 , 0
1 - exponenciální křivka
01 - tvar S-křivky, která je nesymetrická
t
t infl=
−ln −ln 
ln 
Logaritmická transformace: ln T t =ln ln  t , což je posunutý exponenciální trend
13
IV. Klouzavé průměry
Adaptivní metoda
– trend se dokáže přizpůsobit změnám v průběhu dat
– postupný trend - konstruovaný jen pro část dat
– lokální vyhlazování - parametry trendové funkce se mění v čase, nejsou globální
Základní myšlenka/postup
1.) Zvol délku okna m
2.) Daty v okně prolož polynom (trendovou funkci)
3.) Spočítej vyrovnanou hodnotu pro střed okna
4.) Posuň okno doprava a vrať se ke kroku 2.)
Předpis
y t =T t t , t=1 , ... , n
vyhlazování = odhad trendu y t =T t
Prokládání dat polynomem je totéž, co vážené průměry v rámci okna.
Centrování
m je liché - necentrované (obyčejné) klouzavé průměry
m je sudé - centrované klouzavé průměry (zde musíme přidat ještě jeden krok - centrování)
Zprůměrováním dvou sousedních vyrovnaných hodnot se
dostaneme k původním celočíselným časovým okamžikům
- centrované klouzavé průměry.
Indexování
Místo indexu t budeme psát t , i , kde t je střed okna a i je index pozice vůči středu.
p1 , p2 , ... , n− p pro m=2 p1
t=
1
3
1
p , p ,... , n− p pro m=2 p
2
2
2
− p , ... ,−1 , 0 , 1 , ... , p pro m=2 p1
i=
1
1 1
1
− p ,... ,− , , ... , p− pro m=2 p
2
2 2
2
{
{
14
Centrovaný čas v okně i=0=∑ i
Střed okna i=0
Platí: y t = y ti , např. y 5= y 3 , 2= y 4,1 = y 5 ,0 = y 6 ,−1= y 7 ,−2
Vážené průměry
y t =∑ w i y t , i , kde w jsou váhy
i
i
Speciálně w i=
1
∀ i⇒ obyčejný aritmetický průměr, neboli prostý klouzavý průměr.
m
Polynomický trend
2
r
T t ,i =a 0 ta1 t ia 2 t i ...a r t i ( i lze chápat jako centrovaný čas v okně)
r ... řád klouzavého průměru
T t ,0=a0 t
y t = yt ,0 =a0 t ... stačí odhadnout absolutní člen
Zůstanou zde nevyrovnané počáteční a koncové hodnoty.
Metoda nejmenších čtverců:
min ∑  y t ,i −a 0 t−a1 t i −a 2 t i 2−...−a r t i r 2
a 0 ,..., a r i
}
!
∂
: −2 ∑  y t , i−a0 t −a 1t i−a 2 t i 2−...−ar t i r = 0
∂ a0
i
!
∂
: −2 ∑  y t ,i −a 0 t−a1 t i−a 2 t i 2−...−a r t i r i=0
∂ a1
i
∂ : −2  y −a −a i−a i 2−...−a i r  i 2=! 0 r1 normálních rovnic
∑ t, i 0t 1t 2t
rt
∂a 2
i
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
!
∂
: −2 ∑  y t ,i −a 0 t−a1 t i−a 2 t i 2−...−a r t i r i r= 0
∂ ar
i
∑ y t ,i =a 0 t ∑ 1a1 t ∑ ia 2 t ∑ i2...a r t ∑ ir 0 
i
∑ i y t ,i =a 0 t ∑ ia1 t ∑ i 2a 2 t ∑ i 3...a r t ∑ ir 1 1
i
∑ i 2 y t , i=a 0 t ∑ i 2a 1t ∑ i3a 2 t ∑ i 4...a r t ∑ i r2 2
i
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
∑ i r y t ,i=a0 t ∑ ir a 1t ∑ ir 1a 2 t ∑ ir 2...a r t ∑ i 2 r  r 
i
centrovaný čas ⇒ ∑ i k =0 pro k =1 , 3 , 5 , ... , neboť v rámci okna máme centrovaný čas
i
a) Pro výpočet a 0 t , a2 t , a 4 t ,... použijeme sudé rovnice 0 , 2 ,4 ,... .
k
Odhady jsou lineární kombinace výrazů ∑ i y t , i , kde k je sudé, tj. platí i k =−ik pro
i
k =0 , 2 , 4 , ... .
l 
l
l 
a l t=∑ cil  y t ,i , l =0 , 2 , 4 , ... , kde c i jsou symetrické váhy vůči i c i =c−i 
i
 0
Speciálně a 0 t =∑ ci y t , i , kde c 0i =w i jsou váhy, které jsou symetrické, nezávislé na t
i
, závislé na r , m a normované
∑ w =1
i
i
15
.
Pokud je r sudé, pak platí, že na výpočet a 0 t nemá vliv následující r 1 -ní rovnice
⇒ a 0 t je stejné pro řád r i r 1 .
y t = y t ,0 =a 0 t jsou vyrovnané hodnoty ve středu okna
b) Pro výpočet a 1t , a 3 t , a5 t ,... použijeme liché rovnice 1 ,3 ,5 , ... .
Odhady jsou lineární kombinace výrazů ∑ i k y t , i , kde k je liché, tj. platí i k =−−i k
i
pro k =1 , 3 , 5 , ... .
l 
l 
a l t=∑ cil  y t ,i , l =1 , 3 ,5 ,... , kde c i =−c−i
i
Poznámka:
Pro řád r a délku okna m≤r1 (lichou) platí y t = y t
Speciálně pro r =2 dostaneme kvadratický trend, m=3 (parabola tyto 3 body přesně proloží).
Poznámka:
Pro r =0 , 1 dostáváme prosté klouzavé průměry y t = y t= a 0 , t=
1
∑ y (aritmetický průměr v
m i t ,i
okně).
Vyrovnání počátečních a koncových hodnot a předpovědi
r
r
l =0
l=0
r
y t , j=∑ a l t j l =∑ ∑ ci l y t ,i j l=∑ ∑ ci l  j l y t ,i =∑ v i j  y t , i
i
i

l =0
v
i
 j
i
v i j ... váhy pro vyrovnané hodnoty s pozicí j , nejsou symetrické v i j ≠v−ij  ani normované,
− j 
závisí na r , m , j , platí v i j=v−i
(symetrie, pokud překlopíme pozici)
Počáteční hodnoty:
p1 m liché , m=2 p1
t=
1
p
m sudé , m=2 p
2

{
{
− p ,− p1 , ... ,−1 mliché
1
1
− p , ... ,−
m sudé
2
2

j=
1.okno
Koncové hodnoty:
n− p
mliché
t=
1
n− p
msudé
2

{
levá část okna
{
1 ,... , p
m liché
j= 1 3
1
, , ... , p−
msudé
2 2
2

poslední okno
praváčást okna
Předpovědi - prodloužíme trend z posledního okna:
n− p
mliché
p1 , p2 ...
m liché
t=
j=
1
1
3
n− p
msudé
p , p ,... m sudé
2
2
2

{
{
budoucnost
16
Příklad:
Vyrovnáme první a poslední hodnoty m=5 , r =3 .
m=2 p1 , p=2
počáteční:
vol t=3 , j=−2 ⇒t j=1
1
y 1 = y 3−2 má váhy
69 , 4 ,−6 , 4 ,−1
70
poslední:
vol t=n−2 , j=2 ⇒t j=n
1
y n= y n−2 , 2 má váhy
−1 , 4 ,−6 , 4 , 69
70
Volba řádu r a délky okna m
Preferujeme jednoduché průměry co nejnižšího řádu. Pokud poslouží dobře jednodušší model, je
zbytečné ho komplikovat. Délku okna volíme dle požadovaného stupně vyhlazení - čím delší okno,
tím vyhlazenější funkci získáme.
– okno je delší než perioda ⇒ vyhladíme periodu
– okno je kratší než perioda ⇒ zmizí pouze nesystematické vlivy nebo kratší periody
Srovnání účinnosti klouzavých průměrů
Nakolik redukují rozptyl bílého šumu?
t ~WN 0 , 2 (nekorelované, WN - white noise)
aplikujeme klouzavý průměr:  t =∑ wi t , i
i
var  t=∑ w var t ,i =
2
i
i
2
∑w
2
i
i
∑ w2i ...redukční intenzita klouzavého průměru
i
například w i=
1
...prostý klouzavý průměr
m
∑ w2i = m1
17
V. Exponenciální vyrovnávání
– neplést s exponenciálním trendem
– adaptivní metoda - dokáže se rychle přizpůsobit změnám v průběhu dat
– při odhadu parametrů se využívají všechna minulá pozorování, ale těm starším se přiřadí
menší váha
– často se využívá koncept postupného vyhlazování (aktualizace vzorců) - metodu
odstartujeme s vhodně zvolenou počáteční hodnotou, přidáme jedno pozorování a spočteme
odhad. Takto postupujeme a neustále přepočítáváme náš odhad. Jedná se o neustálou
aktualizaci vypočtených hodnot.
Změna indexování:
t t−k , kde platí:
t ... aktuální okamžik (počet pozorování k dispozici pro aktuální výpočet, předtím bylo t
pořadí v čase)
k ... stáří pozorování (vzhledem k aktuálnímu okamžiku), k =0 , 1 , 2 , ... , t−1
n ... celkový počet dat
Model:
y t− k =T t −k t −k , k =0 ,1 ,... ,t−1 , t je aktuální okamžik
Vážená MNČ:
t −1
min ∑ k  y t −k −T t− k 2 , kde k jsou váhy (exponenciálně klesající)
k=0
∈0,1 ... vyhlazovací konstanta
18
V.1. Jednoduché exponenciální vyhlazování
vol T t−k =0 , nezávisí na k
MNČ:
t −1
min ∑ k  y t −k −0 2
k=0
t−1
∂ : −2  k  y − =! 0
∑
t −k
0
∂0
k=0
t −1
t −1
∑ k y t− k =0 ∑ k
k =0
t −1
aproximace:
k =0
k =0
t −1
∑ k y t− k =O
k =0
∞
1
∑  =∑ k = 1−
k .
k=0
t −1
1
1−
⇒
 0=1− ∑ k y t −k
k=0
vyrovnané hodnoty: y t−k = 0 , jsou nezávislé na k
pro aktuální okamžik k =0  :
t−1
y t =  0=1− ∑ k y t−k ! k je zde jako sčítací index !

k=0
St
S t - jednoduchá vyrovnávací statistika
t −1
t−1
j :=k−1
k−1
platí: y t =1− y t 1− ∑  y t− k =1− y t 1− ∑  y t −1− k−1 = 1− y t
k
k =1
k=1
t −2
 1− ∑  j y t−1− j=1− yt  y t−1
j =0
Aktualizační vzorec:
y t=1− y t  y t −1
postupně pro t=1 , 2 , ... , n a pro vhodně zvolené y 0 (viz. dále)
Pro  malé metoda rychle reaguje na změny v datech.
Bodové předpovědi:
y Pth= y t , nezávisí na h
Volba vyhlazovací konstanty:
– subjektivní volba (doporučuje se volit ∈ 〈 0,7 ; 1  )
– analogie s délkou okna u klouzavých průměrů
M −1
=
, kde M je délka okna odpovídajícího klouzavého průměru
M 1
– dle kvality předpovědi - pro různá  hledáme nejlepší předpovědi - nejmenší průměrnou
n
1
y Pt−11
chybu předpovědi např. min ∑ y t− 
n t =1

∣
y t−1
19
∣
– 2-fázový postup
1.) hledáme optimální  dle kvality předpovědi
n
n
1
vol y 0= ∑ y s ... počáteční úsek dat, kde n 1=6 nebo n 1=
2
n1 s=1
2.) vyrovnání s optimálním 
n
1
vol y 0= ∑ y s ... průměr všech dat
n s=1
obě fáze se liší jen volbou y 0
1
Předpovědní intervaly (pro t =n )
na hladině spolehlivosti 1− p
y Pnh= y n±u p / 2 d n kde:
u p je kritická hodnota N 0,1
–
d =1,25
–
–
n =

n
1
 y t− y t −12 ... střední čtvercová chyba předpovědi
n∑
t =1
20
V.2. Dvojité exponenciální vyrovnávání
T t −k =0−1 k , k =0 ,1 ,... , t−1 , kde t je aktuální okamžik
t −1
MNČ:
min ∑ k  y t −k −01 k 2
0 , 1 k=0
t−1
∂ : −2  k  y −  k 2=! 0
∑
t −k
0
1
∂0
k=0
t−1
∂ :
∂1
t −1
∑
k =0
t −1
k
!
2 ∑  k  y t −k −01 k 2=0
k=0
t −1
t−1
y t− k =0 ∑  −1 ∑ k  k
k
k =0
t −1
k=0
t −1
∑ k k y t−k =0 ∑ k k−1 ∑ k 2 k
k =0
k =0
t −1
aproximace:
.
∞
∑ k =∑ k =
k =0
∞
k=0
k=0
1
1−
∣
d
d
∗
1
∣⋅
2
k =1
1−
∞

d
k k =
∣
∗
∑
2
d

k =0
1−
∞
11−2 21− 1
2 k−1
=
∑k  =
k =1
1−4
1−3
∞
 1
∑ k 2 k = 1−3 ∗
k =0
∑ k  k−1=
Vzorce s ∗ dosadíme do normálních rovnic:
t −1

1− ∑ k y t −k =0−1
1−
k=0
t−1
 1
1−2 ∑ k k y t −k =0 −1
1−
k=0
Definice:
t −1
S t :=1− ∑ k y t− k ... jednoduchá vyrovnávací statistika
k =0
t −1
S t 2 :=1− ∑ k S t −k ... dvojitá vyrovnávací statistika
k =0
Platí:
a)
b)
S t =1− y t − S t−1
 2
2 
S t =1− S t  S t −1
t=1 , ... , n
t−1
c)
 S 2t−1 =1−2 ∑ k  k y t −k
k=0
21
∣⋅
upravíme normální rovnice:

1
S t =0 −1
1−
1
1−
1
2
 2
 =0−1
odtud S t =0 1−−1
1−
1−
2
2 
S t −1−S t =0 −1


Odhady parametrů  0 ,  1 :
2−11 :
 2
0 −1 0=S t −1− S t −1 S t
 0=−S 2t 2 S t =2 S t−S t2
2−1 :
 1
2
−1
1
=S t 2−1− S t− S t
1−
1−
−
2 
1
=S t −S t
1−
1−
 1=
S t −S 2t 

Vyrovnané hodnoty:
y t−k = 0−  1 k , k =0 , 1 , ... ,t−1 ... stáří pozorování
Speciálně pro k =0 je aktuální okamžik y t =  0=2 S t −S 2t 
Rekurentní vzorce pro vyrovnané hodnoty:
S t =1− y t  S t−1
 2
2 
S t =1− S t  S t −1 , t=1 , 2 ,... , n
Počáteční hodnoty:

S 0=  0,0 − 1,0
1−
2
 2
S 0 = 0,0−  1, 0
1−
kde  0,0 ,  1,0 jsou MNČ odhady lineárního trendu z celé časové řady y 1 , ... , y n .
Bodová předpověď:
y tPh=  0  1 h , h=1 , 2 , ...
1−
1−
1−
y tPh=2 S t −S t2 
S t−S t2  h= 2
h S t − 1
h S 2t 



Speciálně pro h=1 dostáváme předpověď o jeden krok dopředu
1
1
y tP1=
S t− S t 2



 

Volba vyrovnávací konstanty:
– subjektivně
M −1
=
, kde M je délka okna odpovídajícího klouzavého průměru
–
M 1

22
– hledání optimálního  podle kvality předpovědi
projedeme interval 0,1 s nějakým krokem (například 0,1 nebo 0,05) a posuzujeme chybu
předpovědi n :=

n
1
 y t− y tP−112 , optimální  musí mít nejmenší chybu
∑
n t =1
předpovědi
jediný rozdíl v postupu:  0,0 ,  1 , 0 se počítají z počátečního úseku časové řady o délce
n
např. n 1=6 nebo n 1=
2
Intervalová předpověď na hladině 1− p :
P
pro t=n : y nh ±d h⋅ n⋅u p kde:
1−
–
u
1−
p
2
2
... kvantil N 0,1

n
1
–
n := ∑  y T − y Pt−11 2
n t =1
1−
1
[ 14 5 221−13 h21−2 h2 ]
3
1
d h=1,25
–
pro h=1,2 ,3 , ...
1−
1
[3 14 52 21−13 2 1−2 ]
1
speciálně pro h=1 platí d 1=1,25
23
V.3. Trojité exponenciální vyrovnávání
2
T t −k =0 /1 k 2 k , k =0 , 1 , ... , t−1 ... stáří pozorování
t=1 , 2 , ... , n ... aktuální okamžik
– vážená MNČ
– exponenciální váhy k , ∈0,1 ... vyhlazovací konstanta
S 3t  :=1−S 2t  S 3
t−1 ... trojitá vyhlazovací statistika
Počáteční hodnoty:
1 
 
S 0=  0,0−
 1,0 
 2 ,0
1−
21−2
2 12  
2 
S 02= 0,0 −
 1,0
 2, 0
1−
21−2
3 13  
3 
3 
S 0 = 0,0−
 
 2 ,0
1− 1,0
21−2
kde  0,0 ,  1,0 ,  2,0 jsou MNČ odhady kvadratického trendu buď z celé časové řady při
vyhlazování s optimálním  , nebo z počátečního úseku při hledání optimálního  .
Vyrovnané hodnoty (pro aktuální okamžik k=0 ):
y t =  0 =3 S t−3 S t 2S t 3
Bodová předpověď:
1
P
2
2 2
2
2 2
2
y t h= 2 {[ 6  151− h1− h ] S t −[ 6  214 1−h2 1− h ] S t 
2
[ 2 213 1− h1−2 h 2 ] S t 3 } pro h=1 , 2 , 3 , ...
24
VI. Sezónní složka
Máme dvě možnosti, jak se sezónní složkou pracovat:
a) izolace sezónnosti - pro oddělené zkoumání
b) eliminace - pro zkoumání dlouhodobých tendencí (trend + cyklus)
Sezónnost
a) proporcionální - amplituda sezónní složky je úměrná hodnotě trendu
b) konstantní
U proporcionální sezónnosti se používá multiplikativní dekompozice, kdežto u konstantní se
používá aditivní dekompozice.
Je třeba předem zvolit typ dekompozice.
Sezónnost
a) proměnlivá
b) stálá (konstantní)
ve smyslu mezi roky
např. model konstantní sezónnosti nebo model skrytých period
Indexování:
{
t=1 , ... , n i=1 , ... , p roky
, kde r je počet sezón v 1 roce
j=1 ,... , r sezóny
předpokládejme n= p⋅r (máme všechna pozorování)
platí: t=i−1 r j
Dekompozice:
multiplikativní
y i j =T i j S i j C i j  i j
–
r
– normující podmínka: ∑ S i j=r nebo
j=1
r
∏ S i j=1
j=1
aditivní
y i j =T i jS i jC i j i j
–
r
– normující podmínka:
∑ S i j=0
∀i
j=1
Sezónní vlivy se v rámci roku vykompenzují.
S i j ... sezónní vlivy (faktory)
S i j =S j ... předpoklad stálé sezónnosti mezi roky
25
∀i
VI.1. Postup vícenásobného očišťování
Předpoklady:
Sezónnost je proporcionální vůči trendu  multiplikativní rozklad.
Sezónnost je stálá mezi roky: S i j =S j
Máme měsíční data: r =12
y i j =T i j S j C i j i j i =1 ,... , p roky
j=1 , ... , r =12 měsíce
1.) očištění od sezónní a náhodné složky klouzavými průměry s délkou okna m=13
y i j=
T i j C i j 
2.) očištění od náhodné složky:
yi j 
= S j  i j 
y i j
pomocí aritmetických průměrů přes roky:
p
y
1
S j = ∑ i j , j=1 ,... , 12
p i =1 y i j
normování:
12
Sj
S =
⇒ ∑ S j =12
j
12
1
1
Sk
∑
12 k=1
3.) sezónní očištění časové řady:
y
y oi j= i j
S
{
j
4.) určíme trend analytickou funkcí z očištěných hodnot:
T i j
5.) odhad cyklické složky:
y oi j
y
= i j =
C i j i j 
T i j S j T i j
klouzavé průměry na 
C i j ij  C i j
6.) očištění od periodické složky:
yi j
o o 
yi j =
S j C i j
7.) nový odhad trendu z y oo
analytickou funkcí
ij
P
8.) bodová předpověď y nh :
speciálně předpověď na příští rok, tj. i= p1 ,

y Pp1, j =T p1, j⋅ S j ⋅
C p1, j


nezávisína roce předpovědi z klouzavých průměrů
9.) intervalová předpověď:
střed: y Pp1, j
šířka jako na trendové funkci T i j
26

T i j
j=1 , 2 ,... ,12
VI.2. Regresní přístup s umělými proměnnými
Předpoklady:
– Sezónnost je konstantní vůči trendu (aditivní rozklad),
– Sezónnost je stálá mezi roky S i j =S j 
y i j =T i jS ji j , kde
,... , p
{i=1
j=1 , ... , r
roky
sezóny
Platí: t=i−1 r j , n= p⋅r
S j =2 x 2 j3 x 3 j ...r x r j
r ... počet sezón
2 ,... , r ... parametry pro sezóny
x k j= k j ... umělé proměnné
S 1=0
S j = j , j=2 , ... , r
například pro 2. sezónu:
T
x 2=0
, 1 , 0 ,... , 0 , 0
, 1 , ... , 0 , ... , 0
,1 , ... , 0 
n×1
1. rok
2. rok
p− tý rok
MNČ odhad 2 ,... , r
například čtvrtletní data r =4
+ lineární trend
y t =01 t2 x 2 t 3 x 3 t4 x 4 t t , t=1 , ... , n
dizajnová matice
X=
n×5
 
1
1
0
1
2
1
⋮ 3
0
⋮ ⋮ 0
⋮ ⋮ ⋮
⋮ ⋮ 0
⋮ ⋮
1
⋮ n−1 0
1
n
0
0
0
1
0
⋮
0
0
1
0
0
0
0
1
⋮
0
0
0
1
Nelze zahrnout do modelu 1 , neboť sloupce X by byly lineárně závislé  nelze spočítat
MNČ.
 X T X −1 X T y
MNČ  0 ,  1 ,  2 ,  3 ,  4 , =
Přechod k sezónním faktorům
1 :=0
 := 1   2 3 4 
4
S 1=−
S 2= 2−
S 3= 3−
S 4= 4 −
27
4
platí:
∑ S j =0
1
nový absolutní člen: ∗0 =0 
Model:
y t = 0  1 tS 1 x 1 t S 2 x 2 t S 3 x 3 t S 4 x 4 t , kde x k t= k j , kde k =1 , 2 ,3 , 4 a
t=i−1 r j
neboli
y i j= 0  1 [i−1r  j]S j
VI.3. Model konstantní sezónnosti se schodovitým trendem
Předpoklady:
– trend je v rámci roků konstantní, tj. T i j =a i
– průběh sezónnosti nezávisí na roce, tj. S i j =b j
– sezónní výkyvy se vykompenzují, tj. ∑ S i j=∑ b j =0
j
j
Model:
y i j =ai b j i j , kde
,... , p
{i=1
j=1 , ... , r
roky
sezóny
MNČ odhad parametrů:
r
1
a i = y i⋅= ∑ y i j ... průměr v i-tém roce
r j=1
p
1
1
b i j = y ⋅ j− y= ∑ y i j−
∑ ∑ y , kde j=1 ,... , r
p i =1
r p i j ij
Poznámka:
Wintersova metoda - zobecnění exponenciálního vyrovnávání pro sezónní složku.
28
VII. Periodická složka
P=S C (perioda = sezóna + cyklus)
Přístup spektrální analýzy:
Časová řada se modeluje jako směs sin a cos s různou frekvencí a amplitudou. Hledají se
významné frekvence a pouze tyto se ponechají ve výsledném modelu.
Typický je přechod do frekvenční/spektrální oblasti (hlavní proměnnou není čas, ale frekvence).
Modelování periodicity:
sin t , cos t ... jednoduché periodické funkce, jsou 2  - periodické, t je čas
sin
   
2
2
t , cos
t
T
T
... T -periodické funkce, 1 cyklus proběhne za dobu T
1
(doba, za jakou proběhne jedna celá vlna)
frekvence
frekvence ... počet cyklů za časovou jednotku
2 ⋅počet cyklů
[radiany ]
úhlová frekvence ...
časová jednotka
úhlovou frekvenci označíme 
=2  ... 1 cyklus za časovou jednotku
1
= ... 2 cyklu za časovou jednotku
cyklus=perioda=
Při analýze časových řad uvažujeme okamžiky t=1 , 2 , 3 ,... , n , tj. časový interval o délce n .
n n
Uvažujeme následující periody: P j=n , , ,...
2 3
V intervalu 〈 0 , n〉 proběhne celočíselný počet cyklů odpovídající úhlové frekvenci
j
 j=2 , j=1 , 2 , 3 , ... , j ... počet cyklů v intervalu 〈 0 , n〉
n
29
Nejkratší perioda/nejvyšší frekvence zjistitelná z dat:
n
proběhne za 2 časové jednotky, tj. j=
2
Do modelu uvažujeme frekvence:
j
 j=2 ,
n
{
j=1 , 2 ,... , n
2
j=1 , 2 ,... , n−1
2
n sudé
n liché
Model skrytých period (MSP):
p
y t =0∑  j cos  j t j t
j =1
t=1 , 2 , ... , n ... čas
 j ... úhlová frekvence (daná)
}
 j ... fázový posun
parametry
 j ... amplituda
0 ... absolutní člen
platí: sin  x y =sin x cos ycos x sin y
cos  x y =cos x cos y−sin x sin y
 j cos  j t j = j [ cos  j t cos  j−sin  j t sin  j ] = j sin  j t j cos  j t 
kde
{
 j=− j sin  j
 j= j cos  j
Ekvivalentní model:
p
p
j =1
j=1
y t =0∑  j sin  j t ∑  j cos j t t
0 , j ,  j ... parametry (amplitudy)
{
n
n sudé
2 j
 j=
, j =1 , 2 , ... , p , kde p= 2n−1
, zadané frekvence
n
n liché
2
Periodogram:
Úkol: pro data y 1 , ... , y n ověřit, zda vyhovují modelu skrytých period.
K tomu slouží periodogram - najde významné frekvence.
I :=
1
 A2 B 2   , kde
4
{
n

∑
2
A= ∑ y t sin  t
n t =1
n
2
B=
y cos t 
n t=1 t
∈〈− , 〉 nebo ∈〈 0 , 2〉 (naše  j ∈〈0 , 〉 )
Poznámka:
Definice periodogramu I  se může lišit o konstantu.
30
Platí:
pokud data y 1 , ... , y n obsahují frekvence  j=
2 j
, j=1 , ... , p , tak
n
{
n
= j
2
I = 
≠ j , kde  2=var t .
2
Lokální maxima odpovídají přítomným frekvencím.
⋅
Fisherův test periodicity:
H 0 : yt =0 t , kde t ~N 0 , 2 ... normální bílý šum
v modelu nejsou žádné významné periody
H 1 : existuje alespoň 1 významná perioda, tj. ∃ j∈{1 , ... , p }: j ≠0∨ j≠0
Postup:
a) spočti hodnoty periodogramu:
{ [∑
1 1
I  j =
2 n
n
t =1
2
] [∑
1
yt sin  j t  
n
t=1
]}
2
n
y t cos  j t 
{
n
2 j
, j=1 , 2 , ... , p= 2
kde  j=
n
n−1
2
b) uspořádej dle velikosti:
I  1≥ I 2 ≥...≥ I  p
c) testová statistika (normovaná):
I
Y  1= p 1
∑ I  k
k=1
test: Y  1g Fp  ... zamítáme H 0 , tj. existuje významná perioda  j odpovídající
největšímu vrcholu I  1
g Fp  ... kritická hodnota Fisherova testu (ve speciálních tabulkách)
p ... počet period zahrnutých do modelu
alternativně: pomocí aproximace
p −1
p −1
p−2
P Y x = p 1− x − p 1−2 x  p 1−3 x  −...
2
3
sčítá se, dokud 1−k x 0 nebo pro p≤50 lze užít P Y x = p 1− x p −1
spočti P Y x  pro x=Y 1
pokud P Y Y 1  , tak zamítáme H 0
d) pokud v bodě c) zamítáme H 0 , tak pokračujeme dalším největším vrcholem
I
Y  2= p  2
1


∑ I k 
k =2
Y  2 g Fp−1  ... další významná perioda  j
takto pokračujeme, až dokud nenajdeme další významnou periodu
J ... množina indexů významných frekvencí, J ={ j 1 , j 2 , ...}
2
Pokud existuje více významných period, tzv. složená periodicita, tak Fisherův test nemá příliš
velkou sílu (nezamítne H 0 , přestože H 0 neplatí).
31
Siegelova modifikace:
T

T  =∑  Y  j − g Fp  
j=1
Y  j=
I  j
P
∑ I k 
k =1
⋅ ... kladná část
 ... parametr nutno zvolit, doporučuje se =0,6
T  g Sp ,   ... zamítáme H 0 ( g Sp ,   kritické hodnoty pro Siegelův test)
F
významné jsou periody, pro než Y  j g p 
Odhady parametrů:
v modelu jsou zahrnuty pouze významné periody
y t =0 ∑  j sin j t ∑  J cos  j t  t , t=1 , ... , n
j∈J
j∈J
J ... množina indexů významných period, 0 , j ,  j ... parametry
MNČ odhady, neboť model je lineární v parametrech
0
1
y t =∑ k f k t t , kde  k =  j , f k t= sin  j t  ,  j dané
k
cos  j t 
j
{
{
n
∑  y t−0−∑  j sin j t−∑  j cos  j t 
 , ,
min
0
j
j
j=1 ,..., p
∂ :
∂0
∂ :
∂ j
t =1
j∈J
2
j∈J
∑ y t =n 0∑  j ∑ sin  j t ∑  j ∑ cos  j t 
t
j
t
j
t


=0
=0
∑ y t sink t=0 ∑ sin k t∑  j ∑ sin j tsin k t∑  j ∑ cos  j t sin k t 
t
t
j
t
j
t



n
=  jk
2
=0
∂ :
∂ j
=0
∑ y t cos k t =0 ∑ cos k t ∑  j ∑ sin  j t cos k t ∑  j ∑ cos j t cosk t
t
t
j
t
Platí (Besselovy vzorce):
n
n
t =1
t=1
∑ sin  j t =∑ cos  j t =0
∑ sin  j t sin k t =∑ cos  j t cos k t = n2  j k
t
t
∑ sin  j t cos k t=0 ∀ j , k =1 ,... , p
t
Dosadíme:
1
 0= ∑ y t= y
n t
2
 k = ∑ y t sin k t 
n t
2
 k = ∑ y t cos  k t
n t
{
n
k =1 , ... , p= 2
n−1
2
32
j
t
VIII. Boxova a Jenkinsova metodologie
Výhody:
– flexibilní modely, adaptivní metody (model se dokáže rychle přizpůsobit změnám v průběhu
dat)
– stochastické modely nejen náhodné složky, ale i trendu a sezónnosti
– dobré praktické výsledky, kvalitní předpovědi
– algoritmizovaný postup téměř bez subjektivních zásahů
Nevýhody:
– je potřeba alespoň 50 dat
– finanční a časová náročnost
– obtížná interpretace modelů (není tak dobře vidět, co se děje)
VIII.1. Základní pojmy
Stacionarita:
– ustálené pravděpodobnostní chování (v čase)
– uvažujme systém { yt , t∈T } ... náhodný proces, t ... čas
Definice:
1.) t := E y t , t∈T ... střední hodnota procesu
2.) t=0 , ∀ t∈T ... centrovaný náhodný proces
3.) R s , t :=cov  y s , y t = E  y s−s y t −t  , s , t∈T ... kovarianční funkce procesu
(zobecnění kovarianční matice)
4.) R s , s=var y s =E  y s −s 2≥0 ... rozptyl procesu
Věta: (Vlastnosti kovarianční funkce)
1.) R s , t je pozitivně semidefinitní,
n
n
tj. ∀ n∈ℕ ∀ c1 ,... , cn ∈ℝ , ∀ t 1 , ... , t n∈T : ∑ ∑ c j c k Rt j ,t k ≥0
j=1 k=1
2.) R s , t= Rt , s ... symetrie
3.) každá pozitivně semidefinitní funkce je kovarianční funkcí nějakého náhodného procesu
4.) ∣R  s ,t ∣≤  R  s , s ⋅Rt , t ∀ t , s∈T
5.) součet kovariančních funkcí je opět kovarianční funkce
6.) konečná lineární kombinace kovariančních funkcí s nezápornými koeficienty je kovarianční
funkce
33
Důkaz:
Bez újmy na obecnosti zvolme t≡0 (centrovaný proces).
1.)
0≤E
n

2
n
∑ c j yt
j=1

j
náhodná veličina

∑ ∑  ∑ ∑
n
=E
n
cj ytj
n
n
ck yt = E
j=1
k
k=1

c j ck yt yt =
j=1 k =1
j
k
n
∑ ∑ c j c k R t j , t k 
j=1 k=1
∀ n∈ℕ , ∀ ci ∈ℝ , ∀ t j ∈T , j=1 ,... , n
2.) R s , t=cov  y s , y t = E  y s y t =cov  y t , y s =Rt , s ... symetrie
3.) bez důkazu
4.) ∣R  s ,t ∣=∣E  y s y t ∣
Nechť g je konvexní, pak g  E X ≤ E g  X  - Jensenova nerovnost
∫ f g≤ ∫ f 2 ∫ g 2 - Schwarzova nerovnost

Jensen
Schwarz
∣R  s ,t ∣=∣E  y s y t ∣ ≤ E∣ y S yt∣ ≤  E ∣y s∣2⋅E∣ y t∣2= R s , s⋅R t , t
5.) stačí ověřit pozitivní semidefinitnost dle 3.)
nechť f 1  s , t , f 2  s , t jsou kovarianční funkce
f := f 1 f 2
∀ n , ∀ c 1 ,... , c n ∈ℝ , ∀ t 1 , ... , t n ∈T
n
n
n
n
n
n
∑ ∑ c j c k f t j , t k =∑ ∑ c j c k f 1 t 1 , t k ∑ ∑ c j c k f 2 t1 ,t k ≥0
j=1 k=1
j =1 k=1
j=1 k =1


≥0
≥0
6.) analogicky jako 5.)
Definice:
Náhodný proces y t , t∈T , je kovariančně stacionární, jestliže platí
R s , t= R s−t ∀ s , t∈T , neboli kovarianční funkce je funkcí rozdílu argumentů (časového
posunutí).
Poznámka:
Pro kovariančně stacionární proces platí:
1.) R s =R−s ∀ s ∈T ... symetrie
2.) R0= R s , s=var y S ... rozptyl
nezávisí na s , konstantní rozptyl
3.) R s−t =R s , t=cov  y s , y t =cov  y s h , y th =R sh , th ∀ h
Poznámka:
U kovariančně stacionárního procesu závisí kovariance mezi dvěma veličinami pouze na časovém
rozdílu mezi nimi. Každý proces, který toto splňuje, se nazývá kovariančně stacionární.
Definice:
Náhodný proces je (slabě) stacionární, jestliže:
1.) je kovariančně stacionární
2.) má konstantní střední hodnotu, tj. t= ∀ t∈T
34
Poznámka:
Box & Jenkins pracují pouze se stacionárními časovými řadami.
Některé nestacionární časové řady lze převést na stacionární vhodnou transformací, např.
diferencováním.
VIII.2. Autokovariance a autokorelace
Předpoklady:
Mějme (slabě) stacionární časovou řadu y t ,t ∈ℤ t=... ,−2 ,−1 ,0 , 1 , 2 , ... diskrétní čas  .
{ y t , t ∈ℤ} ... náhodná posloupnost, náhodný proces s diskrétním časem
Autokorelační funkce (ACF)
Definice:
1.) autokovarianční funkce
 k :=R k =cov  y t , yt k =E
 yt − y t k − ,

k =... ,−2 ,−1 , 0 , 1 , 2 , ...  k ∈ℤ
nezávisí nat
speciálně pro k =0 dostáváme rozptyl
0 =R0=var y t= 2y ... nezávisí na t
2.) autokorelační funkce (ACF)
k
cov  y t , y t k 
ϱk := =
, k ∈ℤ
0  var y t⋅var y tk
Platí:
1.) symetrie :  k =−k , ϱk =ϱ−k , tj. stačí se omezit na k =0 , 1 , 2 , ...
2.) ∣ϱk∣≤1 ∀ k
3.) ϱ0=1
Korelogram:
pomáhá identifikovat model
Odhady autokovarianční a autokorelační funkce:
y 1 , ... , y n ... pozorování
n
1
y := ∑ y t
n t=1
 y
1.) =
n−k
1
2.) c k := k = ∑  y t− y y t k − y  , k =0 ,1 , 2 ,... , n−1
n t=1
k c k
3.) r k :=ϱk = = , k =0 ,1 ,... , n−1
0 c 0
35
Prakticky je to vhodné použít pro n≥50 , k ≤
n
.
4
odhady jsou konzistentní
c k ... vychýlené odhady, tj. E c k ≠k
1
'
c k :=
∑  yt − y  y tk − y  ... nevychýlený odhad
n−k t
Pozor MSE c k ≤MSEc 'k  (MSE - střední čtvercová chyba)
2
2
MSE c k =var c k Bias c k =E  c k −k 
c k , c 'k ... asymptoticky pro n ∞ nevychýlené
Dáváme přednost c k .
Identifikační bod
Chování ACF identifikuje B-J modely, je třeba určit, zda platí ϱk =0 , ∀ k k 0 .
Definice:
Identifikační bod je nejmenší takové k 0 .
Příklad:
k 0=2
Poznámka:
Může být k 0 =∞ .
Příklad:
model: y t =t t−1 , kde t ~WN 0 , 2
White noise - nekorelované veličiny, nulová střední hodnota  E t =0 , konstantní rozptyl
2
var  t=  .
=0 ,  ... parametr
2
2 2
2
2
0 =var y t =var t  t −1 =   2⋅0= 1 
1=cov  y t , y t 1=cov t  t −1 , t 1t =0 200= 2
 k =0 , k =2 , 3 ,...
ϱ0=1

 2

ϱ1 = 1 = 2
=
2
0  1  12
ϱk =0 , k =2 ,3 , ...
k 0 =1 ... identifikační bod
V praxi hodnoty ϱk neznáme, ale odhadujeme je pomocí odhadů r k .
Testujeme hypotézu H 0 : ϱk =0 ∀ k k 0 , tzn. k 0 je identifikační bod.

k0

1
za platnosti H 0 : var r k = 2∑ r 2j , ∀ kk 0 (Bartlettova aproximace)
n
j=1
rk
.
~ N 0,1
 var r k
.
36
Postup při testování:
1.) k 0 :=0
2.) spočti var r k
pokud ∃ jk 0 :∣r j∣2  var r k , tak k 0 :=k 01
jinak k 0 je identifikační bod
Parciální autokorelační funkce (PACF)
Definice:
ϱk k :=cor  y t , y t k∣y t 1 ,... , yt k −1 =ϱ0 k .1 , ..., k −1
Korelace mezi y t a y t k při pevných y t1 ,... , y t k−1 .
Korelace očištěná od vlivu y t1 ,... , y t k−1 .
Věta:

1
ϱ1
∣A∣
ϱk k =
, kde B = ϱ2
∣B∣
k ×k
⋮
ϱk−1
ϱ1
1
ϱ1
⋱
⋯

1
ϱ1
posledního řádku: A = ϱ2
k ×k
⋮
ϱ1
ϱ1
1
ϱ1
⋱
ϱ2

ϱ2
ϱ1
1
⋱
ϱ2
⋯ ϱ k−1
⋱ ⋮
⋱ ⋮ , matice A vznikne z matice B záměnou
⋱ ϱ1
ϱ1
1
ϱ2
ϱ1
1
⋱
⋯
⋯ ϱk−1
⋱ ⋮
⋱ ⋮
⋱ ϱ1
⋯ ϱk

.
Důkaz:
parciální korelace obecně (viz. též MRSA)

x
X=1
p ×1
2x

∑11 ∑12
∑ :=var x= ∑21 ∑22
p×p
r×1
s×1
r

r
s
s
p=rs
parciální variance a kovariance:
−1
var 1 x∣2 x =∑11⋅2 =∑11 −∑12 ∑22
 ... kovarianční matice
P ... korelační matice
−
P= Diag  
1
2
−
  Diag  
∑21
1
2
parciální korelace:
−
P= Diag  11⋅2 
1
2
−
11⋅2  Diag  11⋅2 
1
2
37
speciálně v našem případě:

y0
yk
X = y1
⋮
y k−1
r =2 , s=k −1 , p=k 1

1
ϱk
ϱ1
ϱ2
ϱk
1 ϱk −1 ϱ k−2
ϱ1 ϱk−1
1
ϱ1
=P = ϱ2 ϱ k−2 ϱ1
1
 k1×k 1
⋮
⋱
⋱
⋱
⋮
⋱
⋱
⋱
ϱk −1 ϱ1 ϱk−2 ⋯

1 ϱ1 ⋯ ϱk−1
ϱ
platí: B= 1
⋮
22
ϱk−1

⋯ ϱ k−1
⋯ ϱ1
⋯ ϱk −2
⋱
⋮
⋱
⋮
⋱ ϱ1
ϱ1
1
 
, A=

ϱk −1
⋮
ϱ1
ϱk
2 2
ϱ1 ⋯ ϱk−1

pro determinant blokové matice platí:
T
∣B∣=∣ 2 2∣⋅∣1−ϱ1 , ... ,ϱ k−1 −1
2 2 ϱ1 , ... ,ϱk−1  ∣
T
∣A∣=∣ 2 2∣⋅∣ϱk −ϱ1 ,... ,ϱk −1  −1
2 2 ϱk −1 ,... ,ϱ1  ∣
prvek 1,1 matice
:

1 1⋅2
 2×2
−1
T
 1 1⋅2 1 1= 1 11 1− 1 2 T1⋅ −1
2 2   2 1⋅1=1−ϱ1 ,... ,ϱk −1   2 2 ϱ1 , ... ,ϱ k−1 =
∣B∣
∣ 2 2∣
dále využijeme symetrie  2 2 :
prvek  j , l=prvek k − j , k −l
k −1 k−1
' '
jl
k− j , k−l
ϱ1 , ... , ϱk−1  −1
=∑ ∑ ϱk− j ϱk −l  2j 2l =
22 ϱ1 ,... ,ϱk −1 =∑ ∑ ϱ j ϱl  2 2= ∑ ∑ ϱ j ϱl  2 2
'
j =1 l=1
j
l
j'
'
l'
−1
22
=ϱ1 , ... ,ϱk−1   ϱk−1 , ... ,ϱ1
'
}
j =k− j ⇒ j=k − j
l ' =k−l
l=k −l '
'
∣B∣
∣ 2 2∣
∣A∣
 1 1⋅2 1 2= 1 1⋅2 2 1=ϱk −ϱ1 , ... ,ϱk−1  −1
2 2 ϱk−1 , ... , ϱ1 =
∣ 2 2∣
 1 1⋅2 2 2=1−ϱ k−1 , ... ,ϱ1  −1
2 2 ϱk−1 , ... , ϱ1 = 1 1⋅2 1 1=
+ normování na korelace
ϱk k =
P1 1⋅2  1 2 = Diag 
1
2
11⋅2 1 1
−

 1 1⋅2 1 2  Diag 
1
2
1 1⋅2 2 2
 2×2
38
 
1
 
1
∣B∣ − 2 ∣A∣ ∣B∣ − 2
∣A∣
∣A∣
 =
⋅
⋅
=
=
∣ 2 2∣ ∣ 22∣ ∣ 2 2∣
∣B∣∣B∣ ∣B∣
−
Speciálně pro:
k =1 : ϱ11=ϱ1
1 ϱ1
ϱ1 ϱ2 ϱ2−ϱ21
=
k =2 : ϱ2 2=
1 ϱ1 1−ϱ21
ϱ1 1
∣ ∣
∣ ∣
rekurentní vzorec pro odhady PACF:
r k k =ϱ k k 
r 11=r 1
k−1
r k −∑ r k−1 , j r k− j
rkk=
j =1
k −1
k 1 , kde r k j =r k−1 , j−r k k r k−1 , k− j ,
j=1 , 2 ,... , k −1
1−∑ r k−1, j r j
j =1
Hledání identifikačního bodu:
H 0 :ϱk k =0 ∀ k k 0 , tzn. k 0 je identifikační bod
. 1
∀ k k 0
využívá se Quenouilleovy aproximace var r k k =
n
Postup:

Hledaný bod je nejmenší k 0 takové, že ∣r k k∣2 1
n
∀ k k 0
VIII.3. Lineární proces
Je to náhodná posloupnost { y t , t ∈ℤ} , zadaná ve tvaru y t =t 1 t −1 2  t−2 ...
kde  t tvoří bílý šum t ~WN 0, 2  a 1 , 2 , ... jsou parametry  ∈ℝ .
t∈ℤ ∗ ,
Operátor zpětného posunutí B :
B y t = y t−1
j
B y t = y t − j , j=1 , 2 , ...
tedy lineární proces:
∞
2
j
y t =t 1 B t  2 B  t ...=  B t , kde  B=11 B 2 B ...=1∑  j B je
2
j =1
operátor lineárního procesu
Věta:
Nechť  B∞ pro ∣B∣≤1 , tj. řada konverguje jakožto funkce reálné proměnné B na
intervalu 〈−1 ,1〉 . Potom  B t konverguje podle kvadratického středu, tj. existuje náhodná
posloupnost { yt , t∈ ℤ} vyhovující ∗ .
Poznámka:
Označ n  B=11 B...n B n . Potom konvergence dle kvadratického středu znamená, že
lim E n  B t − y t 2=0 .
n ∞
39
Věta:
Lineární proces je centrovaný a stacionární.
Důkaz:
Lineární proces je přímo zadán ve tvaru ∗ , tzn. existuje { yt } , která vyhovuje zadání.
E y t=0, neboť E t =0 ∀ t .
cov  y t , y t k =cov  t 1  t−1... , t k  1  tk −1... k t  k1  t−1...=
= 2  k 1 k 12  k2... nezávislé na t , závislé na k ... stacionarita
Důsledek (podmínka stacionarity):
 B∞ pro ∣B∣≤1
Definice:
Lineární proces se nazývá invertibilní, jestliže se dá přepsat ve tvaru
y t =1 y t−12 y t−2... t , t∈ ℤ , neboli
∞
2
j
y t −1 y t−1− 2 y t−2−...=t , tj.  B y t =t , kde  B=1−1 B−2 B −...=1−∑  j B
j =1
je operátor invertibilního procesu.
Věta (podmínka invertibility):
Nechť  B∞ pro ∣B∣≤1 . Potom je lineární proces invertibilní.
Platí:
y t = B t = B  B y t , t ∈ℤ ,
odtud  B  B=1
2
2
11 B2 B ...1−1 B−2 B −...=1
porovnání koeficientů:
1−1=0
2 −2−1 1=0
atd...
40
IX. Proces klouzavých součtů (MA proces, Moving Average)
Jedná se o speciální případ lineárního procesu.
y t =t  1  t−1... q  t−q , t∈ ℤ , kde
 t~WN 0 , 2
1 ,... , q ... parametry
q ... řád procesu
MA q ... proces klouzavých součtů řádu q
Podmínka stacionarity:
2
q
 B = B=1
konverguje vždy ∀  1 ,... ,  q∈ℝ
1 B 2 B ... q B

polynom v B , konečná řada
⇒ MAq je vždy stacionární.
q
 B=1∑  j B j ... operátor klouzavých součtů
j =1
potom:
y t = B t , t ∈ℤ
E y t=0 ∀ t ... centrovaný proces
Autokovarianční funkce:
rozptyl: 0 =var y t = 2 112...2q 
kovariance:  k =cov  yt , y t k = (opět nezávisí na t )
=cov t 1  t−1...q−k  t−q k ...q  t− q , t k 1 t k−1... k t ...q  tk −q =
{
 2 k 1  k 12  k 2... q −k q  pro k q
=  2 q
pro k =q
0
pro k q
Autokorelační funkce:
ϱk =
{
 k 1 k1... q −k q
121... 2q
q
121... 2q
0
pro k q
pro k =q
pro k q
k 0 =q ... identifikační bod
při známých ϱk lze dopočítat  i
41
Parciální autokorelační funkce:
k 0 neexistuje
funkce je omezená geometricky klesající posloupností nebo sinusovkou s geometricky klesající
amplitudou.
Podmínka invertibility:
 B∞ pro ∣B∣≤1 , kde  B  B=1 , tj.  B=−1  B
pro MA q:  B=−1  B=1 1 B... q B q−1 , označme h 1 , h2 ,... , hq kořeny  B
B
B
B
h 1⋅...⋅h q 1−
1− ⋅...⋅ 1−
přepíšeme:  B=c h 1−Bh 2−B⋅...⋅h q−B=c
h1
h2
hq
−1  B=
1
   
1−
B
B
⋅...⋅ 1−
h1
hq
=1
    
∞ pro ∣B∣≤1
⇔∣h j∣1 , j=1 , ... , q ... podmínka invertibility
tj. kořeny  B vně jednotkového kruhu
IX.1. Klouzavý proces prvního řádu
MA 1 , q=1
2
y t =t  1  t−1 , t ∈ℤ ,  t ~WN 0,  
y t = B t , kde  B=11 B
proces je vždy centrovaný a stacionární
Podmínky invertibility:
kořen h 1 : ∣h1∣1
!
 B=1 1 B=0
1
h 1=−
1
∣h1∣1 ⇔∣1∣1 podmínka invertibility MA1
Potom:
 B=−1  B=
∞
1
1
=
=∑ −1 B j=1− 1 B12 B 2− 31 B 3...
11 B 1−− 1 B  j =0
Invertovaný tvar:
 B y t =t
y t −1 y t−1 21 y t−2−...= t
neboli
2
y t =1 y t−1− 1 y t−2 ... t
Autokorelační funkce:

ϱ1 = 1 2
11
ϱk =0 , k 1
k 0=1 ... identifikační bod
42
Lemma:
Pro invertibilní proces platí: ∣ϱ1∣
1
2
Důkaz:
pro invertibilní proces platí: ∣ 1∣1
x
vyšetři funkci f  x =
na −1 ,1
1x 2
11x 2 − x 2 x
1− x 2 !
'
f

x
=
=
=0
najdi extrémy
1 x 2 2
1x 2 2
1
−1
f 1= , f −1=
2
2
1
∣ f  x∣ na −1 ,1
2
⇒ x=±1
Výpočet 1 při známém ϱ1 :

ϱ1 = 1 2
11
2
ϱ1ϱ1 1 −1=0
1± 1−4ϱ21
t 1,2=
2ϱ1
1 1−4ϱ21∣
∣
2

1 1−4
ϱ1 1
∣t 1∣=


∣2ϱ1∣
1
∣ϱ1∣
∣
2
 ∣
0
tj. t 1 nevyhovuje podmínce invertibility, tedy 1=t 2=
1− 1−4ϱ21
2ϱ1
Parciální autokorelační funkce:
Lemma:
Pro invertibilní proces platí:
−1 k1 k1 1−12
1.) ϱk k =
1−12 k1
2.) ∣ϱk k∣∣1∣k omezená geometrická klesající posloupnost
Důkaz:
1.) bez důkazu
k
2.) s využitím 1.) ∣ϱk k∣=∣1∣
1− 21
1−2  k1
∣
∣
43
IX.2. Klouzavé součty druhého řádu
MA 2 , q=2
y t =t  1  t−1 2 t −2 , t∈ ℤ ,  t~WN 0 , 2 
y t = Bt , kde  B=11 B2 B2
Podmínky invertibility:
kořeny  B ... h 1 , h2
  
 B=11 B 2 B2= 1−
B
B
1−
h1
h2
porovnání koeficientů:
1
 2=
h1 h 2
1 1
1=− −
h1 h 2
Poznámka:
 j ∈ℝ i pro h 1 , h2 komplexně sdružené.
Lemma:
Pro invertibilní proces platí:
1.) ∣1∣2 ,∣2∣1
2.) 2 1−1
3.) 2− 1−1
Důkaz:
1.) pro invertibilní proces musí platit ∣h j∣1
1 1
1
1
∣1∣=  ≤  2
h1 h2 
h1 
h2
∣
∣∣ ∣∣ ∣
1
1
1
1 1
=
1
∣ 2∣=
h1 h 2 
h1 
h2
∣ ∣ ∣ ∣∣ ∣
1
1
1
1 1
− −
2.)  21=
h1 h2 h 1 h 2
uvažuj funkci f  x , y =x y−x − y (spojitá, symetrická)
? průběh na x ∈−1 , 1 a y ∈−1 , 1
!
∂f
= y−1= 0
y=1
f  x ,1=−1
∂x
!
∂f
=x−1=0
x=1
f 1, y=−1
∂y
0 1
D2 f =
1 0
∣ I −D 2 f ∣=  −1 =2−1=! 0
−1 
1,2=±1 ... vlastní čísla D 2 f , matice je indefinitní - není globální extrém
tedy ∣ f  x , y∣−1 na −1 ,1×−1,1
3.) analogicky
 
∣
∣
44
Oblast invertibility:
Autokorelační funkce (ACF):
z obecného vzorce pro MA q :
 1 1 2
ϱ1 =
2
2
11  2
2
ϱ2 =
2
2
11 2
ϱk =0 , k 2
Identifikační bod: k 0 =2
Lemma:
Pro invertibilní proces platí:
1
1.) ϱ1ϱ2 −
2.)
2
1
ϱ2−ϱ1−
2
3.)
ϱ214ϱ2 1−2ϱ2 
Důkaz:
Platí: abc 2≥0
a 2b 2c 22 a ba cb c ≥0
1 2 2 2
a ba cb c≥− a b c 
2
a ba cb c
1
≥−
pro a , b , c≠0,0 ,0
2
2
2
2
a b c
rovnost pro abc=0
 1 2 1 2
1
≥−
1.) ϱ1ϱ2 =
2
2
2
11 2
vol a=1 , b=1 , c=2
rovnost pro 1 1 2=0 , tj. 2=−1 −1 - hranice oblasti invertibility, tedy uvnitř
1
oblasti platí ostrá nerovnost −
2
2.)
ϱ2−ϱ1 =
− 12− 1 2
2
1
2
2
≥−
1
2
1 
vol a=1 , b=−1 , c= 2
rovnost pro 1− 1 2=0 , tj.  2=1−1 - hranice oblasti invertibility, tedy uvnitř oblasti
1
platí ostrá nerovnost −
2
3.) Zřejmě platí jen na části oblasti invertibility
viz. Cipra , str. 113 (11.56)
45
Výpočet  1 , 2 při daných ϱ1 ,ϱ 2 :
– iteračně
– pomocí speciálních diagramů
PACF:
Je omezená geometrickou klesající posloupností nebo sinusovkou s geometricky klesající
amplitudou.
46
X. Autoregresní proces
AR p ... autoregresní proces řádu p
y t =1 y t −1... p y t− p t , kde t∈ ℤ , t ~WN 0 , 2
neboli  B y t=t
 B=1−1 B−2 B2 −...− p B p ... autoregresní operátor (polynom v B )
B j y t = y t− j ... operátor zpětného posunutí
AR p ... centrovaný, invertibilní (je přímo zadán v invertovaném tvaru)
Podmínky stacionarity:
Kořeny polynomu  B musí být vně jednotkového kruhu, tj. ∣g j∣1 , j=1 ,... , p (odvození
obdobně jako pro podmínku invertibility u MA q ).
potom: y t =−1  B t
Autokorelační funkce (ACF):
vyhovuje soustavě ϱk = 1 ϱk−1 2 ϱk −2... p ϱ k− p , k =1 , 2 , ...
odvození:
y t =1 y t −1 2 y t −2... p y t − pt ∣y t −k , E pro k =1 , 2 , ..
 k = 1  k−1 2 k−2 ... p k − p0 ∣ 1
0
ϱk = 1 ϱk−1 2 ϱk −2... p ϱ k− p ... soustava diferenčních rovnic
ϱk − 1 ϱk−1− 2 ϱk −2−...− p ϱ k− p =0
charakteristický polynom:
z p− 1 z p−1− 2 z p−2 −...− p=0 ∣ 1p pro z ≠0
z
1
1
1
1− 1 −2 −...− p =0 ... AR polynom v proměnné 1
z1
z2
zp
z
1

=0
z
1
qj = , j=1 , ... , p
pro kořeny z 1 ,... , z p platí vztah:
zj

kořeny  B
podmínka stacionarity: ∣g j∣1⇔∣z j∣1
z 1 ,... , z p navzájem různé reálné kořeny
a)
obecné řešení: ϱk =a1 z k1 ...a p z kp , k =1,2 ,... , a j ∈ℝ
pokud ∣z j∣1 , j=1 , ... , p , tak ϱk je lineární kombinace geometricky klesajících
posloupností
47
b)
z j , z 'j ... komplexně sdružené kořeny
obecné řešení obsahuje člen: a j z kj a j z jk , a j ∈ℂ
nechť z j =d ei  , a j= e i  ,  , d ∈ℝ ,  ,∈0 , 2 
i  k 
pak a j z kj a j z j k = e i  d k ei k   e−i  d k e −i k = d k e
e−i k  =
2 Re e
k
'
k
i k 

'
=2  d cos  k = d sin k  
do obecného řešení přibývá člen  d k sin k  , kde ∈ℝ , ∈0, 2 
i
, pokud ∣z j∣1 , tak d ∈0,1
z j =d e
k
 d sin k  - tlumená sinusovka s geometricky klesajícími kmity (pro k ∞ )
z j ... reálný kořen násobnosti r
c)
do obecného řešení přibude b0 b1 k ...b r−1 k r −1 z kj
pro ∣z j∣1 je průběh polynomu výrazně překrýván průběhem z kj
Závěr:
Autokorelační funkce je v podstatě lineární kombinací geometricky klesajících posloupností a
sinusovek různých frekvencí s geometricky klesajícími amplitudami.
Identifikační bod zde neexistuje.
Výpočet parametrů  j při znalosti ϱ k :
Používají se Yuleovy-Walkerovy rovnice:
ϱ1=1 2 ϱ1... p ϱ p−1
ϱ2=1 ϱ1 2... p ϱ p−2
.............................................
ϱ p= 1 ϱ p−1 2 ϱ p −2... p
Výpočet rozptylu  0 :
y t =1 y t −1 2 y t −2... p y t− p t ∣y t , E
0 =1 1 2 2... p  p 2 ∣ 1
0
2
1= 1 ϱ12 ϱ2... p ϱ p 
0
2

0 =
1−1 ϱ1− 2 ϱ2−...− p ϱ p
PACF:
Identifikační bod k 0 = p , tj. ϱk k =0 , k  p .
48
X.1. Autoregresní proces prvního řádu
AR1
y t =1 y t −1 t , t ∈ℤ ,  t ~WN 0 ,  2 
centrovaný, invertibilní
Podmínka stacionarity:
1
 B=1−1 B ... kořen g 1=

∣g 1∣1⇔∣ 1∣1
1
−1
potom: y t =−1  B t , kde   B=
∞
1
=∑ 1 B j =1 1 B21 B 2...
1− 1 B j=0
y t =t 1 t −112  t−2 ... tvar MA
Autokorelační funkce (ACF):
vyhovuje vztahu ϱk = 1 ϱk−1= 1 1 ϱk −2=...=k1 , k =1 , 2 ,...
ϱk = k1
speciálně ϱ1=1
PACF:
ϱ11=ϱ1=1
ϱk k =0 , k 1
k 0 =1 ... identifikační bod
49
X.2. Autoregresní proces druhého řádu
AR 2
y t =1 y t −1 2 y t −2 t ,
centrovaný, invertibilní
Podmínka stacionarity:
t∈ℤ , t ~WN  0 ,  2
  
 B=1−1 B−2 B2 = 1−
B
B
1−
g1
g2
1
1

g1 g2
porovnáním koeficientů:
−1
2 =
g1 g2
1=
}
stejné rovnice jaku u MA 2 až na znaménko
stacionarita: ∣g j∣1 , j =1 , 2 , ...
ekvivalentně:
∣ 1∣2 ,∣2∣1
 211
podmínky stacionarity
 2−11
}
Oblast stacionarity AR  2 :
Autokorelační funkce (ACF):
vyhovuje soustavě
ϱk = 1 ϱk−1 2 ϱk −2 , k =1 , 2 ,...
speciálně pro k =1 :
ϱ1=1 2 ϱ1
1
ϱ 1=
... počáteční podmínka
1−2
ϱk − 1 ϱk−1− 2 ϱk −2=0
charakteristický polynom:
z 2 −1 z− 2=0
kořeny z 1 , z 2 :  z 1−z  z 2−z =0
Podmínka stacionarity: ∣z j∣1 , j=1,2
1= z 1z 2
 2=−z 1 z 2
1
z 1z 2
=
počáteční podmínka: ϱ1=
1−2 1z 1 z 2
50
a)
z 1≠ z 2 ... reálné kořeny
obecné řešení ϱk = A z k1 B z k2 , k =1 , 2 , ...
speciálně pro k =0 : 1= AB ⇒ B=1−A
z 1z 2
= A z 11− A z 2
k =1 :
1z 1 z 2

A=
z 1 z 2
−z
1 z 1 z 2 2
=
2
2
z 1− z 1 z 2
z 1 1− z 2 
=
 z 1−z 2 
1 z 1 z 2  z 1−z 2 1 z 1 z 2 z 1−z 2 
2
z 1z 1 z 2−z 2 −z 1 z 22− z 1z 1 z 22
−z 2 1−z 21 
B=1− A=
=
1 z 1 z 2  z 1−z 2 
1z 1 z 2  z 1−z 2 
2
k 1
2
k1
1−z 2 z 1 −1− z 1  z 2
řešení: ϱk =
pro k =1 , 2 ,...
1z 1 z 2 z 1 −z 2 
b) z 1= z 2 ... dvojnásobný kořen
obecné řešení: ϱk = AB k  z 1k
k =0 : 1= A
2 z1
=1B z 1
k =1 :
1z 21
2 z 1−z 1−z 31 1− z 21
1 2 z1
B=
−1=
=
z 1 1z 21
z 1 1 z 21 
1 z 21

řešení: ϱk = 1
1− z 21
2
1

k z k1 , k =1 , 2 , ...
1 z
z 1= z 2 ... komplexně sdružené kořeny
c)
obecné řešení: ϱk = A d k sin  k B , kde z 1=d e i 
k =0 : 1= Asin B
z 1z 2
= Ad sin  B
k =1 :
1z 1 z 2
je možné vyjádřit A , B a tyto hodnoty dosadit do obecného řešení
k
0 .
pro stacionární proces: d ∈0,1 , tedy d k
∞
Výpočet 1 , 2 při známých ϱ1 ,ϱ2 , tj. Yuleova-Wolkerova soustava:
ϱ1=1 2 ϱ1
ϱ2=1 ϱ1 2
ϱ1 1−ϱ2 
ϱ2−ϱ21

=
odtud: 1=
,
2
1−ϱ21
1−ϱ21
Lemma:
Pro stacionární proces platí:
1.) ∣ϱ1∣1
2.) ∣ϱ2∣1
ϱ 1
3.) ϱ21 2
2
Parciální autokorelační funkce (PACF)
Identifikační bod k 0 =2 , tj. ϱk k =0 pro k 2 .
51
XI. Smíšený proces
ARMA  p , q  :
y t =1 y t −1... p y t− p t1 t −1... q t −q , t∈ ℤ , t ~WN 0, 2 
neboli   B y t = B t , kde
{
 B=1−1 B− 2 B2−...− p B p
 B=11 B2 B2... q B q
Je centrovaný.
Podmínka stacionarity:
Kořeny   B leží vně jednotkové kružnice.
Podmínka invertibility:
Kořeny  B leží vně jednotkové kružnice.
Autokorelační funkce (ACF):
splňuje soustavu rovnic:
ϱk = 1 ϱk−1 2 ϱk −2... p ϱ k− p pro k q
Řešení je stejného tvaru jako pro AR  p  , ale až pro k ≥max 0, q− p1 .
Pro q≥ p mají hodnoty ϱ0 , ... ,ϱq − p jiný tvar! (vhodné pro identifikaci modelu)
Identifikační bod k 0 neexistuje.
Parciální autokorelační funkce (PACF):
stejná jako u MA q , ale až pro k ≥max 1, p−q1
Identifikační bod k 0 neexistuje.
52
XI.1. ARMA (1,1)
tj.
p=q=1
y t =1 y t −1 t 1 t −1 , t∈ ℤ , t ~WN 0, 2 
 B=1−1 B
 B=11 B
centrovaný
Podmínka stacionarity:
∣ 1∣1
Podmínka invertibility:
∣1∣1
Autokorelační funkce (ACF):
splňuje ϱk = 1 ϱk−1 pro k 1
je třeba určit ϱ1 :
y t =1 y t −1 t 1 t −1 ∣⋅y t E
2
0 =1 1E 
t  1 y t−1  t 1 t −1  1 E  t−1 y t= 1 1  1 E t −1 1 y t−1 t1 t −1=
nekorelované
2
2
2
2
2
= 1 1  1 1  1  = 1 1 11 1 1 
y t =1 y t −1 t 1 t −1 ∣⋅y t −1 E
2
1= 1 0 1 
dosaď za 1 :
0 =1 1 01  2  2 112 1 1 
 2 1 212 1  1 
0 =
1− 21
  2 1122 1 1 
2
2
1= 1


=
1 1  212 21 11− 21  1 =
1
2
2
1− 1
1− 1
2
2
2
=  2  1 1  21112 1=  2 1 1 1  1 1 1=  2  11 1  1 
1− 1
1− 1
1−1
   11 1 
ϱ1= 1 = 1 12
0
1 2  
1
1
1
Výpočet 1 , 1 při daných ϱ1 ,ϱ2 :
ϱ
1= ϱ21
1−2 ϱ212
b±  b2 −4
, kde b=
a znaménko ± volíme tak, aby ∣ 1∣1
 1=
ϱ1− 1
2
Lemma:
Pro stacionární a invertibilní proces platí:
2 ϱ12−∣ϱ1∣ϱ2∣ϱ1∣
53
Důkaz:
Víme, že ∣ϱ1∣1 , ∣1∣1
2. nerovnost: ϱ2=1 ϱ1∣ϱ1∣
Parciální autokorelační funkce (PACF):
Je omezena geometricky klesající posloupností, stejně jako MA q  proces.
XI.2. Shrnutí ACF a PACF pro stacionární a invertibilní procesy:
∪ ... funkce tvaru lineární kombinace geometricky klesajících posloupností a sinusovek s
geometricky klesající amplitudou
Tabulka 1
ACF ϱ k
PACF ϱ k k
MA  q
AR  p
k 0=q
funkce typu ∪
k 0 neexistuje
omezená funkcí ∪
k 0 neexistuje
k 0= p
ARMA p , q
∪ po prvních q− p hodnotách
k 0 neexistuje
omezená funkcí typu ∪
po prvních p−q hodnotách
k 0 neexistuje
Poznámka:
Prakticky se užívají modely, kde pq≤2 .
Poznámka:
Obecně necentrovaný proces, tj. E y t= ∀ t .
y t  y t− ... centrování
například AR  p  :
y t −=1  y t −1−... p  y t −t
y t =1−
1−...− p1 y t −1... p y t− p t ... AR  p  s absolutním členem

=: 
odhad  :
 y ... y t  y t− y ... centrování
a) =
nebo
b) spolu s ostatními parametry  , 1 ,... ,  p =
54

1−1 −...− p
XII. Výstavba modelů
Předpokládáme stacionární časovou řadu.
Výstavba modelu probíhá ve třech fázích:
1.) identifikace
2.) odhady parametrů
3.) verifikace - statistické testy kvality modelu
XII.1. Identifikace modelu
Určit typ modelu ( MA, AR, ARMA) a řád modelu  p , q .
a) Příprava dat
vykreslíme data do grafu
vizuálně ověřujeme stacionaritu respektive její porušení
- konstantní úroveň
- stejný rozptyl
- mohla by být stacionární
- odstranitelná stacionarita
- nestacionarita vůči rozptylu
55
centrování, pokud ≠0
n
lze otestovat H 0 : =0 pomocí y=
1
∑y
n t=1 t
pokud ∣y∣2   2y , zamítám H 0
odvození rozptylu  y 2 :
n
var  y =
n
1
1
cov  y t , y s= 2
2∑∑
n t =1 s=1
n
[
n
n−1
t =1
t=1
∑ var y t 2 ∑ cov  y t , y t1 
]
n−2
1
 n 02 n−1 12 n−2 2...
n2
t =1
.
1
n−1
n−2
1
2 n−1 = 02 2 12 2 2...2 2 n−1=
n
n
n
n
∞
∞

. 1
. 1
=  02 1...2 n−1= 02 ∑  k = 0 12 ∑ ϱk =:  2y
n
n
n
k=1
k =1
2
výpočet  y pro jednotlivé modely:
2 ∑ cov  y t , y t −2... 2 cov  y 1 , y n  =

 

∞
AR 1 : ϱk = 1 ϱk−1 , k =1 , 2 ,... (víme, že ϱ1=1 )
∞
∑ ϱk =1
1
∞

MA q  :
MA 1 :
MA 2 :
k
1
ϱ1
1−ϱ1
1
2 ϱ1
 1ϱ1
1
= 0
1−ϱ1
n 1−ϱ1
1ϱ1 1ϱ2 −2ϱ21 
1−ϱ11−ϱ2 
ϱk =0 , k q
=

0
n

 2y = 0
n
k 0 =q ,
0
2
 y = 12ϱ1 
n

 2y = 0 12ϱ12ϱ2 
n
 2y =
AR 2 :

k=1
1∑ ϱ 
∑ ϱk = 1−1
1
∞
∣∑
∞
ϱ2
ARMA1,1 : ϱk = 1 ϱk−1 , k =2 , 3 , ... (víme, že 1= ϱ1 ) ∣∑
∞
∞
1
∞
1
2
∑ ϱk−ϱ1=1 ∑ ϱ k
ϱ1
ϱ1
ϱ12
ϱ
=
=
=
∑ k 1−ϱ
ϱ
1
1
1− ϱ21 ϱ1−ϱ2

2

2ϱ1
 = 0 1
n
ϱ1−ϱ2
2
y

56
b) vlastní identifikace
zkoumáme vlastnosti odhadnuté ACF a PACF dle tabulky 1 (průběh funkce, identifikační
bod)
r k =ϱ k , r k k =ϱ k k , k =1 , 2 , ... ,~10až 20
Hodnoty r k i r k k bývají korelované, takže výsledky z tabulky neplatí přesně. V případě
nejasností nutno přezkoušet několik alternativ.
plus navíc: kontrola omezení na r k (viz. tabulka 2)
c) výpočet počátečních hodnot parametrů  , , 2
dle vzorců při známých r k =ϱ k , r k k =ϱ k k , c 0=  0 (viz tabulka 2)
počáteční odhady je třeba iteračně zpřesnit (software)
omezení na r k
Tabulka 2
Počáteční odhady
AR 1
 1=r 1

 =c 0 1−r 21 
∣r 1∣1
r 1 1−r 2 
r 2−r 21
 1=
,  2=
1−r 21
1−r 21
 2=c0 1−
 1 r 1− 
 2 r 2
∣r 2∣1
2
AR 2
MA 1
MA 2
1−  1−4 r 1
 1=
2r1
c
 2= 0 2
1 1
2
 1= 2=0,1 nebo z grafického diagramu
c0
2
 =
2
2
1  
1
ARMA1,1
 1=

2
r2
r1
r 21
1r 2
2
∣r 1∣
1
2
1
2
1
r 2−r 1−
2
r 2r 1−
2 r 21−∣r 1∣r 2∣r 1∣
1−2 r 2
 12
1
2
 1=  b±  b −4 , kde b=
2
1
r 1 −

znaménko ± volíme tak, aby ∣ 1∣1
n
c '0
2
1
'
'
' 2
 =
2 , kde c 0= ∑  y t − y 
n 1
1 1
'
y t = y t− 1 y t −1
57
XII.2. Odhady parametrů
Složité předprogramované procedury. Základem je metoda nejmenších nelineárních čtverců
(standardní přístup). Při normalitě aproximuje maximálně věrohodný přístup.
= , =1 , ... ,  p ,  1 , ... , q
n
.
S  :=∑  2t  = min přes obor invertibility a stacionarity ,
t =1
, 
kde t =−1  B B y t = y t− 1 y t −1−...− p y t− p−1  t−1 −...−q  t−q  
... odhadnutelná hodnota bílého šumu při identifikovaném modelu (tj. p , q dané)
funkce nelineární v parametrech
Rekurentní výpočet:
t = y t −1 y t−1−...− p y t − p−1 t −1  −...−q  t −q 
 , ... počáteční odhady
nutno zadat počáteční parametry y 0 , y−1 , ... , y 1− p , 0 , −1 , ... , 1−q
a) Podmíněná metody
všechny počáteční hodnoty jsou nulové
0=E y t =E t (při centrovaném modelu)
b) Nepodmíněná metoda
složitější počáteční podmínka
Pro n75 je rozdíl mezi metodami zanedbatelný.
Vlastní minimalizace:
Gaussova-Newtonova iterační metoda. Jako hlavní nástroj používá Taylorův rozvoj funkce t 
v bodě 0 , kde 0 je počáteční odhad parametrů.
pq
0
0
∂
t = t  0− ∑ x t j  0  j−0j , kde x t j  =− ∂   t   ∣=
j
j =1
Maticově:
0
0
0
 t  = X   −   ... lineární regresní model
n×1
n× pq   p q×1
Odhad metodou nejmenších čtverců:

−0= X T  0  X  0 −1 X T 0  0 
1. iterační krok
1=0
−0
+ další iterace
 ... výsledný odhad
parciální derivace se počítají numericky
  2  X T  
 X  
 −1
var =
n
n
1  1
1
 nebo  2=

 2= S  =
2t  
2t  
∑
∑
n
n t =1
n− pq t =1
58
Speciálně: var  pro jednotlivé modely
1− 
 21

AR1: var 1=
n
1
2
AR 2: var 
 1=var 
 2= 1−
 2
n
1
2
MA 1: var  1 = 1− 1 
n
1
2
MA 2: var  1=var  2 = 1− 2 
n
{
k2
 21 
1−
n
ARMA1,1:
k2

var  1= 1− 21 
n
 1=
var 
kde k =
Intervaly spolehlivosti:
přibližně na hladině 95%
asymptoticky normální rozdělení
 1±2  var 
1
například: 
59
 1  1
1
 1 1

XII.3. Ověřování modelu
verifikace, diagnostika
a) Potvrdit a přijmout, nebo
b) Zamítnout a vylepšit
Metoda přeparametrizování modelu:
při velkých rozptylech var  a  2 přidáme další parametry a posoudíme
– nové rozptyly
– nenulovost přidaných parametrů
například: MA 1 ARMA1,1
Metoda odhadnutých reziduí:
 ... rezidua při odhadnutých parametrech
 , 
 t = t  
−1
  B y t= y t −
 1 y t −1−...−
 p y t− p − 1  t−1−...− q  t −q
 t =  B 
k dispozici máme rezidua  1 , ... ,  n
odhadnutá autokorelační funkce reziduí
n−k
∑   t−   t k − 
r k   = t =1
n
∑   t − 
, k =1 , 2 , ... , n
2
t =1
odhad rozptylu r k   
1
1
2  k−1
2
AR 1: var r k  = 1−
1
1−
 1  k
∞
n
n
1 2

speciálně k =1 : var r 1  = 
n 1
1
var r 1   =  22
n
AR 2:
1 2 2
 2 2 
var r 2   =  
 1 1
n 2
MA q nebo ARMA p , q : možno použít vzorec pro AR  pq , případně 
{
Test:
∃k ∣r k   ∣2  var r k    ... zamítáme model
n
prakticky stačí pro prvních ~ 4 hodnot
[]
Portmanteau test (věšákový test):
Rychlejší ale méně přesný než předchozí.
K
Q=n ∑ r 2k    2K − p−q  ... zamítáme model
k =1
.
K = n ... obecný ARMA p , q
Oprava modelu při zamítnutí:
původní model ARMA p , q nevyhovuje
Rezidua  t znovu namodelujeme jako ARMA  p∗ , q∗  , který vyhovuje.
Výsledný model ARMA p p∗ , qq∗ .
60
XIII. Rozšířené ARMA modely
XIII.1. Integrované modely
ARIMA
– stochasticky modelují náhodnou i trendovou složku
– jsou vhodné pro data, jejichž změny úrovně mohou mít nesystematický charakter
Idea:
ARMA modely se sestavují až pro diferencovanou řadu.
 y t= yt − y t −1 , t=2 , ... , n
1. diference:
2 y t = yt − y t −1 = y t − y t−1 − y t −1− y t −2= y t −2 y t −1 y t−2 , t=3 ,... , n
2. diference:
d-tá diference: d y t= d −1 y t −d −1 y t−1 , t=d 1 ,... , n
diferenční operátor:  B
 B y t=1−B y t= yt − y t −1
B ... operátor zpětného posunutí
2
2
  B y t =1− B y t
obecně  p  B y t =1−Bd y t
Předpoklad:
Časová řada je převoditelná na stacionární časovou řadu pomocí diferencování.
(homogenní nestacionarita)
61
Download

t - Jabbim