5.1
Měření závislosti statistických dat
Každý pořádný astronom je schopen vám
předpovědět, kde se bude nacházet daná
hvězda půl hodiny před půlnocí. Ne každý je
však téhož schopen předpovědět v případě
své sedmnáctileté dcery.
James Truslow Adams
Kvantitativní metody B
Co se dozvíte
o
o
o
o
o
Asociace, kovariance a korelace, míry závislosti.
Modelování statistické závislosti.
Regresní přímka, metoda nejmenších čtverců.
Vybrané nelineární závislosti.
Měření kvality modelu.
Kvantitativní metody B
2
Asociace
míra závislosti mezi četnostmi výskytu hodnot dvou kvalitativních
znaků X a Y v kontingenční tabulce
expected
hypotetické (očekávané) sdružené četnosti eij
pro nezávislé hodnoty xi a yj platí:
eij = nij
míra (ne)závislosti kvalitativních znaků G
r – počet řádků (obměn znaku X)
s – počet sloupců (obměn znaku Y)
Kvantitativní metody B
3
Míry asociace
[: chí – kvadrát :]
G jako Pearsonova χ2 míra asociace znaků X a Y
G=0
G = n.h
znaky X a Y jsou nezávislé
znaky X a Y jsou maximálně závislé
h = min (r - 1 ; s - 1)
Cramerův kontingenční koeficient V
V=0
V=1
Kvantitativní metody B
znaky jsou nezávislé
znaky jsou maximálně závislé
4
Příklad
Je politická orientace závislá na vzdělání?
orientace
nij
Σ
střed
pravice
ZŠ
5
5
2
12
SŠ
3
13
8
24
VŠ
1
10
3
14
9
28
13
50
Σ
5 − 2,16 )
(
G=
2,16
2
5 − 6, 72 )
(
+
Cramerův koeficient:
6, 72
V=
Kvantitativní metody B
2
vzdě
vzdělání
vzdě
vzdělání
levice
orientace
eij
Σ
levice
střed
pravice
ZŠ
2,16
6,72
3,12
12
SŠ
4,32
13,44
6,24
24
VŠ
2,52
7,84
3,64
14
9
28
13
50
Σ
3 − 3, 64 )
(
+ ... +
2
3, 64
G
7,11
=
= 0, 27
n⋅h
50 ⋅ 2
= 7,11
slabá závislost
5
Kovariance
kovariance sxy vyjadřuje vzájemný vztah proměnných X a Y
pro populaci bude
ve jmenovateli n
vyjadřuje intenzitu lineární závislosti mezi X a Y
sxy > 0
sxy < 0
sxy = 0
přímá (pozitivní) závislost
nepřímá (negativní) závislost
lineárně nezávislé veličiny
Kvantitativní metody B
X↑
X↑
Y↑
Y↓
6
Korelace
korelační koeficient rxy – relativní vyjádření vztahu mezi X a Y
−1 ≤ rxy ≤ +1
vyjadřuje intenzitu lineární závislosti mezi X a Y
rxy > 0
rxy < 0
převažuje rostoucí závislost mezi x a y
převažuje klesající závislost mezi x a y
rxy = 0
rxy = ±1
znaky x a y jsou lineárně nezávislé
znaky x a y jsou lineárně závislé
Kvantitativní metody B
7
Příklad – korelační tabulka
Lze dosažené známky z mikro (Mi) a Makro (Ma) ekonomie
považovat za nezávislé veličiny?
Mi \ Ma
1
2
3
Σ
1
16
4
2
22
2
8
3
4
15
3
3
5
5
13
Σ
27
12
11
50
X – známka z Mi
Y – známka z Ma
střední hodnoty a rozptyly:
22 ⋅1 + 15 ⋅ 2 + 13 ⋅ 3
x=
= 1,82
50
27 ⋅1 + 12 ⋅ 2 + 11⋅ 3
y=
= 1, 68
50
Kvantitativní metody B
22 ⋅12 + 15 ⋅ 22 + 13 ⋅ 32 − 50 ⋅1,822
s =
= 0, 681
49
27 ⋅12 + 12 ⋅ 22 + 11⋅ 32 − 50 ⋅1, 682
2
sy =
= 0, 671
49
2
x
8
Příklad
kovariance
16 ⋅1⋅1 + 4 ⋅1⋅ 2 + ... + 5 ⋅ 3 ⋅ 3 − 50 ⋅1,82 ⋅1, 68
sxy =
= 0, 268
49
korelační koeficient
0, 268
rxy =
= 0,396
0, 681 ⋅ 0, 671
Mezi oběma předměty je slabá pozitivní závislost.
Kvantitativní metody B
9
Regresní funkce
korelace a regrese
korelace – vzájemný (lineární) vztah proměnných
regrese – matematické vyjádření vztahu mezi proměnnými
regresní model:
X1
.
.
.
Xk
?
Y = f(X1, X2, …, Xk) + e
Y
deterministická
složka
náhodná
složka
lze vypočítat
Kvantitativní metody B
10
Přečtěte si
Matematické pojmy poskytují hlubší pohled na ekonomické
koncepce a dodávají jim přesnost a jasnost
jasnost.. Mnoho ekonomických
jevů může být bráno jako matematické proměnné, např.
např. příjmy,
výnosy, náklady, ceny, zásoby, atd.
atd. V ekonomii se snažíme určit
vztahy mezi těmito proměnnými
proměnnými..
Takovým speciálním případem vyjádření vztahů mezi proměnnými je
regresní funkce
funkce..
Doc.. RNDr
Doc
RNDr.. Ing.
Ing. Petr Fiala, CSc
CSc.., MBA.
MBA.
Úvod do kvantitativní ekonomie
Kvantitativní metody B
11
Jednoduchá lineární regrese
Lineární regrese
lineární regresní model
60
55
50
45
y
40
35
rovnice regresní přímky
30
25
20
15
8
13
18
23
28
33
x
[ xi ; yi ]
[ xi ; y)i ]
body náležící souboru znaků X, Y
body ležící na regresní přímce
Kvantitativní metody B
12
Metoda nejmenších čtverců
reziduum
yi
)
yi
ei
xi
metoda nejmenších čtverců – minimalizuje rozptyl hodnot kolem regresní přímky
) 2
SSE = ∑ ei2 = ∑ ( yi − yi ) min !
i
i
SSE – Sum of Squared Errors
Kvantitativní metody B
13
Koeficienty lineární regrese
rovnice regresní přímky:
regresní koeficient b1
směrnice regresní přímky
mezní přírůstek závisle proměnné Y
∆X = 1
→
∆Y = b1
koeficient b0
průsečík regresní přímky s osou y
přímka prochází těžištěm
Kvantitativní metody B
[x ; y ]
14
Kvalita regresního modelu
determinační koeficient R2
rozptyl teoretických hodnot
rozptyl empirických hodnot
0 ≤ R2 ≤ 1
jakou část variability závislé proměnné Y lze vysvětlit
vlivem nezávislé proměnné X
pro lineární modely je determinační koeficient druhou mocninou
koeficientu korelace
Kvantitativní metody B
15
Sdružené regresní přímky
odhad proměnné Y pro X = xi
odhad proměnné X pro Y = yi
Regresní nůžky
12000
11500
11000
10500
10000
9500
9000
8500
8000
250
300
350
400
450
500
≠1
Kvantitativní metody B
16
Příklad
závislost známek ze zkoušek mikro (X) a makro (Y):
y = f(x)
x = g(y)
b1 =
0, 268
= 0,39
0, 681
0, 268
a1 =
= 0, 40
0, 671
b0 = 1, 68 − 0,39 ⋅1,82 = 0,96
x
1
2
3
y
1,35
1,74
2,13
a0 = 1,82 − 0, 40 ⋅1, 68 = 1,15
y
1
2
3
x
1,55
1,95
2,35
makro je lehčí než mikro
Kvantitativní metody B
17
Nelineární regresní modely
parabolická (kvadratická) regrese
Kvadratická regrese
90
85
80
75
Y
70
65
y = -0,0825x2 + 4,423x + 19,415
R2 = 0,919
60
55
50
45
40
10
hyperbolická regrese
15
20
25
30
35
40
45
50
X
Hyperbolická závislost
80
Y - počet kontaktů / týden
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
X - vzdálenost v m
exponenciální regrese
Exponenciální regrese
80
70
60
x
y = 2,0758.1,072
2
R = 0,9424
y
50
40
30
20
10
0
20
25
30
35
40
45
50
55
x
Kvantitativní metody B
18
Parabolická regrese
regresní funkce:
řešíme soustavu
rovnic:
KDY ?
proměnná Y se mění rychleji než lineárně
proměnná Y mění průběh
Kvantitativní metody B
19
Hyperbolická regrese
regresní funkce:
rovnice lineární v parametrech
(substitucí lze převést na lineární)
KDY ?
modelování nepřímé úměrnosti
proměnná Y konvexně klesá
Kvantitativní metody B
20
Exponenciální regrese
regresní funkce:
rovnice linearizovatelná transformací
(logaritmováním lze převést na lineární)
KDY ?
proměnná Y roste rychleji než kvadraticky
Kvantitativní metody B
21
Příklad – nelineární regrese
Tabulka uvádí závislost mezi vzdáleností pracovníků na pracovišti v
metrech a četností jejich pracovních styků za týden:
vzdálenost
3
8
9
12
20
32
52
počet styků
25
18
10
9
7
5
3
graf napovídá:
30
25
použijeme hyperbolickou
regresi
20
15
10
5
0
0
10
20
30
40
50
Kvantitativní metody B
60
22
Příklad
výpočtem dostaneme:
kvalita modelu – determinační koeficient:
vypočteme rozptyly:
s y2 = 61
sY2 = 54
2
s
R 2 = Y2 = 0,886 = 88, 6%
sy
kvalita modelu je poměrně vysoká
Kvantitativní metody B
23
Proč matematické modely?
matematický model je abstraktní reprezentace ekonomických vztahů
v reálném světě
matematika zavádí přesnost do definic a vztahů
matematika je jazyk, který usnadňuje sdělování ekonomických
koncepcí
matematické modely můžeme zkoumat nezávisle na realitě
HMOTNOST = -77 + 0,83 VÝŠKA -6,78 POHLAVÍ + 0,27 VĚK
Kvantitativní metody B
24
Co Vás čeká příště
Analýza časových řad
o
o
o
o
o
Časové řady a jejich rozklad.
Elementární analýza časové řady.
Analýza trendu, typy trendů časových řad.
Analýza sezónnosti, sezónní odchylky a indexy.
Prognózování budoucího vývoje.
Kvantitativní metody B
25
Download

Kvantitativní metody B