Mere asimetrije podataka
1. Redosled aritmetičke sredine, modusa i medijane:
Kod simetrične raspodele: X = M e = M o
Ako je X > M e > M o raspodela je pozitivno asimetrična
Ako je X < M e < M o raspodela je negativno asimetrična
Kod asimetrične unimodalne distribucije približno važi
X − Mo = 3 ⋅ X − Me
Primer 1
Ispitati asimetričnost sledeće serije podataka.
X: 5 5 5 6 6 7 8 10 11 12 13
Rešenje:
X =8
M e = X 11+1 = X 6 = 7
M o = 5.
2
X − M e = 1 > 0 ⇒ pozitivna asimetričnost
2. Udaljenost prvog i trećeg kvartila od medijane
Ako je raspodela simetrična ⇒ Q 3 − M e = M e − Q1
Ako je Q 3 − M e > M e − Q1 ⇒ raspodela je pozitivno asimetrična
Ako je Q 3 − M e < M e − Q1 ⇒ raspodela je negativno asimetrična
:
Primer 2
Ispitati asimetričnost sledeće serije podataka na osnovu udaljenosti kvartila.
X: 5 5 5 6 6 7 8 10 11 12 13
Rešenje:
Q1 = X ⎡11⎤
⎢ 4 ⎥ +1
⎣ ⎦
= X3 = 5
Q 2 = M e = X 11+1 = X 6 = 7 Q 3 = X ⎡ 3⋅11⎤
2
⎢ 4 ⎥ +1
⎣
⎦
= X 9 = 11
Q 3 − M e > M e − Q1 ⇒ raspodela je pozitivno asimetrična
1
3. Treći centralni momenat, prvi Pirsonov koeficijent i koeficijent asimetričnosti
Treći centralni momenat
Negrupisani podaci
n
∑ (Xi − X)3
μ3 = i =1
N
Distribucija frekvencija
k
μ3 =
∑ f i (Xi − X)
3
i =1
k
∑ fi
i =1
Prvi Pirsonov koeficijent
μ2
β1 = 3
μ 32
U statističkom softveru se kao mera asimetrije koristi koeficijent asimetričnosti.
Koeficijent asimetričnosti (skewness)
α3 =
μ3
σ3
Kod simetrične raspodele (distribucija) je μ 3 = 0 , β1 = 0 i α 3 = 0.
Ako je μ 3 ≠ 0 ( β1 ≠ 0, α 3 ≠ 0) sledi da je raspodela asimetrična
Ako je μ 3 > 0 ( α 3 > 0) raspodela je pozitivno asimetrična.
Ako je μ 3 < 0 ( α 3 < 0) raspodela je negativno asimetrična
α 3 < 0.1 nema asimetrije
0.1 ≤ α 3 < 0.25 mala asimetrija
0.25 ≤ α 3 < 0.5 srednja asimetrija
α 3 ≥ 0.5 jaka asimetrija
2
Mera oblika (spljoštenosti) podataka
Drugi Pirsonov koeficijent
Četvrti centralni momenat
Negrupisani podaci
n
∑ (Xi − X)4
μ4 = i =1
N
Distribucija frekvencija
k
μ4 =
∑ f i (Xi − X) 4
i =1
k
∑ fi
i =1
β2 =
μ4
μ 22
β 2 > 3 Raspodela (distribucija) izdužena u odnosu na normalnu raspodelu
β 2 = 3 Raspodela iste spljoštenosti kao i normalna raspodela
β 2 < 3 Raspodela spljoštena u odnosu na normalnu raspodelu
U statističkom softveru se kao mera oblika koristi koeficijent spljoštenosti.
Koeficijent spljoštenosti (kurtosis)
k = β2 − 3
k > 0 Raspodela izdužena u odnosu na normalnu raspodelu
k = 0 Raspodela iste spljoštenosti kao i normalna raspodela
k < 0 Raspodela spljoštena u odnosu na normalnu raspodelu
3
IZRAČUNAVANJE PIRSONOVIH KOEFICIJENATA KOD NEGRUPISANIH
PODATAKA
Primer 1 Izračunati Pirsonove koeficijente i objasniti dobijene vrednosti.
μ2 =
90
= 8,181818
11
(X − X )2 (X − X )3 (X − X )4
X
X−X
5
5
5
6
6
7
8
10
11
-3
-3
-3
-2
-2
-1
0
2
3
9
9
9
4
4
1
0
4
9
-27
-27
-27
-8
-8
-1
0
8
27
12
13
88
4
5
0
16
25
90
64
125
126
μ3 =
126
= 11,454545
11
β1 =
81
81
81 16 16 1 0 16 81 256
625
1254
11,4545 2
= 0,239555
8,1818 3
α 3 = 0,239555 = 0,48944
μ4 =
1254
= 114
11
β2 =
114
= 1,70297
8,1818 2
Podatke karakteriše srednje jaka pozitivna asimetrija. Po obliku je distribucija
podataka spljoštena u poređenju sa normalnom distribucijom.
4
POKAZATELJI ASIMETRIČNOSTI I OBLIKA DISTRIBUCIJE FREKVENCIJA
2. Na osnovu distribucije frekvencije veličine poseda (ha) 30 individualnih gazdinstava
izračunati pokazatelje asimetričnosti i oblika distribucije:
Grupni
intervali
0,1-2
2,1-4
4,1-6
6,1-8
8,1-10
X
1
3
5
7
9
f
5
7
10
5
3
30
Kumulativ
ispod
5
12
22
27
30
fX
5
21
50
35
27
138
X−X
-3,6
-1,6
0,4
2,4
4,4
f (X − X )
-18,0
-11,2
4,0
12,0
13,2
0,0
f (X − X ) 2
64,80
17,92
1,60
28,80
58,08
171,20
f (X − X ) 3
-233,2800
-28,6720
0,6400
69,1200
255,5520
63,3600
f (X − X ) 4
839,8080
45,8752
0,2560
165,8880
1124,4288
2176,2560
171,2
63,3600
2,112 2
= 5,7067
μ3 =
= 2,1120
β1 =
= 0,02400
30
30
5,7067 3
μ
2,112
72,5419
= 2,2275
β 2 = 42 =
α3 =
= 0,1549
3/ 2
μ 2 5,7067 2
5,7067
μ2 =
Distribucija frekvencija je pozitivno asimetrična, po jačini je asimetrija mala.
Distribucija frekvencija je spljoštena u poređenju sa normalnom distribucijom.
5
Download

Mere asimetrije podataka