Pozicione mere
Pozicione mere određuju poziciju jedne vrednosti statističke serije u odnosu na druge vrednosti
statističkej serije.
Kvantili su vrednosti numeričke promenljive koji niz uređen po veličini (statističku seriju) dele
na q jednakih delova.
Kvartili su kvantili koji dele statističku seriju na 4 jednaka dela. Kako je u ovom slučaju red kvantila
q=4 postoje tri kvartila, prvi ili donji ( Q1 ) , drugi kvartil ili medijana ( Q 2 ) i treći (gornji) kvartil ( Q 3 ).
Decili ( D i , i = 1,..,9) su kvantili koji dele statističku seriju na 10 jednaka dela.
Percentili ( Pi , i = 1,..,99) su kvantili koji dele statističku seriju na 100 jednakih delova.
Izračunavanje kvartila kod ne grupisanih podataka
U slučaju da broj podataka n nije deljiv sa 4 prvi kvartil je Q1 = X ⎡ N ⎤
⎢⎣ 4 ⎥⎦ +1
, dok je treći kvartil
XN + XN
Q 3 = X ⎡ 3⋅N ⎤
⎢⎣ 4 ⎥⎦ +1
. Ako je broj podataka deljiv sa 4 prvi kvartil je Q 1 = 4
X 3⋅N + X 3⋅N
Q3 =
4
4
2
+1
4
2
+1
, dok je treći kvartil
.
Primer
X: 3 5 5 6 6 7 8 10 11 12 12
Q1 = X ⎡11 ⎤
⎢ 4 ⎥ +1
⎣ ⎦
= X 3 = 5 Q 2 = X 11+1 = X 6 Q 3 = X ⎡ 3⋅11 ⎤
2
⎢ 4 ⎥ +1
⎣
⎦
= X 9 = 11 Izračunavanje kvartila kod intervalne serije distribucije frekvencija
Prvi kvartil je
N
− FQ 1 −1
⋅i
Q1 = L + 4
fQ1
1 gde je L donja granica grupnog intervala koji sa prethodnim sadrži četvrtinu ukupnog broja podataka,
FQ 1 −1 je zbir frekvencija grupnih intervala koji prethode intervalu koji sadrži prvi kvartil, f Q je
1
frekvencija interval koji sadrži prvi kvartil, i je dužina grupnog interval.
3 ⋅N
− FQ 3 −1
⋅i Q3 = L + 4
fQ3
Primer Grupni intervali X f Kumulativ ispod
0,1-2
1 5 5
2,1-4
3 7 12(≥30/4)
4,1-6
5 10 22
6,1-8
7 5 27(≥3 ⋅ 30/4)
8,1-10
9 3 30
30
Q1 = 2 +
7,5 − 5
22,5 − 22
⋅ 2 = 2,71 Q 3 = 6 +
⋅ 2 = 6,2 7
5
Na osnovu kvartila se definišu pokazatelji varijabiliteta:
interkvartilna razlika i koeficijent interkvartilne varijacije.
Interkvartilna razlika se definiše kao razlika trećeg i prvog kvartila.
IQR = Q 3 − Q1 Interkvartilna razlika je pokazatelj apsolutnog varijabiliteta i manje je osetljiva na prisustvo ekstremnih
opservacija.
Koeficijent interkvartilne varijacije je relativni pokazatelj varijabiliteta i definiše se
VQ =
Q 3 − Q1
⋅ 100(%).
Q 3 + Q1
Koeficijent interkvartilne varijacije se nalaze u intervalu [0,100%] Box-plot je grafički prikaz koristeći pet mera: medijanu, prvi kvartil, treći kvartil, najveću i najmanju
vrednost u seriji podataka između donje i gornje unutrašnje granice. Gornja i donja unutrašnja granica su
Q1 − 1,5 ⋅ IQR, Q 3 + 1,5 ⋅ IQR. Gornja i donja spoljašnja granica su Q1 − 3 ⋅ IQR, Q 3 + 3 ⋅ IQR.
Vrednosti izvan unutrašnjih granica se nazivaju atipične (outliers). Vrednosti izvan spoljašnje granice su
ekstremne.
2 Primer: Data je serija podataka:
X
3
6
7
11
13
22
30
40
44
50
52
61
68
80
94
Q1 = X ⎡ 15 ⎤
⎢⎣ 4 ⎥⎦ +1
= X 4 = 11
Q 2 = X 15+1 = X8 = 40
2
Q 3 = X ⎡ 3⋅N ⎤
⎢⎣ 4 ⎥⎦ +1
IQR=61-11=50
= X12 = 61
(11 − 1,5 ⋅ 50,40 + 1,5 ⋅ 50) Kako sve vrednosti obeležja pripadaju intervalu (-64,115) sledi da nema atipičnih opservacija.
3 4 
Download

Pozicione mere