Testiranje parametarskih hipoteza
• Pretpostavka
p
((hipoteza)
p
)op
parametru raspodele
p
se zove
parametarska hipoteza.
• Postupak njenog potvrđivanja ili odbacivanja na osnovu
podataka
d t k iz
i uzorka
k jje parametarski
t
ki test.
t t
• Ako hipoteza u potpunosti određuje raspodelu obeležja
kaže se da je to prosta hipoteza. Hipoteza da je
nepoznati parametar θ jednak broju θ0, u oznaci H0(θ =θ0),
je primer proste hipoteze.
• Ako
Ak hi
hipoteza
t
nije
ij prosta,
t onda
d jje složena.
l ž
1
Prag značajnosti ili nivo značajnosti
• Obično imamo dve hipoteze: hipoteza koju testiramo H0 nulta
lt hi
hipoteza
t
i hi
hipoteza
t
H1 – alternativna
lt
ti
hipoteza.
hi t
• Ako se odbacuje nulta hipoteza kada je tačna, pravi se
greška
g
eš a p
prvog
og tipa.
t pa
• Ako se prihvata nulta hipoteza kada je tačna alternativna
hipoteza, pravi se greška drugog tipa.
• Verovatnoća α odbacivanja hipoteze H0, ako je tačna, je
verovatnoća greške prvog tipa i naziva se prag
značajnosti ili nivo značajnosti. Obično se uzima da je
0,01; 0,05 ili 0,1.
2
Opšte napomene
• Neka jje X1, ...,, Xn p
prost slučajan
j uzorak obima n za
obeležje X u čijoj raspodeli figuriše nepoznati parametar θ.
• Testiramo hipotezu H0(θ = θ0) protiv alternative H1(θ ≠ θ0) .
• Formira se statistika kojom se ocenjuje parametar θ.
• Izračuna se realizovana vrednost statistike θn*
• Pomoću odgovarajućih tablica se nalazi ε iz uslova
statistika
PH 0 [ θˆ n − θ0 ≥ ε] = α
H0 se odbacuje na osnovu datog uzorka i za dato α ako je
θ*n − θ0 ≥ ε
realizovana
vrednost statistike
3
Opšte napomene,
napomene nastavak
• Druga
g mogućnost
g
jje da se p
pri p
pretpostavci
p
H0 izračuna
PH 0 [ θˆ n − θ0 ≥ θ*n − θ0 ] = α*
H0 se odbacuje ako je α∗ ≤ α.
Skup
p K=(-∞,
( , θ0 - ε]] ∪ ((θ0 + ε,, ∞]] je
j kritična oblast za H0 p
pri H1.
PH 0 [θˆ n ∈ K ] = α
H1 (θ ≠ θ0).
Kritična oblast je jednostrana K=(θ
K (θ0 + ε, ∞]] ako je H1 (θ > θ0).
)
Kritična oblast je jednostrana K=(-∞, θ0 - ε,] ako je H1 (θ < θ0).
4
Verovatnoće odluka
• Postupak
p donošenja
j odluke i verovatnoće p
pojedinih
j
odluka pri testiranju hipoteze H0 protiv alternativne H1
Hipoteza koja je prihvaćena ⇒
Hipoteza koja je tačna ⇓
H0
H1
H0
Pravilna odluka
(1-α)
Greška 1. vrste
(α)
H1
Greška 2. vrste
(β)
Pravilna odluka
(1-β)
• Veličina (1-β) predstavlja verovatnoću da se ne učini
greška druge vrste – moć testa.
5
Hipoteze o matematičkom očekivanju
Testiranje
j hipoteze
p
H0((m=m0) o matematičkom očekivanju
j
obeležja X koje ima normalnu raspodelu N(m, σ2), ako je
σ2 poznato.
• Neka
N k jje alternativna
lt
ti
hi
hipoteza
t
H1(m≠m
(
)
0).
• Ako je H0 tačna, uzoračka sredina ima N(m,σ2 /n) raspod.
ε nalazimo iz uslova
PH 0
[
]
 X n − m0

ε
X n − m0 ≥ ε = PH 0 
n ≥
n = α
σ
σ 

Za dato α pomoću tablica se nalazi zβ i izračuna ε
ε
zβ =
n
σ
6
Hipoteze o matematičkom očekivanju
• Nultu hipotezu
p
odbacujemo
j
ako jje
xn − m0 ≥ ε
• Oblast K=(-∞, m0 - ε] ∪ (m0 + ε, ∞] je kritična oblast za
hipotezu H0(m = m0) pri alternativi H1(m ≠ m0).
• Ak
Ako realizovana
li
vrednost
d
statistike
i ik xn ∈ K , onda
d
hipotezu H0 odbacujemo.
interval poverenja
β
verovatnoća
t ć da
d parametar
t
bude u intervalu → 1
kritična oblast
α
verovatnoća da parametar
bude u krit. oblasti → 0
7
Hipoteze o matematičkom očekivanju
Testiranje hipoteze H0(m=m0) o matematičkom
očekivanju obeležja X koje ima normalnu raspodelu
N(m, σ2), ako disperzija σ2 nije poznata.
• Neka jje alternativna hipoteza
p
H1(m≠m0)).
X n − m0
n −1
• Ako je H0 tačna, onda statistika:
Sn
ima Studentovu raspodelu sa n-1
n-1 stepeni slobode.
slobode Iz
tablica za Studentovu raspodelu nalazi se ε iz
 X n − m0

ε
PH 0 X n − m0 ≥ ε = PH 0 
n −1 ≥
n − 1 = α
Sn
 Sn

[
]
H0 se odbacuje ako je ε manje ili jednako od realizovane
vrednosti xn − m0 iz uzorka.
8
Hipoteze o disperziji
Testiranje hipoteze H0(σ2 = σ20) ako obeležje ima normalnu
raspodelu
p
N((m, σ2) i ako jje m p
poznato.
• Neka je alternativna hipoteza H1(σ2 > σ20).
~
nS n2
• Pri tačnoj hipotezi H0 statistika 2 ima χ 2n
σ0
Kritičnu oblast nalazimo iz
~
 nS n2

PH 0  2 > ε  = α
 σ0

Iz tablica za χ2 raspodelu se nalazi vrednost ε. Ako je
n~
sn2
>ε
2
σ0
H0 se odbacuje na osnovu datog uzorka za dato α.
9
Hipoteze o disperziji,
disperziji nastavak
Testiranje hipoteze H0(σ2 = σ20) ako obeležje ima normalnu
raspodelu
p
N((m, σ2) i ako m nije
j poznato.
p
• Neka je alternativna hipoteza H1(σ2 > σ20).
nS n2
• Pri tačnoj hipotezi H0 statistika 2 ima χ 2n −1
σ0
• Kritičnu oblast nalazimo iz
 nS n2

PH 0  2 > ε = α
 σ0

Za dato α iz tablica za χ2 raspodelu sa n-1 stepeni
slobode se nalazi vrednost ε. Ako je ns 2
n
>ε
2
σ0
H0 se odbacuje
db
j na osnovu datog
d t uzorka
k i za d
dato
t α.
10
Testiranje
j hipoteze
p
o jjednakosti disperzija
p
j
Testiranje hipoteze H0(σ12 = σ22) za nezavisna obeležja sa
normalnim raspodelama i poznatim očekivanjima.
• Neka nezavisna obeležja imaju normalne raspodele
X : N ( m1 , σ12 )
Y : N ( m2 , σ 22 )
• Neka je alternativna hipoteza H1 (σ12 ≠ σ22).
• Ako je H0 tačna,
tačna tada statistika
~
S n21
Z=
σ12
~
S n22
σ 22
~
S n21
= ~2
S n2
i
ima
Fiš
Fišerovu raspodelu
d l Fn1,n2.
11
Hipoteza o jednakosti disperzija
• Iz uslova
P[ Z ∈ (0,1 − ε1 ) ∪ (1 + ε 2 , ∞)] = α
ne mogu
g se jjednoznačno odrediti ε1 i ε2. Postavljaju
j j se
dodatni uslovi
α
α
P ( Z < 1 − ε1 ) =
P(Z > 1 + ε 2 ) =
2
2
ε1 i ε2 se određuju iz tablica za Fn1,n2 raspodelu.
12
Testiranje
j hipoteze
p
o jjednakosti disperzija
p
j
Testiranje hipoteze H0(σ12 = σ22) za nezavisna obeležja sa
normalnim raspodelama i nepoznatim očekivanjima.
• Neka nezavisna obeležja imaju normalne raspodele
X : N ( m1 , σ12 )
Y : N ( m2 , σ 22 )
• Neka je alternativna hipoteza H1 (σ12 ≠ σ22).
• Ako je H0 tačna,
tačna tada statistika
Sˆn21
Z= 2
Sˆn2
ima Fišerovu raspodelu Fn1-1,n2-1.
13
Hipoteza o jednakosti disperzija
• Iz uslova
P[ Z ∈ (0,1 − ε1 ) ∪ (1 + ε 2 , ∞)] = α
ne mogu
g se jjednoznačno odrediti ε1 i ε2. Postavljaju
j j se
dodatni uslovi
α
α
P ( Z < 1 − ε1 ) =
P(Z > 1 + ε 2 ) =
2
2
ε1 i ε2 se određuju iz tablica za Fn1-1,n2-1 raspodelu.
Ako je realizovana vrednost statistike Z u kritičnoj
oblasti (0, 1- ε1)∪(1+ε2, ∞) hipotezu H0 odbacujemo za
date uzorke i dati prag značajnosti
značajnosti.
14
Neparametarski testovi
• Hipoteze
p
o raspodeli
p
obeležja
j ((koje
j se odnose na samu
raspodelu obeležja) se nazivaju neparametarske
hipoteze, a odgovarajući testovi neparametarski
g
)
testovi ((testovi saglasnosti).
• Pirsonov χ2 - test
• Testira se hipoteza H0 da obeležje X za koje imamo
prost slučajan uzorak X1, ..., Xn ima datu funkciju
raspodele F0(x). Pišemo: H0 (X : F0(x))
• Neka je u raspodeli obeležja X nepoznato s parametara.
• Skup mogućih vrednosti obeležja se razbija na r
disjunktnih delova S1, ..., Sr , tako da je broj mj elemenata
p Sj najmanje
j
j 5.
iz uzorka u skupu
15
Pirsonov χ2 - test
• Brojevi
j
mj su realizovane vrednosti slučajnih
j
veličina Mj,
čije su raspodele B(n, pj), j=1,...,r.
• Nalaze se verovatnoće p j = PH 0 [ X ∈ S j ]
• Statistika kojom se testira postavljena hipoteza je
r
(M j − n ⋅ p j )2
j =1
n⋅ pj
χ 2U = ∑
r
=∑
M 2j
j =1 n ⋅
pj
−n
• Ako je H0 tačna, test-statistika ima raspodelu
χ 2r − s −1
16
χ2 - test
• Za dati nivo značajnosti,
j
, iz uslova
P(χ 2r − s −1 ≥ χ 2r − s −1;α ) = α
2
se određuje χ r − s −1;α .
• Ako je vrednost test-statistike veća od tablične,
hipoteza se odbacuje
odbacuje. U suprotnom
suprotnom, hipoteza se prihvata
prihvata.
• Ovaj test se naziva hi-kvadrat ili Pirsonov test.
17
Test Kolmogorova
• Neparametarski
p
test ((nezavisan od raspodele
p
obeležja).
j )
• Primenjuje se za obeležja koja imaju neprekidne raspodele.
• Nulta hipoteza H0 je da je raspodela F(x) jednaka raspodeli
F0(x), a alternativna hipoteza je da je F(x) različita od F0(x).
• Test-statistika, tj. statistika Kolmogorova je
uzoračka funkcija
raspodele
Dn = sup Fn* ( x) − F0 ( x)
−∞ < x<∞
• Kolmogorov
g
jje p
pokazao da za neprekidne
p
funkcije
j
raspodela važi
lim P[ n Dn < λ ] = K (λ ) =
n→∞
∞
∑ (−1)
k = −∞
K (λ ) = 0,
λ≤0
k
e
− 2 k 2 λ2
,
λ>0
18
Test Kolmogorova,
Kolmogorova nastavak
• Neka jje realizovana vrednost statistike Kolmogorova
g
d n = sup Fn* ( x) − F0 ( x)
−∞< x <∞
• Kritična
K itič oblast
bl t jje
C = [ d n ,α , ∞ )
određuje se iz
tablica
• Hipotezu H0 odbacujemo (za dati prag značajnosti i za
dati uzorak), ako je
d n > d n ,α
19
Poređenje neparametarskih testova
• χ2 – test se odnosi na sve raspodele.
p
Test Kolmogorova
g
samo za neprekidne raspodele.
• U χ2 – testu mogu figurisati i raspodele sa nepoznatim
parametrima.
ti
• Kod χ2 – testa se upoređuju empirijske i teorijske
frekvencije, a kod testa Kolmogorova empirijska i
teorijska funkcija raspodele.
• U χ2 – testu se vrši grupisanje podataka i samo je važno
k lik ih ima
koliko
i
po pojedinim
j di i iintervalima,
t
li
a ne i kkojiji su.
Time se gubi deo informacije o uzorku.
20
Download

16TestiranjeHipoteza