Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Matematick´a statistika
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
ˇarka Hudecov´
S´
a
Katedra pravdˇ
epodobnosti a matematick´
e statistiky
Matematicko-fyzik´
aln´ı fakulta Univerzity Karlovy
letn´ı semestr 2012
Testov´an´ı hypot´ez – motivaˇcn´ı pˇr´ıklad
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Pˇr´ıklad (Platov´
a diskriminace)
firma provedla ˇsetˇren´ı s c´ılem zjistit, zda doch´az´ı k platov´e
diskriminaci ˇzen
Dvouv´
ybˇ
erov´
y
t-test
do studie zahrnuto 100 n´
ahodnˇe vybran´ych zamˇestnanc˚
u,
z toho 35 ˇzen a 65 muˇz˚
u
mˇes´ıˇcn´ı plat ˇzen
X 35 = 20 685.5 Kˇc
mˇes´ıˇcn´ı plat muˇz˚
u
Y 65 = 21 364.4 Kˇc
lze z tˇechto v´ysledk˚
u usuzovat, ˇze muˇzi maj´ı (v dan´e
firmˇe) obecnˇe vyˇsˇs´ı platy neˇz ˇzeny?
Testov´an´ı hypot´ez – motovaˇcn´ı pˇr´ıklad
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Ot´
azka: Maj´ı muˇ
zi vyˇsˇs´ı pˇr´ıjem neˇ
zˇ
zeny?
pˇresnˇejˇs´ı formulace
zaj´ım´
a n´
as zˇrejmˇe porovn´an´ı
stˇredn´ıch hodnot plat˚
u muˇz˚
u a ˇzen, E X a E Y
porovn´an´ı X a Y
n´ahodn´e veliˇciny
jin´y n´ahodn´y v´ybˇer by zahrnul jin´ych 100 zamˇestnanc˚
u
dostali bychom odliˇsn´e v´ybˇerov´e pr˚
umˇery X a Y
Je rozd´ıl Y − X = 678.9 > 0 Kˇc dostateˇcnˇe pr˚
ukazn´y na
to, abychom mohli tvrdit, ˇze muˇzi maj´ı (v dan´e firmˇe)
obecnˇe vyˇsˇs´ı platy neˇz ˇzeny? Nebo je to jen vliv n´ahody?
Testov´an´ı hypot´ez
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Testov´
an´ı hypot´
ez
= vyhodnocov´
an´ı pravdivostn´ı hodnoty v´yrok˚
u na z´akladˇe
n´ahodn´eho v´ybˇeru
(tj. ovˇeˇrov´an´ı platnosti nˇejak´eho v´yroku)
− prov´ad´ıme pomoc´ı statistick´ych test˚
u
Hypot´
eza
= v´yrok, o jehoˇz pravdivosti chceme rozhodnout
nulov´
a hypot´
eza H0
tvrzen´ı o populaci, o jehoˇz platnosti rozhodujeme
(nen´ı rozd´ıl, nez´avis´ı, neliˇs´ı se, . . . )
alternativn´ı hypot´
eza H1 :
alternativa (doplˇ
nuj´ıc´ı moˇznost) k H0
ˇcasto tvrzen´ı, kter´e chceme prok´azat
Statistick´y test
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Statistick´
y test = rozhodovac´ı pravidlo, na jehoˇz z´akladˇe
zam´ıt´ame nebo nezam´ıt´
ame H0
testov´a statistika Tn = Tn (X1 , . . . , Xn ) = n´ahodn´a
veliˇcina, kter´
a je funkc´ı pozorov´
an´ı X1 , . . . , Xn
kritick´y obor C = moˇzn´e v´ysledky pokusu, kdy H0
zam´ıt´ame
Chyba I. a II. druhu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
rozhodujeme na z´
akladˇe n´
ahodn´eho v´ybˇeru
nem˚
uˇzeme
testovanou ot´
azku zodpovˇedˇet s absolutn´ı jistotou
m˚
uˇzeme se dopustit chyby
tyto chyby se budeme snaˇzit
omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 zam´ıt´
ame
H0 plat´ı
H0 neplat´ı
H0 nezam´ıt´ame
Chyba I. a II. druhu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
rozhodujeme na z´
akladˇe n´
ahodn´eho v´ybˇeru
nem˚
uˇzeme
testovanou ot´
azku zodpovˇedˇet s absolutn´ı jistotou
m˚
uˇzeme se dopustit chyby
tyto chyby se budeme snaˇzit
omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 zam´ıt´
ame
H0 plat´ı
H0 neplat´ı
OK
H0 nezam´ıt´ame
OK
Chyba I. a II. druhu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
rozhodujeme na z´
akladˇe n´
ahodn´eho v´ybˇeru
nem˚
uˇzeme
testovanou ot´
azku zodpovˇedˇet s absolutn´ı jistotou
m˚
uˇzeme se dopustit chyby
tyto chyby se budeme snaˇzit
omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 zam´ıt´
ame
H0 plat´ı
chyba 1. druhu
OK
H0 neplat´ı
H0 nezam´ıt´ame
OK
Chyba I. a II. druhu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
rozhodujeme na z´
akladˇe n´
ahodn´eho v´ybˇeru
nem˚
uˇzeme
testovanou ot´
azku zodpovˇedˇet s absolutn´ı jistotou
m˚
uˇzeme se dopustit chyby
tyto chyby se budeme snaˇzit
omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 zam´ıt´
ame
H0 plat´ı
chyba 1. druhu
OK
H0 neplat´ı
H0 nezam´ıt´ame
OK
chyba 2. druhu
Chyba I. a II. druhu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
rozhodujeme na z´
akladˇe n´
ahodn´eho v´ybˇeru
nem˚
uˇzeme
testovanou ot´
azku zodpovˇedˇet s absolutn´ı jistotou
m˚
uˇzeme se dopustit chyby
tyto chyby se budeme snaˇzit
omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 zam´ıt´
ame
H0 plat´ı
chyba 1. druhu
OK
H0 neplat´ı
H0 nezam´ıt´ame
OK
chyba 2. druhu
Oznaˇc´ıme:
α = P(chyba 1. druhu) = P(zam´ıt´
ame H0 | H0 plat´ı)
β = P(chyba 2. druhu) = P(nezam´ıt´
ame H0 | H0 neplat´ı)
Pˇrirozen´y poˇzadavek: α, β → min ! bohuˇzel nelze souˇcasnˇe
Chyba I. a II. druhu
Matematick´
a
statistika
zvol´ıme hladinu testu α (zpravidla α = 0.05)
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
maxim´aln´ı dovolen´a pst chyby 1. druhu
maxim´aln´ı pst faleˇsn´eho prok´az´an´ı vˇedeck´e hypot´ezy
vol´ıme pˇred pokusem, nez´avisle na jeho v´ysledku
pro dan´e α chceme minim´
aln´ı β ! maxim´aln´ı 1 − β
s´ıla testu 1 − β
pst zam´ıtnut´ı neplatn´e H0
pst, s jakou prok´aˇzeme platnou vˇedeckou hypot´ezu H1
nem´ame pod kontrolou (z´avis´ı na tom, co opravdu plat´ı)
m˚
uˇzeme ovlivnit volbou statistick´eho testu, poˇctem
pozorov´an´ı, . . .
α m´ame plnˇe pod kontrolou, o β toho moc nev´ıme (chyba
1. druhu je z´avaˇznˇejˇs´ı)
Dosaˇzen´a hladina testu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Dosaˇ
zen´
a hladina testu p-hodnota (angl. p-value)
pravdˇepodobnost, ˇze dostaneme v´ysledek, kter´y stejnˇe
nebo jeˇstˇe m´enˇe podporuje H0 , jestliˇze H0 plat´ı
nejmenˇs´ı hladina α, na kter´e lze jeˇstˇe H0 zam´ıtnout
stupeˇ
n d˚
uvˇery“ v platnost H0
”
v´ysledek proveden´ı statistick´eho testu pomoc´ı softwaru
Pravidlo:
je-li p ≤ α
je-li p > α
zam´ıt´
ame H0
nezam´ıt´
ame H0
(Zapamatovat!)
Nesymetrie H0 a H1
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 a H1 nejsou posuzov´
any symetricky:
H0 povaˇzujeme a priori za platnou a zam´ıt´ame ji jen
tehdy, pokud k tomu m´
ame dostateˇcnˇe siln´e d˚
uvody
pokud jsme zam´ıtli H0
m˚
uˇzeme tvrdit, ˇze data svˇedˇc´ı o
tom, ˇze H0 neplat´ı (a prokazujeme platnost H1 )
pokud jsme H0 nezam´ıtli
pak
bud’ H0 opravdu plat´ı
anebo H0 neplat´ı, ale data neposkytuj´ı dostateˇcn´e
d˚
ukazy“ k jej´ımu zam´ıtnut´ı (mal´a s´ıla testu)
”
nutn´e volit opatrn´e formulace z´
avˇer˚
u (hypot´ezu H0
nelze na z´akladˇe naˇsich dat zam´ıtnout apod.)
Z´avˇer
Hypot´ezu H0 nem˚
uˇzeme prok´
azat, ale pouze vyvr´atit
Opakov´an´ı
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Minule:
filozofie testov´
an´ı hypot´ez
testy stˇredn´ı hodnoty v norm´
aln´ım rozdˇelen´ı (pˇri zn´am´em
a nezn´am´em σ 2 )
spec. jednov´ybˇerov´y t-test
Studentovo t-rozdˇelen´ı
intervalov´e odhady
Opakov´an´ı: Jednov´ybˇerov´y t-test:
Matematick´
a
statistika
Situace: X1 , . . . , Xn n´
ahodn´y v´ybˇer z norm´aln´ıho rozdˇelen´ı
2
2
N(µ, σ ), kde σ nezn´
ame. Chceme testovat
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
H0 : µ = µ0
proti
H1 : µ 6= µ0
Dvouv´
ybˇ
erov´
y
t-test
Testov´a statistika
Tn =
√ X − µ0
n
Sn
m´a za platnosti H0 tn−1 rozdˇelen´ı.
ame H0 .
Test: je-li |Tn | > tn−1 (1 − α2 ), pak zam´ıt´
Jin´e moˇzn´e altervativy: H1 : µ < µ0 nebo H1 : µ > µ0
modifikace testu
Pˇr´ıklad
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Pˇr´ıklad
Prov´ad´ıme pr˚
uzkum, jak´y skuteˇcn´y objem piva toˇc´ı v
nejmenovan´e hospodˇe. Zakoupeno bylo 10 piv a jejich objem
byl (v litrech):
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
0.510, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488, 0.512, 0.505.
Z pohledu z´akazn´ıka bychom chtˇeli otestovat, zda hostinsk´y
netoˇc´ı pod m´ıru.
Pˇr´ıklad
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Pˇr´ıklad
Prov´ad´ıme pr˚
uzkum, jak´y skuteˇcn´y objem piva toˇc´ı v
nejmenovan´e hospodˇe. Zakoupeno bylo 10 piv a jejich objem
byl (v litrech):
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
0.510, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488, 0.512, 0.505.
Z pohledu z´akazn´ıka bychom chtˇeli otestovat, zda hostinsk´y
netoˇc´ı pod m´ıru.
Model: Pˇredpokl´
adejme, ˇze dat˚
um odpov´ıdaj´ı nez´avisl´e
n´ahodn´e veliˇciny s norm´
aln´ım rozdˇelen´ım N(µ, σ 2 )
Hypot´
ezy:
H0 : µ = 0.5 proti H1 : µ < 0.5
Pˇr´ıklad – pokraˇc.
Matematick´
a
statistika
spoˇcteme
X = 0.4893,
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
odtud
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
S = 0.0197.
Tn =
√ X − 0.5 √ 0.4893 − 0.5
= 10
= −1.7148
n
S
0.0197
H0 zam´ıt´ame, pokud Tn < −t9 (0.95) = −1.833
H0 nelze na hladinˇe v´yznamnosti 5 %
nerovnost neplat´ı
zam´ıtnout
nelze prok´azat, ˇze by hostinsk´y toˇcil pivo pod m´ıru
(bud’ skuteˇcnˇe pod m´ıru netoˇc´ı nebo tak m´alo, ˇze tuto
odchylku nem˚
uˇzeme na z´
akladˇe naˇsich dat prok´azat)
Pˇr´ıklad – v´ypoˇcet v programu R
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
>t.test(pivo,mu=0.5,alternative=‘‘less‘‘)
One Sample t-test
data: pivo
t = -1.7148, df = 9, p-value = 0.06026
alternative hypothesis: true mean is less than 0.5
95 percent confidence interval:
−Inf 0.5007382
sample estimates:
mean of x
0.4893
p-hodnota > 0.05
nezam´ıt´
ame H0 na hladinˇe 5 %
Probl´em
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
na kaˇzd´em subjektu mˇeˇr´ımˇe dvˇe veliˇciny
ot´azka: Maj´ı tyto dvˇe veliˇciny stejnou stˇredn´ı hodnotu?
Neboli, jsou co do polohy stejn´e?
Pˇr´ıklad
Vˇek rodiˇc˚
u: Jsou otcov´e starˇs´ı neˇz matky?
´
Uˇcinnost redukˇcn´ı diety: Je hmotnost po dietˇe niˇzˇs´ı neˇz
pˇred n´ı?
´ eˇsnost reklamn´ı kampanˇe: Je prodejnost v´yrobku vyˇsˇs´ı
Uspˇ
po kampani neˇz pˇred n´ı?
Jsou dvojˇcata stejnˇe inteligentn´ı?
...
Matematick´y z´apis
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
p´arov´a pozorov´
an´ı (X1 , Y1 ), . . . , (Xn , Yn )
nez´avisl´e dvojice n´
ahodn´ych veliˇcin
n´ahodn´y v´ybˇer z dvourozmˇern´eho rozdˇelen´ı
P´
arov´
y t-test
Xi a Yi mˇeˇreny na stejn´em subjektu i
Dvouv´
ybˇ
erov´
y
t-test
pˇr´ıklady: vˇek matky a vˇek otce, hmotnost pˇred a po
redukˇcn´ı dietˇe, . . .
µX = E X i , µY = E Y i
chceme otestovat hypot´ezu
H0 : µX = µY proti H1 : µX 6= µY .
(pˇr´ıp. proti jednostrann´ym H1 )
P´arov´y t-test
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Idea:
zavedeme Zi = Xi − Yi rozd´ıly
(napˇr. rozd´ıl vˇeku rodiˇc˚
u)
pˇredpoklad Z1 , . . . , Zn stejn´e rozdˇelen´ı ! norm´aln´ı
zjevnˇe µZ = µX − µY , a proto
H0 : µX = µY plat´ı
⇔ plat´ı µZ = 0
stˇredn´ı hodnota Xi a Yi je stejn´
a ⇔ Zi kol´ısaj´ı kolem nuly
u
´loha pˇrevedena na jednov´ybˇerov´y test
P´arov´y t-test
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
definujeme Zi = Xi − Yi , i = 1, . . . , n
pˇredpokl´ad´
ame, ˇze Z1 , . . . , Zn n´
ahodn´y v´ybˇer z N(µZ , σ 2 )
test
H0 : µZ = 0
proti
H1 : µZ 6= 0
jednov´ybˇerov´y t-test: spoˇcteme Z odhad µZ , S 2 odhad σ 2
testov´a statistika
Tn =
√ Z
√ X −Y
n = n
S
S
H0 zam´ıt´ame
ve prospˇech H1 : µ 6= 0, pokud |Tn | > tn−1 (1 − α/2)
ve prospˇech H1 : µ > 0, pokud Tn > tn−1 (1 − α)
ve prospˇech H1 : µ < 0, pokud Tn < −tn−1 (1 − α)
P´arov´y t-test: Pozn´amky
Matematick´
a
statistika
Obecnˇ
ejˇs´ı hypot´
ezy:
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
lze testovat obecnˇeji H0 : µX − µY = δ
√ Z −δ
testov´a statistika: Tn = n
S
Poruˇsen´ı pˇredpoklad˚
u:
test dodrˇzuje poˇzadovanou hladinu α, pokud
Zi maj´ı norm´aln´ı rozdˇelen´ı, nebo
poˇcet pozorovan´ych dvojic n je dost velk´y (n > 50)
jestliˇze normalitu nelze pˇredpokl´
adat
je-li n dost velk´e
lze p´arov´y t-test
je-li n mal´e
p´arov´y test m˚
uˇze d´avat nespr´avn´e v´ysledky
nutn´e pouˇz´ıt jin´y postup (Wilcoxon˚
uv p´arov´y test)
Pˇr´ıklad — vˇek otce vs. vˇek matky
Matematick´
a
statistika
Ot´
azka: Jsou otcov´e student˚
u vyˇsˇs´ı neˇz matky student˚
u?
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
n = 256 student˚
u z let 2006 – 2011
matky
vˇek otce a vˇek
X - vˇek otce, Y - vˇek matky, Z = X − Y rozd´ıl vˇek˚
u
test H0 : µZ = 0 proti H1 : µZ > 0 na hladinˇe α = 0.05
vypoˇcteme X = 48.88, Y = 46.60, Z = 2.28, S = 4.12
testov´a statistika
Tn =
√
256
2.28
= 8.85
4.12
kritick´a hodnota t255 (0.95) = 1.65
Pˇr´ıklad — vˇek otce vs. vˇek matky
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Tn = 8, 85 > t255 (0.95) = 1.65 ⇒ zam´ıt´ame hypot´ezu
H0 : µZ = 0 ve prospˇech H1 : µZ > 0
p-hodnota < 10−16
Z´avˇer: Prok´
azali jsme, ˇze stˇredn´ı vˇek otc˚
u je statisticky
v´yznamnˇe vyˇsˇs´ı neˇz stˇredn´ı vˇek matek
Ovˇ
eˇren´ı pˇredpokladu normality:
graficky— histogram, QQ graf
Shapir˚
uv-Wilk˚
uv test: p-hodnota 6 · 10−14
normalitu dat nelze pˇredpokl´
adat; nicm´enˇe n dostateˇcnˇe
vysok´e
p´
arov´y t-test lze pouˇz´ıt
Pˇr´ıklad – Vˇek otce vs. vˇek matky
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Ot´
azka: Je stˇredn´ı hodnota vˇeku otce pˇresnˇe o dva roky vyˇsˇs´ı
neˇz stˇredn´ı hodnota vˇeku matky?
nyn´ı test H0 : µZ = 2 proti H0 : µZ 6= 2
testov´a statistika:
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Tn =
√
256
2.28 − 2
= 1.078
4.12
kritick´a hodnota t255 (0.975) = 1.970
neplat´ı |Tn | > 1.97
(p-hodnota 0.282)
nelze zam´ıtnout H0
Z´avˇer: Stˇredn´ı vˇek otc˚
u je bud’ pˇresnˇe o dva roky vyˇsˇs´ı neˇz
stˇredn´ı vˇek matek anebo je rozd´ıl stˇredn´ıho vˇeku tak bl´ızko
2 rok˚
um, ˇze odchylku od 2 let na z´
akladˇe nasb´ıran´ych dat
nedok´aˇzeme rozpoznat.
Pˇr´ıklad – Vˇek otce vs. vˇek matky
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
95 % intervalov´y odhad rozd´ılu vˇeku rodiˇc˚
u:
obecn´y vzorec
S
S
Z − √ tn−1 (1 − α/2), Z + √ tn−1 (1 − α/2)
n
n
dosad´ıme:
(1.771, 2.784)
interval, kter´y s pravdˇepodobnost´ı 95 % pokryje skuteˇcn´y
rozd´ıl stˇredn´ıch hodnot vˇeku rodiˇc˚
u
hodnota 2 leˇz´ı v tomto intervalu
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
ˇ sen´ı v programu R:
Reˇ
> t.test(vek.otce,vek.matky,mu=2,paired=T)
Paired t-test
data: vek.otce and vek.matky
t = 1.0782, df = 255, p-value = 0.282
alternative hypothesis: true difference in means is not
equal to 2
95 percent confidence interval:
1.770783 2.783904
sample estimates:
mean of the differences
2.277344
Dvouv´ybˇerov´y probl´em
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
jedna veliˇcina mˇeˇren´
a ve dvou nez´
avisl´ych skupin´ach
m nez´avisl´ych pozorov´
an´ı Xi a n nez´
avisl´ych pozorov´an´ı Yj
navz´ajem nez´
avisl´e
zaj´ım´a n´as porovn´
an´ı jejich stˇredn´ıch hodnot
Pˇr´ıklad
v´yˇska muˇz˚
u a ˇzen ! jsou muˇzi vyˇsˇs´ı neˇz ˇzeny?
(je v jejich pr˚
umˇern´e v´yˇsce systematick´y rozd´ıl?)
plat muˇz˚
u a ˇzen ! je plat muˇz˚
u stejn´y jako plat ˇzen?
(je v platech muˇz˚
u a ˇzen rozd´ıl, kter´y se projevuje ve
stˇredn´ı hodnotˇe?)
liˇs´ı se v´yˇse cholesterolu u kuˇr´
ak˚
u a nekuˇr´ak˚
u?
Matematick´y z´apis
Matematick´
a
statistika
Model:
Opakov´
an´ı
P´
arov´
y t-test
dva nez´avisl´e n´
ahodn´e v´ybˇery
X1 , . . . , Xm z norm´
aln´ıho rozdˇelen´ı N(µX , σX2 )
Y1 , . . . , Yn z norm´
aln´ıho rozdˇelen´ı N(µY , σY2 )
Dvouv´
ybˇ
erov´
y
t-test
pˇredpoklad: shodn´e rozptyly σX2 = σY2
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Chceme otestovat
H0 : µX = µY proti H1 : µX 6= µY
(resp. proti jednostrann´ym alternativ´
am)
dvouv´ybˇerov´y t-test
Dvouv´ybˇerov´y t-test: odvozen´ı
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Idea:
porovn´ame pr˚
umˇery X a Y
velk´y rozd´ıl
zam´ıtnut´ı hypot´ezy H0
je tˇreba br´
at v u
´vahu tak´e rozsahy v´ybˇer˚
u a rozptyl
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Testov´
a statistika:
X −Y
T =
=
S.E.(X − Y )
r
mn X − Y
,
m+n
S
kde S 2 je spoleˇcn´y odhad rozptylu σ 2 spoˇc´ıtan´y z obou v´ybˇer˚
u
S2 =
1
(m − 1)SX2 + (n − 1)SY2
m+n−2
Dvouv´ybˇerov´y t-test: odvozen´ı
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
Spoleˇ
cn´
y odhad rozptylu:
um´ıme odhadnout σ 2 z kaˇzd´eho v´ybˇeru zvl´aˇst’ pomoc´ı
v´ybˇerov´ych rozptyl˚
u
m
P´
arov´
y t-test
SX2 =
Dvouv´
ybˇ
erov´
y
t-test
1 X
(Xi − X m )2
m−1
i =1
SY2 =
1
n−1
n
X
(Yi − Y n )2
i =1
vezmeme v´
aˇzen´y pr˚
umˇer
S2 =
1
(m − 1)SX2 + (n − 1)SY2
m+n−2
Rozdˇelen´ı testov´e statistiky
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Model:
dva nez´avisl´e n´
ahodn´e v´ybˇery
X1 , . . . , Xm z norm´
aln´ıho rozdˇelen´ı N(µX , σX2 )
Y1 , . . . , Yn z norm´
aln´ıho rozdˇelen´ı N(µY , σY2 )
shodn´e rozptyly σX2 = σY2
Pak za H0 : µX = µY m´
a testov´
a statistika
r
mn X m − Y n
,
T =
m+n
S
tm+n−2 rozdˇelen´ı, tj. t-rozdˇelen´ı s m + n − 2 stupni volnosti.
Dvouv´ybˇerov´y t-test:
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 : µX = µY zam´ıt´
ame ve prospˇech alternativy
H1 : µX 6= µY kdyˇz |T | > tm+n−2 1 − α2
H1 : µX > µY kdyˇz T > tm+n−2 1 − α
H1 : µX < µY kdyˇz T < −tm+n−2 1 − α
zam´ıt´ame-li H0 , ˇr´ık´
ame, ˇze rozd´ıl ve v´ybˇerov´ych pr˚
umˇerech je
statisticky v´yznamn´y
Dvouv´ybˇerov´y t-test:
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
H0 : µX = µY zam´ıt´
ame ve prospˇech alternativy
H1 : µX 6= µY kdyˇz |T | > tm+n−2 1 − α2
H1 : µX > µY kdyˇz T > tm+n−2 1 − α
H1 : µX < µY kdyˇz T < −tm+n−2 1 − α
zam´ıt´ame-li H0 , ˇr´ık´
ame, ˇze rozd´ıl ve v´ybˇerov´ych pr˚
umˇerech je
statisticky v´yznamn´y
Pozn´
amka
lze obecnˇejˇs´ı hypot´eza H0 : µX − µY = δ
testov´a
statistika
r
mn X m − Y n − δ
T =
m+n
S
Ovˇeˇren´ı pˇredpoklad˚
u
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Normalita
ovˇeˇren´ı normality pro kaˇzd´y v´ybˇer zvl´
aˇst’
pro velk´a n, m poruˇsen´ı normality velmi nevad´ı
Shoda rozptyl˚
u
SX2 a SY2 podobn´e
F-test shody rozptyl˚
u
pochyby o shodˇe
H0 : σX2 = σY2 proti H1 : σX2 6= σY2
Welch˚
uv test (modifikace t-testu)
Welch˚
uv test:
model: nez´
avisl´e v´ybˇery X1 , . . . , Xm z norm´aln´ıho rozdˇelen´ı
N(µX , σX2 ) a Y1 , . . . , Yn z norm´
aln´ıho rozdˇelen´ı N(µY , σY2 )
modifikace testov´e statistiky
jiˇz nem´a rozdˇelen´ı tm+n−2 , numerick´
a aproximace
Pˇr´ıklad – plat
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Probl´
em: Je plat muˇz˚
u vyˇsˇs´ı neˇz plat ˇzen?
100 n´ahodnˇe vybran´ych zamˇestnanc˚
u
mˇes´ıˇcn´ı plat v Kˇc
35 ˇzen a 65 muˇz˚
u
X – plat ˇzen, Y – plat muˇz˚
u
Dvouv´
ybˇ
erov´
y
t-test
ˇzeny
muˇzi
rozsah
35
65
pr˚
umˇer
20 686
21 364
smˇer. odchylka
5 180
4 334
Pˇr´ıklad – plat
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Probl´
em: Je plat muˇz˚
u vyˇsˇs´ı neˇz plat ˇzen?
100 n´ahodnˇe vybran´ych zamˇestnanc˚
u
mˇes´ıˇcn´ı plat v Kˇc
35 ˇzen a 65 muˇz˚
u
X – plat ˇzen, Y – plat muˇz˚
u
Dvouv´
ybˇ
erov´
y
t-test
ˇzeny
muˇzi
rozsah
35
65
pr˚
umˇer
20 686
21 364
smˇer. odchylka
5 180
4 334
Pˇredpoklady:
normalita muˇzi
p-hodnota 0.134
normalita ˇzeny
p-hodnota 0.310
test shody rozptyl˚
u
p-hodnota 0.218
Pˇr´ıklad – grafick´e zn´azornˇen´ı
Matematick´
a
statistika
30000
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
15000
10000
Plat
Dvouv´
ybˇ
erov´
y
t-test
20000
25000
P´
arov´
y t-test
zena
muz
Pohlavi
Pˇr´ıklad – pˇredpoklady
Matematick´
a
statistika
10000
15000
20000
zena
25000
30000
muz
25
Opakov´
an´ı
P´
arov´
y t-test
20
Percent of Total
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
15
10
5
Dvouv´
ybˇ
erov´
y
t-test
0
10000
15000
20000
25000
30000
Plat
Q−Q graf
30000
25000
Sample Quantiles
15000
20000
25000
20000
15000
10000
Sample Quantiles
30000
Q−Q graf
−2
−1
0
1
2
−2
−1
0
1
2
Pˇr´ıklad – ˇreˇsen´ı
Matematick´
a
statistika
H0 : µX = µY proti H1 : µX < µY
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
spoleˇcn´y odhad rozptylu
S2 =
35 − 1
65 − 1
51802 +
43342 = 21 356 170
35 + 65 − 2
35 + 65 − 2
testov´a statistika
r
35 · 65 20686 − 21364
· √
= −0.700
T =
100
21 356 170
kritick´a hodnota −t98 (0.95) = −1.661
na z´akladˇe naˇsich dat nelze zam´ıtnout H0 , tj. nelze
prok´azat H1
Pˇr´ıklad – ˇreˇsen´ı
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
ˇ sen´ı v programu R:
Reˇ
> t.test(zeny,muzi,var.equal=T,alternative=‘‘less‘‘)
Two Sample t-test
data: zeny and muzi
t = -0.6971, df = 98, p-value = 0.2437
alternative hypothesis: true difference in means is
less than 0
95 percent confidence interval:
-Inf 938.2113
sample estimates:
mean of x mean of y
20685.51 21364.37
Shrnut´ı
Matematick´
a
statistika
Testy o stˇredn´ı hodnotˇ
e
1 jeden v´
ybˇer
jednov´ybˇerov´y t-test
normalita
(nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru)
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
2
Dvouv´
ybˇ
erov´
y
t-test
p´arov´a pozorov´
an´ı
p´arov´y t-test
normalita rozd´ılu
(nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru)
3
dva nez´avisl´e v´ybˇery
dvouv´ybˇerov´y t-test
nez´avislost
normalita
(nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru)
shoda rozptyl˚
u
(neplat´ı-li
pouˇz´ıt Welch˚
uv test)
Poruˇsen´ı normality
Matematick´
a
statistika
Opakov´
an´ı
Testov´
an´ı
hypot´
ez
Jednov´
ybˇ
erov´
y
t-test
P´
arov´
y t-test
Dvouv´
ybˇ
erov´
y
t-test
Jestliˇze nelze normalitu pˇredpokl´
adat a rozsah v´ybˇeru je mal´y
nutn´e pouˇz´ıt jin´e testy, kter´e pˇredpoklad normality
nepotˇrebuj´ı
neparametrick´e testy
zaloˇzeny na poˇrad´ı
poˇradov´e testy
Uvedeme si
jednov´ybˇerov´y Wilcoxon˚
uv test
dvouv´ybˇerov´y Wilcoxon˚
uv test
Download

8. přednáška