Kurz 4st201 – cvičení č. 7
4ST201 – STATISTIKA
CVIČENÍ Č. 7
• testování hypotéz – parametrické testy
→
test hypotézy o střední hodnotě
→
test hypotézy o relativní četnosti
→
test o shodě středních hodnot
• testování hypotéz v MS Excel
• neparametrické testy
→
chí-kvadrát test dobré shody
Testování statistických hypotéz
• Statistická hypotéza – určitý předpoklad o parametrech či tvaru rozdělení
• Hypotézy se mohu týkat neznámých číselných parametrů rozdělení náhodné veličiny, pak jde o testy
parametrické. Ostatní typy jsou testy neparametrické.
• H0 – nulová (testovaná) hypotéza, hypotéza, jejíž platnost ověřujeme; např. předpoklad, že se průměr
základního souboru rovná určité konkrétní hodnotě
• H1 – alternativní hypotéza – popírá nulovou hypotézu:
→
Dvoustranná hypotéza - dvoustranný test
→
Pravostranná hypotéza, levostranná hypotéza - jednostranný test
• Chyba I. druhu = zamítnutí ve skutečnosti platné H0
→
Pravděpodobnost chyby I. druhu = α = hladina významnosti (volí se před provedením
testu, nejčastěji 0,1, 0,05, 0,01)
• Chyba II. druhu = nezamítnutí H0, ačkoliv ve skutečnosti platí H1
→
Pravděpodobnost chyby II. druhu = β; pravděpodobnost 1-β = síla testu
CHYBA I. A II.
DRUHU
Závěr testu
Skutečnost
H0 platí
H0 platí
OK (1-α)
H0 neplatí
chyba II. druhu
(β)
1
H0 neplatí
chyba I. druhu
(α)
OK (1-β)
Kurz 4st201 – cvičení č. 7
• Testové kritérium = statistika, jejíž hodnotu vypočítáme na základě výběrových (napozorovaných) dat
a podle jejíž hodnoty pak posuzujeme platnost testované hypotézy
• Obor hodnot testového kritéria se rozděluje na dva neslučitelné obory – obor přijetí (V) a kritický obor
(W), obory od sebe oddělují tzv. kritické hodnoty
• Rozhodnutí činíme podle toho, jestli hodnota testového kritéria padne do kritického oboru W
(zamítnutí H0), či do oboru přijetí V (nezamítnutí H0)
• Doporučený postup při testování hypotéz
1) Formulace výzkumné otázky ve formě nulové a alternativní statistické hypotézy (Jakého parametru
se hypotéza týká?)
2) Zvolení přijatelné úrovně chyby rozhodování (volba hladiny významnosti α)
3) Volba testovacího kritéria (ve vzorcích podle typu vhodného testu)
4) Výpočet hodnoty testovacího kritéria
5) Určení kritických hodnot testovacího kritéria (určení krajních hodnot kritického oboru W –
vzorce)
6) Doporučení (nezamítnutí nebo zamítnutí nulové hypotézy H0)
Test hypotézy o střední hodnotě
: = Testujeme nulovou hypotézu
: ≠ (oboustranná alternativní hypotéza)
proti jedné z alternativních hypotéz:
: > (pravostranná alternativní hypotéza)
: < (levostranná alternativní hypotéza)
Při volbě testového kritéria a kritického oboru opět rozlišujeme podle toho, zda je rozptyl základního
souboru známý a jak velký je rozsah výběru:
a) Velký rozsah výběru, rozptyl v základním souboru je známý
o
=
testovým kritériem je náhodná veličina
̅ √
která má při platnosti nulové hypotézy rozdělení N(0;1)
o
,
kritický obor závisí na tvaru alternativní hypotézy a na zvolené hladině významnosti:
H1
Wα
≠ (−∞; − >∪< ; ∞)
< (−∞; − >
> < ; ∞)
b) Velký rozsah výběru, rozptyl v základním souboru není známý
o
=
testovým kritériem je náhodná veličina
která má při platnosti nulové hypotézy rozdělení N(0;1)
o
̅ √
,
kritické obory mají stejný tvar jako v případě známého rozptylu
2
Kurz 4st201 – cvičení č. 7
c) Malý rozsah výběru, rozptyl v základním souboru není známý
o
!=
testovým kritériem je náhodná veličina
̅ která má při platnosti nulové hypotézy rozdělení t(n-1)
o
√
,
kritické obory mají tvar:
H1
≠ > < Wα
(−∞; −! >∪< ! ; ∞)
< ! ; ∞)
(−∞; −! >
Př. 7.1
V pivovaru došlo k opravě plnící linky. Po opravě se provedlo měření u 21 naplněných lahví – průměrný
objem v naplněné lahvi byl 500,36 ml se směrodatnou odchylkou 1,78 (jde tedy o výběrové hodnoty).
Předpokládáme, že jde o výběr z normálního rozdělení. Na hladině významnosti α = 0,05 ověřte, zda se
oprava zdařila, tj. zda linka plní do láhví pivo o objemu 500ml. (Jinak řečeno chceme ověřit, zda zjištěný
průměr se významně liší od požadované hodnoty 500ml)
•
Stanovte nulovou a alternativní hypotézu, zvolte vhodné testové kritérium a kritické hodnoty;
•
Jak se změní postup a výsledek, pokud směrodatná odchylka objemu náplně je známa, tedy nejde o
hodnotu zjištěnou z výběru, a její hodnota je 0,78?
Test hypotézy o relativní četnosti – velké výběry
Testujeme nulovou hypotézu
proti jedné z alternativních hypotéz:
Testovým kritériem je náhodná veličina
:" = "
:" ≠ "
:" > "
:" < "
#$
=
& ('(& )
% ,
která má při platnosti nulové hypotézy rozdělení N(0;1).
Kritické obory:
H1
Wα
) ≠ )
(−∞; − >∪< ; ∞)
) < )
(−∞; − >
) > )
< ; ∞)
Př. 7.2
Strana pronikne do sněmovny, jestliže její volební výsledek překročí 5 %. Byl proveden průzkum, kde z 350
dotázaných respondentů by sledovanou stranu volilo 28 lidí. Můžeme na hladině významnosti 1 %
předpokládat proniknutí strany do sněmovny ve volbách?
3
Kurz 4st201 – cvičení č. 7
Test o shodě středních hodnot – velké nezávislé výběry
: = Testujeme nulovou hypotézu
: ≠ proti jedné z alternativních hypotéz:
: > : < =
Testovým kritériem je náhodná veličina
̅ ' ̅*
* *
+ ', *
' *
,
která má při platnosti nulové hypotézy rozdělení N(0;1)
Kritické obory:
H1
Wα
- ≠ .
(−∞; − >∪< ; ∞)
- < .
(−∞; − >
- > .
< ; ∞)
Př. 7.3
Na základě zadaných dat otestujte na hladině významnosti 0,05 a 0,01 hypotézu, že chlapci a dívky dosahují
u průběžného testu stejných výsledků. Data k příkladu jsou v souboru „vysledky.xlsx“.
Testování hypotéz v MS Excel
• MS Excel má funkce pro testování střední hodnoty, test o relativní četnosti nikoliv
o
Funkce ZTEST (matice = oblast dat; x = testovaná hodnota; [sigma] = hodnota směrodatné
odchylky v základním souboru, pokud je známá)
…umožňuje test o střední hodnotě pro velké výběry.
o
Funkce TTEST (matice1 = oblast dat prvního výběru; matice2 = oblast dat druhého výběru;
chvosty = volba, zda jde o jednostranný (1) nebo dvoustranný test (2); typ = volba zda jde o
párové výběry (1), nezávislé výběry se stejnými rozptyly (2), nezávislé výběry s různými rozptyly
(3))
…umožňuje test o shodě dvou středních hodnot, využívá kvantily t-rozdělení, protože
neobsahuje předpoklad o dostatečně velkých výběrech (oba s rozsahem větším než 30).
o
Modul ANALÝZA DAT umožňuje test o shodě středních hodnot pomocí voleb:
„Dvouvýběrový t-test s rovností / nerovností rozptylů“ slouží k testování shody
středních hodnot dvou nezávislých výběrů (používá kvantily t-rozdělení, protože
nepředpokládá velké výběry)
„Dvouvýběrový z-test na střední hodnotu“ slouží k testování shody středních hodnot
dvou nezávislých výběrů, které pocházejí z normálního rozdělení, přičemž známe
rozptyl v základním souboru.
„Dvouvýběrový párový t-test na střední hodnotu“ testuje shodu středních hodnot
v párových výběrech.
4
Kurz 4st201 – cvičení č. 7
Výstupem testu je tzv. p-hodnota – je-li p-hodnota menší než zvolená hladina významnosti, pak
testovanou hypotézu zamítáme a je-li větší, pak testovanou hypotézu nezamítáme. Zamítli bychom ji až
na hladině významnosti, která by se rovnala právě p-hodnotě. Je-li p-hodnota vyšší než zvolená hladina
významnosti, pak testovanou hypotézu nezamítáme.
Př. 7.4
a) Uvažujte soubor deti.xlsx z příkladu 6.3. Testujte na hladině významnosti 0,05, že průměrná
porodní hmotnost dítěte je 3 kg. Využijte funkci ZTEST.
b) Vypočtěte příklad 7.3 v MS Excel pomocí funkce TTEST a pomocí modulu Analýza dat.
Neparametrické testy
Chí-kvadrát (χ2) test dobré shody
Co testujeme?
•
porovnání výběrového rozdělení četností (tj. četností, které jsme skutečně vypozorovali při
náhodném výběru) a teoretického rozdělení četností (tj. četností, které v základním souboru
předpokládáme již před provedením náhodného výběru)
Příklad využití
•
Chceme ověřit teoretický předpoklad o poměrném zastoupení skupin v základním souboru – např.
předpokládáme, že z narozených dětí je 48,5 % dívek a 51,5 % chlapců. Provedeme náhodný výběr a
testujeme, zda poměr narozených dívek a chlapců odpovídá našemu předpokladu.
•
Chceme ověřit, zda data, která máme k dispozici, vykazují normální rozdělení. Porovnáváme pak
četnosti jednotlivých hodnot v našich datech s četnostmi, kterých by jednotlivé hodnoty nabývaly
v případě normálního rozdělení.
Test
•
nulová hypotéza říká, že v konečném základním souboru, roztříděném podle nějakého znaku do k
skupin, jsou podíly jednotlivých variant rovny číslům π0,1, π0,2, … π0,k.
•
alternativní hypotéza nulovou popírá
H :π = π,
" = ",
…
"3 = ",3
•
:4540
testové kritérium G porovnává výběrové a teoretické četnosti v každé skupině (počet skupin = k)
a za předpokladu velkého výběru (teoretické četnosti alespoň větší než 5 v každé skupině) má
přibližně chí-kvadrát rozdělení s ν = k-1 stupni volnosti.
5
Kurz 4st201 – cvičení č. 7
7 = ∑3=>
Testovým kritériem je náhodná veličina:
9:; :; <
:;
*
,
kde ?A@ jsou teoretické (předpokládané) absolutní četnosti v základním souboru a ?@ jsou empirické
(skutečné) absolutní četnosti ve výběrovém souboru.
Testové kritérium má při platnosti nulové hypotézy rozdělení B CD − 1F.
CD
G =< B
− 1F; ∞)
Kritický obor:
Př. 7.5
Při opakovaném házení hrací kostkou byly z 60 hodů zjištěny tyto výsledky:
Hodnota (xi)
1
2
3
4
5
6
Četnost (ni)
9
8
11
12
9
11
Ověřte na hladině významnosti α = 0,01, že kostka je v pořádku tj. že má těžiště v geometrickém středu.
Chí-kvadrát test dobré shody v MS Excel
• Funkce CHITEST (aktuální = skutečné napozorované četnosti, očekávané = teoretické četnosti
v případě nezávislosti), výstupem je opět p-hodnota. Při interpretaci výsledku pozor na význam nulové
hypotézy. Nulová hypotéza říká, že empirické rozdělení četností odpovídá předpokládanému rozdělení
četností.
6
Download

4ST201 – STATISTIKA CVIČENÍ Č. 7