Slovo úvodem
Ne všechno, co si řekneme v tomto kurzu, je pravda. Není to proto, že by mým záměrem bylo před
posluchači něco tajit nebo je uvádět ve zmatek. Problematika testování statistických hypotéz je široká
a komplikovaná. Její podrobná znalost by vyžadovala několik semestrů výuky a ne jediné setkání.
Úkolem toho kurzu je posluchače připravit na situaci, kdy bude muset sám statistické hypotézy
formulovat a testovat. A kdy se jej pravděpodobně nikdo nebude ptát, jestli tyto hluboké odborné
znalosti má. Většina uváděných informací je proto jakýmsi zjednodušením, které poskytne možnost
samostatně pracovat s daty bez závažných chyb.
Proměnné a konstanty
Tématem celého kurzu jsou proměnné (respektive konstanty). Proměnnou se rozumí nějaká veličina,
kterou jsme zjistili (naměřili) u účastníků výzkumu. Tedy například věk, pohlaví, inteligence. Ze
samotného názvu proměnná vyplývá, že může nabývat různých hodnot. Pokud by tomu tak nebylo, a
hodnota by byla pro všechny jedince stejná, nejedná se o proměnnou ale o konstantu.
Z metodologie známe dělení proměnných do několika skupin. Nejčastěji se užívá dělení dle S.
Stevense. Nicméně nám postačí dělení jednodušší:
Alternativní proměnná – je jakákoli proměnná, která nabývá pouze dvou různých hodnot. Nejčastěji
je značíme 1 a 0 (které skupině dáme jedničku a které nulu, je jedno). Například muž-žena, praváklevák, profesionál-amatér, člen kontrolní skupiny-člen experimentální skupiny.
Nominální proměnná – pro každé dva prvky můžeme s jistotou říct, jestli si jejich hodnoty jsou rovny
nebo nejsou rovny. Může nabývat více než dvou hodnot. Například studijní obor, příjemce jednoho
z několika druhů léčby, národnost.
Ordinální proměnná – pro každé dva prvky můžeme s jistotou říct, jestli si jsou rovny nebo jestli má
jeden vyšší hodnotu než druhý.
Metrická proměnná – pro každé dva prvky dokážeme posoudit, jestli je má jeden vyšší, nižší nebo
stejnou hodnotu jako druhý a navíc dokážeme stejné srovnání provést mezi rozdíly hodnot
libovolných dvou prvků. Například můžu říct, že Honza je vyšší než Anna o 10 cm, zatímco Lucka je
vyšší než Petr o 2 cm, a tedy že rozdíl vzrůstu mezi Honzou a Annou je větší než mezi Luckou a
Petrem. (Do této kategorie patří proměnné, které označujeme jako intervalové i poměrové –
nicméně takto jemné dělení obvykle nepotřebujeme.)
1
O jaké typy proměnných se jedná?
Doplňte do horního řádku K, A, N, O nebo M.
Depresivita
(BDI-II)
Množství vykouřených
cigaret denně
bez dg.
3
1-5
pokročilý
bez dg.
0
0
4.A
začátečník
bez dg.
6
6-15
4.B
expert
bez dg.
14
více než 30
Jméno
Pohlaví
Věk
Třída
Pokročilost Diagnóza
Honza
muž
19
4.A
začátečník
Anna
žena
18
3.C
Lucka
žena
19
Petr
muž
19
Při počítačovém zpracování obvykle používáme kódování pomocí čísel. Přepište tabulku tak, abyste
se zbavili slovních označení a přitom zachovali jakousi logiku značení.
Jméno
Pohlaví
Věk
Třída
Pokročilost Diagnóza
Depresivita
(BDI-II)
Množství vykouřených
cigaret denně
Honza
Anna
Lucka
Petr
Zapamatujte si:
Jakákoli proměnná vyšší úrovně je zároveň proměnnou všech nižších úrovní
nebo na ni může být převedena.
METRICKÁ -> ORDINÁLNÍ -> NOMINÁLNÍ -> ALTERNATIVNÍ -> ( KONSTANTA)
2
Převeďte proměnnou „výše platu“ na nižší úroveň
metrická
ordinální
ordinální
nominální
alternativní
Jméno
Plat
Plat
Plat
Plat
Plat
Honza
7 000
Anna
6 900
Lucka
38 000
Petr
0
Zapamatujte si:
Při převedení proměnné na nižší úroveň ztrácíme část informace, která je
v datech obsažena. Vždy proto volíme nejvyšší úroveň, se kterou můžeme
pracovat.
Testování hypotéz o vztahu mezi dvěma proměnnými
Inferenční statistika nabízí statistický testy pro téměř jakoukoli myslitelnou hypotézu. V tomto kurzu
se však zaměříme pouze na testy hypotéz o závislosti dvou proměnných nebo vztahu mezi
proměnnou a konstantou. Jedná se sice o drastické zúžení oblasti zájmu, nicméně ze zkušenosti víme,
že i takováto úzká znalost postačí k výběru vhodného testu u téměř všech zkoumaných problémů, se
kterými se setkáváme v diplomových pracích z oblasti psychologie.
Závislost nebo rozdíl?
Většina studentů je zvyklá rozlišovat mezi tím, jestli zkoumá vztah dvou proměnných (např. pomocí
korelačního koeficientu) nebo rozdíl mezi skupinami (třeba pomocí t-testu nebo ANOVy). Toto přináší
užitek, zvláště pokud chcete čtenáři práce sdělit, co vlastně děláme. Nicméně pro účely statistické
analýzy je dobré si uvědomit, že vždycky zkoumáme vztah (závislost) mezi nějakými proměnnými, i
když hovoříme o rozdílu skupin.
Níže je napsáno několik otázek, které si výzkumník může pokládat. Všech y se týkají nějaké souvislosti
mezi dvěma proměnnými (nebo proměnnou a konstantou). Doplňte do tabulky, o vztah jakých
proměnných se jedná.
3
Dožívají se inteligentnější lidé vyššího věku?
Existují rozdíly v míře empatie mezi muži a ženami?
Jsou blondýny hodnoceny muži jako atraktivnější než
ženy s jinou barvou vlasů?
Mají pravidelní kuřáci marihuany horší krátkodobou
paměť než nekuřáci?
Liší se čtenářské dovednosti žáků čtvrtých tříd napříč
základními školami Olomouckého kraje?
Odpovídá zastoupení mužů a žen mezi VŠ studenty
zastoupení mužů a žen mezi akademiky?
Je některá ze tří vybraných psychoterapeutických
technik ke zmírnění příznaků PTSD účinnější než jiné?
Vede senzorická deprivace k nárůstu agresivity?
Dokážete odhadnout, o jaké typy proměnných se jedná? (V některých případech není odpověď
jednoznačná.)
Výběr statistického testu
Při výběru vhodného testu můžeme postupovat podle těchto bodů:
1) Určete, s jakými dvěma proměnnými pracujete.
2) Identifikujte, jestli se jedná o alternativní, nominální, ordinální nebo metrické proměnné.
3) Vyberte správný řádek a správný sloupec z následující tabulky, podle toho, s jakými
proměnnými pracujeme. Metoda první volby je zvýrazněná; šedě jsou značeny případné
alternativy.
4) Je zvolený test svázán nějakými dalšími podmínkami, kdy může být použit? Pokud ano,
zamyslete se nad tím, jestli jsou splněny (ověřte jejich platnost). Jsou splněny?
a. Ne -> proměnnou, která podmínky porušuje, musíme nějak upravit. Nejčastějším
řešením bude převedení metrické proměnné na ordinální proměnnou, pokud možno
s co nejmenší ztrátou dat. Po potřebných opravách se vraťte k bodu 3.
b. Ano -> proveďte test a výsledky interpretujete!
4
Konstanta
nebo zadané
četnosti
Alternativní
Nominální
Alternativní
Nominální
Ordinální
Metrická
(odvození p-hodnoty z
binomické nebo normální
distribuce, chí kvadrát test
homogenity)
Chí kvadrát
test homogenity(F)
Wilcoxonův jednovýběrový
test
(znaménkový test)
Jednovýběrový t-test(N)
(z-test)
Fisherův faktoriálový test
(Chí kvadrát test dobré
shody, Fí koeficient)
Chí kvadrát
test dobré shody(F)
Mann-Whitneyův U-test
(Wilcoxonův dvouvýběrový
test)
Studentův t-test pro 2
nezávislé výběry(N,S)
(bodově-biseriální korelace)
Chí kvadrát
test dobré shody(F)
Kruskal-Wallisův test
ANOVA(N,S)
Spearmanův korelační
koeficient
Spearmanův korelační
koeficient
Ordinální
Pearsonův korelační
koeficient(N)
Metrická
Symboly u názvů testů značí podmínky jejich užití: N – podmínka normálního rozdělení, S – podmínka homogenity rozptylů, F – podmínka minimální
očekávané četnosti
5
6
Podmínky užití jednotlivých testů
Podmínka normality
Testy, co označujeme jako parametrické (v
našem případě t-testy, ANOVA a test
významnosti
Pearsonova
korelačního
koeficientu) vyžadují normální rozdělení.
Histogram proměnné, která normální
rozdělení by se měl podobat tomuto
obrázku.
Pokud si nejsme jistí, jestli rozdělení
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
naší proměnné normalitu připomíná
dostatečně, můžeme si pomoci některým
statistickým testem normality (např. Shapiro-Wilkův test). P-hodnota menší než 0,05 je pro nás pak
signálem, že podmínka normality byla porušena.
Dobrá zpráva však je to, že podmínka normality je palčivá pouze u malých rozsahů souboru (n
< 30). S rostoucím rozsahem souboru můžeme tolerovat čím dál tím větší odchylky. Soubory čítající
stovky či tisíce jedinců snesou i nápadně ve1lká odchýlení od požadovaného tvaru.
Podmínka homogenity rozptylů
T-test pro dva nezávislé výběry a analýza rozptylu (ANOVA) požadují, aby rozptyly zkoumané
proměnné u všech srovnávaných skupin, byly přibližně stejně velké. Tento předpoklad lze snadno
ověřit pomocí F testu nebo Leveneova testu. V případě, že najdeme statisticky významné rozdíly ve
velikosti rozptylu mezi skupinami, můžou být naše výsledky zkreslené. Špatná zpráva je, že se
důležitost této podmínky nesnižuje s rostoucí velikostí souboru. Dobrá zpráva, že t test má variantu,
která počítá s nerovností rozptylů (tzv. Welshův test) a porušení této podmínky výsledky nijak
nezkreslí.
Podmínka minimální očekávané četnosti
Testy pracující s četnostmi, které používají rozdělení Chí kvadrát, vyžadují, aby všechny očekávané
četnosti byly vyšší nebo rovné pěti, jinak test ztrácí svou sílu. Klasická situace může vypadat třeba
takto:
pozorované četnosti
Vedoucí pozice
Ostatní pozice
Jedináček
24
75
Nejstarší
29
55
Prostřední
6
10
Nejmladší
12
96
očekávané četnosti
Vedoucí pozice
Ostatní pozice
Jedináček
22,9
76,1
Nejstarší
19,4
64,6
Prostřední
3,7
12,3
Nejmladší
25,0
83,0
S touto podmínkou se však můžeme vypořádat poměrně snadno. Je-li porušena jen u několika málo
četností z velkého počtu a není-li očekávaná četnost blízká nule, můžeme si ji dovolit přehlížet bez
rizika vážného zkreslení výsledku testu. Není-li tomu tak, můžeme sloučit některé malé skupiny (zde
7
třeba Prostřední + Nejmladší = Mladší sourozenci). A nakonec můžeme využít kombinatorický test,
pokud nám jej statistický program nabízí. Ten zjistí zcela přesnou p-hodnotu i v případě, že v některé
buňce vyjde nulová hodnota.
Párové testy
Pro úplnost musím zmínit ještě jednu situaci, které může být někdy matoucí. Představte si, že chceme
ověřit, třeba jestli se nějak liší míra obtíží, které mají pacienti před podáním určitého léku a po jeho
podání. Tabulka by mohla vypadat jako níže uvedená „Tabulka párového testu“.
Tabulka párového testu:
Tabulka jednovýběrového testu:
Pozorované Očekávané
Jméno
zlepšení
zlepšení
Jméno
Potíže před
Potíže po
Honza
52
32
Honza
20
0
Anna
37
39
Anna
-2
0
Lucka
24
12
Lucka
12
0
Petr
26
20
Petr
6
0
Dle našeho postupu bychom došli k tomu, že máme použít Pearsonův korelační koeficient. Ten nám
ale na naši otázku odpověď nedá! Pes je totiž zakopaný v tom, jak nám je problém prezentován. Naše
otázka ve skutečnosti totiž zní „Je průměrné zlepšení (tedy hodnota po mínus hodnota před) vyšší než
nula?“. Při pohledu na druhou tabulku je již výběr metody o mnoho jasnější – jedná se o srovnání
metrické proměnné a konstanty (nuly). Řešením je tedy jednovýběrový t-test.
V knihách i ve statistických programech jej můžeme najít pod názvem „párový t-test“.
Z matematického pohledu se jedná o totožnou metodu – lišit se bude jen formulář, do kterého
zadáváme názvy proměnných, se kterými proměnnými pracujeme. Pokud proměnná rozdíl není
vhodná pro parametrickou metodu (není splněna podmínka normality a máme jen malý soubor), tak
snadno dojdeme k tomu, že správným řešením je Wilcoxonův párový/jednovýběrový test.
Pokud už samotné proměnné potíže před a potíže po nebyly metrické povahy, tak musíme
vybrat některý z jiných testů. Pokud by se jednalo a alternativní proměnné (má/nemá
příznaky), pátrejte po McNemarově testu, pokud o nominální, tak po Bowkerově testu.
(Poznámka pro odvážné: párový test lze použíti i tehdy, když bylo měření před a měření po
provedeno vždy na dvou různých lidech. Je zde však podmínkou, aby každý člověk ze skupiny
před měl svého protějška ve skupině po, který mu je přesně určen. Toto spárování se
nejčastěji provádí podle pohlaví, věku, diagnózy atd... S touto poznámkou bude jistě řada
psychologů nesouhlasit, nicméně je pravdivá.)
8
Úvod do regresní analýzy a GLM
Ve skutečném psychologickém výzkumu si bohužel s výše uvedenými metodami nevystačíme –
většina jevů je natolik komplexních, že je těžko můžeme poznat prostřednictvím vztahů jednotlivých
dvojic proměnných. Velmi dobrým pomocníkem nám proto může být regresní analýza, které dokáže
uchopit celé skupiny proměnných naráz.
Lineární regrese se pokouší modelovat vztah mezi jednou závisle proměnnou (vysvětlovanou
proměnnou, Y) pomocí jedné nebo více nezávisle proměnných (prediktorů, Xi). Zjednodušeně řečeno,
regrese říká, že naše Y je rovno součtu všech X, s tím, že každému přidělíme nějakou váhu b.
Třeba můžeme tvrdit, že individuální rozdíly v tělesné hmotnosti lze vysvětit pomocí hmotnosti jídla,
které člověk denně sní a průměrné době, kterou denně stráví sportem. Regresní rovnice by pak
vypadala ve své obecné formě takto:
Rovnice bude názornější u konkrétního případu. Kolik váží Tom?
Abychom mohli rovnici vypočítat, musíme znát hodnoty koeficientů b. Ty můžeme zjistit jedině tak,
že budeme sledovat všechny tři proměnné u velkého množství lidí a pak je vypočítáme právě pomocí
mnohonásobné regrese. Její postup si ukážeme na praktických příkladech.
Nejnutnější pojmy
b1, b2, b3... – nestandardizované regresní koeficienty. Jednoduše říkají, o kolik bodů se změní hodnota
proměnné Y, když změníme hodnotu příslušné proměnné X o jeden bod
b0 – konstanta (též počátek), Y = b0 tehdy, když jsou všechny proměnné X rovny nule.
β 1, β 2, β 3... – standardizované regresní koeficienty. Říkají, o kolik směrodatných odchylek se změní
hodnota proměnné Y, když změníme hodnotu příslušné proměnné X o jednu směrodatnou
odchylku. Pokud je v rovnici jen jediný prediktor nebo jsou všechny prediktory dokonale
nekorelované, tak přesně odpovídá Pearsonovu korelačnímu koeficientu mezi Y a příslušnou
proměnnou X.
β 0 – se rovná vždy 0, proto se nikde neuvádí. Zamyslete se nad tím, proč tomu tak je.
R2 – koeficient determinance. Jedná se o množství rozptylu (variabilitu) proměnné Y, kterou lze
vysvětlit (předpovědět) pomocí proměnných X. Je to velmi dobrý ukazatel toho, jak je náš model
přesný. Můžeme ho pro názornost psát v procentech.
e – reziduum. Hodnota, kterou získáme z regresní rovnice, není přesná. U každého člověka můžeme
srovnat odhadovanou hodnotu a skutečnou hodnotu. Jejich rozdíl je reziduum.
9
Kdy můžu metodu použít
Regresní analýza je parametrická metoda. Je proto zatížena několika podmínkami, z nichž nám bude
většina zřejmě povědomých.
1) proměnná Y musí být metrická (pokud je alternativní, hledejte logistickou regresi)
2) proměnné X musí být metrické nebo alternativní (poprat se však dokážeme i s nominálními
proměnnými)
3) proměnná Y musí mít normální rozdělení (pozn.: ve skutečnosti je důležitá normalita reziduí,
nikoli proměnné Y, ale zůstaňme u tohoto zjednodušení).
4) vztahy mezi proměnnými jsou lineární (jiné vztahy metoda efektivně zkoumat neumí)
5) potřebujeme velký soubor. Hendl uvádí toto pravidlo, které se odvíjí od počtu prediktorů (k):
a. nejméně 50 + 8*k jedinců k posouzení statistické významnosti celého modelu
b. nejméně 108 + k jedinců k posouzení statistické významnosti jednotlivých prediktorů
Nicméně jiní autoři uvádí jiná pravidla – od 5*k po 40*k s ohledem na metodu vkládání
prediktorů. S tím, že poměr 5*k je skutečně krajní hodnotou, kdy musí dokonale platit
všechny podmínky. Obecně se dá řídit vzorcem 15*k.
6) rozptyl všech proměnných X musí být stejný pro jedince, co mají vysokou hodnotu proměnné
Y i těch, co ji mají nízkou (tzv. homoskedasticita). Tedy rozptyl proměnné „průměrná doba
cvičení“ musí být zhruba stejný u lidí, co váží hodně, i u těch, co vážní málo.
7) prediktory nesmí být vysoce korelované (tzv. multikolinearita). Tedy korelace žádné z dvojic
proměnných X by neměla překročit zdravou míru. Od hodnoty 0,8 bychom měli být na
pozoru, hodnoty vyšší než 0,95 jsou nepřípustné. Vliv jednotlivých prediktorů pak nelze
bezpečně odlišit.
8) v datech by neměly být přítomny odlehlé hodnoty (outliers). Na náš model totiž mají
obrovský vliv, takže několik extrémních případů (např. tři špatně vyplněné dotazníky), můžou
zcela změnit veškeré vztahy
10
Download

Slovo úvodem Proměnné a konstanty