Zaključivanje zasnovano na
jednom, dva ili više uzoraka
Testiranje hipoteza
Jelena Marinković,
Nataša Milić
Sadržaj
1.
2.
3.
4.
Razlikovanje tipova hipoteza
Opisivanje procesa testiranja hipoteza
Objašnjavanje koncepta p-vrednosti
Rešavanje problema testiranja hipoteza
zasnovanom na jednom uzorku
5. Rešavanje problema testiranja hipoteza
zasnovano na dva uzorka
6. Rešavanje problema testiranja hipoteza
zasnovanom na više od dva uzorka
Statističke metode
Statističko zaključivanje
Statističko zaključivanje je proces kojim,
koristeći rezultate iz uzorka (podatke
koje smo dobili istraživanjem),
govorimo nešto o populaciji (ukupnost
hipotetičkih podataka koje bi mogli
dobiti ponavljanjem istraživanja
beskonačan broj puta).
Koncept testiranja hipoteza
Koncept testiranja hipoteza
Populacija
☺
☺
☺
☺ ☺
☺
☺
Koncept testiranja hipoteza
Populacija
☺
☺
☺
☺ ☺
☺
☺
Verujem da su
prosečne godine
starosti u ovoj
populaciji 50
godina (hipoteza).
Koncept testiranja hipoteza
Populacija
☺
☺
☺ ☺
☺
☺
Verujem da su
prosečne godine
starosti u ovoj
populaciji 50
godina (hipoteza).
☺
Slučajni uzorak
AS ☺
☺⎯X = 20
Koncept testiranja hipoteza
Populacija
☺
☺
☺ ☺
☺
☺
Verujem da su
prosečne godine
starosti u ovoj
populaciji 50
(hipoteza).
☺
Slučajni uzorak
AS ☺
☺⎯X = 20
Odbaci
Odbaci
hipotezu!
hipotezu!Ni
Ni
blizu.
blizu.
Testiranje hipoteza
Testiranje hipoteza je deo statističkog
zaključivanja koji koristi uzoračke
podatke za evaluaciju istinitosti
hipoteza o populaciji.
Kao i kod ocenjivanja cilj procesa
testiranja hipoteza je generalizacija sa
uzorka na populaciju iz koje je uzorak
slučajno izabran.
Šta su hipoteze?
•
•
•
Iskaz o jednoj ili više populacija.
Istraživačka hipoteza je pretpostavka o
predikciji ishoda eksperimenta (pretpostavka
koja je pokretač istraživanja).
Statistička hipoteza je hipoteza formulisana
na takav način da može da se evaluira
odgovarajućim statističkim tehnikama.
Šta su hipoteze?
1. Verovanje /
pretpostavka o
populacionom parametru
Verujem da je prosečan
SKP u ovoj grupi 133.5!
Parametar je
populaciona AS,
proporcija, varijansa,
...
Mora biti fiksiran
pre analize
© 1984-1994 T/Maker Co.
Nulta hipoteza
1. Ono što se testira
2. Ima ozbiljne posledice ako se donese
netačna odluka
3. Označava se sa H0 (čita se ha nula)
4. Specifikuj H0: μ = nekoj numeričkoj
vrednosti
Specifikuj sa = čak iako je ≤, ili ≥
Primer, H0: μ = 3
Alternativna / radna /
istraživačka hipoteza
1. Suprotna nultoj hipotezi
2. Uvak ima znak nejednakosti: ≠, <, ili >
3. Označava se sa Ha (H1)
4. Specifikuj Ha: μ ≠ neke vrednosti
Primer, Ha: μ ≠ 3
≠ δ dvosmerno testiranje
<, > jednosmerno testiranje
Identifikacija koraka u procesu
testiranja hipoteza
1. Primer: Testiraj da populaciona
aritmetička sredina nije 3
2. Koraci
Definiši pitanje statistički (μ ≠ 3)
Definiši suprotno tvrđenje statistički (μ =
3)
Mora biti uzajamno isključivo i iscrpno
Izaberi alternativnu hipotezu (μ ≠ 3)
ima ≠, <, ili >
Definiši nultu hipotezu (μ = 3)
Šta su hipoteze?
Da li je populacioni prosek gledanja TV
oko 12 sati?
Definiši pitanje statistički: μ = 12
Definiši suprotno statistički : μ ≠ 12
Izaberi alternativnu hipotezu: Ha: μ ≠ 12
Definiši nultu hipotezu: H0: μ = 12
Šta su hipoteze?
Da li je populacioni prosek gledanja TV
različit od 12 sati?
Definiši pitanje statistički : μ ≠ 12
Definiši suprotno statistički : μ = 12
Izaberi alternativnu hipotezu : Ha: μ ≠ 12
Definiši nultu hipotezu : H0: μ = 12
Šta su hipoteze?
Da li je prosečna godišnja cena troškova
za zdravstvenu zaštitu manja ili jednaka
$200?
Definiši pitanje statistički : μ ≤ 200
Definiši suprotno statistički : μ > 200
Izaberi alternativnu hipotezu : Ha: μ > 200
Definiši nultu hipotezu : H0: μ ≤ 200
Šta su hipoteze?
Da li je prosečna godišnja cena troškova
za zdravstvenu zaštitu veća od $250?
Definiši pitanje statistički : μ > 250
Definiši suprotno statistički : μ ≤ 250
Izaberi alternativnu hipotezu : Ha: μ > 250
Definiši nultu hipotezu : H0: μ ≤ 250
Koraci u testiranju
1. Podaci
2. Pretpostavke za primenu statističkog
metoda testiranja hipoteza
3. Hipoteze
4. Izbor test statistike (statistike testa,
statističkog testa)
5. Raspodela test statistike
6. Pravilo odlučivanja
Koraci u testiranju
(nastavak)
7. Izračunavanje test statistike
8. Statistička odluka
9. Zaključak
Koraci u testiranju hipoteza
- Podaci
Priroda podataka, što je osnova ovog procesa,
mora biti poznata i analizirana, jer ona,
između ostalog, određuje koji će se od
brojnih statističkih testova primeniti.
Određuje se, dakle, imamo li učestalosti
(rezultat procesa prebrojavanja) ili
pojedinačna merenja (rezultat procesa
merenja) za svakog ispitanika, koja je skala
merenja upotrebljena, koje su deskriptivne
statističke mere odgovarajuće i koliko iznose
i koliko imamo podataka.
Koraci u testiranju hipoteza
- pretpostavke
Kada je interes usmeren na ocenu ili testiranje
hipoteza o jednom ili više populacionih
parametara, moramo znati funkcionalnu
formu populacije iz koje je uzorak izvučen –
normalna po pravilu, raspodelu uzoračkih
statistika koje služe za ocenu parametara
(normalna, t, F, hi-kvadrat, itd.) i moramo
pokazati da je opšti (generalni) linearni
model prihvatljiv. To su sve odlike
parametarskih statističkih metoda.
Koraci u testiranju hipoteza
- pretpostavke
Metode koje ne uključuju populacione parametre ili ne
zavise od znanja vezanih za populaciju, tj. one, što
testiraju hipoteze koje nisu iskazi o populacionim
parametrima su neparametarske (preciznije, one
metode koje ne zahtevaju nikakve pretpostavke o
populaciji su metode bez distribucije).
Omogućuju testiranje onih hipoteza koje nisu iskazi o
vrednostima populacionih parametara, forma
populacije je nepoznata, a podaci koji se analizuju
najčešće su rangovi ili kodovi, tj., nisu bazirani na
skalama merenja dovoljno jakim da omoguće
aritmetičke operacije koje su neophodne za
izvođenje parametarskih procedura.
Koraci u testiranju hipoteza
- Hipoteze
Uobičajeno je da:
(a) ono što očekujemo da ćemo biti u stanju da
zaključimo kao rezultat statističkog testa
iskažemo u obliku alternativne hipoteze
(b) nulta hipoteza sadrži iskaz o jednakosti
(c) je nulta hipoteza - hipoteza koja se testira i
(d) su nulta i alternativna hipoteza
komplementarne što znači da zajedno
iscrpljuju sve mogućnosti koje se tiču
pretpostavki o vrednosti hipotetičkog
parametra.
Koraci u testiranju hipoteza
– Izbor test statistike
Test statistika je bilo koja statistika koja može
biti izračunata iz dostupnih podataka u
uzorku.
Uobičajena opšta formula za dobijanje test
statistike (primenljiva u mnogim statističkim
testovima) je:
Test statistika = (relevantna statistika pretpostavljena vrednost parametra) /
standardna greška relevantne statistike
Koraci u testiranju hipoteza
– Raspodela test statistike
Ponavljamo da je ključ statističkog
zaključivanja uzoračka raspodela.
To činimo u situaciji kada je potrebno
specifikovati raspodelu verovatnoća
test statistike.
Koraci u testiranju hipoteza –
Izračunavanje test statistike
Iz dostupnih podataka, koje imamo u
uzorku (uzorcima), računamo vrednost
test statistike i poredimo je sa
regionima prihvatanja i odbacivanja koji
su već specifikovani.
Koraci u testiranju hipoteza
– Statistička odluka
Statistička odluka sastoji se u odbacivanju
ili neodbacivanju nulte hipoteze.
Nulta hipoteza se odbacuje u slučaju da je
izračunata vrednost test statistike u
regionu odbacivanja. U suprotnom, ne
odbacuje se.
Koraci u testiranju hipoteza
– Statistička odluka
p-vrednost testa je verovatnoća dobijanja (ako je
nulta hipoteza tačna) vrednosti test statistike
koje su veće (u odgovarajućem smeru) od
one koja je stvarno izračunata.
Možemo je definisati i kao najmanju vrednost
nivoa značajnosti α za koju nulta hipoteza
može biti odbačena.
Pravilo koje vredi zapamtiti, glasi:
Ako je p-vrednost manja od α, odbacujemo
nultu hipotezu. Ako je p vrednost veća ili
jednaka α, ne odbacujemo nultu hipotezu.
Koraci u testiranju hipoteza
– Zaključak
Ako je H 0 odbačena zaključujemo da je H 1
tačna.
Ako H 0 nije odbačena, zaključujemo da je
ona verovatno tačna.
Primer
Grupa istraživača sumnja da je
raspodela polova u gravitirajućoj
populaciji jednoj zdravstvenoj ustanovi
jednaka. Da bi testirali ovu sumnju
(istraživačka hipoteza) oni su odlučili
da slučajno izaberu dvanaest osoba iz
ove populacije i prebroje osobe jednog
i drugog pola. U uzorku su našli 11
muškaraca i 1 ženu.
Primer
Nulta i radna hipoteza su:
H 0 : P(M) = P(Ž) = 0.5 i
H 1 : P(M) ≠ P(Ž).
Test statistika / Statistički test:
odgovarajući statistički test je binomni
test, baziran na binomnom obrascu.
Nivo značajnosti: istraživači su unapred
odlučili da on bude 0.01.
Primer
Ova uzoračka raspodela pokazuje da je
najverovatniji ishod za uzorak veličine
n=12 baš 6 muškaraca i 6 žena (924).
Dobijanje odnosa 7:5 ili 5:7 je nešto
manje verovatno, ali još uvek moguće.
Pojava 12 muškaraca je, međutim,
gotovo neverovatna, takođe i pojava 12
žena.
Primer
Odluka:
Pošto je u uzorku bilo 11 osoba jednog i 1
osoba drugog pola, verovatnoća povezana
sa ovim događajem iznosi 0.0064, a ona je
manja od α (0.01) pa donosimo odluku da
odbacimo H 0 u korist H 1 . Zaključujemo da
raspodela polova stvarno nije jednaka u
gravitirajućoj populaciji.
Statistički testovi u istraživanjima sa
jednim uzorkom
Skala merenja
Statistički testovi
omerna ili
intervalna
z-test; t-test; Test varijanse
ordinalna
Kolmogorov-Smirnovljev test;
Jednouzorački test nizova
nominalna
Binomni test; Hi-kvadrat test slaganja
Statistički testovi –
Jedna populacija
Dvosmerni t -test
za aritmetičku sredinu
(σ nepoznato)
t Test za aritmetičku sredinu
(σ nepoznato)
1. Pretpostavke
Populacija je normalno raspodeljena
Ako nije normalna, onda je samo malo
iskošena & uzorak je veliki (n ≥ 30)
2. Parametarska procedura testiranja
3. t Test Statistika
X −μ
t=
S
n
Dvosmerni t Test
Nalaženje kritične t vrednosti
Dato: n = 3; α = .10
Kritične vrednosti iz t Tablice
(izvadak)
df = n - 1 = 2
v
α /2 = .05
-2.920 0 2.920 t
α /2 = .05
t.10
.10
t.05
.05
t.025
.025
1 3.078 6.314 12.706
2 1.886 2.920 4.303
3 1.638 2.353 3.182
Dvosmerni t Test
Primer
Da li prosečna kutija
cerealija sadrži 368
grama cerealija?
Slučajan uzorak od 36
kutije imao je u proseku
372.5 & a standardna
devijacija bila je 12
grama. Testiraj na
nivou značajnosti od
.05.
368 gm.
Dvosmerni t Test
Rešenje
H0:
Ha:
α=
df =
Kritična vrednost(i):
Test Statistika:
Odluka:
Zaključak:
Dvosmerni t Test
Rešenje
H0: μ = 368
Ha: μ ≠ 368
α=
df =
Kritična vrednost(i):
Test Statistika:
Odluka:
Zaključak:
Dvosmerni t Test
Rešenje
H0: μ = 368
Ha: μ ≠ 368
α = .05
df = 36 - 1 = 35
Kritična vrednost(i):
Test Statistika:
Odluka:
Zaključak:
Dvosmerni t Test
Rešenje
H0: μ = 368
Ha: μ ≠ 368
α = .05
df = 36 - 1 = 35
Kritična vrednost(i):
Reject H00
Reject H00
.025
.025
-2.0301 0 2.0301
t
Test Statistika:
Odluka:
Zaključak:
Dvosmerni t Test
Rešenje
Test Statistika:
H0: μ = 368
Ha: μ ≠ 368
X − μ 372.5 − 368
t=
=
= +2.25
α = .05
12
S
df = 36 - 1 = 35
36
n
Kritična vrednost(i):
Odluka:
Reject H00
Reject H00
.025
.025
-2.0301 0 2.0301
t
Zaključak:
Dvosmerni t Test
Rešenje
Test Statistika:
H0: μ = 368
Ha: μ ≠ 368
X − μ 372.5 − 368
t=
=
= +2.25
α = .05
12
S
df = 36 - 1 = 35
36
n
Kritična vrednost(i):
Odluka:
Odbaci sa α = .05
Reject H00
Reject H00
.025
.025
-2.0301 0 2.0301
t
Zaključak:
Dvosmerni t Test
Rešenje
Test Statistika:
H0: μ = 368
Ha: μ ≠ 368
X − μ 372.5 − 368
t=
=
= +2.25
α = .05
12
S
df = 36 - 1 = 35
36
n
Kritična vrednost(i):
Odluka:
Odbaci na nivou α = .05
Reject H00
Reject H00
.025
.025
-2.0301 0 2.0301
t
Zaključak:
Postoji dovoljno
dokaza da populacioni
prosek nije 368
Statistički testovi u istraživanjima sa
dva uzorka
Skale merenja
dva zavisna uzorka
dva nezavisna uzorka
omerna ili
intervalna
z-test; t-test;
Randomizacioni test za
vezane uzorke
z-test; t-test; F-test za
odnos dve varijanse;
Randomizacioni test za
dva nezavisna uzorka
ordinalna
Test predznaka;
Vilkoksonov test
ekvivalentnih parova
Test medijane; Test sume
rangova; Man-Vitnijev
test
MekNemarov test
Fišerov test tačne
verovatnoće; Hi-kvadrat
test nezavisnosti i
homogenosti
nominalna
t-test za dva zavisna uzorka
Kod 9 pacijenata kod kojih je izvedena
resekcija želuca (operacija po Bilrotu),
posmatran je uticaj histamina na
lučenje HCl u želucu. Izmerene su
sledeće vrednosti ukupne količine HCl
u mmol/sat pre i posle davanja
histamina:
Istraživački podaci
Pacijent
1
2
3
4
5
6
7
8
9
Pre davanja
histamina
8.4 5.6
5.3
5.8
4.6
4.9
4.8
5.2
5.7
Posle davanja
histamina
4.0 4.6
2.5
3.5
2.9
3.2
3.5
3.8
4.5
t-test za procenu značajnosti
razlike za zavisne uzorke
Prosečnu razliku (pre - posle) vrednosti
obeležja u populaciji označićemo sa μ d a
prosečnu razliku u uzorku sa
H o: μ d = 0
H a: μ d ≠ 0
d
Individualne razlike
d označava individualne razlike za svakog
pacijenta (svejedno je da li formiramo razlike
vrednosti xpre - xposle ili xposle - xpre):
Pacijent:
1
2 3
4 5 6
7
8
9
d = xpre – xposle
4.4 1.0 2.8 2.3 1.9 1.7 1.3 1.4 1.2
Test statistika
t=
d − μ d0
SE d
=
d − μ d0
SDd / n
d
=
(∑ d )
−
2
∑d
2
n
n(n − 1)
Izračunavanje test statistike
∑ d = 18.0, ∑ d
t=
2
2
(
18.0 )2
48.08 −
9
9(9 − 1)
= 48.08, n = 9,
=
d 18.0
∑
d=
=
= 2mmol / sat
2
48.08 − 36.0
72
n
=
9
2
= 4.87, DF = 9 − 1 = 8
0.41
Odlučivanje
Izračunata vrednost t-testa 4.87 veća je od
granične vrednosti ; p < 0.01; pa
zaključujemo da postoji visoko
statistički značajna promena.
Odbacujemo H o i prihvatamo radnu
hipotezu. Stimulacija histaminom
deluje na lučenje HCl u želucu.
t-test za dva nezavisna uzorka
U dva slučajno izabrana uzorka
izvršeno je merenje najmanje
frekvencije koju čuje ljudsko uvo. Prvi
uzorak činilo je 24 muškarca mlađih od
trideset godina a drugi uzorak 17
muškaraca starijih od 30 godina.
Izmerene su sledeće vrednosti u
hercima:
Istraživački podaci
Muškarci mlađi od 30 godina
Muškarci stariji od 30 godina
8
10
17
23
3
10
22
-
9
12
18
24
6
8
27
-
9
13
19
25
7
12
30
-
10
15
19
26
8
19
32
-
10
17
21
28
7
16
32
-
28
29
31
31
8
24
-
-
Istraživačko pitanje
Da li postoji razlika u percepciji zvukova
niskih frekvenci između muškaraca
mlađih i starijih od 30 godina?
t-test za procenu značajnosti razlike
aritmetičkih sredina dva nezavisna
uzorka
Kada su populacione varijanse nepoznate
postoje dve mogućnosti: ili su jednake
ili ne. Razmatraćemo samo prvi slučaj
kada su jednake ili je razumno
pretpostaviti da su jednake:
Ho:μ1=μ2
Ha:μ1≠μ2
t-test za procenu značajnosti
razlike aritmetičkih sredina
dva nezavisna uzorka
(
x
t=
1
)
− x 2 − (μ1 − μ 2 )0
SD p
2
n1
+
SD p
2
n2
DF = n1 +n2 - 2
2
SD p =
(n1 − 1)SD1
+ (n 2 − 1)SD2
n1 + n 2 − 2
2
2
t-test za procenu značajnosti
razlike aritmetičkih sredina
dva nezavisna uzorka
t=
x1 − x 2
n1 SD + n 2 SD
n1 + n 2
×
n1 + n 2 − 2
n1 × n 2
2
1
2
2
Izračunavanje test statistike
t=
18.83 − 15.94
24 × 58.84 + 17 × 100.81 24 + 17
×
24 + 17 − 2
24 × 17
DF=39
= 1.02
Odlučivanje i zaključivanje
Izračunata vrednost t-testa t = 1.02 manja
je od granične vrednosti pa nema
razloga za odbacivanje nulte hipoteze.
Ne postoji razlika u percepciji zvukova
niskih tonova između muškaraca
mlađih od 30 godina i muškaraca
starijih od 30 godina.
Testiranje hipoteza
Kategorijalna analiza podataka
Tipovi podataka
Kvalitativni podaci
1. Kvalitativne varijable su odgovori koji
klasifikuju
Primer: Pol (muški, ženski)
2. Merenje se obavlja kroz određeni #
kategorija
3. Nominalna ili ordinalna skala merenja
4. Primeri:
χ2 Test - Osnovna ideja
1. Poredi observirane (O ili f) i očekivane
učestalosti (E ili fl) ako je nulta hipoteza
istinita
2. Što su ove učestalosti bliže, sve je
verovatnije da je H0 istinita
meri se kvadrirana razlika relativnih u
odnosu na očekivane učestalosti
Nalaženje kritične
vrednosti - Primer
df = k - 1 = 2
α = .05
χ2 Tablica
Povrsina desnog repa
(izvadak) DF .995
…
.95
…
.05
1
...
… 0.004 … 3.841
2 0.010 … 0.103 … 5.991
χ2 Test
•
•
test slaganja
tablice kontingencije
test nezavisnosti
test homogenosti
Primer – Test slaganja
U uzorku od 24 osobe nađeno je da
kod 8 osoba postoje faktori rizika za
nastanak hipertenzije. Pretpostavlja se
da u populaciji svaka četvrta osoba ima
faktore rizika za nastanak
hipertenzivne bolesti. Da li je ova
pretpostavka tačna?
Tablice kontingencije
Najefikasniji način reprezentovanja
učestalosti ukrštenih kategorija
klasifikacije jesu tablice
kontingencije.
χ2 Test nezavisnosti
1. Pokazuje postojeći odnos između dve
kvalitativne varijable
izvučen je jedan uzorak
Ne pokazuje kauzalnost
2. Pretpostavke
Multinomijalni eksperiment
Sve očekivane frekvence ≥ 5
3. Tablice kontingencije 2x2 najcesce
Test nezavisnosti
Najčešće primena hi-kvadrat testa je
testiranje nulte hipoteze o nezavisnosti dva
kriterijuma klasifikacije kada se primene na
iste jedinice posmatranja. Dakle, kažemo da
su dva kriterijuma klasifikacije nezavisna ako
je raspodela jednog kriterijuma ista bez
obzira na raspodelu drugog kriterijuma.
Ako ovu, nultu, hipotezu odbacimo
zaključićemo da dva kriterijuma klasifikacije
nisu nezavisna, dakle, zavisna su, povezana
su.
Primer
U istraživanju povezanosti starenja i zdravlja izabran
je i praćen uzorak od 1124 žene u postmenopauzi.
U toku menopauze njih 156 primalo je estrogensku
terapiju a preostalih 968 nije. Tokom petogodišnjeg
praćenja beleženi su znaci Alchajmerove bolesti u
ovom uzorku i to godišnjim pregledom i
kriterijumima potrebnim za postavljanje prethodne
dijagnoze. Rezultati su bili: ...
Da li postoji povezanost između estrogenske
terapije i pojave Alchajmerove bolesti u
postmenopauznih žena?
Rezultati su bili:
Terapija
estrogenom
Znaci Alchajmerove bolesti
Ukupno
Ne
Da
Ne
147
9
156
Da
810
158
968
Svega
957
167
1124
Primer
H0: pojava znakova Alchajmerove bolesti i
terapija estrogenom su nezavisni
H1: dve varijable nisu nezavisne (zavisne
su)
Broj stepena slobode: (r - 1)(c - 1)
Test statistika
⎡
⎤
(
)
−
f
f
'
2
χ =∑⎢
⎥
f' ⎦
i =1 ⎣
k
2
Raspodela test statistike
Kada je nulta hipoteza tačna ova statistika
se raspodeljuje približno po χ2
raspodeli sa (k-1)(r-1) = (2-1)(2-1) = 1
stepeni slobode. Pri tom je k broj
kolona a r broj redova u tablici
kontingencije.
Izračunavanje test statistike
2
2
2
2
(
(
(
(
147 − 132.82)
9 − 23.18)
810 − 824.18)
158 − 143.82)
χ =
+
+
+
2
132.82
23.18
824.18
= 1.51 + 8.67 + 0.24 + 1.4 = 11.82
143.82
Odlučivanje
Odbacujemo nultu hipotezu jer je 11.82 > 5.024 za nivo
značajnosti 0.05 (tj. za njegovu gornju/desnu
polovinu od 0.025) i istovremeno 11.82 > 7.879 za
nivo značajnosti 0.01 (tj. 7.879 je kritična vrednost
za gornju desnu polovinu od 0.01, tačnije za 0.005).
Zaključujemo da je nulta hipoteza netačna, pa stoga
postoji povezanost između primene estrogenske
terapije i znakova Alchajmerove bolesti.
Češće se zbog jednostavnosti (ali to onda nije sasvim
tačno) koriste kritične vrednosti od 3.841 za nivo
značajnosti od 0.05 ili 6.635 za 0.01 i broj stepena
slobode jedan.
Zaključivanje
Žene koje nisu bile na estrogenskoj terapiji, njih 16.3%,
su imale znakove Alchajmerove bolesti a od onih
koje su bile na ovoj terapiji znake Alchajmerove
bolesti je imalo njih 5.8%.
Dakle, razlika između 16.3% i 5.8% nije posledica
slučajnosti.
Ova povezanost je takva da sugeriše da je u stvari
estrogenska terapija povezana sa ređim
pojavljivanjem znakova Alchajmerove bolesti.
Moguće objašnjenje ove povezanosti istraživači su našli
u činjenici da estrogenska terapija promoviše rast
holinergičkih neurona, stimuliše sekretorni
metabolizam amiloidnih proteina i najverovatnije
interreaguje sa apolipoproteinom E.
Karakteristike testa nezavisnosti
možemo sažeti kao sledeće:
a) iz populacije se bira jedan uzorak a subjekti ili objekti
se klasifikuju na osnovu dve varijable od interesa;
b) računanje očekivanih frekvencija zasnovano je na
zakonu verovatnoće koji tvrdi da ako su dva
događaja (dva kriterijuma klasifikacije) nezavisna,
verovatnoća njihovog zajedničkog pojavljivanja
jednaka je proizvodu njihovih pojedinačnih
verovatnoća i
c) hipoteze i zaključci se definišu u obliku termina
nezavisnosti (ili nepostojanja nezavisnosti) dve
varijable.
Hi-kvadrat test kao test
homogenosti
Istraživač je odredio nezavisne uzorke
koji će biti izvučeni iz nekoliko (u ovom
slučaju dve) populacija.
Da li uzorci potiču iz populacija koje su
homogene u odnosu na izabrani
kriterijum klasifikacije?
Primer
U jednoj ustanovi za lečenje bolesti zavisnosti
primenjuju se svakodnevna grupna terapija i
individualna terapija tri puta nedeljno. Od svih
lečenih metodom svakodnevne grupne
terapije slučajno je izabrano 30 zavisnika.
Grupa iste veličine slučajno je izabrana i od
onih lečenih drugom metodom. Među
pacijentima jedne i druge grupe sprovedeno je
istraživanje putem ankete u kojoj je jedno od
pitanja bilo: " Da li je sopstvena želja za
prekidom uzimanja droge bila presudna za
donošenje odluke o početku lečenja"?.
Primer
Ponuđeni odgovori bili su "ne" i "da". U grupi
pacijenata kod kojih je sprovedena grupna
terapija potvrdno je odgovorilo 23, dok je
negativan odgovor izbrojan kod sedmoro
pacijenata. U grupi zavisnika od droge lečenih
individualnom terapijom sa "da" je odgovorilo
desetoro pacijenata dok je njih dvadesetoro
odgovorilo sa "ne". Da li postoji razlika u
učestalosti postojanja želje za prestankom
uzimanja droge kao presudnog razloga za
lečenje između ove dve grupe pacijenata?
Primer
H0: Dve populacije (pacijenti na grupnoj i pacijenti na
individualnoj terapiji) su homogene u odnosu na
razlog donošenja odluke o lečenju svoje zavisnosti
(ili preformulisano - ne postoji značajna razlika u
učestalostima odgovora "da" i "ne" između ove dve
grupe pacijenata).
HA: Dve populacije nisu homogene u odnosu na razlog
donošenja odluke o lečenju svoje zavisnosti (ili
preformulisano - postoji značajna razlika u
učestalostima odgovora "da" i "ne" između ove dve
grupe pacijenata).
Primer
χ 2 = 11.38
DF = (2-1) (2-1) = 1
Pošto je izračunata vrednost χ 2-testa veća od granične
χ; (
) = 6 . 635 p < 0.01, odbacićemo nultu i
vrednosti
prihvatićemo radnu hipotezu.
Da bismo doneli konačan zaključak možemo u tablici
kontingencije videti koje su to učestalosti gradacija
obeležja koje su uslovile da razlika bude značajna.
U grupi pacijenata na grupnoj terapiji veća je učestalost
odgovora da je presudna za donošenje odluke o
početku lečenja bila sopstvena želja za prekidom
uzimanja droge nego u grupi pacijenata na
individualnoj terapiji.
2
0 . 01 ;1
Testovi homogenosti imaju
sledeće karakteristike:
a) dve ili više populacije se unapred identifikuje pa se iz
svake bira jedan nezavisan uzorak
b) uzorački subjekti ili objekti smeštaju se u
odgovarajuće kategorije varijable od interesa
c) računanje očekivanih frekvenci zasnovano je na
tvrdnji da ako su populacije homogene najbolja
ocena verovatnoće da će subjekt ili objekt pripadati
određenoj kategoriji varijable od interesa dobija se
agregiranjem uzoračkih podataka i
d) hipoteze i zaključci definišu se u terminima
homogenosti (u odnosu na varijablu od interesa)
populacija.
Statistički testovi u istraživanjima sa
više od dva uzorka
Skale merenja
Više od dva zavisna
uzorka
Više od dva nezavisna
uzorka
omerna ili
intervalna
Fišerova analiza
varijansnog količnika,
ANOVA za ponovljena
merenja
Fišerova analiza
varijansnog količnika,
ANOVA
ordinalna
Friedmanova analiza
varijanse
Kruskal-Wallisova
analiza varijanse, Test
medijane
Kokrejnov Q-test
Fišerova ANOVA za
proporcije, Varijante hikvadrat testa
nominalna
Jedan
prediktor
Analiza
povezanosti
Intervalni / omerni
podaci
Nezavisne
grupe
Između dve
grupe
Analiza
razlika
Tip
podataka
Zavisne
grupe
Nezavisne
grupe
Između više
grupa
Nominalni /
Ordinalni
podaci
Više
prediktora
Zavisne
grupe
Korelacija:
Pearson
Regresija
Višestruka
regresija
t-test za
nezavisne uzorke
t-test za
zavisne uzorke
ANOVA za
nezavisne uzorke
ANOVA sa
ponovljenim merenjima
Korelacija::
Spearman
Ordinalna
Frekvencije
Regresija
Hi-kvadrat
Neke vrste
regresija
Download

Zaključivanje zasnovano na jednom, dva ili više uzoraka Testiranje