Ders 10: Bazı Tek Kitleli Hipotez Testleri
29.04.2014






Hipotez testi kavramı
Ortalama için hipotez testi (bilinen varyans)
Ortalama için hipotez testi (bilinmeyen
varyans)
P-değeri yaklaşımı
Güven aralıkları ile hipotez testi ilişkisi
Tek kitlenin varyansı için hipotez testi
29.04.2014





İstatistiksel hipotez: bir veya birden fazla kitle
hakkındaki varsayım veya iddia.
İstatistiksel hipotezi doğruluğunu kesin olarak
sınamak için tamsayım gerekir.
Hipotez testi, istatistiksel hipotezin doğruluğunu
belli bir hata payı ile sınamak için yapılır.
Test edilen hipotez 0 ile gösterilir ve sıfır
hipotezi olarak adlandırılır.
1 veya  olarak gösterilen karşıt hipotezin
kabul edilmesi, 0 reddedildiği anlamına gelir.
29.04.2014

Hipotez testleri, test istatistiği denilen örneklem
istatistiği üzerine kurulur.
HİPOTEZ
Doğru
Yanlış


KARAR
0 Reddetme 0 Reddet
Doğru karar I. Tip hata
II. Tip hata Doğru karar
I. Tip hata yapma olasılığı , test yapılmadan
önce seçilir ve testin önem düzeyi olarak
adlandırılır. 0,10; 0,05; 0,01 ve 0,001 yaygın olarak
kullanılan  değerleridir.
II. Tip hata yapma olasılığı ise  ile gösterilir.
Yanlış olan 0 ’ı reddetme olasılığı olan 1 − ’ya
testin gücü denir.
29.04.2014





0 , mevcut durumu (statüko) gösterdiği için
istatistiksel olaran anlamlı olan 0 ’ın
reddedilip yerine 1 ’in kabul edilmesidir.
Test istatistiği kritik bölgede yer alırsa 0
reddedilir.
Kritik bölgenin dışına kabul bölgesi denir.
Çoğu zaman yapılan testler iki yönlüdür, 0
eşitlik (=), 1 ise eşitsizlik (≠) içerir.
Tek yönlü testlerde 0 , ≤ veya ≥, 1 ise < veya
> içerir, .
29.04.2014



0 :  = 0
0 doğru ise:
~ 0 ,  2 
Test istatistiği:
=

 :  ≠ 0
1−
 2
−0
 
 2
 > 1− ⇒ 0 ’ı reddet
2
29.04.2014
15 yıl önce yapılan kapsamlı bir çalışma ile 10
yaşındaki kız çocukların boy ortalamasının
138cm, standart sapmasının ise 7,5cm olduğu
tespit edilmiştir. Son günlerde yapılan bir
çalışmada rastgele seçilen 10 yaşındaki 50 kızın
ortalama boyu 141cm olarak ölçülmüştür. Buna
göre, son 15 yıl içinde 10 yaşındaki kızların boy
ortalamasının değiştiği %10 önem derecesi ile
söylenebilir mi?
29.04.2014
15 yıl önce yapılan kapsamlı bir çalışma ile 10 yaşındaki
kız çocukların boy ortalamasının 138cm, standart
sapmasının ise 7,5cm olduğu tespit edilmiştir. Son
günlerde yapılan bir çalışmada rastgele seçilen 10
yaşındaki 50 kızın ortalama boyu 141cm olarak
ölçülmüştür. Buna göre, son 15 yıl içinde 10 yaşındaki
kızların boy ortalamasının değiştiği %10 önem derecesi
ile söylenebilir mi?
0 :  = 138
 :  ≠ 138
Kritik değer: 1− = 0,95 = 1,65
−0
 
2
141−138
7,5 50
=
=
≅ 2,82 > 1,65 ⇒ 0 ’ reddet. Kızların
boy ortalamasının değiştiği söylenebilir.
29.04.2014



0 :  ≤ 0
0 doğru ise:
~ 0 ,  2 
Test istatistiği:
−0
=


 :  > 0


 > 1− ⇒ 0 ’ı reddet

0 :  ≥ 0
 :  < 0
  <  ⇒ 0 ’ı reddet
29.04.2014
Normal labaratuvar koşullarında deney farelerinin
ortalama ömürleri ortalaması 32 ay, standart
sapması 4,5 ay olan normal dağılım
göstermektedir. Bir araştırmacı farelere verilen
besinlerin toplam kalorisi %30 azaltılır, vitamin
miktarı arttırılır ise daha uzun yaşayacaklarını iddia
etmektedir. 25 farelik örneklem, araştırmacının
önerdiği şekilde beslenmiş ve örneklemin
ortalamasının 33,5 ay olduğu gözlemlenmiştir.
Buna göre, %1 önem derecesinde söz konusu
şekilde beslenen farelerin daha uzun yaşadığına
dair yeterli delil var mıdır?
29.04.2014
0 ∶  ≤ 32
 :  > 32
Kritik değer: 1− = 0,99 = 2,33
Test istatistiği:
=
33,5−32
4,5 25
≅ 1,667
 < 2,33 ⇒ 0 ’ı reddetmek için yeterli delil yok.
29.04.2014


Dağılımın varyansı bilinmiyorsa test istatistiği
 hesaplanamaz, onun yerine
 − 0
=
 
kullanılır.
Test istatistiği tek yönlü  için −1,± 1− , çift
yönlü  için −1,1− ile karşılaştırılır.
2
29.04.2014
Portlant Çimentosunda SiO2 oranının %21
olması istenmektedir. Bir çimento santralindeki
üretimden rastgele 16 örnek alınmış ve oranları
aşağıdaki gibi ölçülmüştür:
21,51
22,23
22,23
21,23
21,20
21,17
21,79
22,92
21,67
20,93
22,03
21,09
22,24
21,32
23,30
22,36
Buna göre ortalama SiO2 oranının %21’den farklı
olduğu %5 önem derecesi ile söylenebilir mi?
29.04.2014
21,51
22,23
22,23
21,23
21,20
21,17
21,79
22,92
21,67
20,93
22,03
21,09
22,24
21,32
23,30
22,36
0 :  = %21
 :  ≠ %21
Kritik değer: 15;0,975 = 2,1315
 = 21,83
 = 0,688
−
21,83−21
0
Test istatistiği: =
=
= 4,80
 
0,688 16
 > 2,1315 ⇒ 2  %21′  
29.04.2014



Önceden belirlenen önem düzeyine göre 0 ’ın
test edilmesi sonucunda kritik değere ne
kadar yaklaşıldığı hesaba katılmaz.
P-değeri, 0 ’ın reddedileceği en küçük önem
düzeyidir; reddedilip reddedilmediğinden
daha fazla bilgi içerir.
P-değeri, aynı zamanda 0 doğru ise en az
eldeki kadar ‘‘uç’’ bir örneklemin elde edilme
olasılığıdır.
29.04.2014
Önceki 3 alıştırmada hesaplanmış olan test
istatistiklerine ait P-değerlerini bulunuz.
29.04.2014
Önceki 3 alıştırmada hesaplanmış olan test
istatistiklerine ait P-değerlerini bulunuz.
a) = 2,82 ⇒   > 2,82 = 0,0024 ⇒  − ğ
= 0,0048
b) = 1,667 ⇒   > 1,67 = 0,0475 ⇒  − ğ
= 0,0475
) = 4,80 ⇒  15 > 4,80 = 0,000117 ⇒  − ğ
= 0,000234
29.04.2014


0 :  = 0
 :  ≠ 0
Testi için kabul bölgesi
−
− 1− <
<  1−
 
2
2
 için güven aralığı:


 −  1− ∙
<  <  +  1− ∙


2
2
29.04.2014


 −  1− ∙
<  <  +  1− ∙


2
2


− 1− ∙
<  −  <  1− ∙


2
2
−
− 1− <
<  1−
 
2
2
−
− 1− <
<  1−
 
2
2
 önem düzeyinde 0 ’ın kabul edilmesi 1 − 
güven aralığının 0 ’ı kapsaması ile eşdeğerdir.
29.04.2014
Normal dağılımlı ve  2 varyanslı bir kitleden 
örnek alındığında elde edilen örneklemin varyansı
 2 ise, test istatistiği
2

−
1

2 =
2

 − 1 serbestlik dereceli  2 dağılımı gösterecektir.
Red Bölgesi


 2 = 0 2
 2 ≠ 0 2
 2 <  2 /2 ve
 2 >  2 1−/2
 2 ≥ 0 2
 2 < 0 2
2 < 2
 2 ≤ 0 2
 2 > 0 2
 2 >  21−
29.04.2014
Dietil eter üretiminde saflığın yüksekliği kadar
değişkenliğin düşüklüğü de önemlidir. Gaz fazı
dehidrasyonu yöntemi ile yapılan üretimde yeni
geliştirilen bir katalizörün kullanımı ile yapılan
30 deneme üretiminde saflığın standart
sapmasının %0,35 olduğu görülmüştür. Buna
göre, yeni katalizörün kullanımının standart
sapması %0,5 olan mevcut prosesten daha
düşük varyanslı olduğu %5 önem derecesi ile
söylenebilir mi?
29.04.2014
0 :  ≥ %0,5
 :  < %0,5
Kritik değer:  2 29;0,05 = 17,7
Test
istatistiği: 2
=
−1  2
2
=
29×0,352
0,52
= 14,21
 2 < 17,7 ⇒Yeni katalizörün kullanımı varyansı
azaltmaktadır.
29.04.2014
Download

Sunum