Hipotez Testi
ENM 5210
İSTATİSTİK VE YAZILIMLA
UYGULAMALARI
Ders 4
Minitab’da İstatiksel Çıkarım-I
(Ortalamalar ve Oranlar İçin Hipotez Testi)
Hipotez Testi
Örneğin, bir montaj hattındaki krtitik bir işlemin
tamamlanma süresiyle ilgilendiğimizi varyasalım.
§  İşlem süresi olasılık dağılımı ile tanımlanabilen rassal
bir değişkendir.
§  Dağılımın bir parametresi olan ortalama işlemin
tamamlanma süresi ile ilgilendiğimizi düşünelim.
§  Özellikle, ortalama işlem süresinin 130 saniye olup
olmadığına karar vermekle ilgileniyoruz
İstatistiksel Hipotezler
İstatistiksel hipotez testi ve parametrelerin güven aralığı
tahmini, karşılaştırmalı bir deneyin (örneğin belirlenmiş
bir değerle bir kitlenin ortalamasının karşılaştırılması
gibi) veri analizi aşamasında kullanılan temel
metotlardır.
Tanım
İstatistiksel hipotez, bir yada daha çok kitlenin
parametreleri hakkındaki bir ifadedir.
Hipotez Testi
Çift Taraflı Alternatif Hipotez
H 0 : µ = 130 sn
Sıfır Hipotezi
H1 : µ ≠ 130 sn
Alternatif Hipotez
Tek Taraflı Alternatif Hipotezler
H 0 : µ = 130 sn
H1 : µ < 130 sn
yada
H 0 : µ = 130 sn
H1 : µ > 130 sn
1
Bir Hipotezin Testi
Bir Hipotezin Testi
• Belirli bir hipotez hakkında bir karara yol açan bir
prosedürdür.
Hipotez Testlerinde
I.Tip ve II.Tip Hatalar
H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır.
H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır.
KARAR
•  Hipotez testi prosedürü, kitleden alınan bir rasgele
örneklemdeki bilginin kullanılmasına dayanır.
•  Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu
sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin
yanlış olduğu kararına varırız.
Anakitle Parametresi İçin
Hipotez Testi ve Güven Aralığı
•  Anakitle Ortalaması İçin İstatistiksel Çıkarım
Ø Anakitle standart sapması biliniyor.
Ø Anakitle standart sapması bilinmiyor.
•  Anakitle Oranı İçin İstatistiksel Çıkarım
H0 Kabul
H0 Red
H0 Doğru
Doğru Karar
I. Tip Hata
H0 Yanlış
II. Tip Hata
Doğru Karar
α=P(H0 red/H0 doğru)=P(I.Tip Hata)
β=P(H0 kabul/H0 yanlış)=P(II. Tip Hata)
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Ortalama İçin Hipotez Testi
Test İstatistiği:
2
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Çift taraflı hipotez testi için H0=µ0 doğru iken
Z0‘ın dağılımı ve kritik bölgeler
Kritik bölge
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Alternatif Hipotezin tek taraflı olduğu durumda, ortalamanın (µ)
hipotez testi için prosedürler geliştirebiliriz.
Kritik bölge
Kabul
bölgesi
Kritik bölge
Kabul
bölgesi
H0=µ0 doğru iken Z0‘ın dağılımı ve tek taraflı üst hipotez
testi için kritik bölge
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
P-Değeri Yaklaşımı
Tanım
P değeri, verilen veriyle (H0) sıfır hipotezinin
reddedilmesine yol açan en küçük anlam seviyesidir.
Kritik bölge
Kabul
bölgesi
H0=µ0 doğru iken Z0‘ın dağılımı ve tek taraflı alt hipotez
testi için kritik bölge
H 0 : µ = µ0 H1 : µ ≠ µ0 için çift taraflı test
⎧ 2 P( Z > z0 ), z0 ≥ 0
⎪ 2 P( Z < z ), z < 0
H 0 : µ = µ0 H1 : µ ≠ µ0 için çift taraflı test
⎪
0
0
P=⎨
H 0 : µ = µ0 H1 : µ > µ0 için üst tek taraflı test
⎪ P ( Z > z0 )
H 0 : µ = µ0 H1 : µ < µ0 için alt tek taraflı test
⎩⎪ P( Z < z0 )
3
Hipotez Testinin Adımları
(P Değeri Yaklaşımı)
1. Problemin içeriğinden ilgili parametreyi tanımla.
2. Sıfır Hipotezini (H0 )ifade et.
Tek Taraflı Testler
Montaj işlem süresi problemini düşünelim. Eğer ortalama işlem süresi
130 sn’den uzunsa, bunu güçlü bir kararla göstermek istediğimizi farz
edelim. Hipotez aşağıdaki gibi ifade edilir:
H 0 : µ = 130 sn
3. Uygun bir alternatif hipotez (H1) belirt.
4. Bir anlam düzeyi (önem düzeyi) α seç.
5. Uygun bir test İstatistiği belirle.
6. Örneklem verisinden H0 hipotezinin reddedilmesini gerektirecek en
küçük anlam düzeyi P değerini hesapla.
7. P<α ise H0 hipotezini reddet, aksi halde H0 hipotezini reddetme. Problem
bağlamında bunu rapor et.
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Örnek 1 Bilgisayar klavyesi montajı yapan bir üretim hattının şefi, montaj hattına yeni bir
süreç kurulduğundan kritik bir parçadaki hatalı montaj sayısının arttığını ve
darboğazların oluştuğunu fark etmiştir. Üretim şefi yeni süreci gözden
geçirdiğinde üretim sürecinin kritik bir parçası olan bir montajın tamamlanma
süresinin ortalaması 130 saniye ve standart sapması 15 saniye olan Normal
Dağılıma uyduğunun kabul edildiğini ve bu şekilde sürecin kurulduğunu
görmüştür. Oysa üretim şefi, bu kritik montajın tamamlanma süresinin 15
standart sapmayla Normal Dağılıma uyduğunu kabul etmekle birlikte, ortalama
tamamlanma süresinin 130 saniye olduğundan emin değildir. Şef, üretim
hattında bir ayarlama gerekip gerekmediğine karar vermek için kritik parça
montajı sırasında rastgele 100 parçanın tamamlanma süresini ölçmüş ve
örneklem ortalamasını 126,8 olarak bulmuştur. α = 0, 05 olarak alınırsa ne gibi
sonuçlar çıkarılabilir?
H1 : µ > 130 sn
Burada kritik alan X dağılımının alt ucunda (kuyruğunda) uzanır. H0’ın
reddi daima güçlü bir karar olduğu için, hipotezin bu ifadesi H0
reddedildiğinde istenen sonucu üretecektir. H0 hipotezi eşitlikle ifade
edilmesine rağmen, alternatif hipotezle belirtilmeyen herhangi bir µ
değerini içerdiği anlaşılır. Bu nedenle, H0’ı reddetme hatası tam olarak
µ=130 sn’yi kastetmez, ancak biz H1’i destekte güçlü delile sahip değiliz.
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Problemi hipotez testi adımlarını takip ederek çözebiliriz.
1. İlgilenilen parametre ortalama işlem süresi µ 'dür.
2. H 0 : µ = 130 sn
3. H1 : µ ≠ 130 sn
4. α =0.05
5. Test istatistiği
z0 =
x − µ0
σ/ n
4
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
6. Bu soruda çift taraflı test kurulduğu için her iki uçtaki alanı bularak P-değerini
hesaplayabiliriz.
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
7.
Ho Kabul
! = ! ! < −2,13 + ! ! > 2,13 = 0,0166 + 0,0166 = 0,0332
Yada P değerini bir uçtaki olasılığı ikiyle çarparak da bulabiliriz. Genel olarak çift
taraflı testlerde P değeri ! = 2!(! > ! ) ile bulunabilir.
0 p=0.0332
1
Ho Red
P değerini, ortalaması 0 ve
standart sapması 1 olan
Normal Dağılımı kullanarak
Minitab’da hesaplayın.
P=0,0332<α=0,05 olduğu için
H0 red
H 0 : µ = 130 reddedilir. Yani 100 ölçümlük örnekleme dayanarak,
ortalama islem süresi 130 sn'den farklıdır.
Ortalama islem süresinin 130 sn'den düsük olduguna iliskin
güçlü bir delil vardır.
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
Örnek 2 Çözüm:
Bir mağaza yöneticisi yeni bir faturalandırma sistemi üzerine
1. İlgilenilen parametre ortalama aylık hesap miktarı µ 'dür.
çalışmaktadır. Gerekli finansal analizler yapılmıştır. Yeni geliştirilen
sistem eğer müşterilerinin aylık hesabı 170 TL’den fazla ise maliyetleri
azaltacaktır. Rassal olarak seçilen 400 müşterinin hesapları incelenmiş
ve ortalaması 178 TL olarak bulunmuştur. Yönetici hesapların, standart
sapması 65 TL olan normal dağılıma uyduğunu bilmektedir. Yönetici bu
veriler ışığında, yeni sisteme geçmenin maliyeti düşüreceğini
söyleyebilir mi? (α =0.05)
2. H 0 : µ = 170 TL
3. H1 : µ > 170TL
4. α =0.05
5. Test istatistiği
z0 =
x − µ0
σ/ n
5
Bilinen Varyansla Normal Dağılıma
Sahip Bir Kitlenin Ortalaması İçin
Hipotez Testi
6.
7.
Sonuç:
H 0 : µ = 170 reddedilir. Yani 400 ölçümlük
örnekleme dayanarak, ortalama hesap miktarı
170 TL'den farklıdır.
Dolasıyla, ortalama hesap miktarının 170 TL'den
fazla olduguna iliskingüçlü bir delil vardır.
Yeni sisteme geçis maliyetleri azaltır.
Seçilecek anlam düzeyinin 0,0069 dan
küçük olması durumunda H0 hipotezi
reddedilemeyecek, 0,0069’dan büyük
olması durumunda H0 hipotezi
reddedilecektir.
Örnek
Hipotez Testleri ve Güven
Aralıkları Arasındaki İlişki
Sözgelimi θ gibi herhangi bir kitle parametresi hakkındaki bir
hipotez testi ve bu θ için güven aralığı arasında yakın bir ilişki
mevcuttur. [l,u], θ parametresi için % 100(1-α) güven aralığı ise,
θ0 sadece ve sadece % 100(1- α) güven aralığı sınırları içinde
değilse H0 reddedilir.
H 0 : θ = θ0
H1 : θ ≠ θ 0
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle standart sapması biliniyor.
Montaj işlem süresi örneğine geri dönersek kurulan hipotez aşağıda
verilmiştir.
H 0 : µ = 130 sn
H1 : µ ≠ 130 sn
Örnek: Bir deterjan paketi doldurma hattı her bir pakete 4 kg.
deterjan doldurmaktadır. 20 birimlik bir örneklem alinmış ve
ölçülen gram ağırlıkları aşağıda verilmiştir:
Ortalama işlem süresinin % 95 güven aralığı:
Geçmiş veriler standart sapmanın 25 gramdır. Sürecin dağılımını
ve paket ağırlık ortalamasının 4 kg. olup olmadığını araştırın.
130 değeri % 95 güven aralığında olmadığı için H0:µ=130 sıfır hipotezi
reddedilir.
6
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle standart sapması biliniyor.
Anakitle standart sapması biliniyor.
Örneklem verileri
özet haldeyse bu
bölümü kullan
Örneklem verisinin
istatistiksel özeti
Anakitle ortalamasının % 95’lik güven
aralığı. Hesaplanan aralık % 95 güvenle
anakitle ortalamasını kapsar. Daha yüksek
bir güven düzeyi seçilirse, örneklem
büyüklüğü arttırılmadığı sürece aralık
genişler.
1000 defa örneklem alıp
aralık hesaplasak ve H0
hipotezini reddetsek,
bunların yalnızca 11’inde
reddetmememiz gerektiği
halde H0’ı reddederiz.
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle standart sapması biliniyor.
Anakitle standart sapması biliniyor.
Aralığın güven düzeyini bu
bölümden değiştirebilirsiniz.
Alternatif hipotezin tipi, bu
bölümden tanımlanabilir.
7
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle Ortalaması İçin
Hipotez Testi ve Güven Aralığı
Anakitle standart sapması bilinmiyor.
Anakitle standart sapması bilinmiyor.
Anakitle standart sapması bilinmiyorsa,
referans dağılım t dağılımıdır
Anakitle Oranı İçin
Hipotez Testi ve Güven Aralığı
Bir otomobil üreticisi, Still paketine fiyatı arttıran otomatik park
özelliğini eklemeyi düşünmektedir. Ancak, bu özelliğin çok az
sürücü tarafından kullanılacağı ve bu özelliği satın almaya istekli
olacağı düşünülmektedir. Bu düşünceyi onaylamak için rassal
olarak seçilmiş 200 sürücüye bir anket uygulanmış ve bu
sürücülerden sadece 17’sinin bu özelliği satın almak isteyeceği
görülmüştür.
Anakitle Oranı İçin
Hipotez Testi ve Güven Aralığı
Bu bölümü örneklem verisini sayısal
(0/1) yada (Evet/Hayır) şeklinde
sütuna girdiyseniz kullanın.
a)  Otomatik park özelliğini satın alacak sürücülerin oranı için
% 95’lik güven aralığı hesaplayın.
b)  Üretici, eğer otomatik park özelliğini satın alacak müşterilerin
oranının % 10’dan küçük olduğuna ilişkin delil bulabilirse, bu
özelliği Still paketine eklemekten vazgeçecektir. 0,05 anlam
seviyesi için bu durumu analiz edin.
Varsayılan değerler
Elle yapılırken np>5 ve n(1-p)>5
için Binom dağılımına Normal
Dağılımla yaklaşılabilir.
Minitab, gerçek dağılımı kullanır.
8
Anakitle Oranı İçin
Hipotez Testi ve Güven Aralığı
Problemde p’nin %10’dan küçük olduğunu göstermek istediğiniz
için alternatif hipotezin ‘less than’ olarak formüle edildiğine dikkat
edin.
Normallik Testi
Bu bölümde ya verilerin
yüzdelik değerlerini yada
veri değerlerini girebilir
yada none seçeneğini
seçebilirsiniz.
Test tipi. Varsayılan
olarak AndersonDarling testi kullanılır.
P=0,285 değeri anlam düzeyi 0,05’ten çok küçük olduğu için H0
hipotezini reddedemeyiz. Buna göre otomatik park özelliğini kullanmak
isteyen sürücülerin oranı % 10’dan azdır. Firma bu sonuca göre bu
özelliği Still paketine eklemekten vazgeçecektir.
Normallik Testi
Deterjan örneğindeki ağırlık verilerinin dağılımının Normal Dağılıma
uygunluğunun testi için: Stat>Basic Statistics>Normality Test
Normallik Testi
9
Normallik Testi
10
Download

1 ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI Ders 4