Örneklem Ortalamaları Dağılımı
• Örneklem ortalamaları dağılımı, H0 doğru ilen herhangi bir olayın
gözlenme olasılığını gösterdiği için olasılık tanımını kullanarak
herhangi bir ortalama değerin gözlenme olasılığı belirlenebilir.
X < 60 durumuna uyan örneklem #
P(X < 60) =
Toplam örneklem #
• Bu sayede örneklem ortalamaları dağılımını göreli frekans dağılımına
yani olasılık dağılımına çevirebiliriz.
• Dağılım normal olduğu için (Ortalama=µ ve Standart Sapma= σẊ)
artık H0 ile tanımlanan herhangi bir durumun gözlenme olasılığı
hesaplanabilir.
Örneklem Ortalamaları Dağılımı
• Bu amaçla kullanılacak yöntem
(
X − X)
z=
s
zX
(
X - µ)
=
σX
• Normal dağılımı esas alan ve z standart puanlarını kullanan bu
istatistiksel teste zẊ testi denir.
Örnek 1
• µ=50 ve σẊ=5 olan bir örneklem ortalaması dağılımında,
• Ortalaması 55 veya daha fazla olan bir örnekleme rastlama olasılığı?
• Ortalaması 38,4 veya daha az olan bir örnekleme rastlama olasılığı?
• Ortalaması 60 veya fazla olan veya 40 veya daha az olan bir
örnekleme rastlama olasılığı?
Anlamlılık Seviyesi (α)
• Araştırma kapsamında incelediğimiz örneklem için H0 ile tanımlanan
ortalamadan farklı bir ortalama bulduğumuzda H0’ı hemen
reddetmeli miyiz? Veya neler yapmalıyız?
• Bu kararı vermek için öncelikle örneklem ortalamasının gözlenme
şansını hesaplamamız gereklidir.
• Genel olarak bir durumun şans eseri gözlenme olasılığı küçük bir
değere sabitlenir.
%5 = 0,05
%1 = 0,01
Anlamlılık düzeyi (α=,05 veya α=,01 )
• Anlamlılık düzeyi farklı araştırmalarda farklı değerlere sabitlenir.
Anlamlılık Seviyesi (α)
• Bir eczacılık araştırmasında bir ilacın zararlı olup olmadığı hakkında
H0: Araştırılan İlaç Etkili Değildir.
• H0 doğru iken reddetmek çok ciddi sorunlar doğurabileceğinden bu
riskin azaltılması gerekir.
1. Tip Hatayı azaltmak için α=,001 seçilebilir.
Bu durumda 2. Tip Hata artar ama sağlık açısından bu durumda
1. Tip hata daha risklidir.
• Öte yandan, bir okulda kullanılacak iki ders kitabının faydalarının
karşılaştırılması hakkında
H0: Araştırılan Kitaplar arasında fark yoktur.
• H0 doğru iken reddetmek eczacılık çalışmasına göre çok daha az
riskli bir durum olduğu için 1. Tip hatadan çok fazla çekinmeyebiliriz.
α=,25 gibi bir değer seçilebilir.
Anlamlılık Seviyesi (α)
• α = ,05 seçilmiş ise ve gözlemlenen herhangi bir durumun H0 ile
tanımlı durum altında gerçekleşme olasılığı
• p ≤ 0,05 ise H0’ı reddet
–
• p > 0,05 ise H0’ı kabul et
–
• α = ,05 seçilmiş ise aynı evrene ait her 100 olayın 5 tanesinin
evrene ait olmadığını söyleme riski var. (1. Tip Hata)
Anlamlılık Seviyesi (α)
• α= H0 doğru iken reddetme olasılığı (1. Tip Hata) olduğundan
• α=,05 seçilmiş ise doğru bir H0’ı kabul etme olasılığımız %95’tir.
• Bu değerleri z puanı cinsinden ifade etmek istersek neler yapmamız
gerekir?
• İpucu: Normal dağılım eğrisi altındaki alanlar tablosu kullanılarak
testin yönüne göre istenilen yüzdelik aralığını sağlayan z puanlarını
tespit edin.
– Buna göre H0 için kabul veya red durumlarını belirleyin
α=,05 için Tek Yönlü Test (Pozitif Yönlü)
H0: µ = 50
ve
H1: µ > 50
ise
α=,05 için Tek Yönlü Test (Negatif Yönlü)
H0: µ = 50
ve
H1: µ < 50
ise
α=,01 için Tek Yönlü Test (Pozitif Yönlü)
H0: µ = 50
ve
H1: µ > 50
ise
α=,01 için Tek Yönlü Test (Negatif Yönlü)
H0: µ = 50
ve
H1: µ < 50
ise
α=,05 için Çift Yönlü Test
H0: µ = 50
ve
H1: µ ≠ 50
ise
α=,01 için Çift Yönlü Test
H0: µ = 50
ve
H1: µ ≠ 50
ise
Anlamlılık Seviyesi (α)
• Yukarıdaki dağılımlarda sınır değerlerini gösteren zẊ değerlerine
zẊKritik değeri denir.
• zẊKritik değerinin pozitif veya negatif değer alması keyfi olmayıp H0 ve
H1 ile koyduğumuz şartlara bağlıdır.
• Tek veya çift yönlü test seçilirse seçilsin, toplam hata miktarının α’yı
geçmemesi sağlanmalıdır.
• H1’in tek yönlü mü yoksa çift yönlü yazılacağı çalışma öncesinde
belirlenmelidir. Analizler yapıldıktan sonra tek yönlü hipotez yerine
çift yönlü hipoteze geçiş yapılırsa toplamda yapılan 1. Tip hata α
oranından fazla hale gelir.
– Bu durumun nasıl sorun oluşturduğunu görsel olarak gösteriniz.
Örnek 2: Anlamlılık Seviyesi (α)
• Aşağıdaki her anlamlılık seviyesinde tek yönlü ve çift yönlü hipotez
testlerinde kullanılacak kritik z değerlerini hesaplayınız.
• α = 0,10
• α = 0,15
• α = 0,20
• α = 0,25
• α = 0,30
z İstatistiği ile Tek Örneklem Hipotez Testi
• Çalışmaya başlarken veri toplamadan önce hipotezler (H0,H1) ve anlamlılık
seviyesi (α) belirlenmelidir.
• Aynı evrenden 30 veya daha fazla elemanı rastgele seçim yöntemi ile
seçip örneklem ortalaması hesaplanır.
– İstatistiksel modelimizi göre, örneklemimiz, ortalaması (µ) ve standart
sapması (σẊ) olan örneklem ortalamaları dağılımından seçilmiştir.
• Örneklem ortalamaları dağılımı normal dağılım olduğu için, örneklem
ortalamasının (Ẋ) evren ortalaması µ ‘ye göre konumuna bakarak bu
değerin şans eseri gözlenme olasılığına bakarız.
• Bu kararı vermek için iki tane z puanına ihtiyacımız vardır
Ẋ’ya ait z değeri (zẊ HESAP)
Hipotezlerimizle belirlenen kritik z değeri (zẊ KRİTİK)
|zẊ HESAP | ≥ |zẊ KRİTİK| ise H0 Red
|zẊ HESAP | < |zẊ KRİTİK| ise H0 Kabul
Örnek 3
• Uzun mesafe koşucularının kalp atışı sayısı bakımından diğer
insanlarla aynı evrene ait olup olmadığı araştırdığımız çalışmada 36
adet uzun mesafe koşucusu rastgele seçilmiş olsun.
• Tüm insanlar evreninde dakikadaki kalp atışı sayısı için (µ=72 ve
σ=9) bilgisi verildiğine göre ve örneklemimiz için dakikadaki ortalama
kalp atışı sayısı 69,3 bulunmuşsa, bu örneklemin diğer insanlar
evrenine ait olup olmadığına karar veriniz. (α=,05)
Örnek 3
Örnek 3
• Yukarıdaki örnekte tek yönlü bir analiz kullanılsaydı (uzun mesafe
koşucularının diğer insanlardan daha düşük kalp atışı sayısına sahip
olup olmadığı araştırılsaydı) sonuç ne olurdu?
Bu test sonucuna göre, hangi karara varılabilir?
Örnek 3 Hakkında Yorum
• Ẋ= 65 gibi bir değer olsaydı (zẊ HESAP=- 4,67) hem tek yönlü hem çift
yönlü testte H0’ı reddederek aynı karara varırdık, ama
• Örneğimizde olduğu gibi, örneklem ile evren ortalamaları arasındaki
fark küçük olduğunda testin tek yönlü veya çift yönlü olması H0
hakkındaki kararımızı etkiler.
• Tek Yönlü Testlerde, çift yönlü testlere kıyasla örneklem ile evren
ortalaması arasındaki fark daha azken bile Ho reddedilebilir.
• Fakat, tek yönlü testler için, eğer örneklem ile evren ortalaması
arasındaki fark H1 ile tanımlı durumun tam tersi yönde ise araştırma
baştan çıkmaza girer. Çift yönlü testler her durumu ele aldığından
böyle bir risk yoktur.
Ẋ=74 olsaydı tek yönlü testi yapamazdık.
• H0 hakkındaki kararı önemli biçimde etkilediğinden, araştırma öncesi
beklentilerimize göre testin kaç yönlü olacağına karar vermeliyiz ve
sonrasında araştırma esnasında bir değişiklik yapmamalıyız.
Hipotez Testlerinde Örneklem Büyüklüğü ve
Anlamlılık Düzeyi İlişkisi
• Anlamlılık düzeyi evrenden rastgele seçilen gruplar üzerinde
çalışılırken kullanılır.
• Aynı anlamlılık seviyesinde, örneklem boyutu büyüdükçe, grup
ortalamaları arasındaki farkı “anlamlı” bulmak (H0’ı reddetmek)
kolaylaşır, yani daha küçük farklar için de bu karara varılabilir.
• Evrenin tümüne ulaşıldığında anlamlılık düzeyi seçilmez. Çünkü;
–
Güven Aralığı
• Ağrı Dağı’nın deniz seviyesinden yüksekliğini tahmin etmeniz
istendiğinde aşağıdakilerden hangisini tercih edersiniz
5140 metre
5130 ile 5150 metre arası
• Türkiye Süper Ligi sonunda şampiyon ile 2. takım arasında kaç puan
fark olacağına dair iddiaya girecekseniz, hangi tercihi yapmak daha
mantıklıdır?
2 puan fark
1 ila 3 puan fark
• Aralık tahmini yapmak nokta tahmini yapmaya göre daha güvenirlidir.
• Fakat, nokta tahmininde kesinlik varken, aralık tahmininde kesinlik
azalır.
Güven Aralığı
• Örneklemleri kullanarak evren hakkında yorumlar yaptığımız için
(Ẋ => µ) her işlemi en uygun biçimde yapsak bile örneklem seçimi
hatalarından kaynaklanan hatalar devreye girer (σẊ).
• σẊ azaldıkça, Ẋ’i kullanarak µ değerini daha az hata payı ile
tahmin edebiliriz.
• Örneklem ortalaması (Ẋ), evren ortalaması (µ) hakkındaki en iyi
nokta tahminimizdir.
• Ama, hata payının her zaman olacağını göz önünde tutarak µ’yü
tahmin ederken güvenirliği artırmak amacıyla nokta tahmini yerine
aralık tahmini yapılır.
Güven Aralığı(G.A.) [Confidence Interval] [CI]
Güven Aralığı
• Bir evren için aşağıdaki parametreler geçerli ise:
µ = 50, σ = 20,
20
n = 100 ⇒ σ X =
=2
100
• Yukarıdaki evren ortalamasını bilmediğimizi varsayalım ve 100 kişilik
bir örneklem yoluyla µ’yü tahmin etmeye çalışalım.
(σẊ=2 biliniyor)
• Örneklemimizin ortalamasını (Ẋ=50,7) ölçtüysek µ hakkında güvenilir
bir tahmin yapmak için bir güven aralığı belirleyelim.
Ẋ ± 2.σẊ => 46,7 < µ < 54,7
• Yukarıdaki aralık µ değerini kapsıyor, fakat eğer Ẋ=55 olsaydı, ne
olurdu?
Güven Aralığı
• Bu durumda µ aralığı tahminimiz
Ẋ ± 2.σẊ => 51 < µ < 59
• Görülüyor ki, örneklem ortalamamız için güven aralığımız µ’yü
kapsamıyor.
• Buna göre, hata payı aynı tutulsa bile bazı örneklemler için
hesaplanan güven aralıkları µ’yü kapsamayabilir.
• Evren ortalamasını her zaman önceden bilemeyeceğimiz için hangi
güven aralığının µ’yü kapsayıp kapsamadığını bilemeyiz.
• Bu nedenle, güven aralıklarının µ’yü içerip içermediği hakkında
olasılık hesabı yapmalıyız.
Güven Aralığı
• Evren ortalaması bilinen durumlar için yeterince deneme yapılırsa
Ẋ ± 2.σẊ gibi bir durumda örneklemlerin çoğu için hesaplanan
güven aralıklarının µ’yü kapsayacağı gözlenir.
• Daha önceki hipotez testi şartlarında örneklem ortalamaları
dağılımında örneklem ortalamalarının %95’inin z = ± 1,96 arasında
olduğunu görmüştük. Buradan hareketle,
• Tüm rastgele seçilmiş örneklemlerin %95’inin ortalamaları için
hesaplanan güven aralıkları evren ortalamasını (µ) içerecektir.
• Rastgele seçilmiş bir örneklem için, aşağıda tanımlanan güven
aralığının µ’yü içerme olasılığı %95’tir. (%95 Güven Aralığı)
X − 1,96σ X ≤ µ ≤ X + 1,96σ X
Güven Aralığı
• Aynı yöntemle, %99 Güven Aralığı yazılırsa
X − 2,58σ X ≤ µ ≤ X + 2,58σ X
• Yukarıda incelenen örnek için %95 ve %99 güven aralıkları:
G.A..95= 46,78 ≤ µ ≤ 54,62
G.A..99= 45,54 ≤ µ ≤ 55,86
• Bu iki güven aralığını karşılaştırdığınızda birbirine göre avantaj
ve dezavantajları nelerdir.
Güven Aralığı
• Güvenirlik düzeyim %100’den aşağı olmaz diyen biri için güven
aralığını hesaplayınız.
• Güven aralıklarının z puanları ile bu ilişkisi nedeniyle hipotez
testlerinde de güven aralıkları hakkında karara varılabilir.
Güven Aralığı
• %95 G.A. Kullanıldığında, H0 ile tanımlı evrene ait örneklemlerin
%95’inde G.A.’ları µ’yü kapsayacağı için;
H0 ile tanımlı evrenden seçilen100 durumun 95’inde örneklemin
H0 ile tanımlı evrene ait olduğu kararı verilir. (α =,05)
Güven Aralığı Örnek
• Uzun mesafe koşucularının kalp atışı sayıları örneğini güven
aralığı kullanarak cevaplandırınız.
• Yukarıdaki işlemlerde test kaç yönlüdür?
• Bu işlemleri tek yönlü olarak yapabilir miyiz?
z İstatistiği ile Örneklem Ortalamalarını
Karşılaştırma
• Tek örneklem analizinde incelenen örneklemin H0 ile tanımlı evrene
ait olup olmadığı araştırılıyordu. İki örneklem analizinde ise bu
örneklemlerin aynı evrene ait olup olmadıkları araştırılır.
• İki örneklem analizinde de H0 eşitlik üzerine kuruludur.
H 0 : µ1 = µ 2
veya
H 0 : µ1 − µ 2 = 0
veya
H1 : µ 1 − µ 2 ≠ 0
• H1 çift yönlü olabilir.
H1 : µ 1 ≠ µ 2
• Veya, beklentilerin yönüne göre tek yönlü yazılabilir.
H1 : µ1 > µ 2
veya
H1 : µ1 − µ 2 > 0
H1 : µ1 < µ 2
veya
H1 : µ1 − µ 2 < 0
z İstatistiği ile Örneklem Ortalamalarını
Karşılaştırma
• Bu amaçla eğitim alanında en sık rastlanılan çalışmalar
Deney – Kontrol grupları
Öntest – Sontest puanlarını karşılaştırma
• ẊDENEY=110,23 ve ẊKONTROL=109,57 ise aradaki ẊD-ẊK=0,66 puanlık fark
için, bu fark
İki örneklemin farklı evrenlere ait olduğunu gösterir mi?
Örnekleme hatası nedeniyle şans eseri mi gözlendi?
Deney grubuna uygulanan yöntemin anlamlı bir fark oluşturmada
etkili olduğunu gösterir mi?
• Yanlışlığı kanıtlanana kadar H0 doğru kabul edildiğinden bir karara
varmak için H0 altında seçilen iki örneklemin ortalamaları farklarına ait
dağılım kullanılmalıdır. (Örneklemler Arası Ortalama Farkları Dağılımı)
Birçok Deney ve Kontrol grubu örneklemleri seçilerek ẊD-ẊK farkı için
dağılım elde edilir.
Örneklemler Arası Ortalama Farkları Dağılımı
•
Örneklemler Arası Ortalama Farkları Dağılımı (Sampling Distribution of
Differences Between Means), H0 doğru ilen herhangi bir Ẋ1-Ẋ2 farkının
gözlenme frekansını gösterir.
•
Rastgele seçilmiş n elemandan oluşan örneklemlerin ortalamaları
arasındaki farklar dağılımı için matematiksel olarak şunlar söylenebilir.
1. Normal dağılım gösterir.
2. Ortalaması sıfırdır. (H0: µ1- µ2 =0)
3. Standart sapması (σẊ1-Ẋ2) yani Ortalamalar Arası Farkın Standart Hatası
(Standart Error of Difference Between Means) şu şekilde hesaplanır.
n1 , n 2 ≥ 30
•
⇒
σ X1 - X2 = σ 2X1 + σ 2X2
Ortalamalar Arası Farkın Standart Hatası, örneklem ortalamaları farkları
yoluyla evren ortalamaları farklarını tahmin ederken yaptığımız hatadır.
Örneklemler Arası Ortalama Farkları Dağılımı
σ X1 - X2 = σ 2X1 + σ 2X2
H 0 : µ1 − µ 2 = 0
Örneklemler Arası Ortalama Farkları Dağılımı
• n1,n2≥30 şartını sağlayan çok sayıda örneklem için Ẋ1-Ẋ2 farkını
hesaplayıp oluşturduğumuz Örneklemler Arası Ortalama Farkları
Dağılımı olasılık dağılımına çevirmek için yine z puanlarını kullanabiliriz.
(
X − X)
z=
z X1 - X 2 =
s
H 0 : µ1 − µ 2 = 0 ⇒
σ X1 - X2 = σ
2
X1
+σ
2
X2
(X1 - X 2 ) - ( µ1 − µ 2 )
z X1 - X2 =
σ2 σ2
=
+
n1 n2
σ
X1 - X 2
(X1 - X 2 )
σ
X1 - X2
z X1 - X2
(X1 - X 2 )
=
1 1
σ. ( + )
n1 n2
z İstatistiği ile Örneklem Ortalamalarını
Karşılaştırma
•
Örneklemleri karşılaştırmada kullanılacak zẊ1-Ẋ2 KRİTİK değerleri
i.
Testin anlamlılık seviyesine (α) ve
ii.
H1 hipotezinin yönüne göre
Tek örneklem testindeki değerlerle aynı değerleri alır.
•
•
α = ,05 ve Tek Yönlü Test için
α = ,05 ve Çift Yönlü Test için
zẊ1-Ẋ2 KRİTİK= 1,65 veya -1,65
zẊ1-Ẋ2 KRİTİK=± 1,96
•
•
α = ,01 ve Tek Yönlü Test için
α = ,01 ve Çift Yönlü Test için
zẊ1-Ẋ2 KRİTİK= 2,33 veya -2,33
zẊ1-Ẋ2 KRİTİK=± 2,58
Örnek 4
• Teknoloji destekli bir öğretim programının ilköğretim öğrencilerinin
ders başarılarına etkisini araştıran bir çalışmada 60 öğrenci deney
ve kontrol gruplarına eşit olarak atanıyor. Dönem sonunda deney
ve kontrol gruplarına uygulanan testler hakkında aşağıdaki bilgiler
verildiğine göre araştırma sonucunda hangi karar verileceğini
yorumlayınız (α=,05 ve σD= σK= 10 olarak kullanınız).
Örnek 4
Örnek 5
• Kız ve erkek öğrencilerin fene karşı tutumları arasında fark olup
olmadığını araştıran bir çalışmada 100 kız ve 100 erkek öğrenciye
uygulanan bir anket sonucunda aşağıdaki ortalama değerler
bulunduğuna göre hangi karara varılacağını yorumlayınız.
• (α=,01 ve σK= σE= 5 olarak kullanınız).
Örnek 5
Örneklem Ortalamalarını Karşılaştırmada
Güven Aralıkları
• Ortalamalar arası farklar için güven aralıklarının yazımı ve yorumları
yine tek örneklem durumu ile benzerdir.
G.A.,95 = (X1 − X 2 ) − 1,96σ X1- X2 ≤ µ1 - µ 2 ≤ (X1 − X 2 ) + 1,96σ X1- X2
G.A.,95 = (X1 − X 2 ) ± 1,96σ X1- X2
• Yorum 1: Rastgele seçilmiş örneklemlerin ortalamaları arasındaki
fark için hesaplanan güven aralıklarının %95’i Ẋ1-Ẋ2’nin beklenen
değeri olan 0’ı (µ 1- µ 2 =0) içerir, %5 ise içermez.
G.A.,99 = (X1 − X 2 ) − 2,58σ X1- X2 ≤ µ1 - µ 2 ≤ (X1 − X 2 ) + 2,58σ X1- X2
G.A.,99 = (X1 − X 2 ) ± 2,58σ X1- X2
• Yorum 2: Rastgele seçilmiş iki örneklemin ortalamaları arasındaki
fark için yukarıda tanımlanan güven aralığının 0’ı (µ 1- µ 2 =0) içerme
olasılığı %99’dur.
Örnek 5
• Örnek 5’te yapılan hipotez testini güven aralığını kullanarak yapınız
ve sonucu yorumlayınız.
Download

Parametrik Testler (z İstatistiği)