Anlam Çıkarıcı İstatistiksel Yöntemler
• Örneklem üzerinde yapılan çalışmalar sonucunda evren hakkında
yorumlarda bulunmayı sağlayan istatistiksel yöntemler
– Örneklemdeğer yardımı ile evrendeğeri tahmin etme
• Anlam çıkarıcı istatistiksel analizler genel olarak iki tür araştırmaları
kapsar
1. Gözlemlerin ait olduğu örneklem hipotezimizdeki evrene ait midir?
2. İki örneklem üzerinde yapılan gözlemler sonucu bulunan farklar
örneklemlerin ait olduğu evrenler arasında da var mıdır?
• İki örneklem aynı evrene ait midir?
Hipotez Oluşturma
•
Bir araştırma tasarlanırken öncelikle incelenecek değişkenler
arasındaki ilişkilerden yola çıkarak literatürdeki araştırmalar ışığında
ve üretici düşünme becerisi yardımıyla somut olarak test edilebilen
araştırma problemleri orta konur.
•
Belirlenen araştırma problemi doğrultusunda veriler toplanarak
hipotez testi yapılır ve hipotez hakkında kabul veya red kararı verilir.
•
Bir araştırmada değişkenler arasındaki ilişki hakkında yorumda
bulunmak için 2 tür hipotez kullanılır.
1.
Null Hipotez (H0)
2.
Alternatif Hipotez (H1 veya HA)
Null Hipotezi (H0)
• İstatistiksel hipotez veya temel hipotez
• Her zaman eşitliğe dayanır.
Gruplar arasında fark olmadığını (H0: µ1= µ2),
veya
Değişkenler arasında ilişki olmadığını belirtir. (H0: ρXY= 0)
• Araştırma sonuçlarında genelde null hipotezine yer verilmez.
Neden?
Alternatif Hipotez (H1)
• Araştırmaya yön veren hipotez
– Araştırma hipotezi
• Araştırmacının beklentilerini gösterir.
Değişkenler arasında fark olduğunu (H1: µ1≠ µ2),
veya
Değişkenler arasında ilişki olduğunu belirtir. (H1: ρXY ≠ 0)
• Araştırma sonuçları rapor edilirken genellikle araştırma hipotezine
yer verilir.
Hipotez Testleri
• İstatistiksel analizlerde eşitliğe yer verme özelliği nedeniyle test
edilen hipotez her zaman için hangisidir?
• H0 için yapılan test sonucundan hareketle araştırmacı H1’in kabul
edilme veya reddedilme kararını verir.
• H0 reddedilmezse (kabul edilirse) grup ortalamaları arasındaki farkın
sadece şans faktöründen (örnekleme hatasından) kaynaklandığı
sonucuna varılır.
• Tek örneklem ve iki örneklem testleri için bu sonuç ne anlama gelir?
Hipotez Testleri
• H0 reddedilirse, H1kabul edilmiş olur ve grup ortalamaları arasındaki
farkın sadece şans eseri veya örnekleme hatasından kaynaklanmış
olamayacağı sonucuna varılır.
• Tek örneklem ve iki örneklem testleri için bu sonuç ne anlama gelir?
Hipotez Testleri
• İstatistiksel testlerde kesin doğruluk veya yanlışlık kararı verilemez.
• Çünkü her şey olasılık hesabına dayanır ve hiçbir olasılık %100
veya %0 değildir.
• Hipotez testlerinde kararlar verilirken sonuçların tamamen şans
eseri gerçekleşme ihtimali mevcuttur.
• Bu ihtimal (p) daha önceden göz önüne alınarak araştırma türüne
göre %5, %1 veya ‰1 olarak sınırlanabilir.
%95, %99 Güven Aralığı
p ≤ 0,05 ise 100 seferde 5 kez hata yapma ihtimali göz önüne
alınarak karar verilmiş olur.
• Belirlenen bu p düzeyine anlamlılık düzeyi denir ve α ile gösterilir.
α=,05
α=,01
veya
α=,001
Hipotez Testi Süreci
1. H0 ve H1’in Belirlenmesi
•
Hipotez testleriyle evren hakkında yorumlar yapılmak istendiğinden
sembollerde evrendeğerleri gösteren Yunan harfleri kullanılır.
•
Hipotezler semboller yerine sözcüklerle de ifade edilebilir.
•
Hipotezler, tek yönlü veya çift yönlü olarak belirlenebilir.
• Hipotezlerin yön sayısı çalışmaya başlamadan önce
araştırmacının beklentilerine göre belirlenmelidir.
• A ve B gruplarının ortalamaları için
H0 : µ A = µ B
H1 : µ A > µ B
veya
H1 : µ A − µ B > 0 (Tek Yönlü)
H1 : µ A ≠ µ B
veya
H1 : µ A − µ B ≠ 0 (Çift Yönlü)
veya
H0 : µ A − µ B = 0
Hipotez Testi Süreci
2.
Test Ölçütlerinin Belirlenmesi
i.
ii.
iii.
iv.
Kullanılacak test istatistiği (z, t, F, Ki-Kare)
Hata oranını etkileyecek anlamlılık düzeyi (α)
Serbestlik derecesi
α’ya bağlı değişen kritik test istatistiği değeri
3.
•
Test İstatistiğinin Değerinin Hesaplanması
Seçilen test istatistiğine göre gruplar arası farkı temsil eden
değerin hesaplanması
4.
•
Hipotez Hakkında Karar Verilmesi
Hesaplanan test istatistiği değeri ile kritik değer anlamlılık
düzeyinde karşılaştırılarak H0 kabul veya reddedilir.
Uygun Test İstatistiğinin Seçimi
• Bağımlı değişkenin ölçülme türüne, sayısına, veri dağılımının
özelliklerine ve örneklem boyutuna göre farklı test istatistiklerinin
kullanılması gerekir.
• Test istatistikleri parametrik ve parametrik olmayan testler olarak iki
gruba ayrılır.
Parametrik Yöntemler
Parametrik Olmayan
Yöntemler
Eşit Oran/Aralık Ölçeği
Sınıflama, Sıralama
Normal Dağılım
Normal Dağılım şartı yok
n≥30
(n≥15 kabul edenler de var)
n<15 olabilir.
Parametrik ve Parametrik Olmayan Yöntemler
Parametrik Yöntemler
Parametrik Olmayan Yöntemler
z, t, F testleri
Mann Whitney U Testi, Wilcoxon
İşaret Testi,
Kruskall-Wallis Testi
Pearson Korelasyon Katsayısı
Spearman Sıra Farkları
Korelasyon Katsayısı
Regresyon Analizi
Ki-Kare Testi
Hipotez Testlerinde Hata Çeşitleri
BİZİM KARARIMIZ
GERÇEK
DURUM
H0 KABUL
H0 RED
H0 DOĞRU
(Doğru Karar)
1. TÜR HATA
(α)
H0 YANLIŞ
2. TÜR HATA
(β)
(Doğru Karar)
1. Tür Hata: Örneklemler aynı evrene ait olduğu halde farklı evrenlere ait
olduklarına karar verme
2. Tür hata: Örneklemler farklı evrene ait olduğu halde aynı evrenlere ait
olduklarına karar verme
Hipotez Testlerinde Hata Çeşitleri
Hangi hata seviyesini nasıl düşürebiliriz?
•
Araştırma alanına göre (eğitim, tıp vb.) en uygun α değeri
önceden belirlenmiş olur ve hata paylarının önceden tanımlı
sınırların dışına çıkmaması sağlanır.
Hipotez Testlerinde Hata Çeşitleri
• Hipotez testlerinde önemli bir husus gruplar arası farkların tamamen
şans eseri ortaya çıkma olasılığının belirlenmesidir.
Örnek 1: 4 adet Doğru-Yanlış sorusuna cevap veren bir öğrencinin toplam
puanı 2 ise sizce öğrenci bu puanı sorulara rastgele tahmin yoluyla
cevap vererek almış olabilir mi?
Örnek 2: Yukarıdaki öğrencinin toplam puanı 4 olsa idi sizce öğrenci bu
puanı sorulara rastgele tahmin yoluyla cevap vererek almış olabilir mi?
• Hangi durumda öğrencinin rastgele tahmin yapmış olacağına karar
vermek daha mantıklı?
Hipotez Testlerinde Hata Çeşitleri
• Örnek 1’de H0’ı kabul etmek daha mantıklı, çünkü Örnek 2’deki
durumda sadece tahmin yoluyla 4 puan alacağını ileri sürmek zordur.
• Bu nedenle, buradaki önemli husus
• Null hipotezi (H0) ile tanımlanan durumun tamamen şans eseri ortaya
çıkma ihtimalinin belirlenmesidir.
• Eğer H0’ın şans eseri gerçekleşme ihtimali çok düşükse,
H0’ı reddedip alternatif hipotez (H1) kabul edilir.
• Böylece kararlarımızdaki hata olasılığı azaltılmış olur.
Normal Dağılım Yoluyla Anlam Çıkarıcı
İstatistiksel Yöntemler
Tek Örneklem:
• Uzun mesafe koşucularının kalp atışı sayısı diğer insanlarla aynı mıdır?
(Normal insanlar evreni için dakikada kalp atışı ortalaması = 72)
• Bu durumu araştırmak için öncelikle uzun mesafe koşucularından
rastgele bir örneklem seçilir. Hipotezlerimiz
Normal Dağılım Yoluyla Anlam Çıkarıcı
İstatistiksel Yöntemler
Tek Örneklem:
• H0 yanlışlığı kanıtlanana kadar doğrudur.
• Ortalamalar arasındaki fark arttıkça, bu farkın şans yoluyla (örnekleme
hatasıyla) olma olasılığı azalır.
• Ortalamalar arasındaki fark yeterince büyük ise bu farkın şans eseri değil
başka faktörlerin etkisi ile gözlendiği sonucuna varılır. Yani:
• Ortalamalar aynı ise veya fark şans eseri ortaya çıkabilecek kadar küçük ise:
Normal Dağılım Yoluyla Anlam Çıkarıcı
İstatistiksel Yöntemler
İki Örneklem:
• Uzun mesafe koşucuları ile kısa mesafe koşularının kalp atışı sayıları
aynı mıdır?
• Bu durumu araştırmak için de uzun ve kısa mesafe koşucularından
rastgele iki örneklem seçilir. Hipotezlerimiz
• Tek örneklem testinde izlenilen yollar takip edilerek H0 hakkında bir
karara varılır.
Normal Dağılım Yoluyla Anlam Çıkarıcı
İstatistiksel Yöntemler
• Yukarıda tanımlanan araştırmalarda bir her kategorimiz için tek
örneklem göz önüne alırız fakat aynı evrene ait olsalar bile her
defasında aynı amaç için seçilen örneklemlerin ortalamaları arasında
ufak ta olsa farklar olacaktır.
• Örneklem ortalamalarının farklılık göstermesi gerçekte H0 ile
tanımlanan evrenden örnekleme yapıp yapmadığımız kararını
vermemizi zorlaştırır.
• Bu nedenle, evrenden seçilen örneklemlerin dağılımının özelliklerini
bilmek faydalıdır.
• Amaç: Aynı evrenden seçilen örneklemlerin ortalamasının ne kadar
değişebileceğini bilmek
Örneklem Ortalamaları Dağılımı
• H0 hakkında karar vermeden önce bize gerekli olan, H0 doğru kabul
edildiğinde (H0 ile tanımlı şart altında) aynı evrenden seçilen
örneklemlerin ortalamaları arasında ne kadar değişim olabileceğinin
belirlenmesidir.
• Örneklem ortalamalarının oluşturduğu bu dağılıma Örneklem
Ortalamaları Dağılımı (Sampling Distribution of Means) denir.
• Mesela, dakikadaki kalp atışı sayısı için 36 kişiden oluşan farklı
örneklemler seçilsin.
• Örnekleme hatası nedeniyle örneklemlerin ortalamaları hep aynı
olmayacak, aralarında bazı farklar gözlenecektir.
Örneklem Ortalamaları Dağılımı
• Örneklem ortalamaları dağılımının orta
noktası, değişkenin evrendeki
ortalamasına eşittir.
• Fakat evrendeki dağılıma göre
örneklemdeki değişim oranı daha azdır.
– Puanlar ortalama etrafına yığılmış ve
kenarlardaki yoğunluk evrene ait
dağılıma göre daha az
Örneklem Ortalamaları Dağılımı
• Örneklem ortalamaları dağılımının ortalaması 72 ve standart
sapması 1,5 olsun,
• Seçilen bir örneklem için en olası beklenecek ortalama değer
Fakat eğer araştırmamız kapsamında seçtiğimiz bir örneklemde
ortalama 69 çıktı ise ne karar verilebilir?
Örneklem Ortalamaları Dağılımı
•
Örneklem ortalamaları dağılımı, H0 doğru ilen herhangi bir olayın
gözlenme frekansını gösterir.
•
Rastgele seçilmiş n elemandan oluşan örneklemlerin ortalamaları
dağılımı için matematiksel olarak şunlar söylenebilir.
1. Normal dağılım gösterir.
2. Ortalaması, evrenin ortalamasına (µ) eşittir.
3. Standart sapması (σẊ) yani Ortalamanın Standart Hatası
(Standart Error of Mean) şu şekilde hesaplanır.
σ
σX =
n
σ : Evrene ait standart sapma
σ X : Ortalamanın Standart Hatası
Merkezi Limit Teoremi
(Central Limit Theorem)
• Örneklemlerin boyutu n>30 ise
• Merkezi Limit Teoremi gereğince
• Evrendeki dağılım normal dağılım
değilse bile örneklem ortalamaları
dağılımı normal dağılım şeklindedir.
Merkezi Limit Teoremi
(Central Limit Theorem)
• Ortalamanın standart hatası (σẊ), örneklem ortalamaları dağılımın
merkezden (evren ortalamasından) ne kadar saptıklarının ölçüsüdür.
• Örneklem boyutu, n arttıkça σẊ değeri azalır.
n=36 ise σẊ= σ/6
n=1 ise σẊ= σ
• σẊ arttıkça, tek bir örneklem kullanarak evren ortalamasını tahmin
etmedeki hata oranı artar.
Örneklem Ortalamaları Dağılımı
Download

Anlam Çıkarıcı İstatistik Teknikleri