Tek Yönlü ANOVA
•
ANalysis Of VAriance (Varyans Analizi)
•
İsmi varyans analizi olmasına rağmen bu yöntemde de diğer
testlerde olduğu gibi ortalamalar karşılaştırılır.
•
t testleri en fazla iki örneklemin karşılaştırılmasına imkan veriyordu.
•
ANOVA ile ikiden fazla örneklem karşılaştırılarak bunların aynı
evrene ait olup olmadıkları kararı verilir.
•
Tek yönlü ANOVA’da 1 Bağımsız Değişken incelenir.
– Tek faktörlü ANOVA
•
Bağımsız değişkenin (faktörün) her bir değerine düzey denilir.
 Düzey Sayısı = k (Örneklem sayısı)
Tek Yönlü ANOVA Varsayımları
1.
Bağımlı değişken eşit aralık/oran düzeyinde
2.
Bağımsız değişken sınıflama düzeyinde
3.
Örneklemler, ait oldukları evrenlerden rastgele seçilmiş
4.
Örneklemlerin seçildiği evrenlerde puanlar normal dağılıma uygun
5.
Örneklemlerin seçildiği evrenlerin varyansları homojen
•
Bu kararı vermek için örneklem varyansları karşılaştırılır.
•
ANOVA yöntemi çok güçlü olduğu için rastgele örneklem seçimi,
mükemmel normal dağılıma ve homojen varyans varsayımlarında
ihlaller olsa bile yine de kullanılabilir.
•
Örneklem büyüklüklerinin aynı olma zorunluluğu olmasa da, eşit
büyüklükteki (n) örneklemler incelendiğinde varsayımların ihlali daha
az önemlidir.
Örneklem Seçimi
•
Katılımcılar, araştırmacı tarafından bağımsız değişkenin düzeylerine
(kategorilerine) rastgele veya deneysel amaçlı olarak sistematik
biçimde konulabilir.
•
Buna göre örneklemleri oluştururken aşağıdaki yöntemler kullanılabilir:
1. Bağımsız değişkenin düzeyleri tarafından tanımlanan evrenlerden
rastgele seçim yoluyla
• Düşük, orta ve yüksek gelir gruplarından belli sayılarda kişiyi
rastgele seçme
2. Bağımsız değişkenin kategorilerine uygun mevcut durumları kullanma
• Öğretmenleri farklı yöntemler kullanan A, B ve C sınıflarını seçme
3. Katılımcıları bağımsız değişkenin düzeylerine rastgele biçimde atama
• Aynı seviyedeki öğrencileri rastgele olarak Geleneksel, İşbirlikli,
Yarışmacı ortamlara koyma
Tek Yönlü ANOVA
•
•
ANOVA analizinde t istatistiği yerine F istatistiği kullanılır. ANOVA
analizi t testleri ile benzer olup 2 örneklem durumunda çift yönlü
bağımsız örneklem t testi ile özdeştir.
 F = t2
ANOVA, örneklemleri karşılaştırırken iki bilgiyi karşılaştırır.
i.
Grupiçi Değişim Oranı (Within Group Variability)
•
Açıklanamayan varyans
•
Örnekleme hatasından kaynaklanan değişim
ii.
Gruplararası Değişim Oranı (Between Group Variability)
•
Açıklanan varyans
•
Örnekleme hatasına ek olarak uygulama etkisinden
kaynaklanan değişim
F İstatistiği
H 0 : Gruplararası Varyans  Grupiçi Varyans
H1 : Gruplararası Varyans  Grupiçi Varyans
•
Gruplararası Değişim < Grupiçi Değişim => (Between < Within)
– Örneklemler aynı evrene ait
– Gruplar arasındaki fark örnekleme hatasından kaynaklanmakta
– Uygulamanın anlamlı bir etkisi yok.
•
Gruplararası Değişim > Grupiçi Değişim => (Between > Within)
– Örneklemlerin farklı evrenlere ait olduğuna veya
– Uygulama etkisi olduğuna dair kanıt elde edilmiş olur.
F İstatistiği
•
Gruplararası değişimin (varyansın), grupiçi değişime oranı F değerini
verir ve bu F oranlarının dağılımı F dağılımını oluşturur.
Gruplararası Varyans
F
Grupiçi Varyans
F
2
Gruplararası
2
Grupiçi
s
s
•
H0 doğru ise F=1 olması beklenir.
•
H0 yanlış ise beklenen F değeri:
F>1
2
s Between
s B2
F 2
 2
sWithin
sW
F Dağılımı
•
Ortalamanın beklenen değeri
1’dir.
•
Dağılımın en düşük limiti 0
olduğundan dağılımın şekli
– Pozitif Çarpık
•
F istatistiğinde de F dağılımı
esas alınarak H0 doğru iken
hesaplanan F değeri (FHESAP)
serbestlik dereceleri ve
anlamlılık seviyesine göre
belirlenen FKRİTİK ile
karşılaştırılır.
•
FHESAP < FKRİTİK ise H0 kabul
•
FHESAP ≥ FKRİTİK ise H0 red
F Dağılımı
•
F dağılımı da t dağılımı gibi tek bir dağılım olmayıp bir aile dağılımıdır.
Yani, F dağılımı örneklem sayısına ve büyüklüğüne göre değişir.
Bu nedenle, F dağılımında iki tür serbestlik derecesi tanımlanır.
 dfGRUPLARARASI (dfBETWEEN)
Örneklem sayısı, k ile belirlenir.
df B  k  1
 dfGRUPİÇİ (dfWITHIN)
Örneklem büyüklükleri n ve örneklem
büyüklükleri toplamı (N) ile belirlenir.
dfW  (n1  1)  (n2  1)  ...  (nk  1)
sB2
F 2 
sW
df B
k 1

df W N  k
n1  n2  ...  nk  n ise
dfW  k .(n  1)  N  k
df Pay

df Payda
F Dağılımı
• F dağılımı pozitif çarpık olduğundan
F değerini çok yüksek bulma ihtimali
çok düşük bulma ihtimalinden fazladır.
F Testi
•
F testini, t istatistiğinde olduğu gibi olasılıkları kullanarak ta
yapabiliriz. Bunun için öncelikle hipotezleri tanımlarsak
H 0 : μ1  μ 2  μ i  ...  μ k
H 0 : μ i  μ Genel  0 (Tüm i' ler için)
H1 : En az bir populasyonun ortalaması digerlerinden farklı
H1 : μ i  μ Genel  0
(En az bir " i" için)
•
F testinde karar vermek için H0 doğru iken hesaplanan F değerinin
gözlenme olasılığı (p) belirlenir. Bu olasılık, (α=,05 için)
•
p > ,05 ise H0 kabul
•
p ≤ ,05 ise H0 red
F Testi
Toplam Varyans  Grupiçi Varyans  Gruplararası Varyans
•
Örneklemimizdeki her birey için “i” ve her grup (bağımsız değişken
düzeyini) için “g” değişkeni kullanılırsa varyans (s2) formülü
s 
2
2
(
X
X
)

 gi Genel
g
i
N 1
•
Varyansın ortalama bir ölçüsü için ortalamadan sapmaların kareleri
toplamı serbestlik derecesine (n-1) bölünmektedir.
•
Buna göre varyans ölçüsünü serbestlik derecesi ile çarparsak
Kareler Toplamı (Sums of Squares) terimini elde ederiz.
s 2 .( N  1)   ( X gi  X G ) 2  Kareler Toplamı
g
i
Kareler Toplamları (Sums of Squares: SS)
•
Toplam Kareler Toplamı (Sums of Squares Total)
SST   ( X gi  X G )
g
•
i
Grupiçi Kareler Toplamı (Sums of Squares Within)
SSW   ( X gi  X g )
g
•
2
2
i
Gruplararası Kareler Toplamı (Sums of Squares Between)
SS B   ng .( X g  X G )
g
2
Kareler Ortalaması (Mean of Squares: MS)
•
Değişkenliğin ortalama değerlerini tahmin için kareler toplamı
değerlerini kendilerine ait serbestlik derecelerine bölerek Kareler
Ortalaması (MS) değerleri hesaplanır.
•
Grupiçi Kareler Ortalaması (Mean Square Within)
SSW
MSW 
N k
•
Gruplararası Kareler Ortalaması (Mean Square Between)
SS B
MS B 
k 1
F Testi
Gruplararası Varyans
F
Grupiçi Varyans
•
Yukarıdaki işlemlerde önce gruplararası ve grupiçi toplam varyansları
hesapladık.
– Sums of Squares
•
Sonra ise bu varyansların ortalama değerlerini hesapladık.
– Mean Squares
•
Buna göre, hesaplanan F değeri
MSB
F
MSW
ANOVA Modeli
ANOVA Modeli
ANOVA Modeli
F=1
F>1
Örnek 1
•
Yandaki tabloda 1. ve 2. sınıf
öğrencilerine uygulanan bir beceri
testinden alınan puanlar verilmiştir.
Öğrencilerin beceri testi puanlarının
sınıf düzeyine göre farklılık gösterip
göstermediğini yorumlayınız (α=,05)
 (1. Sınıf: Ẋ =2
 (2. Sınıf: Ẋ =3
s=2)
s=2)
Sınıf
Puan
1
0
1
1
1
3
1
5
1
1
2
1
2
2
2
4
2
6
2
2
Örnek 1
Örnek 1
Örnek 1
Varyansın
Kaynağı
Gruplararası
(Between)
Grupiçi
(Within)
Toplam
Kareler
Toplamı (SS)
Serbestlik
Derecesi (df)
Kareler
Ortalaması (MS)
F
Örnek 1
Örnek 2 (9.1)
•
5’er kişiden oluşan üç farklı çalışma grubunun bir performans testinden
aldıkları puanlar tablodaki gibi ise bu grupların ortalama performans
puanları arasında anlamlı bir fark olup olmadığını araştırınız.
Grup 1
Grup 2
Grup 3
9
4
1
12
6
3
4
8
4
8
2
5
7
10
2
Örnek 2 (9.1)
Örnek 2 (9.1)
Varyansın
Kaynağı
Gruplararası
(Between)
Grupiçi
(Within)
Toplam
Kareler
Toplamı (SS)
Serbestlik
Derecesi (df)
Kareler
Ortalaması (MS)
F
Örnek 2 (9.1)
ANOVA Modelleri
•
ANOVA için bağımsız değişken kategorileri (Grup özellikleri)
araştırmacı tarafından önceden belirlenmiş ise:
– Sabit Etki Modeli (Fixed Effects ANOVA)
•
ANOVA ile doğal şartları içinde bir olay araştırılıyorsa yani bağımsız
değişken kategorileri araştırma yöntemine göre yansız olarak ortaya
çıkıyorsa:
– Rastgele Etki Modeli (Random Effects ANOVA)
•
Her iki durumda da ANOVA hesaplamaları aynıdır fakat sonuçlarla
yapılan yorumlar farklıdır.
F İstatistiği
•
Hipotezlere bakıldığında F istatistiğinde (ANOVA’da) testler tek
yönlü mü yokça çift yönlü mü yapılabilir? Neden?
– İpucu: Aşağıdaki gibi bir hipotez nasıl test edilebilir?
• H0: μ1 < μ2 > μ3
•
ANOVA ile 3 veya daha fazla grubun ortalamaları birbiri ile
karşılaştırılabilir demiştik. Fakat sırası ile (1 ile 2, 1 ile 3, 2 ile 3)
karşılaştırmalarını t istatistiği ile yapsaydık herhangi bir sorun ortaya
çıkar mı?
– İpucu: Tanımlanan 3 istatistiksel test birbirinden bağımsız mıdır?
 İlk iki testte X1> X2 ve X1< X3 bulunduysa X2< X3 olduğu 3. testi
yapmadan önce bilinir.
 Bu nedenle, yaptığımız testlerde 1. Tür hata yapma ihtimalimiz
anlamlılık düzeyi (α=,05 veya α=,01) değerlerini aşmış olur.
Varyansların Homojenliği Varsayımı Testi
• ANOVA analizi varsayımlarından birisi de örneklemlerin seçildiği evrenlerin
varyantlarının homojen olduğuydu.
H 0 :  12   22  ...   k2
• Bu varsayımı test etmek için örneklem varyansları kullanılır.
i. Örneklemler arasında varyansı en yüksek ve en düşük olanlar seçilir.
ii. En yüksek varyansın en düşük varyansa oranı yine bir F değeridir.
2
sMaksimum
F 2
sMinimum
iii.Hesaplanan F değerine karşılık serbestlik dereceleri ve anlamlılık düzeyine
göre FKRİTİK belirlenir.
• FHESAP < FKRİTİK ise H0 kabul (Varyanslar homojen)
• FHESAP ≥ FKRİTİK ise H0 red (Varyansların homojenliği varsayımı sağlanmıyor)
Post-Hoc Çoklu Karşılaştırma Testleri
•
ANOVA ile yapılan hipotez testinde H0 reddedildi ise:
– İncelenen gruplar arasında anlamlı bir fark olduğuna karar
verilmiştir.
– Fakat, ANOVA ile incelenen grup sayısı 2’den fazla olduğu için
hangi gruplar arasında anlamlı fark olduğu bilinmemektedir.
•
Ayrı ayrı t testi yapmak toplamdaki 1. tür hata oranımızı α’dan büyük
yapacağı için
– Toplam hata oranı α’yı aşmayacak biçimde grup ortalamalarını
karşılaştırarak anlamlı farkların hangi gruplar arasında olduğunu
belirleyecek çoklu karşılaştırma testlerine ihtiyaç vardır.
•
Çoklu karşılaştırma testleri, ANOVA testi sonucunun anlamlı
olmasına göre yapıldığından Post-Hoc testleri olarak adlandırılır.
Post-Hoc Çoklu Karşılaştırma Testleri
•
En yaygın olarak kullanılan Post-Hoc Testleri
1.
Fischer’s LSD (Least Significant Differences)
•
En küçük anlamlı fark testi
2.
Tukey’s HSD (Honestly Significant Differences)
•
Dürüstçe anlamlı fark testi
3.
Scheffe Testi
Fischer’s LSD
•
Bağımsız değişkenin (faktör) iki düzeyine ait ortalamaları karşılaştırır.
H 0 : μ1  μ 2
•
t istatistiğini kullanır.
– Grup büyüklükleri eşit veya değilken kullanılabilir.
t LSD 
•
X1  X 2
1 1
MSW .(  )
n1 n 2
Hesaplanan t değeri, grupiçi serbestlik derecesine göre t dağılımından
(Ek E) bulunan tKRİTİK ile karşılaştırılarak H0 hakkında karar verilir.
df W  N - k
Tukey’s HSD
•
Grupların büyüklükleri bağımsız değişkenin tüm düzeyleri için aynı
olduğunda tercih edilir.
H 0 : μ1  μ 2
•
Studentized Range Distribution (q) istatistiğini kullanır.
– Ortalamalar arası farkın standart hataya oranı ile q hesaplanır.
q HSD 
•
X1  X 2
MSW
n
Karşılaştırılan ortalama sayısı ve grupiçi serbestlik derecesine göre q
dağılımından (Ek G) bulunan qKRİTİK ile hesaplanan q karşılaştırılarak
H0 hakkında karar verilir.
df W  N - k
Scheffe & Tukey’s HSD
•
Scheffe en yaygın kullanılan post-hoc testlerinde birisidir.
Örneklem ortalamalarının hem ikili karşılaştırmaları hem de iki grup
kombinasyonlu karşılaştırmalarda kullanılabilir.
•
Tukey’s HSD testi Scheffe’den daha yüksek güç (power) sağladığı
için birçok araştırmacı tarafından tercih edilir.
– Tukey’s HSD sadece ikili karşılaştırmalar yapılacağı zaman
tavsiye edilir.
– Fakat Tukey’s HSD ile ikiden fazla ortalamayı içeren
karşılaştırmalar yapılamaz.
En Uygun Post-Hoc Testi Seçimi
•
Post-Hoc yöntemlerinin her birinin birbirine göre avantajları ve
dezavantajları olduğu için her durumda sadece tek bir yöntem
kullanılması tavsiye edilmez.
•
Bazı istatistikçiler, en uygun Post-Hoc testinin seçimi için SPSS ile
tüm Post-Hoc testlerinin yapılmasını tavsiye eder.
– Fakat bu demek değildir ki anlamlı sonuç avına çıkalım!!!
•
SPSS ile yapılan tüm Post-Hoc testleri arasında en küçük kritik
değere sahip (en dar güven aralığına sahip) testin seçilmesi tavsiye
edilir.
– Bu özellikleri sağlayan test bu araştırma için en güçlü testtir.
– Yani α anlamlılık seviyesinde (1. Tür hata limiti) 2. Tür hata oranı
minimum olan testtir.
Etki Büyüklüğü
•
ANOVA’da incelenen örneklemler için değişkenler arası ilişkinin
gücünü karşılaştırmada en yaygın kullanılan istatistik: η2 (Eta-Kare)
SS B
 
SST
2
•
η2, 0 ile 1 arasında değer alır ve bağımlı değişkendeki değişimin
(toplam varyansın ) % kaçının bağımsız değişken tarafından
açıklandığını gösterir.
 2 ,01  Küçük Etki Büyüklüğü
 2 ,06  Orta Etki Büyüklüğü
 2 ,14  Geniş Etki Büyüklüğü
Örnek 2
•
Örnek 2’deki verileri kullanarak η2 etki büyüklüğünü hesaplayınız
ve yorumlayınız.
Etki Büyüklüğü
•
η2, örneklemler için etki büyüklüğünü açıklar.
•
Evrendeki açıklanan varyans oranı hakkında yorum yapmak için w2
(Omega-Kare) kullanılır.
SS B  (df B ).MSW
 
SST  MSW
2
•
w2, evrende bağımlı değişkenin toplam varyansının % kaçının
bağımsız değişken tarafından açıklandığını gösterir.
Örnek 2
•
Örnek 2’deki verileri kullanarak w2 etki büyüklüğünü hesaplayınız ve
yorumlayınız.
Download

Tek Yönlü Varyans Analizi