HİPOTEZ TESTLERİ Yrd. Doç. Dr. Esra Kürüm HİPOTEZ TESTLERİ •  Hipotez testleri, araş8rma sonucunda elde edilen değerlerin ya da varılan sonuçların [email protected]@ksel olarak önem taşıyıp taşımadığını bir diğer deyişle anlamlı olup olmadığını test etmek için başvurulan yöntemlerdir. HİPOTEZ TESTLERİ •  Hipotez testlerinin amacı; araş8rmacılara popülasyondan çekilen örneklem(ler) yardımıyla popülasyon hakkında bir karara varma konusunda yardımcı olmak8r. •  Hipotez testlerinden elde edilen sonuçlara göre bazı kararlara varıldığı için bu testlerinin doğru ve uygun olarak seçilmesi çok önemlidir. HİPOTEZ TESTLERİ •  Geçerliliği olasılık esaslarına göre araş8rılabilen ve bir karar verebilmek için öne sürülen varsayımlara [email protected]@kte “hipotez” denir. •  [email protected]@ksel hipotezler örneklemlerin çekildiği popülasyon parametreleri ile ilgili önermelerdir. •  Tüm bilim dallarında yapılan araş8rmaların sonucunda bazı varsayımlar ya da hipotezler ortaya a8labilir. •  Bu hipotezler kontrol (test) edilmeleri sonucunda anlam kazanır. Hipotezlerin örneklem yardımıyla incelenmesine “Önem Kontrolü” ya da “Hipotez [email protected] denir. HİPOTEZ TESTLERİ •  Hipotez [email protected] basit olarak yapılan işlem, bir hipotez ile onun zıddı olan diğer bir hipotezden hangisinin örneklemden elde edilen sonuçla daha iyi bağdaş8ğını gö[email protected] Hipotez testi 5 aşamalıdır: 1.  Hipotezlerin (sıOr ve [email protected] hipotezler) belirlenmesi 2.  Anlamlılık düzeyinin (α) belirlenmesi 3.  [email protected]@k [email protected] belirlenmesi, gerekli test [email protected]@ğinin ve p değerinin hesaplanması 4.  Karar: SıOr hipotezinin ret/ret edilmeme durumunun belirlenmesi 5.  Yorum 1. Hipotezlerin belirlenmesi •  [email protected]@kte kullanılan iki tür hipotez vardır: •  H0 Farksızlık hipotezi, SıOr hipotezi, Yokluk hipotezi (Null hypothesis) •  H 1 [email protected] hipotez, Seçenek hipotez ([email protected] hypothesis) Alternatif Hipotez •  [email protected] hipotez tek yönlü (one-­‐sided) ya da çi^ yönlü (two-­‐
sided) olarak kurulabilir. •  Tek yönlü hipoteze örnek; H1 : µ < 20 ya da H1 : µ > 20 •  İki yönlü hipoteze örnek; H1 : µ ≠ 20 Test
Sonucu H0
Gerçekte H0
Doğru
Yanlış
Ret
edememe
Doğru Karar
II. Tür Yanılgı (β)
Ret
I. Tür Yanılgı
(α)
Doğru Karar (Testin
gücü)
α : Anlamlılık Düzeyi
(1-β) : Testin Gücü
2. Anlamlılık düzeyi (Risk derecesi) •  α, gruplar arasında fark vardır, ya da ilişki vardır derken yapılan hata miktarı veya Ho hipotezi doğru iken onu yanlışlıkla reddetme olasılığı olarak tanımlanabilir. •  Genellikle risk derecesi olarak %5=0,05 ve %1=0,01 kullanılmakla birlikte bu tercihi bir durumdur. Risk derecesi temelde doğru olan sıOr hipotezinin reddedilme olasılığını gösterir. Anlamlılık düzeyi (Önem derecesi) 4. Karar •  Anlamlılık düzeyi kullanılarak iki şekilde sıOr hipotezinin ret ya da ret etmeme durumuna karar verilir: 1.  Anlamlılık düzeyi ile p değeri karşılaş8rılabilir. 2.  Anlamlılık değerine karşılık gelen [email protected] değer bulunur ve bu değer ile test [email protected]@ği karşılaş8rılır. P değeri •  [email protected]@ksel hipotez testlerinde I. tür yanılgı test sonucunda hesaplanır (p) ve önceden belirlenmiş α değeri ile karşılaş8rılarak karar verilir. Bu durumda I. tür yanılgının gerçekleşen (hesaplanan) değeri, (p) ve öngörülen en büyük (sınır) değeri α’dır. Karar •  p ≤ α ise H0 ret edilir. Bunun anlamı, H0’ı ret etmekle gerçekleşen yanılgı öngörülenden küçüktür. •  p > α ise H0’i ret edecek yeterli kanıt olmadığı sonucuna varılır. Bunun anlamı gerçekleşen yanılgı öngörülenden küçük olmadığı için H0 reddedilemez. •  Not: Tek yönlü̈ hipotez tes@ için α direk alınır iken iki yönlü̈ hipotez [email protected] alan belirlenirken α yerine α/2 değeri ile işlem yapılır. Kritik Değer •  SıOr hipotezinin doğru olduğu varsayımı ile olasılığı α olan değer [email protected] değerdir. İlgili [email protected]@k tes@ için değişmekle birlikte [email protected] değer standart normal dağılımlar için z* ile gösterilir. •  Örneğin α = 0,05 ve tek yönlü bir [email protected] hipotez için [email protected] değer 1.645’dir. 3. HİPOTEZ TESTLERİ •  Hipotez testleri en genel anlamda ikiye ayrılır: 1.  Parametrik testler 2.  Parametrik olmayan testler Hipotez testleri
Parametrik Hipotez
Testleri
Parametrik Olmayan
Hipotez Testleri
•  Örneklem(ler) rasgele olmalıdır.
•  Kitle normal dağılmalıdır.
•  Kitlenin normal dağılması gerekmez.
• Denek sayısı kısıtlaması yoktur.
18
HİPOTEZ TESTLERİ •  Parametrik testler, parametrik olmayan testlere göre daha güçlü testlerdir. Fakat kullanılabilmeleri için bazı varsayımların sağlanması gerekir. •  Parametrik olmayan testler, parametrik testlere seçenek olarak kullanılır. Çoğunlukla da kitlenin normal dağılma koşulunu sağlamadığı durumlarda kullanılır. •  Parametrik testler, kitle ortalaması, oranı, standart sapması üzerine kurulmuş hipotezleri test ederken; parametrik olmayan testler ortanca yada örneklem (ler) dağılımı (ları) üzerine kurulmuş hipotezlerin test edilmesi işlemlerini içerir. HİPOTEZ TESTLERİ •  Parametrik testlerde ham veriler üzerinden ortalama, varyans gibi ölçütler elde edilerek işlemler yapılır. •  Parametrik olmayan testlerde ise ham veriler sıralanır ve sıra numaraları verilir. İşlemler bu sıra numaraları üzerinden yapılır. HİPOTEZ TESTLERİ [email protected]@ksel hipotez testleri çeşitli durumlarda ve farklı amaçlarla uygulanır. Bu testlerin başlıca kullanım alanları şunlardır: 1.  Popülasyondan seçilen tek örneklemden elde edilen veriler yardımıyla, popülasyon parametresinin belli bir değere eşit olup olmadığının test edilmesinde. HİPOTEZ TESTLERİ 2.  Popülasyondan seçilen iki ya da daha fazla grup arasındaki farkın önemli olup olmadığının test edilmesinde. 3.  Aynı grupta farklı koşullar al8nda elde edilen veriler arasındaki farkın önemli olup olmadığının test edilmesinde. 4.  Bir örnek gruptan elde edilen iki değişkenin bağımsız olup olmadığının test edilmesinde. HİPOTEZ TESTLERİ Yukarda [email protected] amaçlarla uygulanan çok sayıda hipotez tes@ vardır. Hipotez testlerinin uygulanmasında en önemli adım, uygulanacak [email protected] doğru seçilmesidir. Uygun [email protected] seçiminde göz önünde bulundurulması gereken çeşitli faktörler vardır. HİPOTEZ TESTLERİ •  Uygun test seçimi aşağıdaki durumlara bağlıdır: 1.  Verilerin ölçüm biçimi 2.  Karşılaş8rılacak grup sayısı 3.  İncelenen grupların bağımlı ya da bağımsız olması 4.  Verilerin Dağılımı -­‐ Normal Dağılım 1. Verilerin ölçüm biçimi •  Değişkenleri nitel ve nicel değişkenler olarak iki kısımda inceleyebiliriz. •  Nitel: Nitelik belirleme amacına yönelik gözlemlerin sonucunda elde edilir, sayısal olmayan değişkenlerdir. •  Nicel: Sayısal ölçeklerle ifade edilebilen ve miktar ile ilgili bilgileri veren değişkenlerdir. 2. Karşılaş8rılacak grup sayısı •  Test edilecek veriler; bir, iki veya ikiden fazla gruba ayrılmış olabilir. Grup sayısının ikiden fazla olması, çoklu karşılaş8rma olarak kabul edilir. Grup sayısı uygulanacak [email protected] seçimini etkiler. Örneğin bazı testler sadece iki grubu karşılaş8rabilirken, bazıları ikiden fazla grubun karşılaş8rılmasına izin verir. 3. İncelenen grupların bağımlı ya da bağımsız olması •  Grupların ayrı ayrı bireylerden oluşması ve bir deneğin seçiminin diğeri ile bağlan8lı olmaması durumunda gruplar bağımsızdır. •  Aynı bireyler üzerinde gözlemlerin tekrarlanması durumunda ise gruplar bağımlıdır. •  Grupların bağımlı veya bağımsız olması durumunda uygulanacak önemlilik testleri birbirinden farklıdır. 4. Verilerin Dağılımı -­‐ Normal Dağılım •  Gruplardaki gerek veri sayısı gerekse verilerin dağılımının Normal olup olmaması hem uygulanacak [email protected] seçimini hem de elde edilen test sonucunun güvenirliğini etkiler. Bazı testlerin uygulanabilmesi için gruplarda yer alan verilerin Normal dağılıma sahip olması gerekir. NORMALLİK TESTİ •  Verilerin dağılımının Normal Dağılım gösterip göstermediği R, SPSS, STATA gibi yazılım programlarında test edilebilmektedir. •  Shapiro-­‐wilk test yapılarak ve Q-­‐Q plot çizilerek yapılabilir. •  STATA: Shapiro wilk test •  swilk: •  [email protected]@cs > Summaries, tables, and tests > [email protected] plots and tests > Shapiro-­‐Wilk normality test Q-­‐Q plot UYGUN TEST SEÇİMİ / 40
32
Varsayımlar •  1 grup, Student t test: •  Veriler normal dağılımdan gelmelidir. •  2 grup, bağımlı gruplar, Student t test: •  Gruplar arası fark normal dağılmalıdır. •  2 grup, bağımsız gruplar, Student t test: •  Her iki gruptaki veriler normal dağılmalıdır. •  ANOVA: •  Veriler normal dağılımdan gelmelidir. •  Gruplar arası varyans eşitliği gereklidir. 2
χ BAĞIMSIZLIK TESTİ •  Sayısal olmayan değişkenler arasındaki ilişkinin var olmadığı başlangıç̧ hipotezi (H0) kurularak daha sonrasında bu hipotezin ret etmeme/ret durumunu belirlemek için yap8ğımız [email protected]@k χ2 [email protected] •  Burada elimizde iki nitel değişken vardır. Bu değişkenler içinse farklı özellikler (sınıflar) söz konusudur. •  χ2 tes@ ile bu değişkenler arasında ilişki olup olmadığı kontenjans tabloları yardımı ile bulunur. Kontenjans tablosu •  Yatay (sa8r) ve düşey (sütun) eksenlerde değişkenlere ait gözlenen frekans değerleri yazılarak elde edilen bir tablodur. Genel olarak kontenjans tablosu şu şekildedir: 2
χ BAĞIMSIZLIK TESTİ •  Her hücrenin gözlenen ve beklenen değeri vardır. •  Beklenen değer iki nitel değişkenin bağımsız olması durumunda bu hücredeki sayının değeridir. •  Her hücrenin beklenen değeri 5 ve 5’den fazla değer varsa ki-­‐
kare tes@ yapılabilir. Eğer bu varsayım sağlanmıyorsa Fisher’s exact test yapılmalıdır. Veri seti •  This data set is collected on women aged 55-­‐80 years with osteoporosis. This trial is being conducted at 11 clinical centers around the United States with a [email protected] center at UC San Francisco. [email protected] were randomly assigned to one of the two groups: placebo and alendronate, which is an aminobisphosphonate and suspected to reduce the rate of fractures. Placebo group did not receive any kind of [email protected] Sorular 1.  Ortalama kolesterol seviyesi 150 midir? 2.  Sigara içen ve içmeyenlerin ortalama kolesterol seviyelerinin karşılaş8rılması 3.  Başlangıçta omur çatlağı olanlarla olmayanların ortalama kolesterol seviyelerinin karşılaş8rılması 4.  İlaç verilenler ile placebo alanların ortalama kemik mineral yoğunluğunun karşılaş8rılması 5.  Sigara içimi ile başlangıçta omur çatlağı olması değişkenleri bağımsız midir? 1. Ortalama kolesterol seviyesi 150 midir? 1. Ortalama kolesterol seviyesi 150 midir? •  One Sample t-­‐test • 
• 
• 
• 
t = 63.3047, df = 1103, p-­‐value < 2.2e-­‐16 [email protected] hypothesis: true mean is not equal to 150 95 percent confidence interval: (225.5104, 230.3410) mean of x : 227.9257 •  Sign test •  V = 606225, p-­‐value < 2.2e-­‐16 •  [email protected] hypothesis: true [email protected] is not equal to 150 2. Sigara içen ve içmeyenlerin ortalama kolesterol seviyelerinin karşılaştırılması 2. Sigara içen ve içmeyenlerin ortalama kolesterol seviyelerinin karşılaştırılması •  Welch Two Sample t-­‐test • 
• 
• 
• 
t = 1.3384, df = 193.724, p-­‐value = 0.1823 [email protected] hypothesis: true difference in means is not equal to 0 95 percent confidence interval: (-­‐2.208061, 11.531886) mean of x mean of y : 232.1197 227.4578 •  Wilcoxon rank sum test •  W = 73065.5, p-­‐value = 0.09983 •  [email protected] hypothesis: true [email protected] shi^ is not equal to 0 5. Sigara içimi ile başlangıçta omur çatlağı olması değişkenleri bağımsız midir? Sigara icimi/ Omur catlagi No Yes Non-­‐smoker 125 823 Smoker 21 121 •  Pearson's Chi-­‐squared test •  X-­‐squared = 0.2829, df = 2, p-­‐value = 0.8681 Warning message: In chisq.test(mytable) : Chi-­‐squared [email protected] may be incorrect •  Fisher's Exact Test •  p-­‐value = 0.7405 Sorular 6.  Her ırkın ortalama kolesterol seviyesi eşit midir? 7.  Her ırkın ortalama kemik mineral yoğunluğu eşit midir? 6. Her ırkın ortalama kolesterol seviyesi eşit midir? 6. Her ırkın ortalama kolesterol seviyesi eşit midir? •  Equality of variances: Levene’s test: p-­‐value = 0.106 •  ANOVA: p-­‐value = 0.9310 •  Kruskal Wallis: p-­‐value = 0.8985 Kaynak h‚p://www.ats.ucla.edu/STAT/stata/whatstat/default.htm h‚p:[email protected]/ 
Download

Hipotez testleri genel bilgi