04.10.2014
NORMALLİK TESTLERİ
VERİLERİ YÜZDE VE
FREKANSLARLA
BETİMLEME
BİR GRUP NİCEL VERİYE
İLİŞKİN TANIMLAYICI
İSTATİSTİKLERİ VERME
Abdullah Can
PARAMETRİK TESTLERDE, (kabul edilen belli bir hata
düzeyinde), örneklemden elde edilen verilerden yola
çıkılarak, evrene ilişkin parametre değerler hakkındaki
önermelerin doğruluğu araştırılır.
Bunun yapılabilmesi için, örnekleme ilişkin değerlerin,
olasılığa dayandırılarak genelleştirilmesi gerekir.
Diğer yandan, evrene ilişkin parametre değerleri,
kuramsal dağılımlardan üretilir.
Abdullah Can
1
04.10.2014
Mevcut değişkenler ve aldıkları
değerlerle parametrik testlerin
yapılabilmesi
için,
verilerin
dağılımının, belli koşulları sağlayıp sağlamadığının önceden
bilinmesi gerekir.
Abdullah Can
Parametrik
testlerde
genel
olarak
sayıtlıların sağlanmış olması gerekir:
şu
1-Veriler en az aralık ölçeğinde (oran da
olabilir) olmalıdır.
2-Veriler normal dağılıma uymalıdır.
3-Birden fazla grup söz konusu ise,
grupların varyansları (değişkeleri) eşit
olmalıdır. (grupların varyansları arasında fark yoktur şeklindeki) yokluk
hipotezinin kabul edilmesi)
Abdullah Can
2
04.10.2014
Araştırmacıya düşen en önemli görev, BİR
PARAMETRİK TEST YAPMADAN ÖNCE, VERİLERİN
DAĞILIMININ
O
TESTİN
SAYILTILARINI
KARŞILAYIP
KARŞILAMADIĞINI
KONTROL
ETMESİ, SAYITLILAR KARŞILANMIYORSA (DOĞRU
OLMAYAN SONUÇLAR RAPOR ETME GİBİ (ETİK
BOYUTU DA OLAN) BİR HATAYA DÜŞMEMEK İÇİN
ALTERNATİF TESTLERLE SONUCA GİTMEYE
ÇALIŞMASIDIR.
Bu noktada, bilimsel araştırmada önemli
olanın, arzulanan sonucu bulmak değil,
gerçek sonucu doğru olarak
bulmak olduğu göz ardı edilmemelidir.
Abdullah Can
Örneklem sayısı 30’un altında kalan gruplarda
verilerin dağılımının normallik özellikleri göstermesi
zayıf bir olasılıktır
Verilerin
(1-Hiç katılmıyorum ….5-Tamamıyla katılıyorum
gibi)
adımlı ölçeklerle toplandığı durumlarda,
herhangi bir verinin tamsayı dışında değerler
alaMIyor olması verilerin sürekliliğini
“kabul ettiğimiz” anlamına
gelmektedir.
Abdullah Can
3
04.10.2014
MERKEZİ EĞİLİM ÖLÇÜLERİYLE
NORMALLİĞİN KONTROLÜ
İdeal bir normal dağılımda, ortalama
ortanca ve tepe değer çakışık olur.
Ortalaması, ortancası ve tepe değeri çakışık olan bir
dizinin dağılım grafiği SİMETRİK BİR ÇAN EĞRİSİ
şeklindedir.
Dağılımın histogramı (dağılım grafiği) çizdirilerek,
grafiğin ne derece simetrik bir çan eğrisine
benzediğine bakılarak da, “normalliğe benzerlik”
görsel olarak değerlendirilebilir.
Abdullah Can
Abdullah Can
4
04.10.2014
DAĞILIMIN ÇARPIKLIK VE BASIKLIK
KATSAYISINA GÖRE NORMALLİĞİN
KONTROLÜ
İdeal bir dağılımın çarpıklık katsayısı ve basıklık
katsayısı 0 (sıfır) olmalıdır.
çarpıklık katsayısını ve basıklık katsayısını, sırasıyla, çarpıklığın
ve basıklığın standart hatasına böldüğümüzde, çıkan değerler
-1.96 ile +1.96 arasında kalıyorsa, dağılımı normal kabul
edebiliriz
Çarpıklık katsayısının -1, +1 arası değerleri normalliği
gösterebilir.
Çarpıklığı ve basıklığı, çarpıklığın ve basıklığın standart hatasına bölmek, bu
katsayının ortalamanın kaç standart sapma üzerinde ya da altında kaldığını
bulmaktır. Eğer çarpıklık ya da basıklık ortalamanın ±1.96 aralığında
kalıyorsa, çarpıklık ya da basıklık değeri, toplam değerlerin %95’inin içinde
yer aldığı bir değere sahip demektir. Başka bir ifadeyle, dağılımı bozan
%5’lik uç değerler arasında DEĞİLDİR demektir.
Abdullah Can
NORMALLİK TESTLERİYLE NORMALLİĞİN
KONTROLÜ
KOLMOGOROV-SMIRNOV
(Veri sayısının 30 ve üzeri olduğu durumlarda)
Eldeki verilerin, tanımlanmış bir evrenin normal olasılık dağılımına uyup
uymadığını sınama esasına dayanır. Test ettiği hipotez, “Mevcut verilerin
dağılımı ile normal olasılık dağılımı arasında fark yoktur.” şeklindeki yokluk
hipotezidir
SHAPIRO-WILK
(Veri sayısının 30’un altında durumlarda)
Bir örneklem veri kümesinin, normal dağılım sergileyen bir evrenden gelip
gelmediğini sınar. Test ettiği hipotez, “Verilerin dağılımı ile normal dağılım
sergileyen evrenin dağılımları arasında fark yoktur.” şeklindeki yokluk
hipotezidir.
Abdullah Can
5
04.10.2014
NORMALLİK TESTLERİYLE NORMALLİĞİN
KONTROLÜ
Abdullah Can
NORMALLİK TESTLERİYLE NORMALLİĞİN
KONTROLÜ
Her iki testte de tabloda (Sig.) ile gösterilen
p değerinin
0.05’ten büyük olması
(“normal dağılımla aralarında
fark yoktur” şeklindeki yokluk hipotezinin kabul edilerek)
normalliğin sağlandığı anlamına gelmektedir.
Abdullah Can
6
04.10.2014
VERİLERİN KUTU-ÇİZGİ GRAFİĞİNE
BAKILARAK NORMALLİĞİN KONTROLÜ
Merkezi eğilim ölçülerinin yanı sıra çeyrek dağılımları da
değerlendirmeye alarak, dağılımın ne şekilde ortaya çıktığının
özel bir çizim aracılığı ile görsel olarak kontrol edilmesidir
Kutunun üst ve
altındaki dikey
çizgilerin boylarının
birbirine yakın
olması, kutudaki
yatay çizginin kutuyu
ortalaması
Abdullah Can
VERİLERİN KUTU-ÇİZGİ GRAFİĞİNE
BAKILARAK NORMALLİĞİN KONTROLÜ
Kutunun uzunluğu birinci ve üçüncü çeyrek dilimler arası
mesafeyi gösterir ve bu mesafeye “kartiller arası değişim aralığı”
denir. Kartiller arası değişim aralığının verilerin standart
sapmasına bölümü sonucu elde edilen değer de normalliğin
kontrolü için bir ölçüt sayılabilir. Çıkan değerin 1,3 civarında
olması verilerin normal dağıldığını gösterir
Abdullah Can
7
04.10.2014
VERİLERİ YÜZDE VE FREKANSLARLA
BETİMLEME
Bir yabancı dil kursunda, 18’i erkek, 32’si kız, toplam 50
öğrenci, Almanca, Fransızca ve İngilizce öğrenmektedirler. Kurs
kayıtlarından, öğrendikleri dillerle birlikte öğrenci listesi
alınmıştır. Ardından, öğrencilerin cinsiyetleri, kızlar 1 olarak,
erkekler de 2 olarak, her bir öğrencinin öğrendiği dil de,
Almanca ise 1 olarak, Fransızca ise 2 olarak, İngilizce ise 3
olarak kodlanmış ve SPSS’e girilmiştir.
BU KURSTA ÖĞRENCİLERİN ÖĞRENDİKLERİ YABANCI DİLLER, ÖĞRENCİLERİN
CİNSİYETLERİNE GÖRE (CİNSİYET DEĞİŞKENİNİN KATEGORİLERİNE GÖRE)
NASIL BİR DAĞILIM SERGİLEMEKTEDİR?
Abdullah Can
Abdullah Can
8
04.10.2014
Abdullah Can
Abdullah Can
9
04.10.2014
Abdullah Can
Bu tabloların, araştırma raporlarına olduğu gibi aktarılması az da
olsa rastlanan DOĞRU OLMAYAN bir yaklaşımdır. SPSS ve diğer
yazılımlar, araştırmacının bulmak istediği sonuçları, gerekli
işlemleri yapıp, yazılımı oluşturanların tercihi olan farklı
biçimlerde sunarlar. Araştırmacı, bu sonuçları, kendi raporunun
gerektirdiği biçime dönüştürerek sunmalıdır. Örneğin CİNSİYET
değişkenine ilişkin tablo şu şekilde olabilir;
Abdullah Can
10
04.10.2014
VERİLERİN ÇAPRAZ TABLOLARLA SUNULMASI
ÇAPRAZ TABLO:
Verilerin, aynı anda birden fazla nitel değişkenin alt
kategorilerine nasıl dağıldığının gösterilmesi.
Bu amaçla SPSS ile satırları ve sütunları farklı nitel
değişkeni gösteren çapraz tablolar hazırlanabilir.
Abdullah Can
Abdullah Can
11
04.10.2014
Abdullah Can
BİR GRUP NİCEL VERİYE İLİŞKİN BETİMSEL (TANIMLAYICI)
İSTATİSTİKLERİ (MERKEZİ EĞİLİM VE DEĞİŞKENLİK ÖLÇÜLERİNİ)
VERME
Öğrencilerin matematik başarıları ile yazılı anlatım
becerileri arasında bir ilişki olduğunu düşünen bir
araştırmacı, bu öngörüsünü sınamak için, matematik
puanları ile yazılı anlatım (kompozisyon) puanları arası
ilişkiye bakmak istemektedir. Araştırmasının bir
yerinde, üzerinde işlem yaptığı puanlara ilişkin
tanımlayıcı istatistikleri de vermek istemektedir.
Öğrencilerin Matematik puanlarının merkezi eğilim ve
değişkenlik ölçüleri nelerdir?
Abdullah Can
12
04.10.2014
Abdullah Can
Abdullah Can
13
04.10.2014
Abdullah Can
Abdullah Can
14
Download

normallik testleri verileri yüzde ve frekanslarla betimleme bir grup