THY ANALİZLERİ
Ki – Kare Testi
KARL PEARSON (1857 - 1936)
Temel ilgi alanı genetiktir. 1892’de “The
Grammar
of
Science”
adlı
kitabı
yayınlandı.İzleyen yıllarda kalıtım ve evrim
süreçlerine ilişkin çalışmalar sırasında istatistikle
ilgilendi.
Regresyon ve korelasyon konularındaki önemli
katkılarının yanı sıra, kuramda kendi adıyla
anılan
ve
gözlem
değerlerinin
olasılık
dağılımlarına ilişkin Pearson eğri sistemini ve
1912 yılında da Ki-kare testini geliştirdi.
GİRİŞ

İstatistikte değişkenler, sayısal (nicel) değişkenler ve sayısal olmayan
(nitel) değişkenler olmak üzere iki grupta sınıflandırılmaktadır.
Günümüzde yapılan bir çok araştırmada sayısal olmayan değişkenlerin dikkate
alındığı gözlemlenmektedir. Örneğin, insanların medeni durumlarıyla seçtikleri
meslek grupları arasındaki bir ilişki incelenmek istendiğinde, medeni durumun
ve meslek grubunun rakamlarla ifade edilmesi olası değildir. Medeni durum
“evli”,“bekar”, “boşanmış” ve “dul” şeklinde gösterilirken meslek grupları da
“serbest meslek”, “devlet memurluğu”, “işçi”, vb. şeklinde gruplandırılabilir.
İşte sayısal olmayan değişkenler arasında herhangi bir ilişkinin var olmadığını
ileri sürerek (Ho hipotezi), bu hipotezin red edilip edilemeyeceğinin incelenmesinde uygulanan test Ki-Kare testi’dir.
Kİ – KARE İLGİ ANALİZİ

Bir faktörün diğer bir faktöre etkisinin olup olmadığını ya
da bir dağılımın homojen olup olmadığını test eder.

Beklenen değerlerle gözlenen değerler arasındaki farkın
anlamlı olup olmadığının testidir.
 Genellikle bir faktörün diğer bir faktöre bağlı olarak
değişip değişmediğini veya etkisi olup olmadığının
belirlenmesi amacıyla kullanılır.
Kİ-KARE ANALİZİNİN BAŞLICA NİTELİKLERİ

Araştırmanın amacı, örnek değerinde gözlenen ilgi hakkında bir
yargıya varmaktır.

Odak noktası bireylerin seçilen bazı nitelikleridir.

Veri matrisini iki veya daha fazla sayıdaki alt setlere ayırmada
analiz öncesi yargılar kullanılır.

Kriter ve tahmin değişkenleri sayısı şart olmamakla birlikte
genelde ikidir.

İlginin fonksiyonel formunun doğrusal olması gerekmez. Analiz
doğrusal olmayan ilişkilere de uygulanabilir.

Veriler nominal ölçekte ölçülmüş olabilir.
Kİ-KARE KULLANIM NEDENLERİ?

Bu analizin yaygın kullanımının en önemli
nedenleri şöyle sıralanabilir;
Çok basit bir analiz türü olması,
 Kullanım alanının çok geniş olması,
 Varsayımlarının azlığı,
 Çok güçsüz ölçeklerde ölçülmüş
verilere uygulanabilmesi

Hipotezlerin Test Edilmesindeki Adımlar

Hipotezler kurulur


Ho: “Gözlenen değer ile beklenen değer arasında Fark yoktur”
H1 : “Fark vardır”

Anlamlılık Düzeyi (Güven Düzeyi) belirtilir. [%95 veya %99]

Serbestlik Derecesi hesaplanır [sd=df]
Bağımsızlık testinde ; (satır sayısı-1).(sütun sayısı-1)
Uygunluk testinde ; (satır sayısı Ti lerin hesabı için hesaplanması gereken parametre sayısı-1)

Test değeri hesaplanır. (Kikare Test Değeri)

Anlamlılık Değeri [Sign (p)] [0-1 arasında olacaktır]

Sonuç : [p>0,05 Ho kabul – p<0,05 Ho rededilir]

Yorum:
Kİ- KARE ANALİZ YÖNTEMİ

Ki-kare analiz yöntemi gözlenen frekans değerleri (Gi)
ile teorik olarak beklenen frekans değerlerinin (Ti)
karşılaştırmasını yapar.

Bir çapraz tabloda yer alan her bir hücre için bu iki
değer arasındaki farkın kareleri alınır. Beklenen
değere olan oranı bulunur. Bu oranların toplamı ise
"Ki-kare" değerini verir. Bulunan bu değer kritik tablo
değerinden büyük ise anlamlı bir ilişkinin varlığından
sözedilebilir.
k
X
2


i 1
( G i  Ti )
Ti
2
Kİ-KARE UYGUNLUK TESTİ

Ki-kare testi, Parametrik olmayan testler içerisinde en
yaygın kullanımı olan testlerdendir.

Frekans tablolarında Uygunluk testi, çapraz tablolarda
ise Bağımsızlık testi biçiminde uygulanır.

Ki-kare uygunluk testi, verilerin herhangi bir dağılımının
uygunluğunu test etmek için kullanılır. Ki-kare
bağımsızlık testi ise ilişki ölçer. İki bağımsız değişken
arasındaki ilişkiyi ölçer.
Kİ-KARE UYGUNLUK TESTİ

Frekans tablosundaki verilerin her hangi bir teorik dağılıma
uygunluğunu test eder.

Uygunluk testinde hipotezler :



H0: “İlişki yoktur”
H1: “ilişki vardır”
Bu teste frekans tablosunun teorik değerleri, gözlemsel frekans
dağılımının uyduğu bilinen belirli yada herhangi bir dağılıma göre
hesaplanabilir. Örneğin, gözlemsel frekans dağılımının Normal,
Tekdüze, Üstel, Binom, Poisson, vb. Dağılımlara uyduğu
düşünülüyorsa bu dağılımların olasılık yoğunluk fonksiyonlarına
göre teorik değerler hesaplanır.
Kİ-KARE UYGUNLUK TESTİ

n hacimli bir örneklemin, ilgili ana kütleyi, iyi temsil
edip edemediğini belirleyebileceksiniz.

Ki-kare uygunluk testinin esasını, n hacimli (birimlik) bir
örneklemin anakütleyi iyi temsil edip edemeyeceğini
araştırmak oluşturur. Bu testte, gözlenen ve beklenen
frekanslardan yararlanılır.

Örnek hipotez;
Üniversite öğrencilerinin barınma yeri konusundaki
tercihleri arasında anlamlı bir farklılık var mıdır?
Kİ-KARE BAĞIMSIZLIK TESTİ

Ki – Kare Bağımsızlık Testi iki değişken arasındaki
ilginin derecesinin belirlenmesi amacıyla kullanılır.

Bu testte diğer ilişkisel analizlerden farklı olarak ilişki
kurulan değişkenlerin her ikisi de Nominal (Sınıflama)
ya da Ordinal (Sıralama) ölçeklidir. Daha açık bir ifade
“gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile
okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır)
ile ücret” değişkenleri arasındaki ilişkiler Ki – Kare
Bağımsızlık Testi ile incelenebilir.
Kİ-KARE BAĞIMSIZLIK TESTİ

İki ya da daha fazla sınıfı iki nitel değişken
arasında bağımsızlık olup olmadığını incelemek
için, Ki-Kare bağımsızlık testine başvurmak
gerekir.

Bu test yapılırken, Kontenjans tablosundan
yararlanılmaktadır. Bu tablo, incelenen iki
değişkenin
şıklarına
düşen
gözlenen
frekansların yazıldığı, yatay (satırlar) ve düşey
(sütunlar) bantlardan oluşan, çift yönlü tablodur.
Kİ-KARE BAĞIMSIZLIK TESTİ

İki ve daha fazla kategoriye sahip X ve Y değişkenlerinin
kategorilerinin birbirleri ile bağımlı/ bağımsız olup
olmadıklarını test eder.


H0: “ilişki yoktur”
H1: “ilişki vardır”
şeklinde hipotez kurulur.

Örnek hipotez;
Bir yörede yaşayan halkın siyasi parti tercihi meslek
dallarına göre anlamlı bir farklılık gösterir mi?
Teorik D eğerler M atrisi
V eri M atrisi (G özlenen D eğerler )
D eğişkenler
D eğişkenler
1
2…
j… …
……n
Toplam
A 1 .B 1
A 1 .B 2
A 1 .B j
A 1 .B n
A1
C
C
C
C
1
2…
j… …
……n
Toplam
1
O 11
O 12
O 1j …
… ..O 1n
A1
2
O 21
O 22
O 2j…
… ..O 2n
A2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
A 2 .B 1
A 2 .B 2
A 2 .B j
A 2 .B n
A2
.
.
.
.
.
.
.
C
C
C
C
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
O i1
O i2
O ij…
… .O in
Aj
i
Ai.B 1
Ai.B 2
A i .B j
A i .B n
Aj
.
.
.
.
.
.
.
C
C
C
C
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A m .B 2
A m .B j
A m .B n
O m j…
.
Am
A m .B 1
Om1
.
...O m n
m
m
.
I n2 … .
C
C
C
C
.
Am
Toplam
B1
B 2… .
B j… ..
… ..B n
C
Toplam
B1
B 2… .
B j… ..
… ..B n
C
B ireyler
B ireyler
1
KONTENJAN KATSAYISI

Sayısal olmayan iki değişken arasındaki ilişkinin derecesini
belirleyebileceksiniz.

Ki-kare bağımsızlık testiyle, iki değişken arasındaki ilişkinin
varlığıyla ilgili karar verebiliyordu. Oysa ki bazı hallerde, iki
değişken arasındaki ilişkinin kuvveti hakkında da bilgi sahibi olmak
istenebilir.

İşte kontenjans katsayısı ilişki düzeyini saptamak amacıyla
kullanılan bir katsayıdır. İki değişken arasında bir ilişki
bulunmuyorsa 0 değeri verir. Buna karşılık iki değişken arasında en
üst düzeydeki ilişki katsayısı her zaman 1 çıkmaz, 1’e çok yakın bir
değer olur. c ile gösterilen kontenjans katsayısının formülü
şeklindedir.
Kİ- KARE HOMOJENLİK TESTİ

Farklı örneklemlerin aynı ana kütleden seçilip seçilmediğini test
edebileceksiniz.

Ki-kare homojenlik testi ana çizgileriyle, iki ya da daha fazla
bağımsız örneklemin,aynı ana kütleden seçilip seçilmediğinin
araştırılmasında kullanılır. Testin uygulaması,ki-kare bağımsızlık
testinde olduğu gibidir. Yine nitel değişkenlerle ve aynı örneklem
istatistiğiyle çalışılır. Ancak, dikkat edilmelidir ki, bağımsızlık testinde
ele alınan değişkenler arasında bir ilişkinin varlığı araştırılırken,
homojenlik testinde bağımsız örneklemlerin aynı ana kütleden
seçilip seçilmediği araştırılmaktadır.
SPSS Kullanımı
Analyze→Descripti Statistics →Crostabs
Statistics: Chi- square
Cell:counts: Observed + Expected
Percentages: Row, Column, Total seçilir.
Symmetric Measures
Nominal by Nominal
Value
,285
Contingency Coefficient
N of Valid Cases
Approx. Sig.
,000
511
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.
Case Processing Summary
Cases
Valid
N
Genellikle tercih edilen
bilet sýnýfý * Gelir
Missing
Percent
511
100,0%
N
Total
Percent
0
,0%
N
Percent
511
100,0%
Genellikle tercih edilen bilet sýnýfý * Gelir Crosstabulation
Gelir
Genellikle tercih edilen
bilet sýnýfý
Ekonomi
Count
1.000.000.0012.000.000.000
58
2.000.000.0013.000.000.000
55
3.000.000.0014.000.000.000
49
4.000.000.0015.000.000.000
34
5.000.000.00
1 ve üstü
111
25,2
42,5
52,4
41,8
37,2
140,0
339,0
9,4%
17,1%
16,2%
14,5%
10,0%
32,7%
100,0%
84,2%
90,6%
69,6%
77,8%
60,7%
52,6%
66,3%
6,3%
11,4%
10,8%
9,6%
6,7%
21,7%
66,3%
6
6
24
14
22
100
172
12,8
21,5
26,6
21,2
18,8
71,0
172,0
3,5%
3,5%
14,0%
8,1%
12,8%
58,1%
100,0%
15,8%
9,4%
30,4%
22,2%
39,3%
47,4%
33,7%
1,2%
1,2%
4,7%
2,7%
4,3%
19,6%
33,7%
38
64
79
63
56
211
511
38,0
64,0
79,0
63,0
56,0
211,0
511,0
7,4%
12,5%
15,5%
12,3%
11,0%
41,3%
100,0%
100,0%
7,4%
100,0%
12,5%
100,0%
15,5%
100,0%
12,3%
100,0%
11,0%
100,0%
41,3%
100,0%
100,0%
Expected Count
% within Genellikle tercih
edilen bilet sýnýfý
% within Gelir
Business
% of Total
Count
Expected Count
% within Genellikle tercih
edilen bilet sýnýfý
% within Gelir
% of Total
Total
Total
1.000.000.0
00 ve altý
32
Count
Expected Count
% within Genellikle tercih
edilen bilet sýnýfý
% within Gelir
% of Total
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value
45,025(a)
49,093
38,769
5
5
Asymp. Sig.
(2-sided)
,000
,000
1
,000
df
511
a 0 cells (,0%) have expected count less than 5. The minimum expected
count is 12,79.
1.000.000.0
00 ve altý
339
YORUMLAR

Ki-kare analizinin uygulanabilmesi için, gözlenen
değerlerin hiçbirinin 0 değerini almaması ve teorik
(beklenen) değerlerin %20 sinden fazlasının 5 den küçük
olmaması gerekir.

Örnekteki tabloları incelediğimizde bu kurala uygun
olduğunu görüyoruz. (Şayet şarta uygunluk olmasaydı,
araştırmacı bu değerlerin ortaya çıktığı sütun veya
satırları diğer sütun ve satırlarla birleştirerek analizi
yeniden uygulamadır.)
YORUMLAR

Ekonomi sınıfı tercih edenlerin %84,2 si 1.000.- TL
ve altı gelire sahiptir.

Ekonomi sınıfı tercih edenlerin %90,6 si 1.000.- TL
ve 2.000.- TL arası gelire sahiptir.

Business sınıfı tercih edenlerin % 47,4 ü 5.000.- TL
ve üzeri gelire sahiptir.

Business sınıfı tercih edenlerin % 39,3 ü 4.000.- TL
ve 5.000.- TL arası gelire sahiptir.
GENEL YORUM

Ekonomik bilet sınıfının genelde daha düşük
gelir seviyesine sahip kişiler tarafından
tercih edildiği,

Business bilet sınıfının ise genelde daha
yüksek gelir seviyesine sahip kişiler
tarafından tercih edildiği görülmektedir.
Download

Kare Testi