22.12.2015
KORELASYON
KORELASYON: İki veya daha fazla değişkenin
değişkenin birlikte değişiminin ölçüsüdür. Birlikte
nasıl değişim gösterdiğinin ölçüsüdür.
İKİ DEĞİŞKEN ARASINDAKİ İLİŞKİ VE İLİŞKİNİN ÖLÇÜLMESİ
 Araştırmacılar olay ve olguları tek tek betimleyeceği gibi olaylar
arasındaki ilişkileri de anlamak ve açıklamak isteyebilirler.
Deneklerin ya da bireylerin iki değişkene ait değerlerine sahip
olunduğunda iki değişken arasındaki ilişki ilişkileri de anlamak
ve açıklamak isteyebilirler. Deneklerin ya da bireylerin iki
değişkene ait değerlerine sahip olunduğunda iki değişken
arasındaki ilişki bulmak için korelasyon teknikleri kullanılabilir.
Y-Değerleri
göstermek için X, diğer değişkenin değerlerini göstermek
için Y sembolü kullanılır. İki değişken arasındaki
korelasyonu hesaplayabilmek için aynı kişiye ait X ve y
değerleri elde edilir ve her bir kişinin X değeri ona karşılık
gelen Y değeri ile eşleştirilir.
Bu tür ilişkilerin açıklanması için korelasyon katsayısı verilen bir
ilişki ölçüsü hesaplanmaya çalışılır.
140
Çalışılan süre ve
kazanılan para
Süre (saat)
Kazanç (TL)
(X)
(Y)
1
15
2
30
3
45
4
60
5
75
6
90
7
105
8
120
 Uygulamada genellikle değişkenlerden birinin değerlerini
120
100
Veri grupları için hangi ilişki ölçüsünün kullanılacağına karar
vermede şu faktörler göz önünde bulundurulur (Heiman, 1996).
80
60
40
20
0
0
1
2
3
4
5
6
7
8
9
(1)Herhangi bir değişkenin hangi ölçek düzeyinde açıklandığı
(sınıflama, sıralama, eşit aralıklı ve oran)
(2)Değişkenin sürekli veya süreksiz olmaları
(3)İki veri grubunun doğrusal olup olmaması
1
22.12.2015
 Ölçek düzeyine göre korelasyon teknikleri
 İki değişken arasındaki ilişki miktarı, ikili ya da basit korelasyon
ÖLÇEK
SEMBOL
TEKNİK
λ
ϕ
C
V
G
Tau
W
rs
r
R
Lambda
Phi
Kontincensi
Cramer V
Goodman ve Kruskal Gamma
Kendal Tau
Kendal’ın uyuşum katsayısı
Sperman Rho
Pearson
Çoklu Korelasyon
Sınıflamalı
Sıralamalı
Aralıklı/oranlı
ismi verilen korelasyon teknikleriyle bulunur. Buna karşılık bir
değişkenin iki ya da daha çok değişken ile olan ilişkisi çoklu
korelasyonun, bu değişkenlerden birisinin dışlanarak
(sabitlenerek) diğer değişkenlerle ilişkisi ise kısmi korelasyon
tekniklerinin konusudur. Basit korelayon tekniklerinin
çoğunluğu değişkenler arasındaki ilişkinin doğrusal olduğunu
kabul eder. Ancak böyle bir varsayımı gerektirmeyen teknikler
de bulunmaktadır.
Kaynak: Elifson, Runyon & Haber’den (1990,200) uyarlandı.
 Saçılma diyagramı (Scatterplot)
 İki değişken araındaki ilişkiyi görsel olarak betimlemede kullanılan
bir grafik türüdür. X-Y puanlarının her bir çiftinin iki boyutlu bir
düzleme yerleştirilmesini gösterir. Genellikle yatay X ekseni
(bağımsız değişken), dikey olan Y değişkeni (bağımlı değişken)
ölçümlerini gösterir. Görsel olarak dış kenarlar etrafında bir çizgi
çizilerek saçılma diyagramı özetlenebilir.
Aile
İstenen çocuk
sayısı (X)
3
1
2
Sahip olunan
çocuk sayısı
(Y)
2
2,5
2
2
3
2
3
3
3
4
4
2
5
3
1
6
1
1
Y-Değerleri
3,5
1,5
1
0,5
0
0
0,5
1
1,5
2
2,5
3
3,5
4
 Pearson momentler çarpımı korelayon katsayısı, aralık ya da oran
ölçeğinde ölçülen iki sürekli değişken arasındaki doğrusal
ilişkiyi açıklamak üzere kullanılır. Böyle bir analiz ile her bir Y
değerinin her bir X değeri ile doğrusal bir biçimde ne kadar tutarlı
bir eşleşme gösterdiği açıklanmaya çalışılır (Arney, 1990; Baykul,
1999; Borg ve Gssall, 1989; Knoke ve Bohrnstedt, 1991). Bunun yanı
sıra değişkenleri ikili olarak normal dağılım gösterdiği de varsayılır (
Green, Salkind ve Akey, 1997; Howell, 1987; Knoke ve Borhnstedt,
1991). Pearson r’sinin hesaplanmasında birçok yaklaşım
kullanılabilmektedir. Burada sadece ham puanları temele alan bir
formül kullanılacaktır. Buna göre X ve Y iki sürekli değişken olmak
üzere aralarındaki ilişki miktarı
4,5
Birey
r
N  X
N  XY   X  Y
2

  X  N  Y 2   Y 
2
2

1
Çalışma
saati (X)
2
Başarı
puanı (Y)
3
2
4
5
3
1
1
4
5
3
N=4
∑X=12
∑Y=12
ÇALIŞMA
SAATİ
İLE
BAŞARI
PUANLARI
ARASINDAKİ
İLİŞKİYİ
AÇIKLAMAM
İÇİN
PEARSON MOMENTLER ÇARPIMI KORELASYON
KATSAYISINI HESAPLAYALIM
2
22.12.2015
Birey
1
2
3
4
N=4
(X)
2
4
1
5
∑X=12
X2
4
16
1
25
2
∑X =46
(Y)
3
5
1
3
∑Y=12
Y2
9
25
1
9
2
∑Y =44
XY
6
20
1
15
∑XY=42
r
r
( ∑X)2 = 144
r
N  X
(∑Y)2= 144
Tablodaki değerler formüldeki yerlere yerleştirildiğinde
N  XY   X  Y
2

  X  N  Y 2   Y 
2
2

r
4(42)  (12)(12)
4(46)  12 4(44)  12 
2
2
r
24
40(32)
N  X
N  XY   X  Y
2

  X  N  Y 2   Y 
2
2

4(42)  (12)(12)
4(46)  12 4(44)  12 
2
r
24
40(32)
2
= 24 / 35,8 = 0.67
= 24 / 35,8 = 0.67
 Açıklanan Varyans, değişkenlerden birindeki değişmenin ne
Açıklanan değişkenliğin oranını yorumlamak için r2 olarak
tanımlanan determinasyon katsayısı bulunur. Buna göre r2
= (0,67)2 = 0,4489’dir. Bu durumda başarı puanındaki Y
değişkenliğinin %44,89’unun çalışma saati (X) tarafından
açıklanabildiği söylenebilir. Bu aynı zamanda doğal olarak
Y’deki
değişkenliğin
%55.11’nin
X
tarafından
açıklanmadığını da göstermektedir.
okuma hızı
Türkçe başarı puanları
Açıklanan varyans miktarı
kadarının diğer değişken tarafından açıklandığını yüzde olarak
ifade edebilmemizi mümkün kılar. Değişkenlerin birbirinde
açıkladıkları varyans miktarı korelasyon katsayısının karesine
(r2) eşit olup bu değer determinasyon katsayısı olarak da
isimlendirilir. Örneğin Türkçe başarısı iel okuma hızı arasındaki
korelasyon katsayısı r = 0,80 olsun, r2 0 ise 0,64’dür. Buna göre
öğrencilerin okuma hızlarındaki toplam varyansın (
değişkenliğin) %64’ünün Türkçe dersindeki başarılarından
kaynaklandığı ifade edilebilir. Bunun tersi olarak öğrencilerin
Türkçe dersindeki başarı puanlarında gözlenen değişmenin
%64’ünün onların okuma hızlarındaki değişmelerden
kaynaklandığı ifade edilebilir.
Spearman rho, sıralı puanlar kullanılarak ölçülen iki değişken arasındaki
doğrusal ilişkiyi açıklar. Sosyal bilimler araştırmalarında spearman rho’su üç
farklı durumlarda kullanılabilir.
(1) Birincisi değişkenlerin miktar olarak ölçülmesinin zor olduğu, değişen yada
bireye ilişkin yargılar doğrudan doğruya sıra değerleri ile gösterildiği
durumlarda
(2) Bir sıralı değişken ile bir aralıklı veya oranlı değişken arasındaki ilişki
bulunmak istendiğinde aralıklı veya oranlı puanların sıralı puanlara
dönüştürülmesi (en yüksek aralıklı veya oranlı ölçüme 1, ikinci en yüksek olana 2
ve bu şekilde sıra dğerleri verilerek,
(3) Ölçümlerin iki değişken için en az aralık ölçeğinde olduğu, ancak dağılımın
normallik varsayımını karşılamadığı durumda. Bunun için ölçümler her iki
değişken için de sıra değerlerine dönüştürülür.
3
22.12.2015
rs  1 
6 d 2
n n2  1

İki hakemin 10 sporcuyu sıralamaları arasındaki ilişkinin hesaplanması için çalışma
tablosu
Hakem (1)
Hakem (2)
X-Y =d
d2
5
7
-2
4
3
2
1
1
9
4
5
25
8
6
2
4
4
5
-1
1
1
1
0
0
7
9
-2
4
6
3
3
9
10
8
2
4
2
10
-8
64
∑d=0
116

Sporcular
A
B
C
D
E
F
G
H
I
J
TOPLAM
 Formülde d ( sırax – sıray) X ve Y değişkenlerine ait sıralar arasındaki farkı, n
ise sıra çiftlerinin sayısının gösterir.
 rs değeri, iki sıra seti arasındaki uyuşma ya da uyuşmazlığın derecesinin bir
ölçüsü olarak da tanımlanabilir. Deneklerin iki ayrı değişkenden aldıkları
puanların sıralamaları ya da iki gözlemcinin belli bir ölçüte göre denekleri
sıralamaları birbirlerine yaklaştıkça, yani denekler için iki sıra değeri
birbirine yaklaştıkça iki sıra seti için rs +1.00 e yakın değer alır. Böyle
durumlarda sıralar arasındaki fark, ilişki sayısı +1,00 e yaklaştıkça azalır.
İki hakemin 10 sporcuyu sıralamaları arasındaki ilişkinin hesaplanması için çalışma tablosu
İki hakemin 10 sporcuyu sıralamaları arasındaki ilişkinin hesaplanması için çalışma tablosu
Sporcular
A
B
C
D
E
F
G
H
I
J
TOPLAM
Sporcular
A
B
C
D
E
F
G
H
I
J
TOPLAM
Hakem (1)
5
3
9
8
4
1
7
6
10
2
Hakem (2)
7
2
4
6
5
1
9
3
8
10
X-Y =d
-2
1
5
2
-1
0
-2
3
2
-8
∑d=0
d2
4
1
25
4
1
0
4
9
4
64
116
Burada yapılacak ilk iş, her bir çift için verilen sıra değerlerinin farklarının kareleri toplamını bulmaktır.
Bunun için yukarıdaki tabloya göre sıra farkları (d) ve farkların karesi (d2)hesaplanır. ∑d, her ne kadar
hesaplamalarda kullanılmasa da elde edilir. Hesaplamanın doğruluğunu değerlendirmede kullanılır.
Söz konusu değer her zaman sıfıra eşit olmalıdır.
rs  1 
6 d 2
n n2  1


Hakem (1)
5
3
9
8
4
1
7
6
10
2
rs  1 
Hakem (2)
7
2
4
6
5
1
9
3
8
10
6.116
10 102  1


X-Y =d
-2
1
5
2
-1
0
-2
3
2
-8
∑d=0
d2
4
1
25
4
1
0
4
9
4
64
116
= 0,30
Bu sayı hakemlerin sıraya koymaları arasındaki
ilişkinin derecesidir.
Burada yapılacak ilk iş, her bir çift için verilen sıra değerlerinin farklarının kareleri toplamını
bulmaktır. Bunun için yukarıdaki tabloya göre sıra farkları (d) ve farkların karesi (d2)hesaplanır.
∑d, her ne kadar hesaplamalarda kullanılmasa da elde edilir. Hesaplamanın doğruluğunu
değerlendirmede kullanılır. Söz konusu değer her zaman sıfıra eşit olmalıdır.
4
Download

istatistik-ı 6. hafta korelasyon ve türleri