Tanımlayıcı İstatistikler
Tanımlayıcı İstatistikler
Tanımlayıcı
İstatistikler
Yer gösteren
ölçüler
Yaygınlık
ölçüleri
Merkezi
eğilim ölçüleri
Konum
ölçüleri
• Bir dağılımı tanımlayabilmek için çeşitli ölçüler
vardır.
• Bu ölçüler yer gösteren ölçüler ve yaygınlık
ölçüleridir.
Yer Gösteren Ölçüler
• Merkezi eğilim ölçüleri ve konum ölçüleri olmak
üzere ikiye ayrılır.
• Merkezi eğilim ölçüleri bir verinin merkezi diğer bir
ifade ile hangi nokta etrafında dağıldığı hakkında
bilgi verir.
• Konum ölçüleri ise bir verideki herhangi bir değerin
verinin neresinde yer aldığı hakkında bilgi verir.
Aritmetik Ortalama
• Veri setindeki tüm değerlerin toplanması ve bu
toplamın veri sayısına bölünmesiyle elde edilir.
Örnek:
7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun.
Buna göre yaş ortalaması:
n
x 

Xi
i 1
n

6  8  7  8  5  9  27
7

70
7
 10
Aritmetik Ortalama
n
x 

Xi
i 1
n

6  8  7  8  5  9  27
7

70
 10
7
• Aritmetik ortalama veri setindeki tüm değerleri
dikkate alır. Bu nedenle çok büyük yada çok küçük
değerlerden etkilenir.
• Bu dağılımda 27 yaş aşırı bir değerdir ve aritmetik
ortalamanın yüksek çıkmasına neden olur.
• Tek tepeli, simetrik verilerde kullanılması uygundur.
Ortanca
• Verileri küçükten büyüğe doğru sıraladıktan sonra
tam ortadaki değerdir.
• Ortanca dağılımın orta noktası hakkında bilgi verir.
• Aşırı değerlerden etkilenmez sadece veri setinin
ortasındaki değeri göz önüne alır.
• Dağılımda aşırı değerlerin bulunduğu durumlarda
veya dağılım simetrik olmadığı durumlarda
ortalama ölçüsü olarak ortancanın kullanılması
daha doğrudur.
Ortanca
Örnek:
7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun.
Buna göre yaş ortancası:
n+ 1
O rtanca=
değerdir
5 – 6 – 7 – 8 – 8 – 9 – 27
2
Ortancadan küçük veri sayısı
büyük veri sayısına eşit
O rtanca=
7+ 1
2
= 4. değer
Ortanca
Örnek: (Veri sayısı çift olsun)
8 kişinin yaşları 6, 8, 7, 8, 5, 9, 15, 27 olsun.
Buna göre yaş ortancası:
5 – 6 – 7 – 8 – 8 – 9 – 15 – 27
O rtanca=
8+ 1
= 4,5. değer
2
O rtanca=
4. değer + 5. değer
2
!!! Bu değer veride yok !!!
=
8+ 8
2
= 8
Tepe Değeri
• Tepe değeri bir dağılımda en fazla tekrar eden
değerdir.
Örnek:
7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun.
Buna göre tepe değer:
En fazla (iki defa) tekrar eden 8’dir.
Tepe Değeri
• Her gözlemin tekrar sayısı aynı ise o veri setinde
tepe değeri yoktur.
• En fazla tekrara sahip tek bir değerin olduğu
dağılımlara tek tepeli dağılım, en fazla tekrara sahip
iki değerin olduğu dağılımlara iki tepeli dağılım
denir. Bu durum ikiden fazla değerde ortaya çıkarsa
çok tepeli dağılım adını alır.
• Tepe değeri, aritmetik ortama ve ortancaya göre
daha az kullanılan bir ortalama ölçüsüdür.
Oran
• Aritmetik ortalama, ortanca ve tepe değeri sayısal
veriler için kullanılan ortalama ölçüleridir.
• Bu ölçüler yardımıyla kategorik veriler özetlenemez.
• Kategorik (niteliksel) verileri özetlemek için oran
kullanılır.
• Kategorik verileri karşılaştırmak için de orandan
yararlanılır.
Oran
Örnek:
Bir sınıftaki öğrencilerin cinsiyet dağılımı
Kız
Erkek
Sayı
45
35
Yüzde
56.25
43.75
Toplam
80
100
Çeyreklikler
• Dağılımı 4 eşit parçaya böler
Çeyreklikler
1. Çeyreklik
2. Çeyreklik
3. Çeyreklik
(Ortanca)
Değerlerin %25’i
Ç1’e eşit ya da
ondan küçüktür.
Değerlerin
%50’si Ç2’ye eşit
ya da ondan
küçüktür.
Değerlerin %75’i
Ç3’e eşit ya da
ondan küçüktür.
Çeyreklikler
Örnek:
8 kişinin yaşları 6, 8, 7, 8, 5, 9, 12, 27 olsun.
Buna göre yaş ortancası yani dağılımın 2. Çeyreği:
Ç2 = ( + 1) × 0.50
nci değer, Yani:
Ç2 = 9 × 0.50 = 4.5 nci değerdir
nci değer, Yani:
Ç1 = 9 × 0.25=2.25
1. Çeyreği:
Ç1 = ( + 1) × 0.25
nci değerdir
3. Çeyreği:
Ç3 = ( + 1) × 0.75 nci değer, Yani:
Ç3 = 9 × 0.75 = 6.75
nci değerdir
Çeyreklikler
Örnek:
Yaşlar sıralandığında
5, 6, 7, 8, 8, 9, 12, 27 olur.
Ç3 = 9 × 0.75 = 6.75
Ç1 = 9 × 0.25=2.25
nci değer, Yani: 11.25
nci değer, Yani 6.25
Ç2 = 9 × 0.50 = 4.5
nci değer, Yani: 8
Yüzdelikler
• Dağılımı 100 eşit parçaya böler.
• 25. yüzdelik Ç1’e, 50. yüzdelik Ç2’ye (Ortanca) ve
75. yüzdelik Ç3’e eşittir.
• Yığılımlı sıklığı gösterir.
• Örneğin verileri küçükten büyüğe doğru sıraladıktan
sonra ilk %10’u 10. yüzdeliğe eşit yada ondan
küçüktür.
10 = ( + 1) × 0.10
20 = ( + 1) × 0.20
80 = ( + 1) × 0.80
Çeyreklikler
Örnek:
Yaşlar sıralandığında 20. yüzdelik
5, 6, 7, 8, 8, 9, 12, 27 olur.
20 = 9 × 0.20 = 1.8
nci değer, Yani 5.8
Yaygınlık Ölçüleri
Yaygınlık
ölçüleri
Dağılım
aralığı
Standart
Sapma
Varyans
Çeyrekler
arası
genişlik
Çeyrek
sapma
Değişim
Katsayısı
• Bir dağılımdaki verilerin, merkezine yada birbirine
göre ne kadarlık bir değişim gösterdiğini belirtir.
Örnek:
Dağılım 1
Dağılım 2
7
4
2
8
7
7
16
6
7
7
3
10
x 7
O rtanca  7
T epe değeri  7
• Her iki dağılımında ortalama, ortanca ve tepe değeri
aynıdır.
• Ancak dağılım 1’deki değerlerin aritmetik
ortalamaya olan uzaklığı dağılım 2’ye göre daha
fazladır.
• Dağılım 1, dağılım 2’ye göre daha yaygındır.
Dağılım Aralığı
• Dağılım aralığı en basit yaygınlık ölçüsüdür.
• En büyük değerin en küçük değerden çıkarılması ile
bulunur.
• Sadece en uçtaki iki değerle ilgilenir, diğer değerleri
dikkate almaz.
• Bu nedenle aşırı değerlerden etkilenir.
• Yalnızca 2 gözleme ilişkin değer dikkate alındığı için
kaba bir yaygınlık ölçüsüdür.
Dağılım Aralığı
• Gözlemlerin çoğunun en büyük yada en küçük
değere yakın olduğu durumlarda gerçek değişkenlik
hakkında bilgi vermez.
R = E n büyük değer - E n küçük değer
• Biraz önceki örnek için,
R D ağılım 1 = 16 - 2 = 14
R D ağılım 2 = 10 - 4 = 6
1. dağılım 2. dağılıma göre
daha yaygındır
Standart Sapma
• Bir dağılımın yaygınlığını gösteren en önemli
yaygınlık ölçülerinden biridir.
• Verideki tüm değerlerin aritmetik ortalamaya olan
uzaklıklarının ortalama bir göstergesidir.
• Standart sapma hesaplanırken verideki tüm
değerler dikkate alınır.
n
s
 (x
n
i
 x)
i 1
n 1
2
 
 (x
i
 )
i 1
N
2
Standart Sapma
• Dağılımın yaygınlığı arttıkça standart sapma büyür.
• Dağılımdaki değerler aynı ise yaygınlık yoktur ve
standart sapma sıfırdır.
• Standart sapma, tek tepeli ve simetrik dağılımlarda
kullanılan bir yaygınlık ölçüsüdür.
• Veriyi özetlerken ortalama ölçüsü olarak aritmetik
ortalama kullanıldığında kullanılır.
• Çarpık dağılımlarda kullanılması önerilmez.
Örnek:
n
s
Dağılım 1
( − ) ( − )2

s

( xi  x )
2
i 1
n 1
Dağılım 2
( − ) ( − )2

7
0
0
4
-3
9
2
-5
25
8
1
1
7
0
0
7
0
0
16
9
81
6
-1
1
7
0
0
7
0
0
3
-4
16
122
10
3
9
20
122
6 1
 4.94
s
20
6 1
2
Varyans
• Aritmetik ortalamaya olan uzaklıkların karesinin
ortalamasına varyans denir.
• Standart sapmanın karesine eşittir.
• Varyansın birimi karesel olduğu için yaygınlık ölçüsü
olarak veriyi tanımlamada kullanılmaz.
n
s 
2

n
( xi  x )
i 1
n 1
2

2


( xi   )
i 1
N
2
Örnek:
n
s 
2
2
2
i 1
n 1
Dağılım 1
( − ) ( − )2

s 

( xi  x )
Dağılım 2
( − ) ( − )2

7
0
0
4
-3
9
2
-5
25
8
1
1
7
0
0
7
0
0
16
9
81
6
-1
1
7
0
0
7
0
0
3
-4
16
122
10
3
9
20
122
6 1
 24.4
s 
2
20
6 1
4
Çeyrekler Arası Genişlik
• Eğer verinin yapısı çarpıksa ve ortalama ölçüsü
olarak ortanca kullanılıyorsa yaygınlık ölçüsü olarak
çeyrekler arası genişlik kullanılır.
• Üçüncü çeyreklikten birinci çeyrekliğin çıkarılması
ile bulunur.
Ç AG  Ç 3  Ç1
• Dağılımdaki verilerin ortadaki 0.50’ sinin yer aldığı
aralığı belirlemek için kullanılır.
Çeyrekler Arası Genişlik
• Özellikle uçtaki değerlerden çok ortadaki değerlerle
ilgilenildiği durumlarda kullanılır.
• Çeyreklikler arası genişlik aşırı uç değerlerden
etkilenmez.
• Çünkü çeyreklikler arası genişlik dağılımdaki
değerlerin merkezdeki %50’si ile ilgilenir.
• Eğer incelenen dağılım simetrikse 25. ve 75.
yüzdelikler ortancadan eşit uzaklıktadır.
Çeyrek Sapma
ÇS 
Ç 3  Ç1
2
• Bu değer çeyrekliklerle ortanca arasındaki uzaklığın
ortalama bir ölçüsüdür.
• Çeyrek sapma, ortalama ölçüsü olarak ortancanın
kullanıldığı durumlarda kullanılan yaygınlık
ölçülerinden biridir.
• Özellikle aşırı değerlerin, dağılımın sadece bir
tarafında olduğu durumlarda kullanılması gerekir.
Değişim Katsayısı
• Standart sapma, bir dağılımın yaygınlığını gösteren
ölçülerden birisidir ve aritmetik ortalama
büyüdükçe standart sapmanın büyüme eğilimi
vardır.
• Ancak sadece standart sapmaya bakarak bir
dağılımın yaygınlığı konusunda karar vermek her
zaman doğru olmayacaktır.
DK 
S
x
x100
Değişim Katsayısı
• İki ya da daha fazla dağılımın yaygınlığını
karşılaştırmak istediğimizde standart sapmayı
doğrudan kullanamayız.
• Değişim katsayısı dağılımdaki değerlerin ortalamaya
göre yüzde kaçlık bir değişim gösterdiğini belirtir.
• Değişim katsayısı yüzde cinsinden ifade edilir ve 0
ile 100 arasında değişir.
• Değişim Katsayısının sıfıra yaklaşması dağılımın
yaygınlığının azaldığını gösterirken, DK’nın %25’in
üzerinde olması incelenen dağılımın oldukça yaygın
olduğunu gösterir.
Örnek:
Dağılım 1
 =
4,94
100 = 70.57
7
Dağılım 2
2
 = 100 = 28.57
7
• Dağılım 1’deki değerler ortalamaya göre %70,6’lık
bir değişim gösterirken, dağılım 2’deki değerler
%28,57’lik bir değişim göstermektedir.
Örnek:
Boy Uzunlukları (cm)
Ortalama
SS
160
180
165
174
190
182
155
165
171,38
12,07
12,07
 =
100 = 0,07
171,38
Boy Uzunlukları (m)
1.60
1.80
1.65
1.74
1.90
1.82
1.55
1.65
1,7138
0,1207
0,1207
 =
100 = 0,07
1,7138
• Her iki dağılımın standart sapması farklı iken
değişim katsayıları aynıdır.
Download

Tanımlayıcı İstatistikler