İSTATİSTİK
VERİLERİN DÜZENLENMESİ VE SUNUMU
Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK
[email protected]
1
VERİLERİN DÜZENLENMESİ VE SUNUMU

Hangi yöntemle elde edilirse edilsin elimize ulaşan veriler ham veri
olarak adlandırılır.

Bu verilerin analize uygun hale getirilmeleri için düzenlenmeleri ve
sıralanmaları gerekir. Bunlarda bize serileri verir.

Toplanan veriler kolay ve anlaşılır bir biçimde düzenlenmelidir.

Bu düzenleme çeşitli şekillerde yapılabilir.

Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya
da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve
düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden
2
faydalanılır.
VERİLERİN DÜZENLENMESİ VE SUNUMU
Seriler;
 Zaman
serileri
 Mekan
serileri
 Dağılım

serileri
Basit Seri: Derlenmiş olan sayısal verilerin küçükten
büyüğe doğru sıralanması ile elde edilen serilerdir.

Sınıflanmış
seri:
Sınıflanmış
serilerde
tekrarlanan
elemanlar bir araya getirilerek frekanslar şeklinde ifade
edilen seridir.

Gruplanmış seri: Belli değer aralıklarına düşen birimler
bir araya getirilerek oluşturulan frekanslı serilere
gruplanmış seri adı verilir.
3
Zaman serisi
Verileri gün, hafta, ay, yıl gibi zaman vasfının şıklarına göre
düzenlenmiş olarak gösteren serilerdir.
Zaman serisi iki sütundan oluşur. Birinci sütunda zaman vasfının
şıkları, ikinci sütunda ise olaya ait değerler bulunur.
Örnek: Yıllara göre Türkiye nüfusu
Yıllar
1950
1955
1960
1965
1970
Nüfus(milyon)
20,9
24,1
27,8
31,4
35,6
4
Mekan serisi
Toplanan verileri mekan vasfının şıklarına göre sıralanmış olarak
gösteren seriler mekan serileri adını alır.
Mekan vasfının şıkları ülke, bölge, il, ilçe, köy gibi şıklar olabilir. Seri
iki sütundan oluşur. İlk sütunda mekan vasfının şıkları, ikici sütunda
değerler bulunur.
Örnek: İllere göre 1970 yılı nüfus değerleri
İller
Nüfus(bin kişi)
İstanbul
3.019
Ankara
2.042
İzmir
1.427
Adana
1.035
Bursa
848
5
Dağılım serileri
Zaman ve mekan vasfının dışında kalan maddi değişken olarak
tanınan değişkenlerin şıklarına göre düzenlenmiş seriler dağılım
serileridir.
Bir sınıftaki öğrencilerin aldığı notlar, boy uzunluğu, ağırlık , işçi
sayısı gibi özellikler örnek verilebilir. Dağılım serileri sayısal
olmayan özelliklere göre de düzenlenebilir. Ancak sayısal özelliklere
göre düzenlenmiş dağılım serileri daha çok kullanılmaktadır. Bu tür
dağılım serileri 3 sınıfta toplanabilir.
 Basit seriler
 Frekanslı/Sınıflanmış (tasnif edilmiş) seriler
 Gruplanmış seriler
6
Dağılım Serileri
Basit seri
Sınıflı/Frekanslı seri
Gruplu seri
7
Basit Seri
• Araştırma veya analizlerde kullanılmak üzere elde edilen veri
sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir.
• Verilerin büyükten küçüğe veya
sıralanmasıyla oluşturulan seridir.
küçükten
büyüğe
Örnek:
7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4
olsun.
Verileri küçükten büyüğe doğru sıraladığımızda;
basit seri; 1,2,3,4,4,5,6 elde edilir.
8
Basit Seri
Örnek: Bir işletmede çalışan 25 işçiye verilecek çocuk
paraları ile ilgili bir araştırma yapılmaktadır. İşçilerin çocuk
sayıları aşağıda verilmiştir.
1,3,2,2,3,1,4,5,3,6,0,5,2,3,2,4,8,0,1,2,3,3,1,0,4
Verilen değerleri basit seri şeklinde düzenleyelim.
0,0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,4,4,4,5,5,6,8
9
Basit Seri
10
Basit Seri
Örnek: 12 öğrencinin bir dersten aldığı notlar;
50, 65, 0, 30, 25, 50, 30, 45, 90, 70, 50, 75
Notlar(xi )
0
25
30
30
45
50
50
50
65
70
75
90
11
VERİLERİN DÜZENLENMESİ VE SUNUMU
12
VERİLERİN DÜZENLENMESİ VE SUNUMU
Basit
18,
seride veriler küçükten büyüğe doru sıralanır.
20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27,
27, 27, 27, 28, 29, 29, 30, 31, 32, 32
Basit
seriler
dönüştürülebilir
bazı
küçük
düzenlemelerle
frekanslı
13
seriye
Frekanslı seri
Gözlem sonuçlarının düzenlenerek birinci sütunda olaya ait
değerleri,
ikinci
sütunda
frekansları
gösterecek
şekilde hazırlanırsa sınıflanmış seri elde edilir.
Örnek: 12 öğrencinin bir derse ait notları (basit seri için verilen
örnek) ve frekansları
Notlar(xi) Frekanslar(ni)
0
1
Not; frekans
25
1
30
2
değerlerinin
45
1
toplamının
50
3
gözlem sayısına
65
1
70
1
eşit olması
75
1
gerekir.
90
1
Frekanslı Seri
Değişkenlerin çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren
sayılar frekans adını alır.
İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta
yazılmış uzun sayı dizileri oluşturulacaktır.
Bu durumda çalışma kolaylığı sağlaması için frekans serileri düzenlenir.
Örnek: Daha önce basit seri olarak
düzenlenen seriyi frekans serisi olarak
düzenleyiniz.
Basit seri; 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2,
3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6, 8
xi
fi
0
3
1
4
2
5
3
6
4
3
5
2
6
1
8
151
Toplam
25
Frekans Serilerinin
Grafikle
Gösterilmesi
16
Basit seri
18,
20, 21, 22,
Frekanslı seri
X (satış adedi)
18
1
20
1
21
1
22
1
23
3
26, 27, 27, 27,
24
4
25
3
27, 28, 29, 29,
26
5
27
4
28
1
29
2
30
1
31
1
32
2
toplam
30
23, 23, 23, 24,
24, 24, 24, 25,
25, 25, 26, 26,
30, 31, 32, 32
Ele alınan değişkenin şıkları çok sayıda
ise sınıflamada sorun çıkabilir. Bu
durumda gruplamaya başvurulur.
17
Gruplama
Bir değişkenin birbirine yakın olan şıklarını bir araya getirmeye gruplama
denir.
Örneğin meslek istatistikleri yapılırken serbest çalışan doktor, avukat, dişçi,
tüccar gibi meslekler “serbest meslekler” grubuna alınmaktadır.
Gruplama ile toplanan veriler hakkında daha geniş ve açık bilgiler
alınabileceği gibi, her gruba düşen frekans sayısı da büyür.
Gruplamanın bu yararları yanında bazı sakıncaları da vardır.
Örneğin grup sınırlarının belirtilmesi önemli bir sorundur.
18
Kesikli
değişkenlerde
gruplu seri

sınıflar
18-20
2
21-23
5
24-26
12
27-29
7
30-32
4
toplam
30

Kesikli karakterdeki niceliksel
verileri gruplarken sınıf
aralıklarında boşluklar oluşur.
Yandaki seride KOBİ’lerde çalışan
işçi sayısı değişkeni kesikli bir
özelliğe sahiptir.
Çalışan İşçi
Sayısı
KOBİ Sayısı
5 – 14
10
15 – 24
20

Bu değişken tamsayı dışında
değerler almaz.
25 – 34
25

Bu sebeple sınıflar arası
boşluklar oluşur.
35 – 44
15
45 – 54
5
k=5
(32-18)/5=2.8
Gruplanmış seri
Gruplanmış seri
Gramaj verileri
Paketlerin
gramajları
992
993
994
995
996
997
998
999
1000
1001
1002
1003
1004
1005
frekanslar
1
1
1
2
2
2
3
5
3
2
4
1
2
1
Oluşturulan
frekanslı seri
Gruplanmış seri
Paketlerin
gramajları
992
993
994
995
996
997
998
999
1000
1001
1002
1003
1004
1005
frekanslar
1
1
1
2
2
2
3
5
3
2
4
1
2
1
Oluşturulan
frekanslı seri
sınıflar
992-994 den az
2
994-996 dan az
5
996-998 den az
4
998-1000 den az
8
1000-1002 den az
5
1002-1004 den az
5
1004-1006 dan az
3
toplam
30
Sürekli değişkene ait gruplu
seri
sınıf orta noktası: sınıfı iki eşit parçaya bölen
nokta. Üst ve alt limitin orta noktasıdır.
Sınıf frekansı: her
bir sınıftaki gözlem
sayısıdır
Sınıf aralığı: üst
sınıf limitinin alt
sınıf limitinden
çıkarılması ile elde
edilen değer.
Bir işletme fakültesi dekanı öğrencilerin haftalık kaç
saat çalıştıklarıyla ilgili bir çalışma yapıyor. 30
öğrenciyi tesadüfi olarak seçiyor ve onların geçen
hafta kaç saat çalıştıklarını kaydediyor.
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5,
20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8,
17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2,
12.9, 27.1, 16.6.
Veriyi sınıflandırıp frekans tablosunu
oluşturunuz.
Adım 1: kaç tane sınıf kullanacağına aşağıdaki
formülle belirle
2k > n
k=sınıf sayısı
n=gözlem sayısı
Adım 2: sınıf aralığını (i) aşağıdaki
formülü kullanarak bul
i > H – L = 33.8 – 10.3 = 4.7
5
k
H=verideki en büyük değer, L=verideki en küçük
değer, k=sınıf sayısı
Çıkan sonucu 5’e yuvarla
İlk sınıfın alt sınırını 10 olarak belirle ve 5 sınıf
oluştur.
Adım 3: herbir sınıf için limitleri belirle ve frekans
dağılımını oluştur
Sınıf orta noktası : aşağıdaki formülü kullanarak
sınıf orta noktasını hesapla
Ust limit + alt limit
2
Nisbi frekans dağılımı herbir sınıftaki frekansın
toplam frekanstaki oranını verir
Örnek: Frekans tablosunu oluşturma

Adım 1: sınıf sayısını belirle
2k > n. Formülünü uygula 80 araç
satıldığından uygun sınıf sayısı en az 7
olmalı.

Adım 2: sınıf aralığını belirle
i  (H-L)/k formülünü kullandığımızda
sınıf aralığı
($35,925 - $15,546)/7 = $2,911 olarak bulunur
Bu rakamı yukarıya 10 veya 100’ün katları şeklinde yuvarla
Örnek: Frekans tablosunu oluşturma

Adım 3: sınıf sınırlarını oluştur ve frekans tablosunu oluştur
Frekans tablosunu oluştur
Nisbi frekans dağılımı
Bir verinin gruplanmış seriye
dönüştürülmesi

Öğrencilerin notları
37 67 79 58 51 33
53 95 60 64 43 66
81 58 65 50 64 50
70
25
56
46
40
56
59
51
89
57 77
60 57
63 80
77
59
73
Xmin: 25
Xmax: 95
S 

95  25
1  3,322 log 36
 11 ,37  11
Serinin sınıf aralıkları
11 birim olacak şekilde
gruplanması
uygun
olacaktır.
Bir verinin gruplanmış seriye
dönüştürülmesi
Notlar
Öğrenci sayısı
25 - 37 dan az
2
37 - 49
“
“
4
49 - 61
“
“
17
61 - 73
“
“
7
73 - 85
“
“
4
85 - 97
“
“
2
Gruplanmış Seri
 Bir seriyi özetlemek ve
daha
anlaşılır
hale
getirmek
istediğimizde
gruplandırılmış
seriyi
kullanırız.
Frekans, olaydaki tekrar
sayısıdır.
Örnek : Bir mağazada
satılan kot pantolonların
bedenlerine göre satış
adetleri;
28 beden 2 adet
29 beden 5 adet
30 beden 6 adet
32 beden 7 adet
33 beden 1 adet
34 beden 4 adet
36
Gruplanmış Seri Tabloları
• Basit serilerde şans değişkeni kesikli olduğundan verileri
bir tablo şekline getirip frekans dağılımı ve rölatif frekans
dağılımını kullanırız.
• Rölatif (göreli) frekanslar her bir grubun içerisindeki
miktarı yüzde olarak ifade eden değerlerdir. Kümülatif
frekans ise mevcut grup ve kendinden önceki grupların
toplam içindeki yüzdesini ifade eder.
Beden Adet(fre.) Relatif(göreli) Frekans
28
29
30
32
33
34
Toplam
2
5
6
7
1
4
25
2 / 25 = 0,08
5 / 25 = 0,20
6 / 25 = 0,24
7 / 25 = 0,28
1 / 25 = 0,04
4 / 25 = 0,16
1,00
Kümülatif Frekans
0,08
0,28
0,52
0,80
0,84
1,00
37
Gruplanmış Seri Tabloları
38
Gruplanmış Seri Tabloları
39
Gruplanmış Seri Tabloları
40
Gruplanmış Seri Tabloları
41
Bileşik Seri
Aylık gelir
(dolar)
Tasarruf (dolar)
1355
50
1300
40
1200
45
Bir işyerinde çalışan 3
işçinin aylık gelir ve
tasarruflarını gösteren
basit bileşik seri

Gözlem değerlerini iki veya daha
fazla vasfa göre bir araya getiren
serilere bileşik seri" adı verilir.
Basit bileşik seri 2 sütundan
oluşur. Sütunlardan birinde
gözlem değerleri vasıflardan
birine göre küçükten büyüğe
doğru sıralanır. Diğer sütunda ise
her birimin diğer vasfına ilişkin
gözlem değeri yer alır
Frekans bölünmesi

Simetrik seri: frekanslar serinin maksimum noktasının etrafında
simetrik olarak dağılır.

Bir olaya etki eden faktörler tesadüfi olarak ortaya çıkıyor ve olayı zıt
yönde etkiliyorlarsa ve bu etkilerin şiddet dereceleri de birbirine eşitse
bu tip seriler ortaya çıkar

Simetrik seri sivri, normal ve basık olabilir.

Normal seride maksimum nokta belli bir yüksekliktedir. Bu yükseklik
normalin üstünde ise sivri seriden altında ise basık seriden söz edilir
Frekans bölünmesi
Eğer gözlem sayısı artarken sınıf aralığı sonsuz küçültülürse, frekans
poligonu bir frekans eğrisi şekline dönüşür.
Uygulamada sıkça karşılaşılan frekans eğrileri Şekil 2. 5’de gösterilmiştir.
Frekans bölünmesi

Frekanslar serinin tam ortasında değil de, ortadan
önceki bir noktada yığıldığında "sağa eğik seri" den,
ortadan sonraki bir noktada yığıldığında ise "sola eğik
seri"den söz edilir. Her iki durumda da seri asirnetrik
olup, sağa eğik seriye "asimetrisi pozitif seri", sola eğik
seriye "asimetrisi negatif “ seri adı da verilir.

Seriye baktığımızda kuyruk sağımızda kalıyorsa seri sağa
eğik solumuzda kalıyorsa sola eğik bir seridir
Frekans bölünmesi

Sağa eğik seriye örnek: kamu sektöründe çalışanlara ödenen maaşların
bölünmesi. Maaşların çoğu aritmetik ortalamanın altında

Sola eğik seriye örnek: sorular kolay olduğunda sınav sonuçlarının
bölünmesi. Notların çoğu aritmetik ortalamanın üstünde.
Frekans bölünmesi
Çok maksimumlu seri

Frekansların iki yada
daha çok maksimum
yaptığı seri

Kütle homojen birimleri
kapsamadığı zaman
ortaya çıkar mesela
erkek ve kadın
boylarının aynı seride
yer alması çift
maksimumlu seri ortaya
çıkarır.
Frekans bölünmesi
J serisi

Frekans başta düşük
yavaşça artar sonra ani
yükselir.

Yaşa göre kalp
hastalıklarından ölüm J
serisine tipik bir
örnektir.
Frekans bölünmesi
Ters J serisi

Ters J serisinde ise, J
serisinin aksine,
frekanslar başlarda en
yüksek düzeyde olup
hemen şiddetle düşer ve
azalışı sonra hafiflemekle
beraber devam eder.

Büyüklüklerine göre
işletmelerin bölünmesi

Çocuk hastalıklarından
ölümlerin yaşa göre
bölünmesi
Frekans bölünmesi
U serisi

Bu serilerde maksimum
frekanslar serinin iki
ucunda, minimum
frekanslar ise ortalarda
yer alır.

Ölüm oranlarının veya
işsizliğin yaşlara göre
bölünmesi
GRAFİKLER

Grafikler istatistiksel bilgilerin şekillerle ifade edilmesidir.

Grafik gözlem sonuçlarının anlaşılmasını kolaylaştırır.

Çünkü grafik temsil ettiği olayın bileşimini ve
değişmelerindeki ana eğilimi bütün canlılığı ile ilk bakışta
belli eder.

Bu nedenle, rakamlardan hoşlanmayan veya onlardan anlam
çıkarmakta güçlük çeken bir kimse serilerden çok
grafiklerle ilgilenir.

Grafiğin bir dezavantajı küçük farkları ve değişmeleri
gösterememesidir.

iyi çizilmiş bir grafik üzerinde gösterilen sonuçlar
insanlarda sürekli bir izlenim bırakır.
GRAFİKLER
Örnek-sütun grafiği
Aşağıda Amerika’nın 6 şehrindeki işsizlik rakamları ile
ilgili veriler verilmiştir
Şehir
Her 100,000 başına düşen
işsiz sayısı
Atlanta, GA
Boston, MA
Chicago, IL
Los Angeles, CA
New York, NY
Washington, D.C.
7300
5400
6700
8900
8200
8900
Sütun grafiği
soru

Bu verilere ait çubuk diyagram grafiğini çiziniz
Evde yaşayan kişi
sayısı
1
6
2
18
3
24
4
41
5
35
6
15
7
19
8
14
10
10
Toplam
180
GRAFİKLER
 Alan
diyagramlarının en çok
kullanılanı daire şeklinde
olanıdır.
 Daire grafiği dağılımın nisbi
frekansını göstermek
bakımından yararlıdır. Daire
frekansa göre oransal olarak
kısımlara bölünür ve bölümler
farklı gruplara tahsis edilir.
200 atlete favorisi olan spor ayakkabı markası sorulmuş ve aşağıdaki
sonuçlar elde edilmiştir. Alan grafiğini (daire) çiziniz
marka
Atlet sayısı
%
Nike
92
46.0
Adidas
49
24.5
Reebok
37
18.5
Asics
13
6.5
Other
9
4.5
Ayakkabı markaları için daire grafiği
18,50%
6,50%
4,50%
Nike
Adidas
Reebok
Asics
Other
24,50%
46%
Ağırlık Verileri
71,6678
71,9902
74,1246
52,1406
70,0821
62,7181
77,5122
86,1013
81,0930
72,1109
77,9169
63,5059
76,8961
90,4038
74,5058
69,6469
61,9232
65,7171
75,5000
83,8189
84,2766
78,6458
73,1000
94,5391
80,6314
74,4337
66,6818
86,5080
68,1715
88,4113
73,6000
73,0000
85,5665
53,1676
80,9486
62,4231
76,6000
61,5705
67,0000
71,3824
66,0908
78,4345
53,6750
82,0000
77,0000
76,0000
67,1974
68,9855
80,0149
68,2225
59
Sınıflanmış Seri Tabloları
Sınıf
50-57’den az
57-64’den az
64-71’den az
71-78’den az
78-85’den az
85-92’den az
92-99’den az
Toplam
Frekans
3
5
10
17
9
5
1
50
Relatif(göreli) Fre.
Küm. Relatif Fre.
3 / 50 = 0,06
5 / 50 = 0,10
10 / 50 = 0,20
17 / 50 = 0,34
9 / 50 = 0,18
5 / 50 = 0,10
1 / 50 = 0,02
1,00
0,06
0,16
0,36
0,70
0,88
0,98
1,00
60
Download

Basit Seri