Hafta 03: Verinin Numerik Analizi
(Yrd.Doç.Dr. Levent AKSOY)
1.
2.
3.
4.
5.
6.
7.
8.
Verinin görsel özetlenmesi ve histogram.
Ortalama, standart sapma ve diğer tanımlayıcı istatistikler.
Kombinasyon, Permutasyon ve Olasılık.
Olasılık kuramı.
Kesikli rassal değişkenler.
Sürekli rassal değişkenler.
Normal dağılım.
Örneklem dağılımı
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Verinin iki temel özelliği dikkatimizi çeker: Merkezi Eğilim
ve Yayıklık
Merkezi Eğilim Ölçüleri:
Mod
Medyan
Aritmetik Ortalama
Geometrik Ortalama
eİKT 203 – İstatistik
Yayıklık Ölçüleri:
Aralık
Dördebölenler Aralığı
Ortalama Mutlak Sapma
Varyans / Standart Sapma
Hafta: 03 – Verinin Numerik Analizi
Merkezi Eğilim
Ortalama
Mod
Medyan
n
x 
x
i
i1
n
Aritmetik
Ortalama
eİKT 203 – İstatistik
Sıralı değerlerin
ortası
En sık gözlenen
değer (varsa)
Hafta: 03 – Verinin Numerik Analizi
En çok tekrarlayan değere mod denir.
Uç değerlerden çok etkilenmez.
Hiç mod olmayabileceği gibi birden çok mod da olabilir.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mod = 9
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
0 1 2 3 4 5 6
Mod yok
En ortadaki gözlemdir. Gözlemlerin %50si solunda %50si
sağındadır.
Uç değerlerden çok etkilenmez.
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
Medyan = 3
Medyan = 3
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Medyan en ortadaki gözlemdir.
Eğer gözlem sayısı tek ise medyan
(en ortadaki gözlemdir).
sıradadır
Eğer gözlem sayısı çift ise medyan
ve
sıradaki
gözlemlerin (en ortadaki iki gözlemin) toplamının
yarısıdır.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Aritmetik ortalama en çok kullanılan merkezi eğilim
ölçüsüdür.
Tüm gözlemlerin değerlerinin toplanıp gözlem sayısına
bölünmesiyle bulunur.
0 1 2 3 4 5 6 7 8 9 10
Ortalama = 3
eİKT 203 – İstatistik
0 1 2 3 4 5 6 7 8 9 10
Ortalama = 4
Hafta: 03 – Verinin Numerik Analizi
Daha formal gösterimiyle ortalama:
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Gözlemlerin değerlerinin mertebelerinin birbirlerinden
çok farklı olması durumunda ortalama en büyük
değerden çok etkilenir. Bu durumda geometrik ortalama
kullanılabilir.
Örneğin gözlemlerimiz {15, 250, 4000} olsun. Aritmetik
ortalama en büyük değerden çok etkilenir.
Geometrik ortalama gözlem değerlerinin birbirleriyle
çarpılıp gözlem sayısı kökünün alınmasıyla bulunur.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Formal gösterimiyle ortalama:
Her iki tarafın da logaritmasını alırsak.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Gözlemlerin ne kadar yayıldığını ölçen yöntemler.
Aralık
Dördebölenler Aralığı
Ortalama Mutlak Sapma
Varyans / Standart Sapma
Merkezi aynı,
yayıklık farklı
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
En basit yayıklık ölçütüdür.
En büyük gözlem ile en küçük arasındaki farka eşittir.
Aralık = Xmaks – Xmin
Örnek:
0 1 2 3 4 5 6 7 8 9 10 11 12
13 14
Aralık = 14 - 1 = 13
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Verinin nasıl dağıldığına bakmaz
7
8
9
10
11
12
7
Aralık = 12 - 7 = 5
8
9
10
11
12
Aralık = 12 - 7 = 5
Uç değerlerden doğrudan etkilenir
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Aralık = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Aralık = 120 - 1 = 119
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Dördebölenler veriyi her bölümünde eşit sayıda gözlem
olacak şekilde ayıran değerlerdir.
25%
Q1
25%
25%
Q2
25%
Q3
Gözlemlerin %25’i Birinci Dördebölen’den (Q1) küçük,
%75’i büyüktür.
Q2 medyan ile aynıdır (%50’si küçük, %50’si büyüktür).
Gözlemlerin sadece %25’i üçüncü dördebölenden
büyüktür.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Sıralı verinden aşağıdaki sırada olan veriler
dördebölenlerin değerleridir.
Birinci Dördebölenin Yeri: Q1 = 0.25(n+1)
İkinci Dördebölenin Yeri:
(medyan)
Q2 = 0.50(n+1)
Üçüncü Dördebölenin Yeri: Q3 = 0.75(n+1)
n gözlem sayısı
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Birinci Dördebölen
Sıralı Veri: 11 12 13 16 16 17 18 21 22
n=9 iken (n+1)/4’üncü veri = (9+1)/4 = 10 / 4 = 2,5. veri
birinci dördebölendir. Tam sayı olmadığı için 2. ve 3.’nün
ortalaması alınır.
Q1 = 12,5
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Ortadaki %50 veriyi içeren aralıktır.
Üçüncü ile birinci dördebölen arasındaki farktır.
Dördebölenler Aralığı = Q3 - Q1
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Bir verinin ortalamasından sapmasının ortalama değerini
verir.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Varyans sapmaların karelerinin yaklaşık ortalamasıdır.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Standart Sapma varyansın kare köküdür.
eİKT 203 – İstatistik
Hafta: 03 – Verinin Numerik Analizi
Download

eIKT 203 Istatistik 03 - Numerik Ölçumler (sistem)