Prof. Dr. Ömer SATICI Biyoistatistik ders notu
İstatistiksel güven aralıkları
uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan
parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin
normal dağılıma uyması gerekir. Örneğin, Ki-Kare Testleri normal dağılımı da içeren her
hangi bir dağılıma uygulanabilir.
Bu bölümde dağılımların normallik testinde
kullanılabilecek iki parametrik olmayan test tekniği açıklanmıştır. Bu teknikler KolmogorovSmirnov K-S veya Lilliefors testi olarak bilinirler. K-S testi daha kolay uygulanmaktadır.
K-S Testi
K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun
karşılaştırılması ile yapılır.
F ( X )  P( X  x )
Örnek yığılmalı dağılım fonksiyonu S(x), seçilen bir x değerine eşit veya daha küçük olan
örnek değerinin oranını tanımlar. S(x) aşağıdaki gibi hesaplanır.
Örnek: 10 gözlemli bir çalışmada:
110 89 102 80 93 121 108 97 105 103 olsun
Önce gözlem değerleri küçükten büyüğe doğru sıralanır.
80 89 93 97 102 103 105 108 110 121
X=80, toplam gözlem değerinin en küçüğü olduğundan bu değere eşit veya daha küçük
değerde olan gözlemlerin oranı ;
S(80)=1/10 =0.10 olur.
Benzer olarak, 10 değerin 2 si 89’a eşit veya daha küçüktür. (80 ve 89) bunların oranı ise;
S(89)=2/10=0.20 olur. Kalanları benzer olarak düzenleyelim.
X
80 89 93 97 102 103 105 108 110 121
S(x) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Bu gözlem değerlerinin ortalaması µ=100 ve standart sapması σ=10 olan ve normal dağılım
gösteren bir yığından çekildiği varsayılırsa,
H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından
çekildiği söylene bilir mi?
H 1: Hayır veriler normal dağılıştan çekilmemiştir.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
X için yığılımlı F(X) hesaplanması
F (80)  P ( x  80) 
 x   80  100 
F (80)  P 

 P (Z  2)  0.0228 olur
10 
 
Benzer hesaplamalarla xler e karşı gelen ölçümler yapılır.
X
F(X)=P(X≤x)
80 P(X≤80)=P(Z≤-2)=0.0228
89 P(X≤89)=P(Z≤-1.1)=0.1357
93 P(X≤93)=P(Z≤-0.7)=0.2420
97 P(X≤97)=P(Z≤-0.3)=0.3821
102 P(X≤102)=P(Z≤0.2)=0.5793
103 P(X≤103)=P(Z≤0.3)=0.6179
105 P(X≤105)=P(Z≤0.5)=0.6915
108 P(X≤108)=P(Z≤0.8)=0.7881
110 P(X≤110)=P(Z≤1.0)=0.8413
121 P(X≤121)=P(Z≤2.1)=0.9821
Eğer H0 : Hipotezi doğru ise, bütün x değerleri için F(X) ve S(X) değerleri benzer olmalıdır.
Buna karşın, eğer H0 hipotezi yanlış ise , en azından bazı x değerleri için F(X) ile S(x)
arasında büyük farklar olacaktır. F(X) ile S(X) arasındaki farkların en büyüğünün mutlak
değeri (D) test istatistiği olarak tanımlanır.
Test istatistiği;
D=max [F(X)-S(X)] olur
D nin hesaplanması için, önce her bir x değeri için F(X) ile S(X) arasındaki fark hesaplanır.
Bu farkların en büyük mutlak değere sahip olanı test istatistiği olarak belirlenir. Farklar
aşağıda hesaplanmıştır.
X
80
89
93
97
102
103
105
108
110
121
F(X)
0.0228
0.1357
0.242
0.3821
0.5793
0.6179
0.6915
0.7881
0.8413
0.9821
S(X)
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
F(X)-S(X)
-0.0772
-0.0643
-0.0580
-0.0179
0.093
0.0179
-0.0085
-0.0119
-0.0587
-0.0179
[F(X)-S(X)]
0.0772
0.0643
0.058
0.0179
0.0793=D
0.0179
0.0085
0.0119
0.0587
0.0179
Değerler incelendiğinde en büyük mutlak fark değerinin D=0.0793 olduğu görülür. Eğer, D
değeri D >F(X)-S(X) ise H0 hipotezi ret edilir.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Bu farkın büyüklüğüne karar vermek için ilgili tablo Ek çizelge 10 da verilmiştir. Kritik
değerler α=0.05, α=0.10, ve α=0.20 önem seviyelerinde n=1…… 40 a kadar için verilmiştir.
Eğer , örnek hacmi n>40 ise, kritik değer
Α- α=0.20 için TH 
B- α=0.10 için TH 
n
1.22
n
C- α=0.050 için TH 
D- α=0.02 için TH 
1.07
, olur
1.36
n
1.52
n
, olur.
, olur
, olur
Ağer,
Sonuç: Yukarıdaki örnek veriler
için hesaplanan test istatistiği D= 0.0793 değeri, α=0.05
önem seviyesindeki n=10 değerine karşılık gelen kritik tablo değeri olan 0.409 değeri ile
karşılaştırılır. D=0.0793 ≤ 0.409 olduğundan Ho hipotezi kabul edilir.
Yorum: Verilerin µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir
yığından çekildiğini söylemek için yeterli destek bulunmaktadır.
II- LİLLİEFORS TESTİ
Çoğu uygulamada , normallik testi yapılacak populasyonun
ortalaması ve varyansı bilinmemektedir. Oysa K-S Testinde, bu parametrelerin bilindiği
kabul edilmektedir.
İşte bu Lilliefors Testi K-S testine benzemektedir. Ama , Lilliefors testi Populasyon varyansı
ve ortalamasının bilinmediği populasyonların normallik testinin yapılmasına yarar.
Aradaki fark nedir diye sorulursa; F(X) in hesaplanmasında (µ ve σ yerine) örnek ortalaması
ve standart sapması s nin kullanıldığını bileceğiz. X, S örnek sonuçları istatistiktir.
Örnek yığılımlı dağılım fonksiyonu S(X) in hesaplanması ve test istatistiği D nin
hesaplanması , K-S testindekilerle aynıdır. Hesaplanan D, test istatistiği Lilliefors test tablo
sonuçları ile karşılaştırılır. Eğer D> Tablo değeri ise Ho hipotezi ret edilir.
ÖRNEK: Bizim işletmede günlük süt üretimi kakında hipotez testi yapmak üzere rasgele
seçilen 15 günlük süt üretim miktarları litre olarak hesaplanmış ve aşağıda verilmiştir.
91 95 93 103 101 105 96 94 101 98 88 102 94 95 92
Bu bulgulara göre,
işletmemizin günlük süt üretiminin normal dağılıp dağılmadığını α=0.05 önem seviyesinde
test ediniz.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
ÇÖZÜM:
Populasyon ortalamsı ve varyansı bilinmediğinden, normallik testi Lilliefors testi ile
yapılabilir. Verilerin ortalama ve standart sapma değerlerini hesaplayalım. X=96.47 , s=4.85
olarak bulunur. Testin uygulanması K_S testindeki işlemlerle aynıdır. Veriler sıraya
dizilecek,
S(X) , F(X) ve mutlak değeleri tabloda verilmiştir. Hesaplamalardan sonra F(X) ve S(X)
farkları ve en büyük mutlak fark değeri bulunacak. D istatistiğ tablo değeri ile
karşılaştırılacaktır.
Örnek ve populayon Yığılmalı Olasılık değerleri
X
88
S(X)
1/15=0.067
F(X)
 x   88  96.47 
P ( x  88)  

  P ( Z  1.75)  0.0401
4.85 
 
91 2/15=0.133
 x   91  96.47 
P ( x  91)  

  P ( Z  1.13)  0.1292
4.85 
 
92 3/15=0.200
 x   92  96.47 
P ( x  92)  

  P ( Z  0.92)  0.1788
4.85 
 
93 4/15=0.267
 x   93  96.47 
P ( x  93)  

  P ( Z  0.72)  0.2358
4.85 
 
94 6/15=0.400
 x   94  96.47 
P ( x  94)  

  P ( Z  0.51)  0.3050
4.85 
 
95 8/15=0.533
 x   95  96.47 
P ( x  95)  

  P ( Z  0.30)  0.381
4.85 
 
96 9/15=0.600
 x   96  96.47 
P ( x  96)  

  P ( Z  0.10)  0.4602
4.85 
 
98 10/15=0.667
 x   98  96.47 
P ( x  98)  

  P ( Z  0.32)  0.6255
4.85 
 
101 13/15=0.867
 x   101  96.47 
P ( x  101)  

  P ( Z  0.93)  0.8238
4.85
 

103 14/15=0.933
 x   103  96.47 
P ( x  103)  

  P ( Z  1.3592)  0.9115
4.85
 

105 15/15=1.00
 x   105  96.47 
P ( x  105)  

  P ( Z  1.76)  0.9608
4.85
 

İlgili Teorik tabloda n=15 ve α=0.01 için kritik değer =0.257 olarak bulunuyor.
D=0.1509 ≤0.257 olduğundan, Ho Hipotezi kabul edilir. İşletmemizdeki günlük süt
üretiminin verileri NORMAL dağılır diyebiliriz.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
MUTLAK FARKLAR VE LİLLİEFORS TEST İSTATİSTİĞİ
X
88
91
92
93
94
95
96
98
101
103
105
F(X)
0.0401
0.1292
0.1788
0.2358
0.3050
0.3821
0.4602
0.6255
0.8238
0.9115
0.9608
S(X)
0.067
0.133
0.200
0.267
0.400
0.533
0.600
0.667
0.867
0.933
1.00
F(X)-S(X)
-0.0269
-0.0038
-0.0212
-0.0312
-0.0950
-0.1509
-0.1398
-0.0415
-0.0432
-0.0215
-0.0392
|F(X)-S(X)|
0.0269
0.0038
0.0212
0.0312
0.095
0.1509=D
0.1398
0.0415
0.0432
0.0215
0.0392
Örnekteki verilere birde SPSS Paket programında Normallik testi uygulayalım.
Örnek : 80 89 93 97 102 103 105 108 110 121 olsun.
H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından
çekildiği söylene bilir mi?
H1: Hayır veriler normal dağılıştan çekilmemiştir.
1. Adım
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
2. Adım
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
3. Adım
4. Adım
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
5. Adım
Descriptives
Statistic
Gunluk süt üretimi
Mean
Std. Error
100,8000
95% Confidence Interval for
Mean
Lower Bound
92,4863
Upper Bound
109,1137
5% Trimmed Mean
100,8333
Median
102,5000
Variance
3,67514
135,067
Std. Deviation
11,62182
Minimum
80,00
Maximum
121,00
Range
41,00
Interquartile Range
16,50
Skewness
-,150
,687
,293
1,334
Kurtosis
Tests of Normality
a
Kolmogorov-Smirnov
Statistic
Gunluk süt üretimi
,141
df
Shapiro-Wilk
Sig.
10
Statistic
*
,200
,989
df
Sig.
10
,995
a. Lilliefors Significance Correction
VERİLERİN NORMAL DAĞILIŞA UYDUĞU GÖRÜLÜYOR
*. This is a lower bound of the true significance.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Örnek: Kız ve Erkek öğrencilerin Biyoistatistik sınav hata puanları dağılımı verilmiştir
Tablo Kız ve Erkeklerin Puan dağılımı
Hata Puanı 24 28 32
fK
0 0 0
fE
1 1 3
Kız ve Erkek öğrencilein
K-S testi ile test ediniz.
36
0
2
hata
40 44 48 52
3 2 3 2
3 0 0 0
puanlarına göre dağılımlarında fark olup olmadığını iki örnek
SPSS te veriler X= Hata PUANI stununa girilir.. Cinsiyet değişkeni için de Y=Cinsiyet
stununa girilir. (Cinsiyet E=1, Cinsiyet K=0) olarak kodlanır . Çözüm K-S Testi için Non
Parametri test kısmında 2 Independent Sample seçeneği seçilerek veriler ilgili yerlere atanır.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Çözüm:
SPSS te veri girişi için
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Çıktılar şöyledir.
Two-Sample Kolmogorov-Smirnov Test
Frequencies
a
Cinsiyet
Hata Puani
Test Statistics
N
,00
10
1,00
10
Total
20
Hata Puani
Most Extreme Differences
Absolute
,700
Positive
,000
Negative
-,700
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
a. Grouping Variable: Cinsiyet
Yorum: ERKEK ve KIZ öğrencilerin hata puanları türdeş değildir. Kızların hata puanları
dağılımı, erkeklerin hata puanı dağılımından önemli düzeyde pozitif uçta yer almaktadır.
Kızların hata Puanları , Erkeklerin hata puanlarından daha yüksektir.
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
1,565
,015
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
K-S Tek Örnek Testi
Örnek çözüm:
Hasta kal. Gun Sayısı Birey Sayısı
5
1
6
0
7
2
8
3
9
2
10
1
11
0
12
1
Bireylerin Tifoya yakalanma ve hastanede kalma günlerine göre dağılımlarında
veriler normal dağılışa uyuyor mu? K-S testi ile Test ediniz.
KAYNAK:
AlimIşık Prof.Dr. İstatistik - II BETA BASIM A.Ş. BAYRAMPAŞA /İSTANBUL 2006
Kazım Özdamar. Paket Programlar ile İstatistiksel veri Analizi KAAN KİTAP EVİ 1999
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Yorum: Tifoya yakalananların hastanede kalış günleri Normal dağılışa
uyuyor P=0.953
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Download

çiNE İLçEsİ AİLE sAĞLIäI MERKEZİ NÖBET LİsTEsİ