ÇUKUROVA ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
DOKTORA TEZİ
Hasan ÖNDER
PERMÜTASYON
TESTLERİNİN
DOĞRUSAL
UYGULANMASI VE KARŞILAŞTIRILMASI
MODELLERDE
ZOOTEKNİ ANABİLİM DALI
ADANA,
2005
ÖZ
DOKTORA TEZİ
PERMÜTASYON TESTLERİNİN DOĞRUSAL MODELLERDE
UYGULANMASI VE KARŞILAŞTIRILMASI
Hasan ÖNDER
ÇUKUROVA ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
ZOOTEKNİ ANABİLİM DALI
Danışman
Yıl
Jüri
: Prof. Dr. Zeynel CEBECİ
: 2005, Sayfa: 121
: Prof. Dr. Zeynel CEBECİ
Prof. Dr. G. Tamer KAYAALP
Prof. Dr. Sadullah SAKALLIOĞLU
Prof. Dr. Ercan EFE
Doç. Dr. Selahattin KAÇIRANLAR
F ve t-testleri genellikle hipotezlerin ve/veya model parametrelerinin önemini
test etmek için kullanılmaktadır. Parametrik testler oldukça etkili olmasına rağmen,
modelin ihtiyaç duyduğu varsayımların sağlanamaması durumunda etkinliklerini
yitirebilmektedirler. Bu durumda, varsayımlardan etkilenmeyen permütasyon testleri
parametrik olmayan bir yöntem olarak uygulanabilmektedir. Bu çalışmada, ham
verinin tam permütastonu, kalıntıların tam permütasyonu ve kalıntıların kısmi
permütasyonu gibi permütasyon yöntemleri doğrusal regresyon, tesadüf parselleri,
tesadüf blokları ve latin kare deneme desenleri için I. Tip hata oranı bakımından
karşılaştırılmıştır. Bu testlerin etkinliklerinin değerlendirilmesinde hayvancılık
verilerinden faydalanılmıştır. Bu çalışmanın sonucu olarak, permütasyon testlerinin I.
Tip hata oranı bakımından parametrik yöntemlere göre daha güvenilir sonuçlar
ürettiği gözlemlenmiştir ve permütasyon testlerinin I. ve II. Tip hatalardan kaçınmak
ve olası fayda kayıplarının engellenebilmesi için önerilebileceği anlaşılmıştır.
Anahtar Kelimeler: Permütasyon testleri, Doğrusal Modeller, I. ve II. Tip hata,
Biyometri
I
ABSTRACT
PhD THESIS
USE AND COMPARISON OF PERMUTATION TESTS IN LINEAR
MODELS
Hasan ÖNDER
DEPARTMENT OF ANIMAL SCIENCE
INSTITUTE OF NATURAL AND APPLIED SCIENCES
UNIVERSITY OF ÇUKUROVA
Supervisor: Prof. Dr. Zeynel CEBECİ
Year : 2005, Pages: 121
Jury : Prof. Dr. Zeynel CEBECİ
Prof. Dr. G. Tamer KAYAALP
Prof. Dr. Sadullah SAKALLIOĞLU
Prof. Dr. Ercan EFE
Assoc. Prof. Dr. Selahattin KAÇIRANLAR
F and t-test are generally used to test significance of hypothesis and/or model
parameters. Although parametric tests are considerably effective, they can be
ineffective when the assumptions needed by model are not provided, which is a usual
stuation for many data sets. In this case, permutation test not affected by the
assumptions can be applied as a non-parametric method. In this study, permutation
tests such as permutation of raw data, permutation of residuals under full model and
permutation of residuals under restricted model are compared for linear regression,
completely randomized designs, randomized block design and latin square design in
terms of the Type I error rates, and performance of each tests are studied via animal
science data. Results from this study indicate that permutation tests yields more
reliable results than parametric tests in terms of Type I error rate, and permutation
tests are recommended in order to avoid Type I and II errors to prevent the potential
profit lost.
Key Words: Permutation tests, Linear models, Type I and II errors, Biometry
II
TEŞEKKÜR
Tez konusunun belirlenmesi ve yürütülmesi aşamalarında yardımlarını eksik
etmeyen danışman hocam sayın Prof. Dr. Zeynel CEBECİ’ye, tez izleme komitemde
yer alan sayın Prof. Dr. G. Tamer KAYAALP’e ve sayın Prof. Dr. Sadullah
SAKALLIOĞLU’ na teşekkür ederim.
III
İÇİNDEKİLER
SAYFA
ÖZ…………………………………………………………………………………….I
ABSTRACT………………………………………………………………………….II
TEŞEKKÜR…………………………………………………………………………III
İÇİNDEKİLER……………………………………………………………………...IV
SİMGELER ve KISALTMALAR…………………………………………………..VI
ÇİZELGELER DİZİNİ……………………………………………………………..VII
ŞEKİLLER DİZİNİ………………………………………………………………..VIII
1. GİRİŞ……………………………………………………………………………..1
2. ÖNCEKİ ÇALIŞMALAR………………………………………………………..4
3. MATERYAL ve METOT………………………………………………………...7
3.1. Materyal………………..…………………………………………………….7
3.2. Metot…………………………………..……………………………………..7
3.2.1. Hipotez, Hata veGüç…………………………………………………….7
3.2.2. Çoklu Doğrusal Regresyon…………………………………………….10
3.2.2.1. Korelasyon Katsayılarının Tahmini………...…………………….12
3.2.2.2. Regresyon Katsayılarının Testi………...…………………………15
3.2.3. Varyans Analizi………………………………………………………..19
3.2.3.1. Tesadüf Parselleri Deneme Deseni……………………………….20
3.2.3.2. Tesadüf Blokları Deneme Deseni………………………………...23
3.2.3.3. Kareler Ortalamasının Beklenen Değeri…………………….……29
3.2.3.4. Tesadüf Bloklarının Tesadüf Parsellerine Göre Etkinliği…….…..33
3.2.3.5. Latin Kare Deneme Deseni………………….……………………42
3.2.4. Permütasyon Testi……………………………………………………...52
3.2.4.1. Permütasyon Testlerinin Tesadüf Parselleri Deneme Deseninde
Uygulanması………………………………………………………...……58
3.2.4.2. Permütasyon Testlerinin Tesadüf Blokları Deneme Deseninde
Uygulanması…………………...…………………………………………59
3.2.4.3.
Permütasyon
Testlerinin
Latin
Kare
Deneme
Deseninde
Uygulanması……………………………………...………………………70
IV
3.2.5. Anderson-Darling Uyum İyiliği Testi………………………………….72
4. BULGULAR VE TARTIŞMA…………………………………………………...75
4.1. Çoklu Doğrusal Regresyon…………………………………………………75
4.2. Tesadüf Parselleri Deneme Deseni…………………………………………76
4.3. Tesadüf Blokları Deneme Deseni…………………………………………..78
4.4. Latin Kare Deneme Deseni…………………………………………………80
5. SONUÇ VE ÖNERİLER…………………………………………………………82
KAYNAKLAR……………………………………………………………………...84
ÖZGEÇMİŞ…………………………………………………………………………89
EK 1. Analizlerde Kullanılan Veriler ve Yazılımların Kullanımı…………………..90
EK 2. Tahminlerin Varyanslarının Ortalama Değeri………………………………117
EK 3.
{ θ 1 , L ,θ K }
Parametrelerindeki
Karşılaştırmaların
Tahminlerinin
Varyanslarına Ait Varsayımlar…………………………………………………….118
V
SİMGELER ve KISALTMALAR
EKK
: En Küçük Kareler Yöntemi
HVTP
: Ham verinin tam permütasyonu
KTP
: Kalıntıların tam permütasyonu
KKP
: Kalıntıların kısmi permütasyonu
ANOVA
: Varyans Analizi (Analysis of Variance)
ML
: En Çok Olabilirlik (Maximum Likelihood)
F*
: Permütasyona tabi tutularak elde edilen istatistik değer
e
~
e
: Teknik Hata
RS
: Rektal sıcaklık
NS
: Nabız sayısı
SS
: Solunum sayısı
KOA
: Uygulama kareler ortalaması
KOB
: Blok kareler ortalaması
KOe
: Hata kareler ortalaması
E(KO)
: Kareler ortalamasının beklenen değeri
KT
: Kareler Toplamı
: Ünite Hatası
VI
ÇİZELGELER DİZİNİ
SAYFA
Çizelge 1.1. Örneğe ait 35 kombinasyon ve bunlara ait istatistik değerleri………...56
Çizelge 4.1. Tesadüf blokları deneme deseni için ANOVA, HVTP, KKP ve KTP
yöntemlerinden elde edilen I. tip hata olasılıkları………………………………78
Çizelge 4.2. Latin kare deneme deseni için ANOVA, HVTP, KKP ve KTP
yöntemlerinden elde edilen I. tip hata olasılıkları………………………………80
VII
ŞEKİLLER DİZİNİ
SAYFA
Şekil 1.1. Permütasyon testlerinin çalışma yöntemi………………………………...19
Şekil 4.1. Doğrusal regresyonlarda EKK, HVTP ve KTP analizlerinden elde edilen I.
tip hata olasılıkları……………………………………………………………...75
Şekil 4.2. Tesadüf parselleri deneme deseni için ANOVA ve HVTP yöntemlerinden
elde edilen I. tip hata olasılıkları………………………………………………..77
Şekil 4.3. Tesadüf blokları deneme deseninde tür ve zaman değişkenleri için
ANOVA, HVTP, KKP ve KTP yöntemlerinden elde edilen I. tip hata
olasılıkları............................................................................................................78
Şekil 4.4. Tesadüf blokları deneme deseninde tür x zaman interaksiyon terimi için
ANOVA, HVTP, KKP ve KTP yöntemlerinden elde edilen I. tip hata olasılıkları
………………………………………………………………………………….79
Şekil 4.5. Latin kare deneme deseninde sıra, sütun ve muamele için ANOVA, HVTP,
KKP ve KTP yöntemlerinden elde edilen I. tip hata olasılıkları……………….80
VIII
1. GİRİŞ
Hasan ÖNDER
1. GİRİŞ
Doğrusal istatistiksel yöntemler için permütasyon testlerinin ilk olarak ortaya
çıkışı yirminci yüz yılın başlarında Fisher (1935) ve Pitman (1937a,b,c) ’ın
çalışmalarına dayanmaktadır. Fisher, Charles Darwin’in mısır (Zea mays) denemeleri
üzerinden almış olduğu verilerde permütasyon testini denemiş olup olası 32,768
permütasyonda orijinal değerden büyük ya da eşit olan 1726 permütasyon sonucu
olduğunu ve bu durumda P = 1726 / 32768 = 0.05267 olduğunu belirtmiştir, orijinal
testten elde edilen sonuç ise P = 0.0497 dir. Fisher bunun üzerine permütasyon
testlerinin daha güçlü sonuçlar verdiğini “The Design of Experiments (1935)” isimli
kitabında açıklamış ve testin teorisini incelemiştir. Fakat tüm permütasyon
işlemlerini elde çözmek zorunda olduğundan bu yöntem üzerinde çalışmaktan
vazgeçmiştir (Ludbrook ve Dudley, 1998). Bu test yöntemleri güçlü bilgisayarların
ortaya çıkışına dek biyoloji ve davranış bilimlerinde kullanılamamış teorik
çalışmalarla sürdürülmüştür (Anderson ve Robinson, 2001; Atkinson ve Bailey,
2001; Nichols ve Holmes, 2001).
Biyolojik ve ekolojik alanlarda çalışan araştırmacılar elde ettikleri verilerin
analizinde diğer alanlara göre daha karmaşık durumlarla karşı karşıya kalmaktadır.
Deneye ve gözleme dayalı çalışmalarda elde edilen verilerde hataların bağımsız ve
ortalaması sıfır, varyansı genel ( σ 2 ) olan normal dağılıma sahip değişken ile aynı
özellikleri
gösterdiği
varsayımı
bulunmaktadır.
Bu
varsayımlar
geleneksel
istatistiksel yöntemler için zorunludur. Çoğu uygulama durumunda bu varsayımlar
gerçekçi olamamaktadır (Anderson, 2001). Varsayımlar sağlanamadığında klasik test
işlemleri yeterliliklerini kaybetmektedir (Mills, 1997). F, t, χ2 gibi geleneksel
yöntemler test istatistiklerinin dağılımına ve varsayımlarına dayanmakta olup
olasılığın hesaplanması için belirlenen sıfır hipotezi altında incelenmektedir.
Permütasyon testleri bahsedilen katı varsayımlara bağlanmayan, geleneksel
yaklaşımlara alternatif olan testlerdir. Bir permütasyon testi, verilerin rasgele yeniden
sıralanmasından sonra test istatistiklerinin yeniden hesaplanmasıyla, belirlenen sıfır
hipotezi altında test istatistiğinin gözlenen değerlerinden eşit ya da büyük olan
1
1. GİRİŞ
Hasan ÖNDER
değerlerin olasılığını hesaplamaktadır (Anderson, 2001; Peres-Neto ve Olden, 2001).
Permütasyon testleri çoğu deneysel veri için gerçekçi olmayan genel normallik
varsayımlarına gereksinim duymamaktadır (URL1). Permütasyon ile ilişkilendirilen
analiz ve yöntemler; hipotez testleri, DNA dizilerinde olasılıkların karşılaştırılması
ve
sistem
güvenirliliği
gibi
istatistiğin
pek
çok
alanında
başarı
ile
kullanılabilmektedir (Fu ve ark, 1999). Çoklu doğrusal regresyon modellerinde bir ya
da daha fazla regresyon katsayısının önem testi için çeşitli permütasyon yöntemleri
önerilmiştir (Anderson ve Robinson, 2001). Bu çeşitli tekniklerin sağlamaya çalıştığı
üstünlük I. Tip hata ve testin gücü üzerinde bulunan teorik yaklaşımları
değerlendirmektir (Anderson ve Legendre, 1999).
Hataların normal dağılım gösterdiği durumlarda F ve t testleri güçlü
istatistiksel özelliklere sahiptir. Ancak hatalar normal dağılım göstermiyor ise
geleneksel F ve t testleri güçlerini kaybedebilmektedir. Özellikle örnek sayısı
büyüdüğünde
(n>10)
permütasyon
testlerinin
kullanımı
ile
testin
gücü
yükseltilebilmektedir (O'Gorman, 2001). Parametrik testlerin ihtiyaç duyduğu
varsayımların sağlanamaması testlerin gücünü düşürmekte olup bu gibi durumlarda
permütasyon testleri iyi bir yaklaşım olarak kullanılabilmektedir (Peres-Neto ve
Olden, 2001).
Çok değişkenli testlerde H0 hipotezini reddetme olasılığı, gözlemlere göre
daha büyük bir istatistik veren permütasyonların oranıdır. Bunun gerçek değeri ancak
bütün permütasyonların hesaplanmasıyla elde edilebilir (kesin permütasyon testi).
Uygulamada, reddetme olasılığı permütasyonların rasgele bir alt kümesi üzerinden
tahmin edilebilmektedir. Permütasyon testleri çarpıklığa neden olan uç değerler için
iyi bir koruma sağlayabilmektedir (Kazi-Aoual ve ark, 1995). Mümkün olan tüm
permütasyonların
kullanılması
bilgisayar
zamanı
bakımından
sorun
teşkil
edebilmektedir ancak permütasyon sayısının artması elde edilen olasılık değerinin
güvenilirliğini artırmaktadır (Anderson, 2001). Permütasyon testlerinden elde edilen
I. Tip hata değerleri parametrik testlerde olduğu gibi bir yaklaşım olmayıp kesin bir
sonuç olduğuna dair görüşler bulunmaktadır (URL1).
Permütasyon testlerinin uygulanabilmesi için gerekli olan iki varsayım şu
şekilde ifade edilebilmektedir.
2
1. GİRİŞ
Hasan ÖNDER
1. Yeniden etiketlenebilirlik: Özellikle varyans analizinde H0 hipotezi doğru
olarak
kurulduğunda
verilerin
gruplar
arasında
permütasyona
tabi
tutulabilmesini,
2. Değişebilirlik: Regresyon ve korelasyon analizinde verilerin kendi grubu
içerisinde sıra değişiminin gerçekleştirilebilmesini tanımlamaktadır.
Eğer sıfır hipotezinin doğru ( H 0 : µ1 = µ 2 ) olduğu varsayılmaz ise
permütasyon testinin varsayımları olan yeniden etiketlenebilirlik ya da değişebilirlik
uygulanamaz. Herhangi bir permütasyon testinde olası tüm kombinasyonlar test
ediliyor ise buna “Permütasyon Testi” eğer bunun bir alt kümesi test ediliyorsa
“Randomizasyon Testi” denmektedir (Fortin ve ark., 2002; Mills, 1997).
Permütasyon testleri bazı çevrelerce modern istatistik olarak da adlandırılmaktadır
(Opdyke, 2002). Permütasyon testleri dağılımdan bağımsız olarak adlandırılan bir
grup yöntemden birisi olup bu ifade testin önem düzeyinin örneğin elde edildiği
hipotetik sonsuz populasyonun yapısından bağımsız olduğu anlamına gelmektedir
(Mills, 1997).
Normal
dağılıma
sahip
olma
varsayımı
sağlanamadığında
verilerin
transformasyonu ve/veya hata dağılımının normalizasyonu gibi başka yöntemler de
yaygın olarak kullanılabilmektedir. Ancak, bazı durumlarda uygun transformasyon
yöntemini seçmek zorlaşabilmektedir. Eğer normallik transformasyondan sonra elde
edilmişse başka bir sorun ortaya çıkmaktadır. Örneğin, eğer orijinal sıfır hipotezi
aritmetik
ortalamaların
eşitliği
varsayımı
ile
oluşturulmuş
ise
logaritmik
transformasyonun ardından sıfır hipotezi geometrik ortalamaların eşitliğini ya da
oranlarının 1 olmasını varsaymaktadır, böyle bir durumda sonucun yorumlanması
oldukça karmaşık hale gelebilmektedir. Verilerden elde edilebilen tüm bilgiyi
yorumladığı için permütasyon testleri oldukça güçlü yöntemler olarak kabul
edilmektedir (Mills, 1997).
Bu çalışmanın amacı doğrusal modeller için ham verinin tam permütasyonu,
kalıntıların tam permütasyonu ve kalıntıların kısmi permütasyonu gibi permütasyon
test yöntemlerini karşılaştırmak ve araştırma sonuçlarını uygulayıcıların kullanımına
sunarak yapılan istatistiklerde başarının artmasına yardımcı olmaktır.
3
2. ÖNCEKİ ÇALIŞMALAR
Hasan ÖNDER
2. ÖNCEKİ ÇALIŞMALAR
Kazi-Aoual ve ark. (1995), iki veri tablosu arasındaki bağımsızlığa dayanan
permütasyon testlerine bir yaklaşım yapmak amacıyla yürütmüş oldukları
çalışmalarında permütasyon dağılımı altında üç farklı test istatistiğinin ilk üç
momentinin açık olarak tanımlanmasına dayanan bir yaklaşım geliştirmişlerdir.
Geliştirdikleri bu yaklaşımı kesin permütasyon testi ile karşılaştırmışlardır.
Araştırıcılar sonuç olarak, çarpık değerlerin alışılmışın üstüne çıktığı durumlarda
permütasyon testlerinin iyi bir koruma sağladığını ve Y deki değişkenler kanonik
korelasyon analizi için yetersiz olduğunda temel bileşenler analizinin iyi bir alternatif
olduğunu belirtmişlerdir.
Routledge (1997), F ve permütasyon testlerini karşılaştırmayı amaçladığı
çalışmasında tesadüf parselleri, tesadüf blokları ve latin kare deneme planlarında Ftestini ve permütasyon testini karşılaştırmıştır. Araştırıcı sonuç olarak, her üç deneme
deseninde de dağılımdan bağımsız olan permütasyon testlerinin daha küçük I. tip
hata değerleri verdiğini bildirmiştir.
Loughin ve Noble (1997), tekerrürsüz faktöriyel deneme desenlerine
permütasyon testini uygulamış olup, permütasyon testlerinin I. tip hatayı azalttığını
ve daha esnek bir yapıya sahip olduğunu belirtmişlerdir.
Walther (1997), çalışmasında permütasyon testinin kullanımıyla χ 2 ve F
istatistiklerinin tesadüfileştirilmesinde benzer sonuçlar elde edildiğini ve önem
düzeyinin p=0.0417 olarak elde edildiğini ancak bu sonuçlara tam olarak
güvenilmemesi gerektiğini bildirmiştir.
O’Keefe ve Movshon (1998), çalışmalarında birincil ve ikincil devinim
sinyallerini karşılaştırmak için permütasyon testlerini kullanmış olup test işleminde
2000 permütasyon kullandıklarını ve önem düzeyinin p=0.01 olarak bulunduğunu
belirtmişlerdir.
Ludbrook ve Dudley (1998), permütasyon testlerini tanıtmış olup,
biyomedikal alanda elde edilen verilerin genellikle küçük örnek büyüklüğünde
4
2. ÖNCEKİ ÇALIŞMALAR
Hasan ÖNDER
olduğunu ve bu durumda F ve t testlerinin güçlerini kaybettiğini ve permütasyon
testlerinin daha güvenilir sonuçlar ürettiğini bildirmişlerdir.
Sierro (1999), çalışmasında habitat seçiminde rol alan 19 çevresel değişkenin
doğrusal regresyonla incelenmesinde permütasyon testlerini kullandıklarını, toplam
permütasyon sayısının 99 olduğunu ve 7 değişkenin habitat seçiminde önemli olarak
tespit edildiğini bildirmişlerdir.
Anderson ve Legendre (1999), çalışmalarında simülasyon kullanarak çoklu
regresyonda kısmi regresyon katsayılarının önemini test etmek için farklı
permütasyon yöntemlerini testin gücü ve deneysel I. tip hata için karşılaştırmayı
amaçlamışlardır. Araştırıcılar sonuç olarak, testin gücü için ham verilerin
permütasyonu, kısmi permütasyon ve tam model permütasyonu arasında fark
olmadığını ancak bazı durumlarda I. tip hata için permütasyon testlerinin uygun
olamayabileceğini bildirmişlerdir.
Hu ve Hu (1999), çalışmalarında X = (X1, X2,...,Xn) şans vektörünün ya da X
in dağılımının negatif ilişkili olarak adlandırıldığı durumlarda, permütasyon
dağılımının X = (X1, X2,...,Xn) vektörünün bileşik dağılımı olduğunu göstermişlerdir.
Bullmore ve ark. (1999), permütasyon testlerinin elde edilen veri hakkında
çok az sayıda varsayıma sahip olduğunu ve I. tip hatanın permütasyon testleriyle
kontrol edilebildiğini bildirmişlerdir. Ayrıca permütasyon testlerinin pek çok
istatistik yöntemde kullanılabileceğini yinelemişlerdir.
Sinha (2000), yaptığı çalışmada tesadüf parselleri deneme deseni için
permütasyon testlerinin teorisini açıklamıştır.
Body ve Jonas (2001), dengeli eşitlik matrislerinin düzenli blok
karşılaştırmaları için permütasyon testini ve kesin testi karşılaştırmışlarıdır.
Araştırıcılar sonuç olarak permütasyon testlerinin daha az hata ürettiğini
belirtmişlerdir.
Anderson ve Robinson (2001), çalışmalarında permütasyon testlerinin
prensiplerini açıklamış, kesin permütasyon testi, kısmi permütasyon (Freedman ve
Lane) yöntemi, Ter Braak yöntemi ve Manly'in yöntemlerini kritik değerler için
karşılaştırmıştır. Sonuç olarak, diğer yöntemlerin de kesin test kadar güçlü olduğunu
bildirmiştir.
5
2. ÖNCEKİ ÇALIŞMALAR
Hasan ÖNDER
Anderson (2001), permütasyon testlerinin kullanılmasını açıklamış ve karışık
deneme desenlerinde permütasyon testlerinin kullanımını kolaylaştırmak için mevcut
sınırlama yöntemlerini karşılaştırmıştır.
O'Gorman (2001), çalışmasında F ve t istatistiklerinde parametreler kümesi
üzerine uygulanan önem seviyeleri için permütasyon testlerini F ve t istatistikleri
üzerinde kullanarak karşılaştırmalarını yapmıştır. Araştırıcı sonuç olarak gözlem
sayısının en az 20 olması durumunda uyguladığı uyarlanmış tartılı en küçük kareler
yönteminin yüksek güce sahip olduğunu bildirmiştir.
Tanizaki (2001), yapmış olduğu çalışmada doğrusal regresyon modellerinin
önem testi için verilerin normal dağılıma sahip olmadığı durumlarda permütasyon
testlerinin kullanılmasının önermiştir.
Seaton ve ark. (2002), tarım ve tıp konularında genler ve polimorfizm
üzerinde yapılan çalışmalarda önemli bir yeri olan QTL gösteriminde permütasyon
testini uygulamışlar ve araştırıcılar sonuç olarak permütasyona tabi tutulmuş
regresyon yaklaşımının kullanılmasında daha güvenilir sonuçlar elde ettiklerini ifade
etmişlerdir.
Hall ve Tajvidi (2002), çalışmalarında istatistiksel testleri veriler arasındaki
uzaklıkların ölçülerini kullanarak gerçekleştirmişlerdir. Permütasyon testlerini önem
düzeyini belirlemek amacıyla kullanmışlardır.
Abney ve ark. (2002), deneysel genotipik önem düzeyini ve bireysel
lokusların önem düzeylerinin permütasyon testleri ile analiz edildiğinde sonuçların
daha güvenilir olduğunu bildirmişlerdir.
Neuhäuser (2003), çalışmasında Baumgartner ve ark. tarafından önerilen B
istatistiğini, χ 2 istatistiğini ve permütasyon testini karşılaştırmış olup, araştırıcı
çalışmasında sonuç olarak kesin permütasyon testinin diğerlerine göre I. tip hatayı
kontrol etmede daha başarılı olduğunu belirtmiştir.
Bohdan (2003), verilerin normal olmadığı ya da hata varyanslarının eşit
sayılamadığı durumlarda permütasyon testlerinin I. tip hata olasılığını azalttığını ve
testin gücünü artırdığını belirtmiştir.
6
3. MATERYAL VE METOT
Hasan ÖNDER
3. MATERYAL ve METOT
3.1. Materyal
Bu çalışmada kullanılan verilerin tamamı Çukurova Üniversitesi, Ziraat
Fakültesi, Zootekni Bölümü’nde daha önce küçükbaş (Darcan, 2004) ve besleme
(Serbester, 2005) alanlarında yürütülen çalışmalarda elde edilen verilerden
oluşmaktadır.
Çoklu doğrusal regresyon analizinde kullanılan veriler küçükbaş hayvancılık
işletmesinde yürütülen bir çalışmadan elde edilmiş olup bağımlı değişken olarak
nabız sayısı (NS) alınırken bunu etkileyen bağımsız değişkenler olarak rektal sıcaklık
(RS) ve solunum sayısı (SS) kullanılmıştır. Tesadüf blokları deneme deseni için RS
bağımlı değişkenini etkileyen muamele olarak tür (koyun, keçi) ve bloklama işlemi
için dört farklı örnek alma zamanı kullanılmıştır (sabah 06:00–07:00, öğle 12:00–
13:00, akşam 18:00–19:00 ve gece 00:00–01:00). Tesadüf parselleri deneme deseni
için tesadüf blokları deneme deseninde kullanılan verilerde bloklama işleminde
kullanılan günün farklı zamanları faktörü göz ardı edilerek sadece tür değişkeni
deneme faktörü olarak kullanılmıştır. Latin kare deneme deseninde hayvan besleme
alanında yürütülen bir çalışmadan elde edilen veriler kullanılmış olup hayvan etkisi
sıra, grup etkisi sütun olarak kullanılmış olup deneme faktörü olarak Rasyon
kullanılmıştır.
Verilerin
analizinde
NPMANOVA
ve
DISTLM
yazılımları
(Anderson, 2000; Anderson, 2003) kullanılmıştır. Veriler ve yazılımların kullanılışı
EK1 de verilmiştir.
3.2. Metot
3.2.1. Hipotez, Hata ve Güç
Hipotez, bir durum hakkında ileri sürülen varsayımlardır. Uygulayıcı istatistik
ile ortaya atılan iddianın doğru olup olmadığını sorgulamaktadır ve bu sorgunun
cevabı iddianın kabulü ya da reddi ile sonuçlanmaktadır. Söz konusu bu karar verme
yönteminde uygulanan sorguya hipotez testi denilmektedir.
7
3. MATERYAL VE METOT
Hasan ÖNDER
İstatistik analiz sonucunda verilecek karar, ϑ = {Pθ , θ ∈ Ω} kümesine bağlı
olan Pθ dağılımına ve şans değişkeni X in değerine göre şekillenmektedir. θ nın
bilindiği varsayımı altında, hipotezin doğru olup olmadığı hakkında hüküm
verilebilmektedir.
ϑ
dağılımı,
doğru
ve
yanlış
hipotezler
için
sınıflandırılabilmektedir. Bu iki açıklayıcı sınıfın sonuçları H ve K ile
gösterilebilmektedir ve sırasıyla Ω H ve Ω K olarak Ω kümesinden sorumludur. Bu
sayede H ∪ K = ϑ ve Ω H ∪ Ω K = Ω olmaktadır. Matematiksel olarak hipotez H
nin bir elemanı olan Pθ ifadesine eşittir.
H hipotezinin kabulü ve reddi sırasıyla d 0 ve d 1 ile gösterilsin. Belirli bir test
yöntemi uygulanarak elde edilen ve iki karardan birine sahip olan X değişkenine ait
sonuç, birbirinin tamamlayıcısı olan S 0 ve S1 gibi iki bölgeden birine atanmaktadır.
Eğer X, S 0 bölgesine atanırsa hipotez kabul edilmektedir, diğer durumda hipotez
reddedilmektedir. S 0 bölgesi kabul bölgesi olarak adlandırılırken, S1 bölgesi red
bölgesi ya da kritik bölge olarak adlandırılmaktadır.
Uygulayıcı kullandığı test sonucunda doğru bir karara varabileceği gibi, iki
tip hatadan birini yapabilmektedir.
Hatanın iki türü kısaca şu şekilde
açıklanabilmektedir; Doğru olan hipotezin reddedilmesi (I. Tip Hata) ve yanlış olan
hipotezin kabul edilmesi (II. Tip Hata). Bahsedilen bu iki tip hatanın sonuçları
oldukça farklıdır (Lehmann, 1997; Good, 2000).
Bu iki tip hatanın oluşturduğu farklı sonuçlar bir örnek üzerinde
açıklanmıştır. Süt sığırları üzerinde gerçekleştirilen bir rasyon denemesinde, ticari
olarak kullanılan bir karma yem ile yeni geliştirilen bir rasyonun süt verimi üzerine
etkilerinin araştırıldığı varsayılsın. Uygulayıcı H hipotezini bu iki rasyonun süt
verimi üzerindeki etkileri arasında istatistiksel olarak fark yoktur şeklinde
kurmaktadır. Araştırıcı uyguladığı istatistik test sonucunda dört farklı durumla
karşılaşabilmektedir:
a- doğru olan hipotezi kabul etmek,
b- yanlış olan hipotezi reddetmek,
c- doğru olan hipotezi reddetmek,
8
3. MATERYAL VE METOT
Hasan ÖNDER
d- yanlış olan hipotezi kabul etmek.
c ve d durumlarında uygulayıcının yapmış olduğu I. ve II. tip hatalarla
ilgilenilsin. c diğer bir ifade ile I. tip hata durumunda, iki rasyonun süt verimine
etkileri arasında istatistiki olarak fark yok iken fark olduğu bildirilmektedir. Bu
durumda, gerçekte süt verimi üzerinde hali hazırda kullanılmakta olan rasyona göre
üstün olmayan yeni ürün yem fabrikaları tarafından üretilmekte, bu nedenle yem
fabrikaları gereksiz olarak yeni yatırımlara yönelmekte ve sığır yetiştiricileri gereksiz
olarak yeni ürüne daha fazla mali kaynak ayırmaktadır. d yani II. tip hata
durumunda, iki rasyonun süt verimine etkileri arasında istatistiki olarak fark
bulunmasına rağmen fark olmadığı bildirilmektedir. Bu durumda, sığır yetiştiricileri
süt verimi üzerinde olumlu etkileri olan yeni rasyonu kullanamamakta ve böylece
hem yetiştiriciler hem de milli ekonomi olası kazanç fırsatlarını kaçırmış olmaktadır.
Bu iki hata kısaca tıp alanında yapılan deneme üzerinde yorumlanırsa; I. tip
hata durumunda, fabrikalar etkisiz ilaç üretmekte ve bu nedenle hastalar yeni
piyasaya sürülen ilacı ilave yan etkilerine rağmen kullanmak zorunda kalmaktadır. II.
tip hata durumunda, hastalar yeni ilaçtan faydalanamayacak ve olası tedavi
fırsatından mahrum kalacaktır.
Bu durumda, söz konusu iki hata olasılığını en düşük seviyede tutacak bir
yöntemin kullanılması gerekmektedir. Ancak, bu iki hata eş zamanlı olarak kontrol
edilememektedir. Alışılmış olarak doğru H hipotezinin hatalı olarak reddedilmesi
olasılığı ile ilgilenilmektedir. Bu nedenle uygulayıcı önem düzeyi olarak adlandırılan
ve 0 – 1 arasında değer alan bir α seçmektedir ve böylece
Pθ {δ ( X ) = d1 } = Pθ {X ∈ S1 } ≤ α
tüm
θ ∈ ΩH
durumunu kabul etmektedir. Bu durum ele alındığında, Ω K içerisinde θ için
Pθ {δ ( X ) = d 0 } ifadesinin en düşük olması istenmektedir ya da benzer şekilde
Pθ {δ ( X ) = d1 } = Pθ {X ∈ S1 } ≤ α
tüm
9
θ ∈ ΩK
3. MATERYAL VE METOT
Hasan ÖNDER
ifadesinin en yüksek olması istenmektedir. Ω K da verilen bir θ için hesaplanan
reddetme olasılığı testin güç fonksiyonu olarak adlandırılmaktadır ve β (θ ) ile
gösterilmektedir (Lehmann, 1997).
α önem düzeyinin seçimi genellikle keyfidir. Çoğu durumda, müsamaha
gösterilebilecek I. tip hata olasılığı için kesin bir sınır yoktur. 0.01 ve 0.05 gibi
standart değerler, çoğu testin uygulanabilmesi için gerekli olan tablolardaki
indirgemelere uyum sağlamak için seçilmektedir. Alışkanlıkla ve kaynakların genel
çerçevesine uyum sağlamak amacı ile bu değerler kullanılabilir uygun düzeyler
olarak zamanla kökleşmiştir. Bu yaklaşım, önem düzeyinin seçiminde testin gücünün
dikkate alınması gereğinden dolayı yetersizdir. Bunun için en uygun yöntem
denemede kullanılan örnek büyüklüğünün artırılmasıdır. Eğer bu mümkün değil ise
daha yüksek önem düzeyleri kullanılmalıdır. Bu konuda diğer bir görüş; deneme
gerçekleştirilmeden önce bu konuda fikir edinilmesidir. Eğer hipotezin doğru
olduğundan kesinlikle emin olunabiliyorsa, önem düzeyi çok düşük düzeylerde
seçilebilmektedir (düşük önem düzeyi, sadece hipotez altında toplam olabilirliği
düşük olan gözlemlerin bir değer kümesi için hipotezi reddedebilecektir, çünkü
hipotez doğru ise hipotezi reddettirecek değerlerin ortaya çıkması çok düşük bir
ihtimale sahiptir) (Lehmann, 1997; Good, 2000).
3.2.2. Çoklu Doğrusal Regresyon
Regresyon modellerinde değişkenlerin birbirinden bağımsız olduğu ve benzer
şekilde dağılım gösterdiği varsayılmaktadır. Buna ek olarak, regresyon katsayılarına
önem testi uygulanacağı durumlarda hata terimlerinin de normal dağılım gösterdiği
varsayılmaktadır. Bu varsayımlar altında, regresyon katsayılarının alışılmış En
Küçük Kareler (EKK) tahmin edicisi n - k serbestlik dereceli t dağılımı
göstermektedir (burada n ve k sırasıyla örnek büyüklüğünü ve bağımsız değişken
sayısını göstermektedir).
10
3. MATERYAL VE METOT
Hasan ÖNDER
Örnek büyüklüğü n arttıkça t dağılımı standart normal dağılıma N(0,1)
yaklaşmaktadır. Merkezi limit teoreminden, EKK tahmin edicilerinin varyansı sonlu
olduğunda, regresyon katsayılarının EKK tahmin edicilerinin yeterli bir örnek
büyüklüğünde normal dağılıma sahip olduğu bilinmektedir. Bununla birlikte, hata
terimleri normal dağılıma sahip olmadığında ve örnek büyüklüğü küçük olduğunda
EKK yöntemi uygulanamamaktadır. Bu sorunu çözmek için Fisher (1935) tarafından
önerilen permütasyon testleri uygulanabilmektedir. Permütasyon testlerinde, tüm
olası kombinasyonlar için korelasyon katsayıları hesaplanarak gerçek veriye ait olan
korelasyon katsayısı ile karşılaştırılmaktadır. Permütasyon testleri regresyon
problemlerine de doğrudan uygulanabilmektedir (Tanizaki, 2001; Abecasis ve ark,
2000). Farklı permütasyon yöntemleri, doğrusal regresyon modellerinde bir ya da
daha fazla regresyon katsayısının testi için önerilebilmektedir (Anderson ve
Robinson, 2001).
Doğrusal modellerde önem testleri genellikle parametrelerin bir alt kümesi
üzerine F veya t istatistikleri uygulanarak yapılmaktadır. Hata normal dağılıma sahip
olduğunda bu parametrik yöntemler oldukça başarılı sonuçlar verebilmekte, ancak
hatalar normal dağılım göstermediğinde F ve t testleri güçlerini kaybetmektedirler
(O'Gorman, 2001). F testinin hassaslığı, bağımsız değişkenlerinin dağılımının
normallikten uzaklaşmasına dayanmaktadır. Eğer bağımsız değişkenler yaklaşık
olarak normal dağılıma sahipseler bağımlı değişkenin normal dağılıma sahip
olmaması F testinin geçerliliği üzerinde önemli olmayan bir etkiye sahip olmaktadır
(Mills, 1997). Çoğu parametrik olmayan testler normal olmayan dağılımlarda
geleneksel parametrik testlere göre daha güçlü testler olarak bilinmektedir
(O'Gorman, 2001). Kontrast içeren modellerde kontrastlar normal dağılıma sahip
değilse ya da aşırı değerler içeriyorsa regresyon denkleminin parametrelerinin
permütasyon testi ile test edilmesi sonuçların güvenilirliğini artırabilmektedir
(Legendre ve Desdevises, 2002). Bu çalışmada tartışılan permütasyon testleri
parametrik olmayan testler arasında yer almaktadır.
11
3. MATERYAL VE METOT
Hasan ÖNDER
3.2.2.1. Korelasyon Katsayılarının Tahmini
Sıfır hipotezi değişkenler arasında ilişki yoktur şeklinde kurulduğunda
bağımlı değişkenin n sayıda değeri bağımsız değişkenler sabit kalmak koşulu ile
herhangi bir şekilde sıralanabilmektedir (Anderson, 2001). n örnek büyüklüğünde
(X1, Y1), (X2, Y2),..., (Xn, Yn) rasgele bir örnek olsun. X ve Y arasında bir korelasyon
var olduğunda, örneğin korelasyon katsayısı ρ 'nun sıfır olup olmadığı hakkında bir
test ile ilgilenildiğinde, korelasyon katsayısı ρ
ρ=
Cov( X , Y )
V ( X )V (Y )
şeklinde belirlenmektedir. Burada, Cov(X,Y), X ile Y arasındaki kovaryansı, V(X),
X 'in ve V(Y), Y 'nin varyanslarını göstermektedir. Buradan, örneğe ait korelasyon
katsayısı ρˆ
ρˆ =
S xy
S xx S yy
şeklinde yazılabilir. Burada, Sxy, Sxx ve Syy sırasıyla, örneğe ait X ve Y arasındaki
kovaryansı, X 'in örnek varyansını ve Y 'nin örnek varyansını göstermektedir. Bu
terimler aşağıdaki şekilde hesaplanmaktadır:
S xy = ∑ XY −
∑ X ∑Y ,
n
(∑ X )
−
2
S xx = ∑ X
2
n
(∑ Y )
−
2
, S yy = ∑ Y
2
12
n
.
3. MATERYAL VE METOT
Hasan ÖNDER
Eğer X, Y 'den bağımsız ise, ρ = 0 olur ve X ve Y nin bileşik yoğunluğu X ve Y nin
marjinal yoğunlukları çarpımı olarak belirlenir.
f xy ( x, y ) = f x ( x) f y ( y )
Burada, fxy(x,y), fx(x) ve fy(y) sırasıyla, X ve Y arasındaki bileşik yoğunluğu, X 'in
marjinal yoğunluğunu ve Y 'nin marjinal yoğunluğunu göstermektedir. Yukarıdaki
eşitlik, tüm i ve j ler için n sayıda Xi ve Yj çiftinin şansa bağlı olarak alındığına işaret
etmektedir. Benzer şekilde, X1 sabit iken n adet kombinasyonun bulunduğu bir
durumda, olası kombinasyonlar (X1,Yj), j = 1,2,...,n ile verilmektedir. Yine benzer
şekilde X2 sabit iken olası kombinasyonlar (X2,Yj), j = 2,3,...,n ile verilmektedir.
Yani n-1 kombinasyon bulunmaktadır. Böylece, X3 için n - 2 ve X4 için n -3
kombinasyon bulunmakta ve bu şekilde devam etmektedir. Dolayısıyla X ve Y
arasındaki olası tüm kombinasyonların sayısı n! olmakta ve n! adet korelasyon
katsayısı elde edilmektedir. Daha sonra n! sayıda korelasyon katsayısı gerçek veriden
elde edilen korelasyon katsayısı ile karşılaştırılmaktadır. Eğer gerçek veriden elde
edilen korelasyon katsayısı n! adet korelasyon katsayısından oluşturulan deneysel
dağılımın kuyruğu içerisinde ise X ile Y arasında korelasyon bulunduğuna dair ileri
sürülen hipotez reddedilmektedir (Tanizaki, 2001). n! permütasyon sayısı n sayısına
bağlı olarak hızla artarken, olası tüm permütasyonların M<n! alt kümesinin
kullanılmasıyla bu sorun giderilebilmekte olup bu test yine de kesin olarak kabul
edilebilmektedir (Anderson ve Robinson, 2001).
Yukarıda açıklanan ve pek çok durumda kullanılabilen test işlemleri
dağılımdan-bağımsız ya da parametrik olmayan testlerdir. Bahsedilen bu parametrik
olmayan test permütasyon testi olarak adlandırılmaktadır. Xi, i = 1,2,...,n sırası sabit
tutulduğunda Yj, j = 1,2,...,n şansa bağlı olarak permütasyona tabi tutulabilir. n! adet
korelasyon katsayısına dayanarak, X ile Y arasında korelasyon olup olmadığı test
edilebilmektedir. n! adet korelasyon katsayısı ρˆ (i ) ,
i = 1,2,...,n, ρˆ (1) gerçek veriden
elde edilen korelasyon katsayısı olarak ele alındığında korelasyon katsayısı ρ 'nun
ρˆ ile gösterilen tahmin edicileri şu şekilde dağılım göstermektedir:
13
3. MATERYAL VE METOT
Hasan ÖNDER
Bu şekilde üç olasılık hesaplanabilmektedir. P ( ρˆ < ρˆ (1) ) ya da P ( ρˆ > ρˆ (1) )
yeterince küçük olduğunda sıfır hipotezi H0: ρ = 0 iki yönlü test ile reddedilir
(Tanizaki, 2001). Uygulanan testin gerçek önem düzeyi, gözlenen istatistik değerin
permütasyondan elde edilen değerlere göre ne kadar uç değere sahip olduğuna
bağlıdır (Mills, 1997).
Bu durumda Sxy aşağıdaki işlemler dizisiyle elde edilerek yeniden yazılabilir:
S xy = ∑ XY −
∑ X ∑Y
n
= ∑ XY − XnY
⎛ n
⎞
S xy = ⎜ ∑ X i Yi ⎟ − X .Y .
⎝ i =1
⎠
X ve Y örnek ortalamaları X ve Y 'nin sırasından bağımsız olarak aynı değeri
almaktadır. Benzer şekilde Sxx ve Syy de X ve Y nin sıralamasından etkilenmez.
Bununla birlikte ρˆ ,
∑i=1 X iYi ye
n
dayanan deneysel dağılım için ρˆ ,
Burada ρˆ ve
∑i=1 X iYi arasında
n
bağlıdır. Yani, n! korelasyon katsayısına
∑i=1 X iYi nin
n
bir monoton fonksiyonudur.
bire bir uyum bulunmaktadır. Bununla birlikte,
14
3. MATERYAL VE METOT
∑i=1 X iYi için
n
Yi,
Hasan ÖNDER
i = 1,2,...,n sırasının değiştirilmesiyle n! kombinasyon
hesaplanabilir. Böylece,
∑i=1 X iYi nin
n
ρˆ yerine uygulanması bilgisayarda çalışma
süresi ve bellek gereksinimini azaltabilir.
Özel bir durumda, (Xi,Yi), i = 1,2,...,n in normal dağılıma sahip olduğu
varsayıldığında:
⎛⎛ µ x ⎞ ⎛ σ 2
⎛ Xi ⎞
x
⎜⎜ ⎟⎟ ~ N ⎜ ⎜⎜ ⎟⎟, ⎜
⎜
⎜
µ
ρσ xσ y
⎝ Yi ⎠
⎝⎝ y ⎠ ⎝
ρσ xσ y ⎞⎟ ⎞⎟
σ 2y
⎟⎟
⎠⎠
yazılabilir. H0: ρ = 0, sıfır hipotezinde örneğe ait korelasyon katsayısı ρˆ aşağıda
verilen t dağılımına sahiptir:
t=
ρˆ n − 2
1 − ρˆ 2
~ tα / 2 , ( n − 2 ) .
Genellikle, (X,Y) normal dağılıma sahip değildir ve (X,Y) nin dağılımı
bilinmemektedir. Gerçek verilere ait olan dağılım normal değilse ve t testi H0: ρ = 0
hipotezi için uygulanırsa güvenilir test sonuçlarının elde edilmesi beklenmemelidir.
Bununla birlikte, dağılımdan bağımsız olduğu için permütasyon testleri normal
olmayan dağılımlar üzerine uygulanabilmektedir.
3.2.2.2. Regresyon Katsayılarının Testi
Korelasyon katsayısı üzerine uygulanan parametrik olmayan testin tamamen
aynısı uygulanarak regresyon katsayılarının testi gerçekleştirilebilmektedir.
Regresyon modeli şu şekilde verilmektedir:
Yi = X i β + u i ,
i = 1,2,...,n
15
3. MATERYAL VE METOT
Hasan ÖNDER
Burada β 'nın EKK tahmin edicisi βˆ aşağıdaki gibi elde edilebilir:
βˆ = ( X ′X ) −1 X ′Y
(3.1)
burada, Y, n x 1 boyutlu bağımlı değişken vektörünü ve X, n x k boyutlu bağımsız
değişkenler matrisini göstermektedir (Tanizaki, 2001; Abecasis ve ark, 2000).
Y 'nin sırasını değiştirerek n! regresyon katsayısı elde edilebilmektedir. βˆ (i ) ,
i = 1,2,...,n! olsun ve βˆ (ji ) , βˆ (i ) nin j inci elemanı olsun, bu durumda
βˆ (i ) = ( βˆ1(i ) , βˆ 2(i ) ,..., βˆ k(i ) ) olur. βˆ (j1) in gerçek verilerden elde edilen regresyon
katsayısı vektörünün j inci elemanı olduğu varsayıldığında, H0:βj = 0 sıfır hipotezi
altında, β nın EKK tahmin edicisinin j inci elemanı olan βˆ j nin deneysel dağılımı şu
şekilde verilebilir:
Tüm j = 1,2,...,k için, yukarıda verilen hesaplama yöntemi uygulanabilmekte
ve her olasılık hesaplanabilmektedir. Önem testi n! regresyon katsayısı içinde
16
3. MATERYAL VE METOT
Hasan ÖNDER
βˆ (j1) nin konumunun tespiti ile uygulanabilmektedir. Eğer P ( βˆ j < βˆ (j1) ) ya da
P ( βˆ j > βˆ (j1) ) yeterince küçük ise iki yönlü testte H0:βj = 0 hipotezi reddedilir.
Genellikle, H0: β = β* hipotez testi işlemlerinde parametrik olmayan bir
yöntem olan permütasyon testi ile ilgilenilebilir, çünkü βˆ − β aşağıdaki şekle
dönüştürülmüş olur:
βˆ − β = ( X ′X ) −1 X ′Y − β
= ( X ′X ) −1 X ′(Y − Xβ )
n
= ∑ ( X ′X ) −1 X i′ (Yi − X i β )
i =1
Geleneksel parametrik önem testlerinde ise ui hata terimlerinin i = 1,2,...,n
bağımsız olduğu ve sıfır ortalamalı σ 2 varyanslı normal dağılım gösterdiği
varsayılmaktadır. H 0 : β j = β *j sıfır hipotezi altında EKK tahmin edicisinin j inci
elemanının dağılımı şu şekildedir:
t=
βˆ j − β *j
S a jj
~ tα / 2 , ( n − k ) .
Burada ajj, ( X ′X ) −1 matrisinin j'inci köşegen elemanını göstermektedir. β* ve S2
sırasıyla
β * = ( β1* , β 2* ,K, β k* )
ve
S 2 = (Y − Xβˆ )′(Y − Xβˆ ) /(n − k )
olarak
tanımlanabilir. Böylece sadece ui lerin normal dağılıma sahip olduğu varsayımı
altında t testi uygulanabilir. Buna karşın, ui ler normal dağılıma sahip olmadığında
geleneksel t testi küçük örnek durumunda hatalı sonuçlar üretebilir. Bilindiği üzere,
büyük örneklem durumunda ui lerin varyansı sonlu olduğunda merkezi limit
teoremini kullanarak
n ( βˆ j − β j ) asimptotik normaldir. Bu durumda küçük ve
büyük örneklerin durumları farklılık göstermektedir (Tanizaki, 2001).
17
3. MATERYAL VE METOT
Hasan ÖNDER
Permütasyon testlerinin doğrusal regresyon modellerinde uygulanması
verileri normal dağılıma sahip olmadığı durumlarda I. tip hatayı azaltmaktadır
(Makarenkov ve Legendre, 2002).
Permütasyon testlerinin doğrusal regresyon modellerine uygulanma adımları
incelendiğinde Şekil 1.1'de gösterilen akış şeması şu şekilde özetlenebilir:
1. Katsayıların tahmini ve regresyon denkleminin önem testini yapmak için
bağımlı değişkenin bağımsız değişkenler üzerine regresyonu uygulanır.
2. Y bağımlı değişkeni, Y* permütasyonu yapılmış bağımlı değişken değerlerini
elde etmek üzere permütasyona tabi tutulur.
3. Katsayıların tahmini ve regresyon denkleminin önem testini yapmak için Y*
bağımlı değişkeninin bağımsız değişkenler üzerine regresyonu uygulanır.
4. 2. ve 3. adımlar olası tüm permütasyonlar için tekrarlanır.
5. Elde edilen sonuçlar içerisinde daha önce teorisi açıklanan şekilde olasılıklar
hesaplanır (Anderson ve Legendre, 1999; Peres-Neto ve Olden, 2001; De
Martini ve Rapallo, 2002).
Örnek büyüklüğüne bağlı olmaksızın, permütasyon işlemleri esnasında aynı
örnek
kombinasyonunun
tekrarlanması
permütasyon
testlerinin
gücünü
düşürmektedir. Bu nedenle işlemlerde aynı örnek kombinasyonunun tekrar analiz
edilmesi engellenmelidir (Opdyke, 2002).
18
3. MATERYAL VE METOT
Hasan ÖNDER
Gerçek veri için test istatistiğinin
hesaplanması
Y* elde etmek için Y nin sıralamasının
permütasyona tabi tutulması
Permütasyonu yapılan veriye regresyon
analizinin uygulanması
İstatistik değerinin elde edilmesi ve
gerçek veriye ait olan değerle
karşılaştırılması
Olasılığın (P) hesaplanması
Şekil 1.1. Permütasyon testlerinin çalışma yöntemi (Makarenkov ve Legendre., 2002;
Charalambides, 2002; Peres-Neto ve Olden, 2001)
3.2.3. Varyans Analizi
Varyans analizi iki ya da daha fazla sayıda örneğe ait olan ortalamalar
arasında istatistiki olarak önemli fark olup olmadığını ortaya koymak için kullanılan
bir yöntemdir. Bu analiz yöntemi iki ya da daha fazla faktörün ana etkilerini ve/veya
birlikte
oluşturdukları
interaksiyonların
etkilerini
değerlendirilmek
için
kullanılabilmektedir (Bek ve Efe, 1995; URL1). Varyans analizi modellerinde
hatanın eşit varyansla birlikte istatistiksel olarak bağımsız olduğu veya kovaryans
matrisinin bilindiği varsayımı kabul edilmektedir. Bu çalışmada modeller hata ile
ilgili varsayımlardan bağımsız olarak ele alınacaktır. Bu modeller uygulama
kombinasyonlarının
deneme
ünitelerine
şansa
bağlı
olarak
atanmasıyla
uygulanmaktadır. Permütasyon yöntemi tesadüf parselleri, tesadüf blokları ve Latin
kare deneme desenleri için formülize edilecektir; ilk olarak model altındaki
19
3. MATERYAL VE METOT
Hasan ÖNDER
tahminleri ve sonra test işlemleri tartışılacaktır. Bu şekilde permütasyon testlerinin
detayları açıklanmış olacaktır.
Genel normal teori varsayımlarının karışıklığından kaynaklanan zorlukları
ortadan kaldırabilen tesadüfileştirmenin kolaylıkla üretilmesini sağlayan ve
matematiksel olmayan ifadeler sıklıkla kullanılacaktır. Tesadüfileştirme modellerinin
açık formülasyonları dikkat edilmesi gereken detaylar içermektedir ve alt
denklemlerin geliştirilmesi ile birlikte detaylı formülasyonlar istatistiksel yorumlama
için elde edilen sonuçların uzun ve karmaşık olmasına neden olabilecektir. Bununla
birlikte incelenen kaynaklarda, bu üç deneme deseni için dikkatli uygulamalar
yapılmasının gerekliliği ve öneminin vurgulandığı gözlemlenmiştir. Bunun yukarıda
verilen genelleştirme hakkında açıklayıcı bir bilgi parçası olduğu ve aynı zamanda
varyans analizinin temel teorisinin bilinmesi gereken bir parçası olan rasgeleliğin
fiziksel gerekçelerden kaynaklanan hata dağılımının yapısını anlamayı gerektirdiği
açıkça görülmektedir (O'Gorman, 2001). Varyans analizinde permütasyon testlerinin
tutarlı I. tip hataya sahip olduğu görüşü hakimdir (Peres-Neto ve Olden, 2001).
Örnek büyüklüğü yirmiden büyük olduğunda ve hatalar normal dağılım
göstermiyorsa permütasyon testleri F testine göre daha güvenilir sonuçlar
verebilmektedir (O'Gorman, 2002). Eğer uygulama etkileri arasında fark yoksa
denemede ünitelerin yerini değiştirmek sonucu etkilemeyecektir (Nichols ve Holmes,
2001).
3.2.3.1. Tesadüf Parselleri Deneme Deseni
k grup ve n tekerrürlü bir tesadüf parselleri deneme deseninde F istatistiği
için
elde
edilebilecek
permütasyon
sayısı
(kn)! /[ k!(n!) k ]
olarak
hesaplanabilmektedir (Anderson, 2001).
Yij = µ + α i + ε ij
; i = 1,...,k
;
j = 1,...,n
E (ε ij ) = 0 ; Var (ε ij ) = σ 2 ; Cov(ε ij , ε i′j′ ) = 0 , eğer (i, j ) ≠ (i ′, j ′)
i, i ′ = 1,...,k ;
j , j ′ = 1,..,n
20
(3.2)
3. MATERYAL VE METOT
Hasan ÖNDER
olarak ifade edilen tesadüf parselleri deneme desenine ait model göz önüne
alındığında. Burada, Yij i’inci uygulamanın j’inci tekerrüründen elde edilen gözlem,
µ ortalamanın etkisi, α i i’inci uygulamanın etkisi ve ε ij i’inci uygulamanın j’inci
tekerrürü için tesadüfi hatayı göstermektedir.
Yukarıda verilen model için yeni varsayım gerekmektedir, modelde k
populasyonlarının dağılım fonksiyonları sürekli olmalıdır ve sadece kendi bölgesel
parametreleri için değişim gösterebilmelidir. (3.2) eşitliğinde verilen ifade matris
notasyonu gösterimi ile
Y = Xβ + ε
(3.3)
şeklinde yazılabilmektedir. Burada, Y = (Y1′ , Y2 ′ , K , Yk ′ )′ gözlemler vektörü olup
burada, i = 1,2,...,k için Yi = (Yi1 , Yi 2 ,K , Yin )′ dir; X ise kn x (k+1) boyutlu dizayn
matrisidir. X matrisinin ilk sütununda bulunan tüm elemanlar 1 dir. X matrisinin
diğer
sütunlarında
bulunan
elemanlar
Y
vektöründeki
sıralarına
göre
belirlenmektedir. β = ( µ ,α 1 ,α 2 ,K ,α k ) ′ parametreler vektörüdür. ε şansa bağlı
hata vektörüdür ki burada E (ε ) = 0 ; Cov (ε ) = σ 2 I olup burada I birim matris ve
σ 2 > 0 dır.
Tesadüf parselleri deneme deseninde doğrusal karşılaştırma için hipotez
k
k
i =1
i =1
H 0 : ∑ C i α i = 0 ; H A : ∑ C iα i ≠ 0
(3.4)
şeklinde tanımlanmaktadır, burada doğrusal karşılaştırmanın tanımından dolayı
∑ ik=1 C i = 0 dır (Sinha, 2000).
k = 2 için sıfır hipotezi doğru olduğunda α 1 = α 2 olup Y vektöründe bulunan
gözlemlerin herhangi bir permütasyonunun dağılımı sabittir. Bununla birlikte k > 2
için permütasyon dağılımının sabitliğinden söz edilememektedir.
21
3. MATERYAL VE METOT
Hasan ÖNDER
(3.3) numaralı ifadede belirtilen özellikler tarafından tanımlanabilen,
AXβ = X * β * gibi A ile gösterilen bir matrisin varlığından söz edilebilmektedir,
burada X * sütunların tam sırasından oluşan bir matris ve β * , β ’nın doğrusal
dönüşümüdür. (3.4) numaralı eşitlikte doğrusal karşılaştırma için verilen hipotezler
ele alındığında, aşağıda verilen varsayım kabul edilebilir;
i = 1,2,...,r için Ci > 0 , burada 1 ≤ r < k ve i = r+1,...,k için Ci ≤ 0
(3.5)
(3.5) de verilen ifadelerin doğru olması için 1’den k’ya kadar olan sabitler
kullanılarak uygulamaların yeniden adlandırılması gerekmektedir.
r
C + = ∑ Ci ; C − =
i =1
k
r
k
i = r +1
i =1
i = r +1
∑ C i ; α + = ∑ C iα i ; α − = ∑ C i α i
(3.6)
Buradan, C + + C − = 0 elde edilebilmektedir. Ayrıca α + + α − = 0 olup, (3.4)
numaralı eşitlikte verilen hipotezi göstermektedir. X dizayn matrisi alt matrislere
aşağıda gösterildiği şekilde dönüştürülebilir;
X kn x ( k +1)
⎡1n
⎢1
=⎢ n
⎢M
⎢
⎣1n
1n
0n
M
0n
0n L 0n ⎤
1n L 0 n ⎥⎥
.
M L M⎥
⎥
0 n L 1n ⎦
(3.7)
Burada, 1n tümü bire eşit olan n elemanlı sütun vektörünü ve 0n tümü sıfır
olan n elemanlı sütun vektörünü göstermektedir.
⎡C I
A2 n x kn = ⎢ 1 n
⎣ 0 nxn
C2 I n
,K, C r I n
0 nxn
,K,
0 nxn
22
0 nxn
0 nxn
− C r +1 I n
− Cr +2 I n
0 nxn ⎤
, K , − C k I n ⎥⎦
,K,
3. MATERYAL VE METOT
Hasan ÖNDER
olsun. Burada, In nxn boyutlu birim matris ve 0nxn tüm elemanları sıfır olan nxn
boyutlu kare matrisi tanımlamaktadır. Bu ifade şu şekilde doğrulanabilmektedir;
⎡ (C + µ + α + )1n ⎤ ⎡1n
AXβ = ⎢
⎥=⎢
−
−
⎣(−C µ − α )1n ⎦ ⎣0 n
0 n ⎤ ⎡ (C + µ + α + ) ⎤
* *
⎢
⎥=X β
1n ⎥⎦ ⎣(−C − µ − α − )⎦
(3.8)
burada, X * ve β * sırası ile matris ve vektör olarak tanımlanabilmektedir. Bu
nedenle, Y = Xβ + ε modelinin dönüşümü Y * = X * β * + ε * olarak verilebilmektedir
ki burada, Y * = AY ve ε * = Aε olarak tanımlanmaktadır.
3.2.3.2. Tesadüf Blokları Deneme Deseni
IJ deneme ünitesi (tarımsal parsel, deneme hayvanı, vb) üzerinde I uygulama
karşılaştırılmakta ve IJ üniteleri her I uygulaması için J blok içinde
gruplandırılmaktadır. Her bir blokta I uygulamaları rasgele olarak atanmaktadır. Bu
işlem J bloklarından bağımsız olarak yapılmaktadır. Bu şekilde denemelerde,
ünitelere uygulamaların tüm (I!)J atamaları aynı olasılığa sahip olmaktadır. Her
bloktaki ünite sayısı v = 1,2,…,I dır. Yijv , j’inci bloğun v’inci ünitesi üzerindeki i’inci
uygulama altındaki “doğru” sonuçtur.
Bu i’inci uygulamanın j,v ünitesine uygulanması durumunda sonucun
beklenen değeri olarak tanımlanabilmektedir. Bu durumda matematik model şu
şekilde yazılabilir;
Yˆijv = µ + α i + β j + (αβ ) ij + ε ijv
(3.9)
burada µ populasyon ortalaması, { α i } muamele ait etki payını, { β j } bloğa ait etki
payını ve { (αβ ) ij } muamele-blok interaksiyon etki payını, { Yˆij } terimi içinde
23
3. MATERYAL VE METOT
Hasan ÖNDER
tanımlamaktadır. Bu şekilde modelin genel şartları sağlanmış olmaktadır ve ε ijv şu
şekilde tanımlanabilmektedir;
ε ijv = µ ijv − µ ij .
(3.10)
Burada işaret etmek gerekir ki, genel ortalama değeri µ = µ K dır ve
uygulamanın ana etkisi { α i = µ i .. − µ } her I uygulaması için bloklarda IJ
ünitelerinin nasıl gruplandırılacağına bağlı değildir çünkü bunlar tüm IJ ünitelerinin
ortalamalarıdır ve
∑ ε ijv = 0
tüm i ve j ler için
(3.11)
v
sağlanmaktadır (v veya v ′ üzerindeki tüm tanımlamalar 1 den I ya kadar
anlaşılmaktadır). ε ijv değeri “ünite hatası” olarak adlandırılmaktadır; bu i’inci
uygulama ve j’inci bloktaki j,v ünitesi için özel olan ünite etkisidir.
Aynı şartlarda tekerrürlerin bir dizisini içeren ardışık bir denemede (bunu
gerçekleştirmek imkansız olabilir) i’inci uygulamaya j,v ünitesinin gözlenen yijv
sonucu, herhangi bir kısmi denemede eijv teknik hatası nedeniyle i’inci uygulamaya
j,v ünitesinin Yˆijv ”doğru” sonucu ile farklı olacaktır, burada, y ijv = yˆ ijv + eijv olup eijv
bir şans değişkeni olarak kabul edilmektedir. y ijv beklentisinde olduğu gibi yˆ ijv nin
tanımı ile;
E (eijv ) = 0
(3.12)
dır. eijv teknik hatası ε ijv ünite hatası ile karıştırılmamalıdır: ε ijv ünite hatası i’inci
uygulamada j,v ünitesinin yˆ ijv doğru sonucunun ortalamasından i’inci uygulamada
j,v ünitesinin yˆ ijv doğru sonucunun farkı olan bir sabittir.
24
3. MATERYAL VE METOT
Hasan ÖNDER
eijv teknik hatası, bunun kavramsal yˆ ijv doğru değeri ile kavramsal y ijv
gözlenen sonucu arasındaki farkı gösteren bir şans değişkenidir. Ünite hatası aynı i
uygulamasında aynı j bloğundaki farklı ünitelerin doğru cevaplarının farkından
dolayı yükselebilir. Teknik hata ise ölçüm hatalarından kaynaklanmaktadır (gözlenen
ve hesaplanan doğru değerler arasındaki farktan oluşmaktadır), bu hata ölçme
aletlerinden ya da ölçümü yapan kişi nedeniyle oluşmaktadır. Uygulamaların
herhangi bir yolla ünitelere atanmasıyla oluşan tesadüfileştirme teknik hatalardan
bağımsızdır.
Eğer y ij , denemedeki j’inci bloktaki i’inci uygulamanın gözlenen değerini
gösterirse;
Yij = µ + α i + β j + (αβ ) ij + e~ij + eij ,
(3.13)
eij ve eij sırasıyla, j’inci bloğa atanan i’inci uygulamanın ünite sayısı olan
burada, ~
v = v(i, j ) için ε ijv ve eijv dir.
eijv } yi { ε ijv } ünite hatası ve { eij } yi { eijv } teknik hatası olarak
{~
eij ünite hatası ve eij teknik hatası aşağıda verilen
adlandırmak mümkündür. ~
notasyonlarla yazılabilir;
~
eij = ∑ d ijv ε ijv ,
(3.14)
eij = ∑ d ijv eijv
(3.15)
v
v
burada (3.10 eşitliği tarafından tanımlanan) { ε ijv } ler bilinmeyen sabit ve { d ijv } ler
sadece 0 ve 1 değerini alabilen I2J şans değişkenleridir. dijv şans değişkeni eğer i’inci
uygulama j,v ünitesine atanmışsa 1 diğer durumlarda 0 değerini almaktadır. { d ijv }
nin bileşik dağılımı yukarıda açıklanan tesadüfileştirme ile kesin olarak belirlenmiştir
ve { ε ijv } nin dağılımından bağımsızdır. Bu dağılım şu şekilde düşünülebilmektedir:
I2 değişkenleri { d ijv } nin J kümesini oluşturan farklı j ler birbirlerinden bağımsızdır.
25
3. MATERYAL VE METOT
Hasan ÖNDER
Sabit bir j için, { d ijv } kümesinin v’inci sütunu ve i’inci satırındaki dijv ile IxI karesine
yerleştirildiği düşünülsün, böylece I! olan kümenin olası değerleri her satır ve
sütunda kesinlikle bir tane 1 ve diğerlerinde 0 dır. Bu I! değerler satır ve sütunlara
eşit olasılıkla atanmaktadır. { d ijv } nin birinci ve ikinci momentleri ele alındığında,
eğer X sadece 0 ve 1 değerlerini alabilen bir şans değişkeni ise, E ( X ) = Pr{ X = 1}
olur ve böylece,
E (d ijv ) = Pr{d ijv = 1} = 1 / I
(3.16)
elde edilebilir çünkü bütün uygulamaların j,v ünitesine atanma olasılığı aynıdır ve bu
durumda i’inci uygulamanın atanma olasılığı 1/I olmaktadır.
j’inci ve j ′ ’ncü bloklardaki j ≠ j ′ tesadüfileştirmeleri bağımsız olduğunda
dijv ve d i′j′v′ lerde bağımsızdır, böylece,
E (d ijv d i′j′v′ ) = 1 / I 2
( j ′ ≠ j ) olur.
E (d ijv d i′jv′ ) yi hesaplamak için, E (d ijv d i′jv ) = 0 ya da 1 olduğu unutulmamalıdır,
E (d ijv d i′jv′ ) = Pr{d ijv d i′jv′ = 1} = Pr{d ijv = 1, d i′jv′ = 1} ya da
E (d ijv d i′jv′ ) = Pr{d i′jv′ = 1 d ijv = 1} Pr{d ijv = 1} dir.
(3.17)
Moment için P ile gösterilebilen yukarıdaki şartlı olasılık, j,v birimine atanan
i’inci uygulama verildiğinde i ′ uygulamasının j , v ′ ünitesine atanmasıdır. Buradan;
⎧
⎪
⎪
P=⎨
⎪
⎪⎩( I
1
0
0
− 1) −1
v = v ′,
v = v ′,
v ≠ v ′,
v ≠ v ′,
i = i′
i ≠ i′
i = i′
i ≠ i′
dır.
26
(3.18)
3. MATERYAL VE METOT
Hasan ÖNDER
Kullanılan son değer j’inci bloktaki v’inci üniteye i’inci uyulama atanmış ise i’inci
uygulama aynı üniteye tekrar atanamaz ve kalan I-1 birimden herhangi birine atanır.
(3.16) ve (3.18) in (3.17) de yerine konmasıyla
(3.19)
elde edilir. Burada δ vv ′ v = v ′ olduğunda 1 diğer durumlarda 0 dır. (3.14), (3.11) ve
(3.16) dan elde edilen sonuç;
E (e~ij ) = 0 ;
(3.20)
(3.15) den, {dijv} ve { ε ijv } kümelerinin bağımsızlığından ve (3.12) den
E (eij ) = 0 dır.
(3.21)
Eğer ψ = ∑ i ciα i , uygulamanın ana etkisi ( ∑ i ci = 0 ) içinde herhangi bir
karşılaştırma ise yansız tahmin E ( yi ) = µ + α i olduğundan ve (3.13), (3.20) ve (3.21)
den dolayı
ψˆ = ∑ ci yi dir.
i
{dijv} kullanılarak hesaplanan momentlerden bu ifadeyi Var (ψˆ ) için
parçalamak mümkündür; bu ifade karışık görülmektedir. Çünkü { ε ijv }, {eijv} nin
varyans ve kovaryansını içermektedir. Var (ψˆ ) nın yansız tahminini elde etmek
varsayımların bölüm 3.2.3.4. de açıklandığı şekilde basitleşmesini sağlamadan
mümkün değildir. Bununla birlikte, eğer farklı bloklardaki teknik hataların bağımsız
27
3. MATERYAL VE METOT
Hasan ÖNDER
olduğu varsayılırsa takip edilen yöntemlerle aşırı tahmin (overestimate) elde
edilebilir: Her blok için ψ ayrı ayrı tahmin edilebilir.
ψˆ j = ∑ ci yij
i
(aşağıda verilen λi miktarı nedeniyle tahminlerin yanlı olduğu görülebilir). Bu J
tahminlerinin örnek varyansı,
S 2 = ( J − 1) −1 ∑ (ψˆ j − ψˆ . ) 2
(3.22)
j
dir. Bu denklem Var (ψˆ ) ifadesinin aşırı tahminini vermektedir, bir anlamda
E ( S 2 / J ) ≥ Var (ψˆ ) , böylece
E ( S 2 / J ) = J −1 ( J − 1) −1 ∑ λ2j + Var (ψˆ )
(3.23)
j
gösterilebilir, burada λ j = ∑ i ci γ ij dır. (3.23) denklemi şu şekilde parçalanabilir;
(3.13) numaralı denklemden ψˆ j = ψ + λ j + f j olup burada f j = ∑ i ci (eˆij + eij )
dir. { f j } sıfır ortalamalı ve farklı bloklarla ilgili olduğu sürece bağımsızdır. ψˆ = ψˆ .
olduğu sürece Var (ψˆ ) = J −2 ∑ j Var ( f j ) dir. Bu sayede
∑ (ψˆ j − ψˆ . ) 2 = ∑ (λ j + f j + f. ) 2 = ∑ λ2j + ∑ ( f j + f. )
j
j
j
elde edilebilir.
28
j
2
+ 2∑ λ j ( f j − f . )
j
3. MATERYAL VE METOT
Hasan ÖNDER
⎛
⎞
⎛
⎞
E ⎜ ∑ ( f j − f . ) 2 ⎟ = E ⎜ ∑ f j2 ⎟ − JE ( f . ) 2 = ∑ Var ( f j ) − JVar ( f . )
⎜
⎟
⎜
⎟
j
⎝ j
⎠
⎝ j
⎠
= ∑ Var (( f j ) − j −1 ∑ Var ( f j )
j
j
olup böylece
⎛
⎞
E ⎜ ∑ (ψˆ j − ψˆ . ) 2 ⎟ = ∑ λ2j + (1 − J −1 )∑ Var ( f j )
⎜
⎟
j
j
⎠
⎝ j
(3.24)
= ∑ λ2j + (1 − J −1 ) J 2Var (ψˆ )
j
olarak elde edilebilir.
(3.22) deki ifade J-1 kez ele alınırsa ve (3.24) denkleminde yerine koyulursa
(3.23) elde edilebilir.
(3.23) den eğer tüm blok-uygulama interaksiyonları { γ ij } sıfırsa, S 2 / J ,
Var (ψˆ ) ifadesinin yansız tahminidir.
3.2.3.3. Kareler Ortalamasının Beklenen Değeri
Uygulamalar ve bloklar için Kareler Ortalamaları KOA ve KOB ile, aynı
zamanda kalıntı, hata veya interaksiyon kareler ortalaması KOe ile gösterilecektir.
{ eij } teknik hataları arasında korelasyon olmadığı varsayıldığında, bu E(KO) ları
hesaplamak için oldukça açık olmasına karşın sıkıntılı bir işlem olabilir. Bunun için
ön görülen şartlar { eijv } ler arasında korelasyon olmadığı varsayımının
sağlanmasıdır ({ eijv } nin bağımsızlığı ya da normalliği { eij } ile aynı değildir),
böylece;
Cov(eij , ei ′j ′ ) = δ ii ′δjj ′I −1 ∑ Var (eijv ) dir.
v
29
(3.25)
3. MATERYAL VE METOT
Hasan ÖNDER
E(KO) nın formülünü, eğer j’inci bloktaki i’inci uygulamaya özel j,v ünitesinin
ε ijv = µ ijv − µ ij. ünite etkisi çözülürse, j’inci bloktaki ana etkileri yorumlamak
kolaylaşabilir.
ξ jv = µ. jv − µ. j. ,
j’inci bloktaki uygulama-ünite interaksiyonun toplanması ile,
η ijv = µ ijv − µ. jv − µ ij. + µ. j. ,
2
(bloklarla içinde “ünite faktörü” ve “uygulama faktörü” ile bunların
ve σ U2 ve σ AU
interaksiyonlarından sorumludur) varyans ifadeleri şu şekilde belirlenebilir ((3.27) ye
kadar verilen ifadelerde teknik hatanın sıfır olduğu varsayılmaktadır)(Scheffé, 1959);
σ U2 = J −1 ( I − 1) −1 ∑∑ ξ 2jv ,
j v
2
2
σ AU
= J −1 ( I − 1) −2 ∑∑∑η ijv
i
j v
böylece,
σ A2 = ( I − 1) −1 ∑ α i2
i
σ B2 = ( J − 1) −1 ∑ β 2j
j
2
σ AB
= ( I − 1) −1 ( J − 1) −1 ∑∑ γ ij2
i
j
2
ile σ e2 şu şekilde belirlenebilir;
ile belirtilebilen σ A2 , σ B2 , σ AB
σ e2 = I −1 J −1 ∑∑ Var (eij ) = I −2 J −1 ∑∑∑ Var (eijv )
i
j
i
(3.25) kullanılarak formülasyon
30
j v
(3.26)
3. MATERYAL VE METOT
Hasan ÖNDER
2
E ( KO A ) = Jσ A2 + σ U2 + I −1 ( I − 2)σ AU
+ σ e2
2
E ( KO B ) = Iσ B2 + I −1 ( I − 1)σ AU
+ σ e2
(3.27)
2
2
E ( KOe ) = σ AB
+ σ U2 + I −1 ( I − 2)σ AU
+ σ e2
olarak elde edilebilmektedir. Eğer uygulamaların hiçbir etkisi yoksa diğer bir ifade
2
= 0 ) sıfır
ile uygulamanın ana etkileri ve blok-uygulama interaksiyonları ( σ A2 = σ AB
2
≠ 0 olsa bile
ise, bu durumda bloklar içinde uygulama-ünite interaksiyonu σ AU
E ( KO A ) = E ( KOe ) olur.
2
ve
σ x2 , varyans analizi için E(KO) formülasyonunda bulunan σ A2 , σ AB
benzerleri gibi bir σ 2 yi temsil ettiği düşünüldüğünde, eğer σ x2 = 0 iken E(KO) ları
eşit olan iki kareler ortalaması varsa, deneme deseni σ x2 = 0 ın testi için bazen
yansız olarak adlandırılır (burada yansız testin var olduğu söylenmemektedir). Daha
güçlü tanımlamalar yapıldığında: E(KO) ları cσ x2 den farklı olan iki kareler
ortalaması olduğunda σ x2 = 0 ın testi için deneme deseni yansızdır, burada c bilinen
ve sıfırdan farklı olan bir sabittir (bu tanımlama σ x2 yansız tahmininin var olduğunu
vurgulamaktadır). Eğer x sabit etki faktörünü tanımlıyorsa σ x2 in tahminine olan ilgi
azalır. Tanımlamada iyi testin gücü ile ilgilenilmek istendiğinde, bu durumda daha
fazla yanlış hipotez daha fazla kareler ortalamasının farklılaşmasına neden olabilir.
2
2
− σ AB
olduğundan,
Tesadüf blokları deneme deseninde E ( KO A ) − E ( KOe ) = Jσ A
2
σ AB
= 0 varsayımı olmaksızın σ A2 = 0 ın testi yanlı olacaktır.
Çoğu uygulamada, blokların bir şansa bağlı etkiler faktörü olarak tahsis
edildiği görülebilmektedir. Sonsuz bir populasyondan gelen rasgele bir örneğin
uygulandığı bloktaki durum için formülasyon (3.27) denklemi ile özdeş olmakla
2
nin E ( KO A ) ya eklenmesi durumu hariç tutulmalıdır.
birlikte buna σ AB
31
3. MATERYAL VE METOT
Hasan ÖNDER
E ( KO A ) − E ( KOe ) = Jσ A2
(3.28)
2
= 0 ın testi için yukarıdaki durumda
Beklenmeyen bir şekilde desen σ A
yansızdır. Bunun ifadeleri ve çözümlenmesi, aynı faktörlerin sırasıyla sabit etkiler
veya şansa bağlı olarak uygulandığı farklı modellerin ilişkisinin anlaşılabilmesine
dayanmaktadır. Sonsuz bir populasyondan gelen J bloklarına bir örnek verilecek
olursa, (3.27) numaralı denklemdeki beklentiler şartlı olarak dikkate alınabilir,
böylece;
2
E ( KO A − KOe J blokları) = Jσ A2 − σ AB
olur.
σ A2 = 0
ve
2
σ AB
≠0
olduğu
(3.29)
varsayımı
altında,
E ( KO A − KOe J blokları) < 0 olur, bunun için tek ve yeter şart;
E ( KO A − KOe ) = E ( E ( KO A − KOe J blokları))
dır.
(3.30)
Bununla birlikte, eğer bloklar şansa bağlı bir faktör olarak ele alınırsa
E ( KO A − KOe ) < 0 olur. Fakat şu anda içinde bulunulan durumda (3.28) den dolayı
E ( KO A − KOe ) = 0 dır.
Bunun ele alınması durumunda σ A2 nın, blokların sabit etki ya da şansa bağlı
etkiler ile muamele edilmesi ile farklı anlamlar kazanması gözden kaçabilen bir
noktadır. Önceki durumda σ A2 , denemedeki J bloğun ortalamaları gibi belirlenen
uygulamaların ana etkilerini göstermektedir, sonraki durumda bloklar populasyon
üzerindendir.
2
ye giren interaksiyonların tanımlanması için
Benzer bir yaklaşım σ AB
ortalamalara uygulanabilir. Önceki durumda daha uygun olan σ 2
A J blokları
32
,
3. MATERYAL VE METOT
Hasan ÖNDER
2
σ AB
notasyonlarının yenilenmesi ve daha önceki σ A2 = 0 durumunun
J blokları
ortadan kaldırılmasıyla, (3.30) nin sol tarafı ve (3.29) in sağ tarafına (3.28) nin
yerleştirilmesiyle;
2
Jσ A
= E ( Jσ 2
A J bloklar
−σ 2
AB J bloklar
)
(3.31)
= 0 anlamına gelmemektedir. Bununla
elde edilir. Eğer σ A2 = 0 ise bu σ 2
A J blokları
birlikte, sonraki J blokların tüm kümeleri için doğru ise bu durumda, σ 2
AB J blokları
,
J bloklarının tüm kümeleri için sıfır olmalıdır, bu bahsedilen karmaşayı ortadan
kaldırabilir (Scheffé, 1959).
3.2.3.4. Tesadüf Bloklarının Tesadüf Parsellerine Göre Etkinliği
Blokların sabit etkiler faktöründen sorumlu olduğu yaklaşımına geri
dönüldüğünde, tesadüf blokları deneme deseninin tesadüf parselleri deneme desenine
göre etkinliği üzerinde durulacaktır. Bu durumda muameleler IJ ünitelerine rasgele
atanmaktadır ve bu durumda her muamele J kez tekrarlanmaktadır ve tüm atamalar
aynı olasılığa sahiptir.
Bu
hesaplamanın
modellerindeki
hataların
yan
ürünleri
ile
korelasyonlarının
ilgilenildiğinde,
yapısı
tesadüfileştirme
açıklanabilir
ve
deneme
ünitelerinin iyi bir şekilde bloklanması ile muamelelerin karşılaştırılmasında elde
edilen doğruluk artabilir. Bu ifade tam eklenebilirlik varsayımı altında geçerlidir.
Belirtmek gerekir ki, model altında en büyük tahmin, bloklar içinde ünite farkının en
küçük ve bloklar arasında en büyük olduğu, tamamen homojen olan bloklara
ayrılmasıyla gerçekleşebilir (bloklama σ U2 yu minimize ederek σ B2 yi maksimize
eder çünkü σ~U2 sabitlenmiştir). Eğer blok farkları büyük ise gerçek durumlarda
33
3. MATERYAL VE METOT
Hasan ÖNDER
uygulama-blok interaksiyonunun olması beklenir. Bu, ele alınan eklemeli modele
yansımamaktadır.
Burada, “Tam Eklenebilirlik” ifadesinin anlamı: şansa bağlı modelde ünite
ve uygulama arasında interaksiyonun olmamasıdır. Yani, ünitelerin bloklar içine
gruplanmasında, bir bloktaki uygulama-blok interaksiyonları { γ ij } ve uygulamaünite interaksiyonlarının {η ijv } sıfır olduğudur,
2
σ AB
=0,
2
σ AU
=0 .
(3.32)
Dahası teknik hatalar eklemelidir, bir anlamda teknik hata eijv (i’inci uygulama j,v
ünitesine uygulandığında) sırasıyla uygulama ve ünite ile ilgili olan tijv ve uijv
bağımsız bileşenlerinden oluşmaktadır,
eijv = t ijv + u ijv .
(3.33)
Burada, E (t ijv ) = E (u ijv ) = 0 , { tijv } ve { uijv } birbirlerinden tamamen bağımsız
olarak varsayılmaktadır ve { dijv } yazılabilir, böylece,
Var (eijv ) = σ t2,i + σ u2, jv
(3.34)
olur. Burada, σ t2,i = Var (t ijv ) ve σ u2, jv = Var (u ijv ) dir.
Bu, bir ya da daha fazla uygulama ya da ünite üzerinden alınan gözlemlerin
varyansının diğerleri ile karşılaştırıldığında beklenmedik şekilde büyük çıkmasına
neden olabilir.
Tam eklenebilirlik durumunda matematik model şu hale gelmektedir;
y ij = µ + α i + β j + ~
eij + eij .
34
3. MATERYAL VE METOT
Hasan ÖNDER
Burada
~
eij = ∑ d ijv ξ jv
v
olup sadece tüm η ijv = 0 olduğunda geçerlidir, böylece ε ijv = ξ jv olur ve
eijv = ∑ d ijv eijv = ∑ d ijv (t ijv + u ijv ) dir.
v
v
{ d ijv } ve { eijv } nin dağılımlarıyla ilgili varsayımlardan hareketle, aşağıda
eij } ve teknik hata { eij }
verilen varyans ve kovaryansa sahip olan ünite hatası { ~
hesaplanabilir:
Cov(e~ij , e~i′j′ ) = δ jj′ (δ ii′ − I −1 )σ U2 , j ,
(3.35)
burada, σ U2 , j = ( I − 1) −1 ∑ ξ 2jv ,
v
Cov(eij , ei′j′ ) = δ ii′δ jj′ (σ t2,i + σ u2, j ) ,
(3.36)
σ u2, j = I −1 ∑ σ u2, jv ve
v
Cov(e~ij , ei′j′ ) = 0 dır.
(3.37)
(3.35) ifadesinin elde edilmesi için (3.20) kullanılarak
35
3. MATERYAL VE METOT
Hasan ÖNDER
Cov(~
eij , e~i′j′ ) = E (~
eij ~
ei′j′ ) = ∑ ∑ E (d ijv d i′j′v′ )ξ jv ξ j′v
v v′
= δ jj′ ∑ ∑ E (d ijv d i′jv′ )ξ jv ξ jv′
v v′
yazılabilir.
(3.19) den i = i ′ için
Cov(e~ij ~
eij′ ) = δ jj′ ∑ ∑ I −1δ vv′ξ jv ξ jv′ = δ jj′ I −1 ∑ ξ 2jv
v v′
−1
= δ jj′ (1 − I
v
)σ U2 , j
ve i ≠ i ′ için
Cov(e~ij , e~i′j′ ) = δ jj′ I −1 ( I − 1) −1 ∑∑ (1 − δ vv′ )ξ jv ξ jv′
v v′
= −δ jj′ I −1σ U2 , j
elde edilebilir. Burada,
∑v ξ jv = 0
dır. Bu iki formülasyon (3.35) ifadesini elde
etmek için birleştirilebilir. (3.36) ifadesini elde etmek için, (3.34), (3.25) de yerine
koyulabilir, benzer şekilde
Cov(e~ij , e~i′j′ ) = ∑∑ E (d ijv d i′j′v′ )ξ jv E (ei′j′v′ ) = 0
v
v′
elde edilebilir ve böylece (3.37) elde edilmiş olur.
(3.35) den yararlanılarak, aynı blok içindeki iki farklı ünite hatası ~
eij ve ~
ei′j
için korelasyon katsayısı hesaplanabilir,
− 1 /( I − 1) .
(3.38)
Eğer bir denemedeki ünitelerin düzeni, gözlemlerin uzun bir dizisinin zaman
sırasına ya da tarımsal parsellerin uzun bir hattı boyunca sıralanıyorsa ve eğer
36
3. MATERYAL VE METOT
Hasan ÖNDER
bloklama I’nın bir kümesinde ünitelerin gruplanmasından oluşuyorsa, aynı bloktaki
ünitelerin pozitif korelasyonu beklenebilir. Bitişik ya da çok yakın üniteler
birbirlerine benzeme eğilimindedir. (3.38) deki “-” işaretinin nedeni ünite hatalarının
bloklar içinden hesaplanmasıdır. Bu blok ortalamasından kaynaklanan farklılıkların
korelasyonunu açıklamaktadır; şu anda sözü geçen tahmin edilen pozitif korelasyon
bitişik bloklar için blok etkisini etkileyebilir. I = 2 uç durumunda, j’inci bloktaki
ünite hataları e~1 j + e~2 j = 0 olduğunu doğrular ve (3.38) daki ifadeye göre
korelasyon katsayısı “-1” olur.
Eklenebilirlik varsayımı altında
y ij = µ + α i + β j + e~ij + eij ,
i’inci uygulamanın değeri
y i. = µ + α i + e~i. + ei. dır.
Karşılaştırmanın ψˆ = ∑i ci y i tahmininin varyansı
⎛
⎞
⎜ ∑ ci = 0 ⎟
⎜
⎟
⎝ i
⎠
ψ = ∑ ci α i
i
(3.39)
Var (ψˆ ) = ∑∑ ci ci′ [Cov(~
ei. , ~
ei′. ) + Cov(ei. , ei′. )]
=J
i i′
−2
∑∑∑∑ ci ci′ [Cov(e~ij , e~i′j′ ) + Cov(eij , ei′j′ )]
i
i′
j
j′
dır.
(3.40) da (3.35) ve (3.36) kullanılmasıyla
37
(3.40)
3. MATERYAL VE METOT
Hasan ÖNDER
⎡
⎤
Var (ψˆ ) = J −1 ⎢(σ U2 + σ u2 )∑ ci2 + ∑ ci2σ t2,i ⎥
⎢⎣
⎥⎦
i
i
(3.41)
elde edilebilir. Burada,
σ u2 = J −1 ∑ σ u2, j = I −1 J −1 ∑ ∑ σ u2, jv dır.
j
j
(3.42)
v
(3.41) sonucu tartışılırken σ U2
nun bloklar içinde ünite hatalarını
tanımlamakta olduğu hatırlanmalıdır. σ u2 ünitelerle ilişkili olan teknik hataların
bileşeni ve σ t2,i i’inci uygulama ile ilgili bileşeni ifade etmektedir.
Tesadüf parselleri deneme deseni ile ilgilenildiğinde, tesadüf blokları ile
karşılaştırıldığında iki indisli IJ ünitelerinin sayısıyla devam etmek uygun olabilir.
Bunlar I’nın J bloğu ile gruplanmış olmalarına rağmen uygulamaların ünitelere
rasgele atanmalarında hatalı bloklama faktörünü ele almak gereksizdir. Bu alt
bölümün eklenebilirlik varsayımı altında eğer i’inci uygulama j,v ünitesine
uygulanırsa elde edilecek yanıt
µ + α i + K jv + t ijv + u ijv
(3.43)
olacaktır, burada
K jv = β j + ξ jv
ünite etkisidir ( ξ jv
(3.44)
gibi j’inci blok içinde değildir). Ek bir not olarak
∑ j ∑v K jv = 0 dır. Böylece
38
3. MATERYAL VE METOT
Hasan ÖNDER
σ~U2 = ( IJ − 1) −1 ∑ ∑ K 2jv
j
v
olup, bloklar içi ünite etkilerinin öneminin ölçüsüdür ( σ U2 ile karıştırılmamalıdır).
Burada belirtmek gerekir ki σ~U2 , IJ ünitelerinin bloklara nasıl dağıtıldığından
etkilenmemektedir, ancak σ U2 etkilenmektedir. (3.44) ün karesi ve toplamından şu
elde edilebilir;
( IJ − 1)σ~U2 = I ( J − 1)σ B2 + J ( I − 1)σ U2 .
(3.45)
(3.43) denkleminden hatırlanabileceği gibi gözlenen i’inci uygulamanın ortalaması;
y i = µ + α i + J −1 ∑ ∑ f ijv ( K jv + t ijv + u ijv )
j
(3.46)
v
dir. Burada, { f ijv } şans değişkenleri tesadüf parselleri deneme deseni için
belirlenmektedir. Benzer şekilde önceden { d ijv } tesadüf blokları deneme deseni için
gösterilmişti: Eğer i’inci uygulama j,v ünitesine uygulanırsa f ijv = 1 ve diğer
durumlarda sıfırdır. Bu durumda (3.19) da verildiği şekilde bir yorumda
bulunulabilir;
⎧ J − δ ii′
⎪
E ( f ijv f i′j′v′ ) = ⎨ ( IJ − 1) I
⎪ I −1δ
ii′
⎩
eger ( j , v) ≠ ( j ′, v ′)
eger ( j , v) = ( j ′, v ′)
ve (3.41) dekine benzer hesaplamalarla (3.46) ve (3.47) yansız tahminler ise
39
(3.47)
3. MATERYAL VE METOT
Hasan ÖNDER
ψ~ = ∑ ci y i
i
(3.39) ile karşılaştırmak için kullanılabilir. Böylece,
⎡
⎤
Var (ψ~ ) = J −1 ⎢(σ~U2 + σ u2 )∑ ci2 + ∑ ci2σ t2,i ⎥
i
i
⎣⎢
⎦⎥
(3.48)
olur. Bu sonuç (3.41) ile karşılaştırıldığında tesadüf blokları deneme deseninin
tesadüf parselleri deneme deseninden daha etkili olduğu görülebilir. (3.39) ile
karşılaştırıldığında yansız tahmin sonucunun daha küçük varyanslı olduğu
görülebilir, bunun için gerek ve yeter koşul,
σ U2 < σ~U2 olmasıdır.
(3.49)
Bu durum (3.39) ile karşılaştırmaya dayanmamaktadır. (3.49) durumu, (3.45) den
dolayı σ B2 > I −1σ~U2 veya σ B2 > I −1σ U2 ya denktir. Aşağıdaki ekte gösterildiği gibi
eğer üniteler bloklara tesadüfen dağıtılırsa (I daki J bloklarına IJ ünitesinin atanma
olasılığı aynıdır), E (σ U2 ) = IE (σ B2 ) = σ~U2 olur. (3.49) ifadesinin anlamı; bloklama ile
gruplar içindeki ünitelerin homojenliği artmaktadır ( σ U2 nun ölçümü gibi) ve bu
sadece blokların tesadüfi olması durumunda gerçekleşmektedir. İyi bir bloklama ile
kesin ifadenin elde edilmesi (3.41) denklemiyle verilmiştir ve bloklar içindeki
ünitelerin varyansının σ U2 ölçüsünün ne kadar küçük olduğuna bağlıdır.
Tesadüf bloklarının etkinliği tesadüf parselleri ile karşılaştırıldığında, (3.41)
ve (3.48) ile belirlenen ξ = Var (ψ~ ) / Var (ψˆ )
40
3. MATERYAL VE METOT
Hasan ÖNDER
(σ~U2 + σ u2 )∑ ci2 + ∑ ci2σ t2,i
ξ=
i
(σ U2
+ σ u2 )
∑
i
ci2
i
+ ∑ ci2σ t2,i
i
olur, tüm σ t2,i ler σ t2 genel değerinde olmadığında
ξ=
σ~U2 + σ e2
σ U2 + σ e2
olur ve üzerinde durulan karşılaştırmaya temel teşkil eder. Böylece (3.26), (3.34) ve
(3.42) den σ e2 = σ t2 + σ u2 yazılabilir. (3.45) nin kullanılması ile bu
ξ=
( J − 1)( Iσ B2 + σ e2 ) + J ( I − 1)(σ U2 + σ e2 )
( IJ − 1)(σ U2 + σ e2 )
olarak yazılabilir, bu kısmın bölen ve bölünen yansız tahminleri KOB ve KOAB de
bulunmaktadır çünkü tam eklenebilirlik durumunda şu sonuçları vermektedir;
E ( KO B ) = Iσ B2 + σ e2
E ( KOe ) = σ U2 + σ e2
Böylece, tesadüf blokları denemesinin verilerinden ξ etkinliği tahmin
edilebilir, bunun için tam eklenebilirlik ve { σ t2,i } lerin eşit olduğu kabul edildiğinde
bloklama
ξˆ =
( J − 1) KO B + J ( I − 1) KOe
( IJ − 1) KOe
41
3. MATERYAL VE METOT
Hasan ÖNDER
şeklinde olmalıdır. Burada belirtmek gerekir ki, bloklama ile elde edilen her hangi
bir avantaj, tesadüf parselleri deseninde “hata” için I ( J − 1) serbestlik derecesinin
J − 1 inin tesadüfen bloklanması ile engellenebilir ve başarılı bir bloklama işlemi
2
blok*uygulama interaksiyonunun σ AB
ölçümünü artırır.
3.2.3.5. Latin Kare Deneme Deseni
Bu bölüme adapte edilecek olan tesadüfileştirme modeli, kullanılacak olan
kareyi içeren dönüşüm kümesinin seçimine bağlı olmaksızın geçerlidir, fakat seçim
yönteminin aşağıda açıklanacak olan özelliklerine bağlıdır. Dönüşüm kümesindeki
tüm kareler satırların, sütunların ya da rakamların permütasyonu ile orijinal kareden
elde edilebilir olmalıdır ve deneme için seçilme olasılıkları eşit olmalıdır. Bu
özellikle farklı tesadüfileştirme modelleri farklı durumlara atanmaktadır.
1. Ana amaç için A, B, C üç faktörü var olduğunda ve her biri m düzeye sahip
olduğunda m2 uygulama kombinasyonu Latin-Kare deneme deseni tarafından
seçilen desende kullanılmaktadır. Gözlemler, yanıtın doğru değerlerinden,
seçilen Latin-karede kullanılan tesadüfileştirmeden bağımsız olan teknik
hatalar
ile
toplanarak
uygulama
kombinasyonlarına
dönüştürülerek
atanmaktadır. Bu model, üç faktörlü ve deneme birimlerinin açıkça
belirlenmediği fiziksel denemelere tahsis edilebilir.
2. Yukarıda olduğu gibi, m2 üç faktör uygulama kombinasyonu rasgele olarak
m2 deneme birimine atanmaktadır. Bu durum, deneme birimlerinin
hayvanlardan oluştuğu biyolojik denmelere uygun olabilir. Bir önceki
bölümde açıklandığı gibi teknik hatalar modele katılabilir.
3. Sadece bir faktör “C” ile ilgilenildiğinde deneme m2 deneme birimi ile
oluşturulmaktadır. Bunların rasgele atanması yerine bunları gruplandırarak
deneme birimlerinin bazı heterojenlik kaynakları elemine edilmesi yolu
kullanılabilir.
Bu
işlem,
tesadüf
blokları
deseninde
olduğu
gibi
sınıflandırmaya göre değil, A ve B faktörlerinin sınıflandırılmasına
dayanmaktadır. Örneğin, tarımsal bir denemedeki m2 parsel sıra ve sütunlara
42
3. MATERYAL VE METOT
Hasan ÖNDER
göre sınıflandırılabilir; ya da m adet bir batında doğan hayvan var olduğunda
her batında doğan hayvanlar için m kadar daha büyük bir desen
kullanılacaktır. Burada yine teknik hatalar modele katılacaktır.
Bu çalışmada, Latin-kare seçiminde olası m3 uygulama kombinasyonun
dışında kalan m2 nin seçimi ve deneme birimlerine atanabilecek olan olası (m2)!
uygulama kombinasyonunun seçimini içeren iki farklı tesadüfileştirme işlemini
içeren 2. durum dikkate alınmayacaktır. Burada ilgilenilecek olan modeller, A ve B
faktörleri ile ilgili yaklaşımları farklı fakat aynı olasılık yapısına sahip olan 1. ve 3.
durumlar üzerinde durulacaktır. 1. durumda A ve B faktörleri C faktörü kadar öneme
sahiptir ve bunların etkileri belirlenmek istenmektedir. 3. durumda bunlar ikincil
öncelikle ele alınacaktır. Bunlar belirlenirken tarımsal bir denemedeki sıra ve
sütunlar
gibi
deneme
birimlerindeki
heterojenliği
azaltmak
amacı
ile
gruplandırılmaktadır.
Yijk , gözlemlerin uygulama kombinasyonları A faktörünün i’inci düzeyinden,
B faktörünün j’inci düzeyinden ve C faktörünün k’ıncı düzeyinden oluştuğunda
gözlenen sonucu göstermektedir. Bu, gerçek değer µ ijk = E (Yijk ) nın teknik hata
E (eijk ) = 0 ile toplanmasıyla çözülebilmektedir. Konuyu kolaylaştırmak için { eijk }
hakkındaki varsayımlar daha da sınırlandırılabilir (EK2), ardından tesadüf
bloklarında olduğu gibi eşit varyans σ e2 ile bağımsızlık kabul edildiğinde
ABC
y ijk = µ + α iA + α Bj + α kC + α ijAB + α ikAC + α BC
+ eijk
jk + α ijk
(3.50)
elde edilebilir. Burada genel ortalama, ana etkiler ve interaksiyonlar belirlenmiştir ve
genel şartlara sahiptir.
AB
ABC
α .A = L = α iAB
= α iABC
= α .ABC
. = α . j = L = α ij.
jk = 0 .
.k
43
(3.51)
3. MATERYAL VE METOT
Hasan ÖNDER
Bu durum tüm i, j ve k lar için geçerlidir. m2 deneme biriminin gruplanmasına bağlı
olarak karakteristik olan A ve B faktörlerinin bulunduğu ve yukarıda açıklandığı gibi
3. durumda, { α iA } ve { α Bj } ana etkileri gruplama ile kontrol edilebilmektedir
(tesadüf bloklarındakine benzer şekilde). { α ijAB } interaksiyonları birim etkilerinde
varlığını sürdürmektedir, { α ikAC } ve { α BC
jk } iki grupta karakterize edilen C
ABC
uygulamasının interaksiyonlarıdır ve { α ijk
} birim-uygulama interaksiyonlarıdır.
Tesadüfileştirmenin { d ijk } şans değişkenleri oluşturması ile eğer A’nın i’inci
düzeyi, B’nin j’inci düzeyi ve C’nin k’ıncı düzeyinden oluşan uygulama
kombinasyonları denemede ortaya çıkarsa d ijk = 1 ve diğer durumlarda d ijk = 0
olacaktır. { d ijk } lar teknik hata { eijk } lardan bağımsız olduğu için gözlemler için
model denklemler geliştirilebilmektedir: Bunlar aşağıdaki üç formdan herhangi birisi
ile yazılabilmektedir.
Yij . = ∑ d ijk y ijk
Yi.k = ∑ d ijk y ijk
ya da
j
k
ya da Y. jk = ∑ d ijk y ijk
i
Burada, { Yijk } (3.50) den yerine konmaktadır ve Yij . A’nın i’inci düzeyini ve B’nin
j’inci düzeyini içeren denemedeki uygulama kombinasyonları üzerindeki gözlemdir.
Latin-Kare deneme deseninin analizinde kullanılan tüm istatistikler üç faktörün farklı
düzeyleri için gözlenen ortalamaların, elde edilen genel ortalamanın, toplam kareler
toplamının (KT) fonksiyonlarıdır ve bunlar aşağıda verilen yapıya sahiptir. Sırasıyla,
A’nın i’inci düzeyi, B’nin j’inci düzeyi ve C’nin k’ıncı düzeyi için gözlenen
ortalamalar;
Yi.. = m −1 ∑∑ d ijk y ijk
j
Y. j . = m −1 ∑∑ d ijk y ijk
k
i
44
k
3. MATERYAL VE METOT
Hasan ÖNDER
Y..k = m −1 ∑∑ d ijk y ijk
i
(3.52)
j
dır. Gözlenen genel ortalama
YK = m −2 ∑∑∑ d ijk y ijk
i
j
(3.53)
k
olup genel kareler toplamı (KT)
2
KTtop = ∑ ∑ ∑ d ijk y ijk
i
(3.54)
j k
dır. Yijk daki her durum (3.50) de yerine konulmaktadır. Eğer (3.50), (3.52) de yerine
konulursa, gözlenen ortalamalar
Y...k = µ + α kC + m −1 ∑∑ d ijk (α ijAB + α ijkABC + eijk )
i
olarak
(3.55)
j
sadeleştirilebilmektedir.
Yi..
ve
Y. j .
ile
ilgili
benzer
ifadelerde
yazılabilmektedir, çünkü aralarında aşağıdaki gibi bir ilişki söz konusudur ve (3.51)
şartları bulunmaktadır;
∑ d ijk =∑ d ijk =∑ d ijk = 1.
i
j
k
(3.55) i takiben oluşan g k ve e k şans değişkenleri şu şekilde gösterilebilmektedir;
ABC
g k = m −1 ∑∑ d ijk (α ijAB + α ijk
),
i
j
45
e k = m −1 ∑∑ d ijk eijk .
i
j
3. MATERYAL VE METOT
Hasan ÖNDER
Bu işlemlerin sonuçları { d ijk } nın birinci ve ikinci momentlerine
dayanmaktadır. Bu momentlerin türetilmesi ile A’nın düzeyleri satır, B’nin düzeyleri
sütun
ve
C’nin
düzeyleri
sayı
olarak
adlandırılabilir.
Bu
durumda
E (d ijk ) = Pr{d ijk = 1} dir bu i,j hücresinde k sayısının ortaya çıkma olasılığıdır.
Böylece,
E (d ijk ) = m −1
(3.56)
elde edilir çünkü tesadüfileştirme satır, sütun ya da sayılar için eşittir ve tüm k
sayıları i,j hücresinde aynı olasılıkla atanmaktadır.
İkinci
momentlerin
türetilmesi
ile (3.17) dekine benzer bir plan
uygulanabilmektedir;
E (d ijk d i′j′k ′ ) = Pr{d ijk = 1}P = m −1 P
(3.57)
burada P şartlı olasılığı göstermektedir.
P = Pr{d i′j′k ′ = 1 d ijk = 1}
(3.58)
ve P yi değerlendirmek için uygun olabilecek dört durumla ilgilenilebilir, bunlar; (1)
tümünün sağlanması, (2) ikisinin sağlanması, (3) birinin sağlanması ve (4) bu üç
şarttan hiçbiri sağlanamadığında ki bu şartlar aşağıda verilmiştir,
i ≠ i′ , j ≠ j′ , k ≠ k ′ .
(3.59)
A, B, C faktörlerinin tasarımındaki simetriden dolayı eğer (3.59) da verilen
şartlardan tam olarak N tanesi sağlanırsa (N=0,1,2,3), olasılığın (P) hesaplanmasında
N sayısının ne olduğu önemsizdir. (1) durumunda P = Pr{d ijk = 1 d ijk =} = 1 dir. (2)
46
3. MATERYAL VE METOT
Hasan ÖNDER
durumunda k ≠ k ′ olduğu varsayılmaktadır. Böylece (3.58) den de görülebileceği
gibi k sayısı i,j hücresinde iken k ′ sayısının i,j hücresine atanma şartlı olasılığı olup
P = 0 dır. (3) durumunda i ≠ i ′ varsayıldığında ve sadece 1,2,…,m sayılarının bazı
permütasyonlarının bulunduğu
i’inci satırdaki sayılarla ilgilenildiğinde j’inci
sütunda diğer bazı k sayıları verildiğinde j’inci sütunda ortaya çıkan k ′ sayısının
şartlı olasılığıdır. Çünkü tesadüfileştirme sayıların rasgele bir permütasyonunu
üretmektedir. 1,2..,m nin olası tüm m! permütasyonları i’inci satırda eşit olasılığa
sahiptir. Bu yüzden, j’inci sütundaki k sayısının permütasyonları (m − 1)! ve j’inci
sütundaki
k′
sayısının
permütasyonları
(m − 2)!
dir.
Böylece,
P = (m − 2)! /(m − 1)! = (m − 1) −1 dir. (4) durumunda i,j hücresindeki k sayısı
verildiğinde i ′, j ′ hücresinde olması gereken k sayısı için şartlı olasılık ile
ilgilenildiğinde; Sayıların rasgele permütasyonundan dolayı bu şartlı olasılık tüm
k ≠ k ′ için aynı olmalıdır. Bu durumda;
(m − 1) −1 [1 − Pr{i ′, j ′ hücresindeki k i, j hücresindeki k}]
[
]
[
]
= (m − 1) −1 1 − Pr{d i′j′k = 1 d ijk = 1} = (m − 1) −1 1 − (m − 1) −1 .
(3) ve (4) durumundaki P değerlerinden son eşitlik P = (m − 1) −2 (m − 2) olarak elde
edilebilir. (3.57) deki P değerlerinin yerine konmasıyla ve (3.59) daki şartlar
sağlandığında aşağıdaki denklem elde edilebilmektedir (Scheffé, 1959);
⎧
m −1 ,
üç şartta varsa ⎫
⎪
⎪
0,
ikisi varsa ⎪
⎪
E (d ijk d i′j′k ′ ) = ⎨
⎬
m −1 (m − 1) −1 ,
biri varsa ⎪
⎪
⎪m −1 (m − 1) − 2 (m − 2),
⎪
yoksa
⎩
⎭
(3.60)
şans değişkeni { d ijk }, teknik hata{ eijk }, µ ve { α i } parametrelere terimlerinin
yapıları
47
3. MATERYAL VE METOT
Hasan ÖNDER
KTC = m∑ ( y..k − y... ) 2
k
denkleminde sırasıyla (3.52), (3.53) ve (3.50) nin yerine konmasıyla elde
edilebilmektedir. (3.54) in yardımıyla KTA ve KTB içinde benzer uygulamalarla
sonuç alınabilmektedir.
KTe = KTtop − my...2 − KT A − KTB − KTC
dir. Bunların beklentileri ve { d ijk }, { eijk } ifadelerinin birinci ve ikinci momentleri,
bu yapılar tarafından belirlenmektedir. Hesaplamalar oldukça karışıktır ve burada
2
2
E ( KOC ) = σ e2 + (1 − 2m −1 )σ ABC
+ σ AB
+ mσ C2 ,
(3.61)
2
2
2
2
E ( KOe ) = σ e2 + (1 − 3m −1 )σ ABC
+ σ AB
+ σ AC
+ mσ BC
,
(3.62)
verilebilir. Burada,
σ C2 =
∑ (α kC ) 2
k
m −1
2
=
, σ AB
∑∑ (α ijAB ) 2
i
j
(m − 1)
2
2
=
, σ ABC
∑∑∑ (α ijkABC ) 2
i
j
k
(m − 1) 3
ve benzer şekilde devam etmektedir. E(KOA) ve E(KOB) için denklemler (3.61) de
A, B ve C ifadelerinin permütasyonu ile elde edilebilir. HC: tüm α kC = 0 ya da
σ C2 = 0 hipotezi altında, E ( KOe ) genellikle E ( KOC ) den büyük olmaktadır ve
dahası, eğer ;
2
2
2
σ ABC
< m(σ AC
+ σ BC
)
(3.63)
48
3. MATERYAL VE METOT
Hasan ÖNDER
olur ise E ( KOe ) > E ( KOC ) olur. Daha önce (3.27) de açıklandığı gibi σ C2 = 0
2
2
2
hipotezinin testi için model yanlıdır (bu durum sadece σ AC
= 0 , σ BC
= 0 , σ ABC
=0
olduğu varsayımı kabul edilmediğinde mümkündür). (3.51) den sonra tartışılan 3.
2
birim uygulama interaksiyonlarının öneminin
durum göz önüne alındığında, σ ABC
ölçüsüdür. Latin kare deneme deseni tesadüf blokları deneme desenine benzemeyen
bir şekilde σ C2 = 0 hipotezinin testi için birim uygulama interaksiyonlarının
2
yapısından dolayı yanlıdır, bu anlamda σ ABC
farklılaşmaktadır;
2
2
2
E ( KOC ) − E ( KOe ) = mσ C2 − σ AC
− σ BC
+ m −1σ ABC
,
bunu sağlayan m-1 katsayısıdır.
E (KO ) sının bölenine olduğu gibi bölünenine de σ 2 için interaksiyonlar
dahil edildiğinde hipotezin F-testi üzerine interaksiyonların etkisi için doğru bir fikir
elde etmek amacıyla merkezileştirilmemiş parametrelerin tam olarak belirlenmesi
gerekmektedir. İlgilenilen test sabit etkili normal teoriye uyduğunda, KObn
ve
KObl sırasıyla F-istatistiğinin kareler ortalamalarının bölünen ve bölenini temsil
ediyorsa;
E ( KObn ) = σ e2 (1 + q −1δ 2 ) ,
E ( KObl ) = σ e2
olarak elde edilir. Burada q bölünen kareler ortalamasının serbestlik derecesi ve δ 2
ise merkezileştirilmemiş parametreyi göstermektedir. Buna alternatif olarak
merkezileştirilmemiş parametre φ 2 = (q + 1) −1 δ 2 kullanılabilmektedir, bu durumda
testin gücü daha da artabilmektedir;
φ2 =
q E ( KObn ) − E ( KObl )
.
q +1
E ( KObl )
(3.64)
49
3. MATERYAL VE METOT
Hasan ÖNDER
KObl ve KObn iki kareler ortalamasının bölümü ile ilgilenildiğinde herhangi bir
durumda (3.64) de tanımlanan φ 2 nin genelleştirilmiş merkezileştirilmemiş
parametre olarak tanımlanması mümkündür. φ 2 , testin gücünün yaklaşık bir
ölçümüdür ve φ 2 nin azalması testin gücünü düşürecektir. (3.61) ve (3.62) den
KOC / KOe istatistiği için genelleştirilmiş merkezileştirilmemiş parametre;
2
2
2
mσ C2 − (σ AC
+ σ BC
) + m −1σ ABC
m −1
φ =
2
2
2
2
m σ e2 + σ AB
+ (σ AC
+ σ BC
) + (1 − 3m −1 )σ ABC
2
(3.65)
dir. Eğer bu kendi değeri ile karşılaştırılırsa,
φ2 =
m − 1 mσ C2
m σ e2
2
gibi bir varyansın aynı
olur. Burada herhangi bir interaksiyon olmadığında, σ AB
katsayı ile hem E ( KObl ) hem E ( KObn ) içerisinde yer alması istenen etkiye sahip
2
olacakken, σ AC
gibi bir varyansa sahip olan bir interaksiyonun sadece E ( KObl ) ’de
yer alması gücün düşmesinde, φ 2 nin bölüneninin değerinin düşmesinde ya da
artmasında iki kat etkili olacaktır. Aynı zamanda şu şekilde bir yorum
2
2
2
2
= 0 ve σ AB
, σ AC
, σ BC
varyansları σ e2 nin önemine
yapılabilmektedir: eğer σ ABC
katkıda bulunmamaktadır. Güç, interaksiyon olmadığında ve hata varyansının σ e2
yaklaşık olarak dört kat daha büyük olması durumuna göre daha düşük olacaktır.
Eğer daha önce açıklanan 3. durumdaki bir uygulamada interaksiyon etkileriyle
2
, deneme ünitelerinin iki yönlü gruplandırılmasıyla etkisi
ilgilenilirse ki burada σ AB
giderilemeyen birim hatalarının önemini göstermektedir. (3.65) numaralı eşitliğin
aşağıda verilen eşitlikle karşılaştırılması gerekebilir;
50
3. MATERYAL VE METOT
Hasan ÖNDER
m − 1 mσ C2
.
2
m σ e2 + σ AB
φ2 =
(3.55) ve (3.56) dan gözlenen uygulama ortalaması y...k , doğru uygulama
ortalaması olan µ + α kC nin yansız bir tahminidir. Burada interaksiyon olup
olmaması önemli değildir ve bu durumda eğer ψ = ∑k c k α kC
(∑k c k = 0) C
faktörünün ana etkilerinde herhangi bir karşılaştırma ise;
ψˆ = ∑ c k y...k
(3.66)
k
ψ nın yansız tahminidir. (3.55) ve (3.60) dan Var (ψˆ ) nın hesaplanması doğrudur,
fakat Var (ψˆ ) için sonucun ifade edilmesi karmaşık görülmektedir ve bunun nasıl
tahmin edileceğini kavramak oldukça güç olabilmektedir. Var (ψˆ ) hakkında (3.61)
kullanılarak
basit
sonuçları
anlamak
mümkün
olabilmektedir:
İlk
olarak
2
σ ABC
= 0 olduğu varsayılmaktadır. Ardından, (3.55) yardımıyla µ + α kC nin { y...k }
tahminleri için, { y...k − µ − α kC } tahminine ait m hata terimlerinin dağılımının
simetrik olduğu ve bunların eşit varyansa ve korelasyon katsayısına sahip olduğu
kanıtlanmaya çalışılabilir. Bu EK2’de verilen uygulamanın hesaplanmasına olanak
tanımaktadır;
2
Var (ψˆ ) = m −1 (σ e2 + σ AB
)∑ c k2 .
(3.67)
k
2
2
= σ BC
= 0 var olmadığında
(3.62) de görülmektedir ki yansız olan σ AC
m −1 ( KOe )∑k c k2 , Var (ψˆ ) nın bir aşırı tahminidir yani pozitif sapmaya sahiptir.
2
σ ABC
= 0 varsayımının kabul edilmediği genel durumda eğer sadece { α kC − α kC′ }
farkının tahmini ile ilgileniliyorsa (bu durumda tahminler { y...k − y...k ′ } dür), bu
51
3. MATERYAL VE METOT
Hasan ÖNDER
tahminlerin varyanslarının ortalama değeri ( (1 / 2)m(m − 1) farkları üzerinden
hesaplanan ortalama)
2
2
2m −1[σ e2 + (1 − 2m −1 )σ ABC
+ σ AB
]
(3.68)
olur (EK3). Bu niceliğin tahmini sadece “önem sırası” göz önüne alınacaksa uygun
olabilir. 2m −1 KOe istatistiği (3.63)’de belirtildiği şekilde genellikle bir yüksek
tahmindir (Tardif ve ark., 2002).
3.2.4. Permütasyon Testi
İlgilenilen model altında hipotez testleri konusu incelendiğinde bu bölümün
önceki kısımlarında açıklanan tesadüf parselleri, tesadüf blokları ve Latin kare
deneme planları tanımlanacak ve kullanılacaktır. Model altında belirlenen hipotezin
kesin testini uygulamak mümkün olabilmektedir ki bu permütasyon testi olarak
adlandırılmaktadır. Dağılımı bozmadan (dağılım her hangi bir permütasyon grubu
için değişmemektedir) gözlemlerin permütasyonunun bir kümesi var olduğunda, bir
hipotez için permütasyon testi, hipotez tam bir simetrik şekle sahip olduğunda
gözlemlerin bileşik dağılımı her ne olursa olsun mevcuttur. Bu test çok geniş bir
hipotez çeşidi için kesin sonuç verebilmektedir çünkü hesaplanan önem düzeyinin
geçerliliği sadece dağılımın simetrisine bağlıdır ve normallik, varyansların
homojenliği veya bağımsızlık gibi ileri varsayımlardan etkilenmemektedir. Bu
simetri üç yöntemle oluşturulabilmektedir; (i) bir ya da daha fazla populasyondan
rasgele örnekleme varsayımı ile (aşağıdaki ilk örnekte olduğu gibi), (ii) tesadüf
blokları deneme deseninde olduğu gibi uygulamaların deneme ünitelerine
atanmasında kullanılan gerçek tesadüfilik ile (iii) 3.2.3.5’de verilen 1. durum için
Latin-kare deneme deseninde olduğu gibi denemede kullanılan uygulama
kombinasyonlarının tamamlanmamış bir düzenlemesinin çeşitli faktörler için
52
3. MATERYAL VE METOT
Hasan ÖNDER
tamamlanmış bir düzenleme uygulama kombinasyonlarının tamamı içinden seçilerek
yapılan gerçek tesadüfilik ile.
Permütasyon testlerinin tanımı oldukça basit olmasına karşın hesaplamaların
dikkatle yapılması gerekmektedir ve bu hesaplamalar beklenmedik şekilde karmaşık
olabilmektedir. Burada ilgilenilmesi gereken esas konu normallik, varyansların
homojenliği ve bağımsızlık varsayımlarını içeren sabit model altındaki hipotez için
F-testinin uyarlanması ya da bu testin açıkça değiştirilmesinin, az kısıtlı model
altında kesin olan permütasyon testine iyi bir yaklaşım olarak algılanmasıdır.
Genel permütasyon testini tanımlamadan önce bir örnekle açıklamak yerinde
olabilir. Aynı populasyondan gelen (3.69) ifadesinde verilen üç ve dört örnek
büyüklüğündeki örneklemde ortalamalar arasında fark yoktur şeklinde kurulan H0
hipotezi test edilmek istensin.
{0, 3, 5}
{2, 3, 6, 9}
(3.69)
Bir permütasyon testi genellikle seçilen belirli bir istatistik yönteme
dayanmaktadır. Populasyondan gelen bağımsız rasgele iki örnek için alternatif
hipoteze karşı yukarıda verilen iki yönlü H0 hipotezini test etmek için genel normal
teori varsayımları altında istatistik
t = c1 x − z K −1 / 2
(3.70)
şeklinde belirlenebilir. Burada t için büyük değer elde edilmesi istatistiksel olarak
önemlidir. c1 ise permütasyon testinde ilgilenilmeyen bir sabit, x ve z örnek
ortalamaları ve K ortak kareler toplamıdır.
53
3. MATERYAL VE METOT
3
4
1
1
Hasan ÖNDER
K = ∑ ( X i − X ) 2 + ∑ (Z i − Z ) 2
olup ayrıca { x1 , x 2 , x3 } ve { z1 , z 3 , z 3 , z 4 } örnekleri göstermektedir.(3.69)’da verilen
örneklerde iki adet 3 rakamı bulunduğundan t istatistiğinde bunları ayırt edebilmek
için alt indis olarak 1 ve 2 rakamları kullanılmaktadır. Ardından birleştirilmiş örnek
{0, 2, 31, 32, 5, 6, 9}
(3.71)
olarak elde edilmektedir. Burada, örnek artan şekilde sıralanmıştır. Ele alınan üç ve
dört örnek büyüklüğünden oluşan birleştirilmiş yedi büyüklüğündeki örnek için
sıralama açısından 35 farklı seçim söz konusudur;
C37 =
7!
= 35 .
4! 3!
Verilen H0 hipotezi altında tüm bu örnekler benzerdir. t istatistiğine dayanan
permütasyon testinin prensibi α önem düzeyinin belirlenmesi ile yapılmaktadır. t
nin 35 değeri ile ilgilenildiğinde, söz konusu 35 kombinasyonun hesaplanması
gerekmektedir. H0 hipotezini reddedilebilmesi için hesaplanan 35 t değerlerinden
orijinal değerden büyük ve eşit olanların sayısının toplam permütasyon sayısına
bölümünün seçilen α değerinden küçük ya da eşit bulunması gerekmektedir.
Anlaşılabileceği üzere test sonuçları arzu edilen şekilde I. tip hata olasılığını (H0
hipotezi doğru iken reddedilmesi) kontrol etmektedir. Eğer H0 hipotezi doğru ise H0
hipotezini reddetme koşullu olasılığı ≤ α
dır ve bu aynı zamanda H0 hipotezini
reddetme olasılığı içinde geçerlidir. Koşullu olasılık beklentisi sıralanan tüm örnekler
için ≥ α olur.
Uygulamada, aynı sonuca ulaşmak için pek çok basitleştirme yapmak
mümkündür. İlk olarak, 35 kombinasyon için sadece d = x − z
54
ifadesinin
3. MATERYAL VE METOT
Hasan ÖNDER
hesaplanması ve t yerine bu istatistikten elde edilen yüksek değerler için H0
hipotezini reddetmek yeterli olabilmektedir çünkü t , d’nin değişmez artan bir
fonksiyonudur. 35 kombinasyondan herhangi biri için benzerlik;
KT A + K = A
(3.72)
dır. Burada, KTA iki örnek için gruplar arası kareler toplamını, K birleştirilmiş hata
kareler toplamını (yukarıda açıklanan şekilde) ve A genel kareler toplamını
göstermektedir ve bunlar tüm 35 kombinasyon için aynıdır. Bu sayede
KT A = c 2 d 2
(3.73)
yazılabilir ve burada c 2 > 0 dır. Bu durumda t , d2 nin sabit artan bir fonksiyonudur
ve
t 2 = c12 d 2 /( A − c 2 d 2 )
olup, (3.70), (3.72) ve (3.73) yardımıyla elde edilebilmektedir.
İkinci olarak, tüm kombinasyonlar için aynı olan B = ∑i xi + ∑ j z j kabul
edildiğinde
m
r
i =1
j =1
x − z = m −1 ∑ xi − r −1 ∑ z j = m −1 ∑ xi − r −1 ( B − ∑ xi )
= (m −1 + r −1 )(∑ xi − C )
elde edilmektedir. Burada C = mB /(m + r ) ve yukarıdaki örnekte m = 3, r = 4, B =
28, C = 12. Söz konusu ikinci basitleştirme ∑ xi − C istatistiği üzerinden yapılan bir
55
3. MATERYAL VE METOT
Hasan ÖNDER
testtir. 35 kombinasyon ve bu istatistikle elde edilen sonuçlar Çizelge 1.1’de
verilmiştir.
Çizelge 1.1. Örneğe ait 35 kombinasyon ve bunlara ait istatistik değerleri
İlk Örnek 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2
2
2
2
2
2
2
2
31 31 31 31 32 32 32 5
5
6
31 31 31
31 32 5
6
9
32 5
6
9
5
6
9
6
9
9
32 5
6
0
4
3
0
1
2
3
4
1
∑ xi − C 7
7
5
4
1
6
4
3
İlk Örnek 2
2
2
2
2
2
2
31 31 31 31 31 31 32 32 32 5
31 32 32 32 5
5
6
32 32 32 5
5
6
5
5
6
6
9
5
6
9
6
9
9
5
6
9
6
9
9
6
9
9
9
∑ xi − C 2
2
1
2
1
4
5
1
0
3
2
5
6
2
5
6
8
2
Hesaplamalar yapılmadan önce önem düzeyi belirlenmelidir, bu sayede bir
basitleştirme mümkün olabilmektedir. Bu örnek için önem düzeyinin 0.1 alındığı
varsayılsın. 35 kombinasyondan 4 tane (orijinal değer dışında üç kombinasyonun)
∑ xi − C
istatistik değeri orijinal değerden büyük veya eşitse hipotez kabul
edilmektedir. Bu durumda tablodaki verilerden sadece gerekli olduğu kadar
hesaplama yapmak yeterli olabilmektedir, ilk olarak 4 adet gözlenen kombinasyon
için ∑ xi − C değeri hesaplanmaktadır. x − z değerinin en yüksek olabilmesi için
x değerinin en küçük ya da en büyük olması gerekmektedir, aynı durum z için de
geçerlidir. x değerinin en küçük olduğu durum {0, 2, 31} ve {0, 2, 32} durumları
olup, en yüksek olduğu durum ise {5, 6, 9} için elde edilebilmektedir. İstatistik
değerleri bu üç kombinasyon için hesaplanmaktadır, bu durumda tümü ≥ 4 olduğu
için hipotez kabul edilmektedir.
Burada eğer elde edilen sonuçlar ≥ 4 ise geriye kalan hesaplamaları yapmaya
gerek yoktur. Bu basitleştirme işlemi permütasyon testinin uygulanmasında
kullanılabilir. Aşağıda permütasyon testine yaklaşım konusu irdelenecektir.
Permütasyon testinin H0 hipotezini kabul ettiği durumda sadece gerekli
hesaplamaları yapmak genellikle en basit yöntemdir (yukarıda olduğu gibi).
56
3. MATERYAL VE METOT
Hasan ÖNDER
Permütasyon testi H0 hipotezini reddettiğinde: eğer H0 hipotezi altında benzer örnek
sayısı N (N = 35) ve M en küçük sayı > αN − 1 ise bu, kendi gözlenen değerinden
büyük ya da eşit istatistik değerler verenlerden farklı olan M örnekten herhangi bir
yöntemle
elde
edilebiliyorsa
H0
hipotezinin
kabul
edilmesi
için
yeterli
olabilmektedir. Test H0 hipotezini reddediyorsa, daha fazla hesaplama yaparak tüm
kombinasyonları göstermeye gerek yoktur.
H0 hipotezi, yukarıda açıklanan iki yönlü x − z istatistiği yerine x − z
istatistiği üzerinden temel alan permütasyon testi ile doğru bir dönüştürme
kullanılarak x-populasyonunun z-populasyonundan farkı olan tek yönlü alternatifi ile
test edilebilir. Bu durumda x − z veya x − z istatistiklerine dayanan permütasyon
testi ile ilgilenilebilir, burada x ve z örnek medyanlarıdır. Eğer H0 hipotezi
alternatif hipoteze karşı test edilecek ise populasyonlar sadece bölge bakımından
değil aynı zamanda ölçüde de farklılık gösterebilir (populasyon medyanları). Bu
durumda permütasyon testi aşağıda verilen istatistiğe dayandırılabilmektedir;
⎞ ⎛
⎛
⎞
τ = c⎜⎜ ∑ xi2 − mx 2 ⎟⎟ / ⎜ ∑ z 2j − rz 2 ⎟ .
⎜
⎟
⎝
i
⎠ ⎝
⎠
j
Burada c konu ile ilgisi olmayan bir sabittir. Büyük değerlerin önemli olduğu bir
istatistiğe
dayanan
permütasyon
testleri
belirlenirse,
x-populasyonu,
z-
populasyonuna göre daha fazla açılmaya sahip olur, bu alternatif hipoteze
atfedilebilmektedir. Eğer, ölçümlerin farklılığı iki yönlü alternatife karşı α önem
düzeyinde H0 hipotezi test edilmek istendiğinde, τ ya da 1 / τ ifadelerinden temel
alan (1 / 2)α düzeyli permütasyon testi uygulanabilir ve bu testlerden herhangi biri
hipotezi reddederse H0 hipotezi reddedilebilir.
Permütasyon
testlerinin
genel
yaklaşımı
yukarıda
verilen
örnekle
açıklanabilmektedir. Permütasyon testleri, yukarıda bahsedilen simetriye sahip olan
dağılımlarda H0 hipotezini test etmek için uygulanabilmektedir. Matematiksel olarak
eşit, uzun ama uygulanabilir olan yöntemlerle bu simetri özellikleri formülize
edilebilir (Scheffé, 1959). Şans değişkenleri vektörü y = ( y1 ,K , y n )′ gözlem veya
57
3. MATERYAL VE METOT
Hasan ÖNDER
örnek vektörünü tanımlasın ve y 0 = ( y10 ,K , y1n )′ y nin olası değerlerini göstersin
(burada farklı değerler alan y şans örneği ile y nin aldığı değerlerden birini alan y0
karıştırılmamalıdır. Bu tanımın uygulanmasında formülasyonda y0, y olası
değerlerinden birisidir). y nin n elemanının L permütasyonundan oluşan G kümesi
var olsun. Burada S(y0), permütasyonların G kümesinin y0 a uygulanmasıyla türetilen
L örnek kümesini temsil etmektedir. Gerek duyulan simetri özellikleri (y nin S(y0)
kümesinde yerine konmasıyla ); S(y0) da L değerlerinden herhangi birini alan y için
H0 hipotezi altında şartlı olasılık S(y0) da herhangi bir L değeri için 1/L dir. Bu
simetri özelliği y nin alması muhtemel tüm y0 değerleri için göz önüne alınmalıdır.
Eğer y0 eşit elemanlar içeriyorsa, yukarıdaki örnekte olduğu gibi dikkate alınmalı ve
L eşit olasılığına dahil edilmelidir. α önem düzeyinde H0 hipotezi için permütasyon
testi için sayısı ≤ α L olan örneklerin S ′( y 0 ) ın bir alt kümesi olan tüm olası S(y0)
kümesinin tanımlanması bir kuraldır. H0 hipotezi, sadece ve sadece gözlenen örnek
y0, S ′( y 0 ) içinde yer alıyorsa reddedilebilir. Önemli örneklerin S ′( y 0 ) alt kümesi
genellikle istatistiklerin ortalamaları kullanılarak tanımlanmaktadır.
Yukarıda ilgilenilen permütasyon testinin genel tanımı yapılırsa: genel
tanımın y vektörü n = m + r ile ( x1 ,K, x m , z1 ,K, z r )′ olarak tanımlanabilir. Bu
durumda, gerekli özelliğe sahip permütasyonların G kümesi, y nin elemanlarından
oluşan tüm permütasyonlarının bir kümesidir. Sonuç olarak G deki permütasyonların
L sayısı n! dir. x lerde ve z lerde simetrik olan herhangi bir istatistik, x lerin ve z lerin
kendi
içinde
permütasyona
uğradığı
G
içindeki
permütasyonlardan
etkilenmemektedir. G kümesinde n!r! permütasyon bulunmaktadır ve L = n!
permütasyon yerine N = n!(m!r!) −1 kombinasyonla ilgilenilebilir. Genel tanımın
geriye kalan uygulamaları oldukça açık olup sadece testlerin uygulanması
gerekmektedir.
3.2.4.1. Permütasyon Testlerinin Tesadüf Parselleri Deneme Deseninde
Uygulanması
58
3. MATERYAL VE METOT
Hasan ÖNDER
Bölüm 3.2.3.1’de verilen (3.4) numaralı eşitlikteki hipotez testi için
permütasyon testinin uygulanması şu şekilde açıklanabilmektedir:
Sıfır hipotezi doğru olarak kurulduğunda (C + + C − ) µ + α + + α − = 0 yani
C + µ + α + = −C − µ − α −
olduğunda sıfır hipotezi altında
Y*
vektörünün
elemanlarının her bir permütasyonunun dağılımı değişmezdir. Bu nedenle, (3.4)
numaralı eşitlikte verilen hipotez için permütasyon testi Y * = X * β * + ε * için
yapılandırılabilmektedir.
Bu yapılandırma, µ1* = C + µ + α + ve µ 2* = −C − µ − α − durumuna sahip
olsun. Aşağıda açıklanan kurallar uygulanarak Y * vektörünün elemanları iki gruba
bölünebilmektedir.
Y * vektöründe bir
y*
elemanı eğer
E ( y * ) = µ i*
ise i’inci gruba
atanabilmektedir. Böylece her grupta bulunan üniteler kendi grubu dışındaki
ünitelerle yer değiştirmektedir. Her bir değişimin ardından varyans analizi
uygulanmakta ve orijinal veriden elde edilen istatistik değere eşit ya da büyüklerin
sayısı toplam permütasyon sayısına bölünerek I. tip hata olasılığı hesaplanmaktadır
(Sinha, 2000).
3.2.4.2.
Permütasyon
Testlerinin
Tesadüf
Blokları
Deneme
Deseninde
Uygulanması
Aşağıdaki yapıya sahip j’inci bloktaki i’inci muameleye ait gözlemde
matematik model ile ilgilenildiğinde,
Yij = µ + α i + β j + (αβ ) ij + e~ij + eij
eij ve teknik hata eij ;
dir. Burada, ünite hatası ~
e~ij = ∑ d ijv ε ilv
v
eij = ∑ d ijv eijv
v
59
3. MATERYAL VE METOT
Hasan ÖNDER
şans değişkenleri ve sabitler (3.2.3.2.) numaralı bölümde açıklandığı şekilde
tanımlanmaktadır. Uygulamalar arasında fark yoktur şeklinde kurulan H0 hipotezi
için
permütasyon
testi
yapılandırılabilmektedir,
bunu
sağlayan;
(i)
2
2
σ A2 = σ AB
= σ AU
= 0 ve (ii) IJ ünitesindeki teknik hataların bileşik dağılımı
uygulamaların ünitelere dağıtılma şeklinden etkilenmemektedir varsayımlarıdır. Bu
durumda, H0 hipotezi altında matematik model
y ij = µ + β j + ∑ d ijv (ξ jv + u jv )
(3.74)
v
şeklinde yeniden yazılabilir, burada u jv , ünitelerdeki uygulamalara bağlı olmadığı
varsayılan eijv olarak da yazılabilen j,v ünitesi ile ilişkilendirilen teknik hatadır. Bu
E (u jv ) = 0 tanımını gerektirmektedir, aksi takdirde { u jv } nin bileşik dağılımı
düzenli değildir.
Permütasyon testleri bloklar içindeki permütasyonların G kümesine
dayanmaktadır. G kümesinin bir elemanı, her J bloğunda bloklardaki gözlemlerin I!
olası permütasyonundan birisinin sonucunda ortaya çıkmaktadır. Bu durumda G deki
toplam permütasyon sayısı L = ( I !) J olur. { y ij } den elde edilen örnekler y0 ile ve
permütasyonların G kümesinin uygulanmasıyla y0 dan elde edilen ( I !) J örnek
kümesi S ( y 0 ) tanımını yapmaktadır. H0 hipotezi ve tesadüfileştirmenin uygulamaya
dahil edilmesi altında S ( y 0 ) daki tüm örnekler aynı şartlı olasılığa sahiptir. Elde
edilen örnekler S ( y 0 ) içinde var olduğunda (3.74) eşitliği
y ij = ∑ d ijv z jv
(3.75)
v
olarak tekrar yazılırsa, burada
z jv = µ + β j + ξ jv + u jv
(3.76)
60
3. MATERYAL VE METOT
Hasan ÖNDER
j,v deneme ünitesi üzerindeki gözlemdir. Burada, { z jv } nin belirsiz bileşik
dağılımından bahsedilebilir, H0 hipotezi altında;
E ( z jv ) = µ + β j + ξ jv
tanımında z , ( z11 ,K, z1I , z 21 ,K, z 2 I , z J 1 ,K , z JI )′ vektörünü ve z 0 , denemede z nin
aldığı değeri tanımlamaktadır. Burada (3.76) denkleminden
E (u jv ) = 0
dır.
Tesadüfileştirmede uygulamaların ünitelere kısmi atanması { d ijv } tanımını
oluşturmaktadır ve böylece (3.75) sayesinde z terimindeki y de bu şekildeki tüm
atamalar aynı olasılığa sahiptir. Bu, başka bir şekilde anlatılmak istenirse; y nin
elemanları, G kümesindeki permütasyonlardan biri ile z nin elemanlarından
oluşturulur ve tüm permütasyonlar eşit olasılığa sahiptir. z = z 0 verildiğinde, S ( z 0 ) ,
G kümesindeki permütasyonların z 0 elemanlarına uygulanmasıyla türetilen örnek
kümesini tanımladığında, S ( z 0 ) bünyesindeki tüm y ler eşit olasılığa sahiptir. S ( z 0 )
daki herhangi bir z için S (z ) , S ( z 0 ) ifadesine eşit olduğundan, S ( z 0 ) da z
verildiğinde S ( z 0 ) bünyesindeki tüm z ler eşit olasılığa sahiptir. Sonuç olarak,
S ( z 0 ) , S ( y 0 ) ifadesine eşittir, S ( z 0 ) bünyesinde z nin olabilmesi için gerek ve
yeter koşul S ( y 0 ) bünyesinde y nin varlığıdır, bu sayede ihtiyaç duyulan sonuca şu
şekilde ulaşılabilmektedir; S ( y 0 ) bünyesinde y verildiğinde, S ( y 0 ) ifadesindeki tüm
y ler eşit şartlı olasılığa sahip olmaktadır.
Aşağıda verilen istatistiğe dayalı H0 hipotezinde kesin permütasyon testini
uygulayabilmek için,
F = cKT A / KTe
ki burada, KT A + KTe , S ( y 0 ) kümesinde sabit değerlere sahiptir çünkü,
61
3. MATERYAL VE METOT
Hasan ÖNDER
KT A + KTe = KTtop − KTB − IJy..2
olup, sağdaki üç terim sabittir. Bloklar için KTB kareler ortalaması sadece blok
toplamına bağımlıdır. Bu, F in KTA nın değişmez bir artan fonksiyonu olmasını takip
etmektedir, ve böylece uygulama toplamlarının kareler toplamı ∑ i (∑ i y ij ) 2 olarak
elde edilebilmektedir. Bu istatistikten temel alan permütasyon testi, F testine
dayanan
permütasyon
testine
denktir.
İstatistik
değeri
uygulamaların
permütasyonundan etkilenmeğinden dolayı ( I !) J değerleri (I!) kümelerinde eşittir.
Diğer bir ifade ile, H0 hipotezi altında ( I !) J −1 değerin eşit olasılığa sahip olduğu
varsayılmaktadır. Bunlar, ilk blokta bulunan gözlemler sabit tutularak diğer
bloklardaki gözlemlerin ( I !) J −1 permütasyonu yapılarak hesaplanabilmektedir.
Genellikle bu permütasyon sayısı hesaplamaların gerçekleştirilebilmesi için çok
fazladır. Bu durumda kesin hesaplama için yaklaşımlar düşünülebilmektedir.
Bu durumda, aşağıda verilen istatistiğe dayanan permütasyon testi ile
ilgilenilebilmektedir;
U = KT A /( KT A + KTe ) .
Bu, F istatistiği ile eşdeğerdir. KTA yerine U seçilmesinin nedeni, bunun hem
kesin hesaplama için bir yaklaşım olması hem de permütasyon testinin normal teori
testi ile karşılaştırılmasına olanak sağlamasıdır. F in F-dağılımına dayanan normal
teori testi, U nun β-dağılımına (aşağıda açıklanmıştır) dayanan testi ile eşdeğerdir.
Fakat KTA nın Ki-kare dağılımına dayanan testi ile eşdeğer değildir. U istatistiği F
istatistiğinden daha elverişlidir çünkü ileri sürülen yaklaşım istatistiğin momentlerini
kullanmaktadır ve U, F den farklı olarak G deki permütasyonlar altında sabit bir
bölen değerine sahiptir.
İlk olarak teknik hataların olmadığı varsayıldığında ( σ e2 = 0 ), tüm u jv = 0
elde edilmektedir. Varsayılan durumda;
62
3. MATERYAL VE METOT
Hasan ÖNDER
2
2
σ A2 = σ AB
= σ AU
= σ e2 = 0
(3.77)
olur. Bu, E (KO) nın geçerli olması için (3.37) denklemi altındaki genel şartların
özel bir durumudur ((3.37) eşitliğinde genel tesadüfileştirme modeli bağımsız teknik
hata durumuna özelleşmiştir, burada σ e2 = 0 varsayımıyla sağlanmaktadır). Böylece;
E ( KT A ) = ( I − 1)σ U2 ,
E ( KTe ) = ( I − 1)( J − 1)σ U2
olmaktadır, burada;
σ U2 = J −1 ( I − 1) −1 ∑∑ ξ 2jv dir.
j
v
KTA + KTe sabit değeri şu şekilde hesaplanabilmektedir;
KT A + KTe = E ( KT A + KTe ) = J ( I − 1)σ U2 = ∑∑ ξ 2jv .
j
v
Bu durumda U nun beklenen değeri;
E (U ) = ( KT A + KTe ) −1 E ( KT A ) = J −1
(3.78)
olur U nun varyansının hesaplanması kolay değildir (Pitman, 1937c);
Var (U ) = 2 J −2 ( I − 1) −1[1 − J −2σ U−4 ∑ σ U4 , j ] .
j
Burada,
σ U2 , j = ( I − 1) −1 ∑ ξ 2jv dir.
v
63
(3.79)
3. MATERYAL VE METOT
Hasan ÖNDER
Bu, j’inci bloğun blok varyansı olarak adlandırılabilmektedir. (3.77) de verilen
varsayımlar altında blok varyansı { y ij } gözlemlerindeki hatalardan bağımsız olarak
hesaplanabilmektedir çünkü (3.76) da u jv = 0 , ξ jv = z jv − z j. dır ve böylece;
σ U2 , j = ( I − 1) −1 ∑ ( z jv − z j. )
2
v
olur. Bu, aşağıdaki eşitlikle benzerdir;
σ U2 , j = ( I − 1) −1 ∑ ( yij − y. j ) .
2
(3.80)
i
(3.79) sonucu
∑ (σ U2 , j − σ U2 ) 2
V =
j
( J − 1)(σ U2 ) 2
şeklinde ifade edilebilmektedir. Blok varyansının varyasyon katsayısının karesi;
Var (U ) =
2( J − 1) ⎛ V ⎞
⎜1 − ⎟
J⎠
J 3 ( I − 1) ⎝
(3.81)
dir. (3.77) varsayımı altında U istatistiği 0 ≤ U ≤ 1 aralığında kesikli dağılışa
sahiptir. Buna, aynı ortalama ve varyansa sahip β-dağılımıyla (sürekli) yaklaşımda
bulunulduğu varsayılsın. X şans değişkeni v1 ve v2 serbestlik dereceli β-dağılımına
sahiptir, 0 ≤ x ≤ 1 için
x
Pr{ X ≤ x} = c ∫ t ( v1 −2) / 2 (1 − t ) ( v2 −2) / 2 dt
0
64
3. MATERYAL VE METOT
Hasan ÖNDER
olup, burada
1
1 / c = ∫ t ( v1 − 2 ) / 2 (1 − t ) ( v2 − 2) / 2 dt dir.
0
β değişkeninin ortalaması ve varyansı
E( X ) =
v1
,
v1 + v 2
Var ( X ) =
2v1v 2
(v1 + v 2 ) 2 (v1 + v 2 + 2)
(3.82)
olarak gösterilebilir. Eğer bunlar E(U) ve Var(U) değerleri ile eşit sayılırsa ve v1 ve
v2 için çözülürse, aşağıdaki eşitlikler elde edilebilir;
v1 = φ ( I − 1) ,
v 2 = φ ( I − 1)( J − 1) .
Burada,
φ=
1
2
dir.
−
−1
1 − J V J ( I − 1)
(3.83)
U istatistiğine dayanan H0 hipotezinin permütasyon testine yaklaşım,
gözlenen örneğin U değeri yukarıda belirtilen v1 ve v2 serbestlik dereceli βdağılımının üst α noktasından büyük ya da eşit ise H0 hipotezinin reddedilmesine
dayanmaktadır.
Eğer X, v1 ve v2 serbestlik dereceli β değişkeni ise, v 2 X /[v1 (1 − X )] X in
değişmez artan bir fonksiyonudur ve v1 ve v2 serbestlik dereceli F dağılımına
sahiptir. Bu durumda, eğer U v1 ve v2 serbestlik dereceli β-dağılımının üst α
noktasından büyük ya da eşit veya F ≥ Fα ,v1 ,v2 ise H0 hipotezi reddedilir. F
istatistiğine dayanan H0 hipotezinin permütasyon testinde yaklaşım, φ faktörü
kullanılarak F-dağılımının serbestlik derecelerinin çoğaltılmasıyla normal teori
65
3. MATERYAL VE METOT
Hasan ÖNDER
testine dönüştürülerek eşit kabul edilebilmektedir. φ faktörü (3.83) denklemi
kullanılarak { y ij } gözlemlerinden hesaplanabilmektedir.
⎤
⎡
⎢ J S2
∑ j ⎥⎥
1 ⎢
V
j
− 1⎥
=
⎢
2
J J −1 ⎢⎛
⎥
⎞
⎥
⎢⎜ ∑ S j ⎟
⎟
⎥⎦
⎢⎣ ⎜⎝ j
⎠
(3.84)
olup, burada
S j = ∑ yij2 − I −1 (∑ y ij ) 2 dir.
i
i
Beklendiği şekilde, φ faktörü önemli ölçüde sapma gösterirse, bu sapma
pozitif olacaktır. Bu durumda test uyarlanmamış normal teori testinden daha duyarlı
olacaktır: F tablosu kontrol edildiğinde, α ≤ 0.1 ve v 2 > 2 için Fα ;V1 ,V2 ifadesinin v1
ve v2 nin azalan fonksiyonu olduğu görülecektir. Uyarlanmamış serbestlik dereceleri
ile hatalı önem düzeyi üreten F istatistiğinin değerleri uyarlanmış serbestlik
dereceleri ile güçlendirilebilmektedir.
U nun ilk iki momenti ve V/J değeri 1’e yakın olmamak koşuluyla üçüncü ve
dördüncü momentleri yardımıyla β dağılımının uyarlaması gösterilebilir.
Yukarıda açıklanan yaklaşımın permütasyon testlerine uygulanabilmesi için,
rasgele bir dağılıma sahip olan teknik hatalar { u jv } bakımından E (u jv ) = 0 olması
gerekmektedir. { u jv } verildiğinde şartlı dağılımlarla ilgilenildiğinde: (3.74)
eşitliğinde verilen { u jv } terimi sabittir ve gözlemlerin yapısına göre (3.74) ifadesi
y ij = µ ′ + β ′j + ∑ d ijvξ ′jv
v
66
3. MATERYAL VE METOT
Hasan ÖNDER
şeklinde yazılabilmektedir. Burada,
ξ ′jv = ξ jv + u jv − u j.
,
β ′j = β j + u j. − u..
,
µ ′ = µ + u..
olup, tüm j’ler için ξ ′j. = 0 dır. Bu, (3.74) numaralı denklemde { ξ jv } yerine { ξ ′jv },
{ β j } yerine { β ′j }, µ yerine µ ′ ve { u jv } yerine sıfır konmasıyla gözlemlerin şartlı
dağılım göstermesini sağlamaktadır. U nun mevcut şartlı dağılımı, { ξ jv } yerine
{ ξ ′jv } kullanılan ve { u jv } ifadesinin sıfır olduğu önceki durumda U nun dağılımı ile
aynıdır, U nun önceki dağılımı { β j } ya da µ ye bağlı değildir. Eğer blok
varyansları tanımında ξ jv yerine ξ ′jv ifadesi kullanılırsa, bu şartlı blok varyansları
değişmeden (3.84)
denkleminde gösterilen { y ij } gözlemleri teriminde olduğu
gibidir. Şartlı permütasyon testine yaklaşım (3.83) ve (3.84) denklemlerinde
hesaplanan φ faktörü tarafından uyarlanan serbestlik derecesi sayıları kullanılarak
normal teori testinin uygulanması ile elde edilmektedir. Aslında φ bir şans
değişkenidir ve sadece şartlı olarak sabittir. Bununla birlikte, eğer test kendi
olasılığının yaklaşık olarak α olması için I. tip hatayı kontrol ediyorsa, bu şartlılığın
olmadığı durumda da aynıdır.
İstatistikçilerin genel bir kanaati olarak ortalamaların testi için uygun model
altında F istatistiğine dayanan kesin permütasyon testinin sonuçlarına güçlü bir
yaklaşım veren normal teori altında elde edilebilen F tabloları ile genel F testi
önerilmektedir. Normal teoride, eğer F ≥ Fα ise α önem düzeyinde hipotez
reddedilmektedir, burada Fα , gözlenen örnek y0 dan bağımsız olan bir sabittir. Kesin
permütasyon testinde F ≥ Fα ( y 0 ) ise hipotez reddedilmektedir, burada Fα ( y 0 )
değeri gözlenen örneğe (y0) dayanmaktadır.
Bu inancı destekleyen ve bir şekilde normal teori testlerinin permütasyon
testlerine yaklaşımıyla ilgilenen pek çok delil, katı kısıtlamalara tabi tutulan gözlenen
örnek y0 da var olan durumu desteklemektedir. Örneğin, yukarıdaki tartışmayı
67
3. MATERYAL VE METOT
Hasan ÖNDER
takiben, V/J ifadesi birleşme ile karşılaştırıldığında daha küçük ise genellikle doğru
olan y0 ın φ fonksiyonu birleşmeye yakınsa, normal teori testi permütasyon testine
iyi bir yaklaşımdır. Kanıtlar iki şekilde ifade edilebilmektedir.
İlk olarak, bazı asimptotik hesaplamalar bulunmaktadır. Tesadüf blokları
deneme deseninde uygulama sayısı I sabit iken blok sayısı J arttığında normal teori
modeli altında F istatistiğinin limit dağılımının χ I2−1 olduğu görülebilir. Eğer { y0}
dizisi kısıtlamalara uygunsa, I sabit iken J sayısı attığında F istatistiğinin
permütasyon sayısı aynı limit yapısına sahiptir. Benzer hesaplamalar tek yönlü
durum içinde uygulanabilmektedir.
İkinci olarak moment hesaplamalarından söz etmek mümkündür. Bunlar
genellikle
F
istatistiğinin
U
dönüşümünde
kullanılmaktadır.
Burada
U = KTH /( KTH + KTe ) olup, KTH ve KTe sırasıyla F istatistiğine ait olan bölünen ve
bölen kareler toplamlarını göstermektedir. Yukarıda belirtildiği şekilde, U nun
permütasyon dağılımı rasgele bir dağılımdır ve bunlar S(y0) ifadesindeki L
örneklerine eşit olasılıkla atanmaktadır. Bunlara ait E (U ) ve Var (U ) ifadeleri (3.78)
ve (3.81) numaralı denklemlerde verilmiştir. H0 hipotezi doğru olduğunda
F = KO A / KO e normal teori testi altında, (I-1) ve (I-1)(J-1) serbestlik dereceli F
dağılımına sahiptir. Bu durumda, U = KT A /( KT A + KTe ) aynı serbestlik dereceleri
ile β değişkenidir. (3.82) numaralı eşitlikten normal teori altında bunu aşağıdaki
eşitlik izlemektedir;
−1
E (U ) = J
−1
,
2 ⎤
2( J − 1) ⎡
Var (U ) = 3
⎢1 + J ( I − 1) ⎥ .
J ( I − 1) ⎣
⎦
(3.78) ve (3.81) numaralı ifadelerle karşılaştırıldığında, E (U ) normal teori
dağılımda olduğu şekilde permütasyon dağılımında da aynıdır. Fakat Var (U ) biraz
68
3. MATERYAL VE METOT
Hasan ÖNDER
farklıdır, normal teori altında Var (U ) ifadesinin permütasyon dağılımı altındaki
Var (U ) ifadesine oranı şu şekildedir;
2 ⎤
⎛ V ⎞⎡
.
⎜1 − ⎟ ⎢1 +
J ⎠ ⎣ J ( I − 1) ⎥⎦
⎝
Eğer V/J, birleşme ile karşılaştırıldığında küçük ise, bu oran genellikle
birleşmeye yakın olacaktır. Serbestlik dereceleri için yukarıda verilen φ faktörü
düzeltmesi yakınsak olduğunda, oran kesin olarak denktir.
F = KO A / KOe ifadesinde U nun permütasyon dağılımı ve normal teori
dağılımı arasında H0 hipotezi altında iyi bir uyuşma olması biraz sürpriz olarak ifade
edilebilmektedir. Bunun nedeni KOA ve KOe ifadelerinin bileşik dağılımının iki
durumda oldukça farklı olmasıdır. Her iki durumda da E ( KOe ) , σ 2 ile ifade
edilmektedir. Bunu takiben, normal teori dağılımında KOA ve KOe aşağıda
gösterildiği şekilde istatistiksel olarak bağımsızdır.
E ( KO A ) = E ( KOe ) = σ 2 ,
Var ( KO A ) = 2v A−1σ 4 ,
Var ( KOe ) = 2ve−1σ 4
Burada, vA = I – 1 ve ve =(I -1)(J - 1) dir. Permütasyon dağılımında KOA ve KOe
tamamen bağımlıdır çünkü v A KO A + ve KOe ifadesi sabittir, bu durumu aşağıda
verilen momentler sağlamaktadır;
E ( KO A ) = E ( KOe ) = σ 2
Var ( KO A ) = 2v A−1σ 4 (1 − J −1 )(1 − J −1V )
Var ( KOe ) = 2ve−1σ 4 J −1 (1 − J −1V ) .
69
(3.85)
3. MATERYAL VE METOT
Hasan ÖNDER
(3.85) ifadesi (3.81) ifadesinden kolaylıkla elde edilebilmektedir. Bu sayede KOA ve
KOe ortalamaları her iki dağılımda da aynıdır, Var(KOA) biraz farklı olsa da,
Var(KOe) J’den daha büyük olan bir faktörle aşırı derecede farklıdır.
V = 0 iken, U’nun permütasyon dağılımı üçüncü ve dördüncü momentler
bakımından normal teori dağılımı ile iyi bir uyum içerisindedir.
Kareler ortalamalarının beklenen değerleri altında, parametrik olmayan bir
alternatif olan tesadüfileştirme modellerindeki alternatiflerine karşı F-testinin gücü
hakkında sahip olunan bilgi yetersizdir.
3.2.4.3. Permütasyon Testlerinin Latin Kare Deneme Deseninde Uygulanması
(3.50) numaralı ifade ile tanımlanan modelde H C : σ C2 = 0 hipotezinin testi
için permütasyon testi bulunmamaktadır, C faktörünün ana etkileri sıfırdır. Bununla
birlikte, H0 hipotezinin testi için bir permütasyon testi bulunabilmektedir ki bu
2
2
2
hipotezde C faktörü, σ C2 = σ AC
= σ BC
= σ ABC
= 0 durumundan dolayı hiçbir etkiye
sahip değildir ve teknik hatalar { eijk } şu özelliklere sahiptir. Denemede ortaya çıkan
m2 değişken { eijk }, bileşik dağılımı C faktörünün düzeylerinin A ve B faktörlerinin
düzeyleri ile kombinasyonunun nasıl olduğuna bağlı olmayan m2 değişken { eij } ile
benzer dağılım göstermektedir. Aslında, (3.2.3.5.) numaralı bölümün başında
açıklanan 3. durumda m2 deneme ünitesi için { eij } ifadesinin bileşik dağılımı
uygulamaların ünitelere nasıl dağıtıldığına bağımlı değildir. { eij } ifadesinin bileşik
dağılımı E (eij ) = 0 şartına bağımlıdır, aksi durumda dağılım belirsizdir. H0 hipotezi
altında eğer bir gözlem A faktörünün i’inci, B faktörünün j’inci ve C faktörünün
k’ıncı düzeyi kullanılarak elde edilen uygulama kombinasyonları üzerinden
oluşturulursa, bu aşağıda verilen yapıya sahip olacaktır;
y ijk = µ + α iA + α Bj + α ijAB + eij
(3.86)
70
3. MATERYAL VE METOT
Hasan ÖNDER
burada tüm i ve j’ler için,
α .A = α .B = α iAB
= α .AB
.
j = 0.
ve { α ijAB } ünite hatasıdır.
Eğer Latin kare tek bir dönüşüm kümesinden rasgele seçilmiş ise
permütasyonların G kümesi sıra, sütun ve sayıların (m!)3 permütasyonundan
oluşmaktadır. Eğer dönüşüm kümesi olası tüm dönüşüm kümelerinden belirli
olasılıklarla seçilseydi, istatistiğin permütasyon dağılımı ya da bunun momentleri
dönüşüm kümeleri için aynı olasılıklarla ağırlıklandırılarak belirlenirdi.
F = KOC / KOe
ifadesine dayanan H0 hipotezinin permütasyon testi
U = KTC /( KTC + KTe ) ifadesine dayanan hipotezle aynıdır ki bu F’in değişmez bir
artan fonksiyonudur ve bölen, permütasyon dağılımında sabittir çünkü aşağıdaki
ifadenin sağ tarafı sabittir.
2
KTC + KTe = KTtop − KT A − KTB − m 2 yK
Permütasyon testini tam olarak uygulamanın en basit yolu sayılar (C
faktörünün seviyeleri) kareler toplamına dayanandır, yani
∑ k Tk2
ifadesine
dayanmaktadır, burada Tk, C faktörü k düzeyinde iken m gözlem toplamıdır.
Dönüşüm kümesindeki farklı karelerin sayısı, kümede bulunan standart karelerin
sayısının m!(m - 1)! katıdır. İstatistik, C faktörünün seviyelerinin m! permütasyonu
altında sabit olduğundan, verilen dönüşüm kümesi için istatistiğin eşit olasılıklarla
aldığı farklı değerlerin sayısı, kümedeki standart karelerin sayısının (m - 1)! katıdır.
Bu değerlerin elde edilmesi için sistematik bir yöntem, sıra ve sütunların sırasıyla A
ve B faktörlerinin seviyelerini gösterdiği karelerdeki gözlemlerin düzenlenmesi ve
ardından ilk oluşturulan standart kareyi takiben standart karenin sıralarının
permütasyonu ile elde edilebilen (m - 1)! kare dönüşüm kümesinin her karesi için
uygulanmasıdır. Burada ilk olarak ilgilenilmesi gereken konu orijinal kareden elde
71
3. MATERYAL VE METOT
Hasan ÖNDER
edilen istatistik değerden büyük ya da eşit sonuç veren karelerin tespit edilmesidir.
m = 4 için iki dönüşüm kümesi mevcuttur, bunlardan ilki tek bir standart kare ile
olurken diğeri üç kare ile olmaktadır, bu durumda, istatistik birinci durumda 6 değer
alırken diğerinde 18 değer almaktadır. Dönüşüm kümeleri, kümedeki standart
karelerin sayısına orantılı olasılıklarla seçilirse ya da dört standart kareden biri eşit
olasılıkla seçilirse, söz konusu 24 değer benzer olacaktır. m = 4 iken genel önem
düzeylerindeki normal teori testlerine permütasyon testi uygun bir yöntem değildir.
Fakat m = 5 iken F istatistiği için elde edilebilen değerler 56 x 4!= 1344 olmaktadır ki
bu durumda permütasyon testleri uygun olabilmektedir.
(3.2.3.5.) numaralı bölümde σ e2 = 0 ile verilen model altında kareler
ortalamalarının beklenen değeri için verilen formülasyonda E (U ) ifadesinin
permütasyon ve normal teori dağılımında aynı olduğu gösterilebilmektedir. Var (U )
hesaplanabilmektedir fakat uygulamada sayısal hesaplamalar yapmak için fazlasıyla
karmaşıktır. Kesin permütasyon testine yaklaşımı daha iyi gerçekleştirebilmek için
normal teori testinin serbestlik derecelerini düzeltmek bu nedenle hesaplamaya
uygun değildir çünkü bu Var (U ) değerinin hesaplanmasını gerektirmektedir. Sadece
m > 4 durumunda permütasyon testlerini uygulamak iyi bir yöntem olabilmektedir.
3.2.5. Anderson-Darling Uyum İyiliği Testi
Bu başlık altında, tezde kullanılan verilerin normal dağılıma sahip olup
olmadığının anlaşılması amacıyla kullanılmış olan Anderson-Darling istatistiği
anlatılmıştır. Anderson-Darling istatistiği günümüzde bir-örnek uyum iyiliği
probleminin testi için en güçlü yöntemlerden biri olarak gösterilmektedir (Thas ve
Ottoy, 2003).
Y = Y1 ,K, Yn bağımsız ve benzer dağılım gösteren şans değişkenleri olsun.
P (Y ≤ y ) , sürekli dağılım fonksiyonu F e eşittir olarak kurulan hipotezin uyum
iyiliği testi, n adet bağımsız değişken X i = F (Yi ),1 ≤ i ≤ n in (0,1) birörnek dağılıma
sahip olmadığı şekline indirgenebilmektedir (Pycke, 2003). Bahsedilen yaklaşımda
72
3. MATERYAL VE METOT
Hasan ÖNDER
bulunarak Anderson-Darling (1952)
1
An = ∫ (U n (t )) 2 /(t (1 − t ))dt
0
olarak tanımlanan istatistiği önermiştir. Burada (U n (t )) 0≤t ≤1 , tüm 0 ≤ t ≤ 1 ve (0,1)
birörneklilik kuralı altında n büyüklüğünde bir örnek kümesi ( X 1 ,K, X n ) dir.
U n (t ) =
1
n
∑ (1{
n
i =1
xi ≤t }
)
−t , 0 ≤ t ≤1
olup deneysel işlemi göstermektedir (Pycke, 2003; Mansuy, 2005).
Diğer bir yaklaşımla, bir-örnek problemi örnek uzayındaki tüm x ler için
H 0 : F ( x) = G ( x) hipotezi ile gösterilebilmektedir. Burada, F ve G sırasıyla normal
ve normalliği test edilen dağılım fonksiyonlarını göstermektedir. X in sürekli
dağılıma sahip olduğu varsayılmaktadır. G dağılımı sonlu-boyutlu bir parametre
vektörü olan θ ya dayandırılabilmektedir. θ biliniyorsa sıfır hipotezi “basit” olarak
adlandırılmakta ve diğer durumlarda “kompleks” olarak adlandırılmaktadır. Sürekli
şans değişkeni X te n gözlemden oluşan ζ n örneği ile ilgilenildiğinde AndersonDarling (1952) nin önerdiği istatistik
An = n ∫ ( Fˆn ( x) − G ( x)) 2 Ψ (G ( x))dG ( x)
olarak tanımlanabilmektedir. Burada, Fˆn deneysel dağılım fonksiyonunu ve Ψ (.)
ağırlık fonksiyonunu tanımlamaktadır. Ψ seçimi keyfi olsa da, kaynaklarda
genellikle
73
3. MATERYAL VE METOT
Ψ (u ) =
Hasan ÖNDER
1
u (1 − u )
(3.87)
seçimi yapılmaktadır (Thas ve Ottoy, 2003). Anderson-Darling istatistiğinin
hesaplanabilir denklemi:
n
An = − n − n −1 ∑ (2i − 1)(ln Z ( i ) + ln(1 − Z ( n +1−i ) ))
i =1
olarak gösterilebilmektedir. Burada, Z(i) , Z=G(x) değişkenine ait i’inci sıra
istatistiğidir. (3.87) ifadesinin kullanılmasıyla Anderson-Darling istatistiği
⎡ ( Fˆ ( x) − G ( x)) 2
((1 − Fˆn ( x)) − (1 − G ( x))) 2 ⎤
+n
An = ∫ ⎢n n
⎥dG ( x)
G ( x)
1 − G ( x)
⎢⎣
⎥⎦
olarak tanımlanabilmektedir. Bu ifade, {n(G ( x), n(1 − G ( x))} in uyum iyiliği testi için
{N1 ( x), N 2 ( x)} = {nFˆn ( x), n(1 − Fˆn ( x))}
frekanslarına
uygulanan
Pearson
χ2
istatistiğinin yorumlanabilmesi açısından oldukça uygundur (Thas ve Ottoy, 2003).
Anderson-Darling istatistiğinden elde edilen p değerleri seçilen α değerinden
(örneğin α =0.05) büyük ise teste konu olan veri kümesinin normal dağılım
göstermediğine, aksi durumda veri kümesinin normal dağılım gösterdiğine karar
verilmektedir.
74
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
4. BULGULAR VE TARTIŞMA
Bu kısımda metot kısmında teorileri verilen yöntemlerin sonuçları aynı sıra
ile açıklanmıştır. Bu kısımda sırası ile doğrusal regresyon, tesadüf parselleri, tesadüf
blokları ve Latin kare deneme desenleri için araştırma bulguları ve elde edilen
bulgulara ait yorumlar yer alacaktır.
4.1. Çoklu Doğrusal Regresyon
Doğrusal regresyon analizinde geleneksel yöntem olan en küçük kareler
(EKK), permütasyon analizinde doğrusal regresyon için uygulanabilen ham verinin
tam permütasyonu (HVTP) ve kalıntıların tam permütasyonu (KTP) yöntemi
uygulanılarak yapılan analizlerinden elde edilen I. tip hata olasılıkları sırasıyla 0.009,
0.0047 ve 0.0054 olarak elde edilmiş olup Şekil 4.1’ de grafik olarak verilmiştir.
0,01
0,009
0,008
0,007
0,006
0,005
0,004
I. Tip Hata
0,003
0,002
0,001
0
Orijinal
HVTP
KTP
Şekil 4.1. Doğrusal regresyonlarda EKK, HVTP ve KTP analizlerinden elde edilen I.
tip hata olasılıkları
Elde edilen araştırma bulguları Şekil 4.1.’de de görülebileceği üzere doğrusal
regresyonlarda uygulanabilen permütasyon yöntemlerinin tümünün En Küçük
75
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
Kareler (EKK) yöntemine göre daha düşük I. tip hata değerleri ürettiğini
göstermektedir. Verilerin normal dağılım gösterip göstermediğini belirlemek için
Anderson-Darling analizi MINITAB istatistik yazılımı kullanılarak gerçekleştirilmiş
ve p=0.345 bulunmuş olup p>0.05 olduğu için verilerin normal dağılım göstermediği
belirlenmiştir. Verilerin normal dağılıma sahip olmaması EKK yönteminin
varsayımlarının sağlanamadığını göstermektedir. Bu durumda EKK yöntemi hatalı
sonuç üretme eğilimindedir ve HVTP ve KTP yöntemlerinden elde edilen I. tip hata
olasılığı değerlerinin EKK yönteminden daha güvenilir olduğu söylenebilir.
HVTP yönteminden elde edilen I. tip hata olasılığı KTP yönteminden elde
edilen değerden daha düşüktür. Anderson ve Legendre (1999) yaptıkları simülasyon
çalışması sonucunda HVTP ve KTP arasında I. tip hata bakımından dikkate değer bir
farklılık olmadığını bildirmişler ancak bilgisayar işlem zamanını dikkate alarak
HVTP yöntemini önermişlerdir. Anderson (2001) yaptığı çalışma sonucunda küçük
örnek durumunda yine bilgisayar işlem zamanı bakımından HVTP yöntemini
önermiştir. Tanizaki (2001) regresyon modellerinin önem testi için verilerin normal
dağılıma sahip olmadığı durumlarda, dağılımdan bağımsız olduğu için permütasyon
testini önermiştir. Elde edilen bulgularda iki permütasyon yöntemi tarafından üretilen
I. tip hata arasındaki farkın 0.0007 oluşu ile Anderson ve Legendre (1999)
çalışmalarının sonucunu destekler niteliktedir. Tanizaki (2001)’ in de bildirdiği gibi
veriler normal dağılıma sahip olmadığından EKK yöntemi yerine permütasyon testi
kullanılması ve kullanılan veri kümesi küçük örnek durumunda olduğundan
Anderson (2001) ve Anderson ve Legendre (1999) sonuçları tarafından da
desteklenen HVTP yöntemi dağılımdan bağımsız olması ve bilgisayar işlem zamanı
dikkate alındığında önerilebilir.
4. 2. Tesadüf Parselleri Deneme Deseni
Tesadüf parselleri deneme deseninde orijinal varyans analizi ve tesadüf
parselleri deneme deseninde uygulanabilen permütasyon yöntemlerinden HVTP
yöntemi uygulanmış olup analizler sonucunda elde edilen I. tip hata olasılıkları
76
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
sırasıyla 0.005 ve 0.0068 olarak elde edilmiş ve Şekil 4.2’ de grafiksel olarak
gösterilmiştir.
0,008
0,007
0,006
0,005
0,004
I. Tip Hata
0,003
0,002
0,001
0
ANOVA
HVTP
Şekil 4.2. Tesadüf parselleri deneme deseni için ANOVA ve HVTP yöntemlerinden
elde edilen I. tip hata olasılıkları
Tesadüf parselleri deneme deseni için ANOVA yönteminin HVTP yöntemine
göre daha düşük I. tip hata olasılığı ürettiği görülmektedir. Ancak yapılan AndersonDarling analiz sonuçları p=0.365 sonucu üretmiştir. Bu durumda p>0.05 olduğu için
verilerin normal dağılım göstermediğini anlaşılmaktadır.
Tesadüf parselleri için yöntemler karşılaştırıldığında tür değişkeni için
aralarında H0 hipotezine ait kararı değiştiren bir farklılığın olmadığı fakat HVTP
yönteminin ANOVA yöntemine göre daha yüksek I. tip hata olasılığı ürettiği
görülebilmektedir. Routledge (1997) ve Anderson (2001) tesadüf parselleri deneme
deseninde ünite hatasını sıfıra eşitlemesi ve dağılımdan bağımsız olması nedeniyle
permütasyon testlerinin daha güvenilir sonuçlar ürettiğini bildirmiştir. Permütasyon
yönteminin ünite hatalarını modelden elimine etmesi ve dağılımdan bağımsız olması
nedeniyle tesadüf parselleri deneme deseni için HVTP yöntemi önerilebilmektedir.
77
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
4.3. Tesadüf Blokları Deneme Deseni
Tesadüf blokları deneme deseninde varyans analizi, tesadüf blokları deneme
deseninde uygulanabilen permütasyon yöntemlerinden HVTP, kalıntıların kısıtlanmış
permütasyonu (KKP) ve KTP yöntemleri uygulanmış olup analizler sonucunda elde
edilen I. tip hata olasılıkları Çizelge 4.1’ de verilmiştir.
Çizelge 4.1. Tesadüf blokları deneme deseni için ANOVA, HVTP, KKP ve KTP
yöntemlerinden elde edilen I. tip hata olasılıkları.
ANOVA
HVTP
KKP
KTP
Tür
0.002
0.0033
0.0033
0.0002
Zaman
0.024
0.0261
0.0045
0.0028
Tür x Zaman
0.423
0.4238
0.4212
0.4590
Çizelge 4.1’de verilen sonuçların daha kolay yorumlanabilmesi açısından tür ve
zaman değişkenleri için Şekil 4.3’de ve tür x zaman interaksiyon terimi için Şekil
4.4’de grafiksel olarak verilmiştir.
0,03
0,025
0,02
Tür
0,015
Zaman
0,01
0,005
0
ANOVA
HVTP
KKP
KTP
Şekil 4.3. Tesadüf blokları deneme deseninde tür ve zaman değişkenleri için
ANOVA, HVTP, KKP ve KTP yöntemlerinden elde edilen I. tip hata olasılıkları
78
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
0,47
0,46
0,45
0,44
Tür x Zaman
0,43
0,42
0,41
0,4
ANOVA
HVTP
KKP
KTP
Şekil 4.4. Tesadüf blokları deneme deseninde tür x zaman interaksiyon terimi için
ANOVA, HVTP, KKP ve KTP yöntemlerinden elde edilen I. tip hata olasılıkları
Tesadüf blokları deneme deseni incelendiğinde Çizelge 4.1. ve Şekil 4.3.’de
de görülebileceği gibi tür değişkeni için permütasyon yöntemlerinden HVTP ve KKP
yöntemlerinin ANOVA yöntemine göre daha yüksek fakat KTP yönteminin daha
düşük I. tip hata ürettiği görülmektedir. Blok olarak kullanılan zaman değişkeni için
ise HVTP yönteminin ANOVA yöntemine göre daha yüksek fakat KKP ve KTP
yöntemlerinin daha düşük I. tip hata ürettiği görülmektedir. Şekil 4.4.’ de
yorumlanabileceği şekilde tür x zaman interaksiyon terimi için HVTP ve KTP
yöntemlerinin ANOVA yöntemine göre daha yüksek fakat KKP yönteminin daha
düşük I. tip hata ürettiği görülebilmektedir.
Anderson (2001) örnek sayısı 10’dan büyük olduğunda KKP ve 10’dan küçük
olduğunda gözlem-ortalama farklarının güvenilir olmayacağını ve dolayısıyla HVTP
yönteminin önerilebileceğini bildirmiştir. Tesadüf parselleri deneme deseninde
olduğu gibi Routledge (1997) ve Anderson (2001) tesadüf blokları deneme deseninde
de ünite hatasını sıfıra eşitlemesi ve dağılımdan bağımsız olması nedeniyle
permütasyon testlerinin daha güvenilir sonuçlar ürettiğini bildirmiştir. Anderson
(2001) analiz edilecek faktör sayısı birden fazla olduğu için KTP yönteminin tesadüf
blokları deneme deseninde yanlış sonuçlar üretebileceğini bildirmiştir. Analiz edilen
veri kümesinin örnek büyüklüğü 10’dan fazla olduğundan KKP yöntemi
önerilebilmektedir.
79
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
4.4. Latin Kare Deneme Deseni
Latin kare deneme deseninde varyans analizi ve Latin kare deneme deseninde
uygulanabilen permütasyon yöntemlerinden HVTP, KKP ve KTP yöntemleri
uygulanmış olup analizler sonucunda elde edilen I. tip hata olasılıkları Çizelge 4.2’de
verilmiştir.
Çizelge 4.2. Latin kare deneme deseni için ANOVA, HVTP, KKP ve KTP
yöntemlerinden elde edilen I. tip hata olasılıkları.
ANOVA
HVTP
KKP
KTP
Sıra
0.203
0.4348
0.4308
0.4308
Sütun
0.052
0.1587
0.1602
0.1602
Muamele
0.030
0.2640
0.0313
0.0313
Çizelge 4.2’de verilen sonuçlar Şekil 4.5’de grafiksel olarak verilmiştir.
0,5
0,45
0,4
0,35
0,3
Sıra
0,25
Sutun
Muamele
0,2
0,15
0,1
0,05
0
ANOVA
HVTP
KKP
KTP
Şekil 4.5. Latin kare deneme deseninde sıra, sütun ve muamele için ANOVA, HVTP,
KKP ve KTP yöntemlerinden elde edilen I. tip hata olasılıkları
80
4. BULGULAR VE TARTIŞMA
Hasan ÖNDER
Latin kare deneme deseninde uygulanabilen permütasyon yöntemi olarak
HVTP, KKP ve KTP yöntemleri ANOVA ile karşılaştırıldığında Çizelge 4.2. ve
Şekil 4.5.’ de görüldüğü şekilde sıra ve sütun değişkenleri için her üç permütasyon
yönteminin ANOVA yöntemine göre daha yüksek I. tip hata ürettiği görülmektedir.
Muamele değişkeni için ise yine her üç permütasyon yönteminin ANOVA yöntemine
göre daha yüksek I. tip hata ürettiği görülmektedir ancak HVTP yöntemi ile ANOVA
yöntemi arasında bulunan fark H0 hipotezine ait verilecek olan kararı
değiştirmektedir. ANOVA yöntemi %5 önem seviyesinde hipotezi red ederken
HVTP yöntemi hipotezi kabul etmektedir. KKP ve KTP yöntemleri ise H0 hipotezini
red etmektedir.
Routledge (1997) Latin kare deneme deseni için permütasyon testlerinin ünite
hatalarını elimine etmesi ve dağılımdan bağımsız olmaları nedeniyle I. tip hata
bakımından daha güvenilir sonuçlar ürettiğini bildirmektedir. Anderson (2001)
varyans analizi için seçilecek permütasyon yönteminin örnek büyüklüğüne bağlı
olduğunu bildirmektedir.
Verilerin normalliği Anderson-Darling analizi ile kontrol edildiğinde p=0.386
olarak elde edilmiş ve p>0.05 olduğundan verilerin normal dağılıma sahip olmadığı
anlaşılmıştır.
Bu
durumda
permütasyon
testlerinin
kullanılması
gereği
anlaşılabilmektedir. Permütasyon testlerinin Latin kare deneme deseninde faktör
düzey sayısının ≥ 5 olduğu durumlarda kullanılabileceği bilgisi göz önüne
alındığında, permütasyon testlerinin uygulanabileceği Latin kare deneme deseninin
en az 25 gözlemden oluşabileceği anlaşılmaktadır. Bu bilgi ışığında Latin kare
deneme deseni için sadece KKP yöntemi önerilebilmektedir.
81
5. SONUÇ VE ÖNERİLER
Hasan ÖNDER
5. SONUÇ VE ÖNERİLER
Permütasyon
testlerinin
doğrusal
modellerde
uygulanmasını
ve
karşılaştırılmasını içeren bu çalışmada permütasyon yöntemlerinden ham verinin tam
permütasyonu (HVTP), kalıntıların kısıtlanmış permütasyonu (KKP) ve kalıntıların
tam permütasyonu (KTP) yöntemleri geleneksel yöntemlerle karşılaştırılmıştır.
Bu çalışmada ele alınan doğrusal regresyon, tesadüf parselleri, tesadüf
blokları ve Latin kare deneme desenleri için permütasyon testlerinin daha güvenilir
olduğu belirlenmiştir. Parametrik yöntemlerin hipotez testlerine ve/veya model
parametrelerinin tahminine sadece bir yaklaşımda bulunduğu, permütasyon
testlerinin ise daha güvenilir sonuçlar ürettiği bilgisine dayanarak parametrik testlerin
araştırma bulgularının da desteklediği üzere I. ve II. tip hata yapma olasılığını
arttırdığı anlaşılabilmektedir.
Çoklu doğrusal regresyon analizinde verilerin normal dağılıma sahip
olmadığı,
bağımsız
değişkenler
arasında
yüksek
korelasyonun
bulunduğu
durumlarda, outlier varlığında kalıntıların tam permütasyonu (KTP), outlier var
olmadığı durumda ise ham verinin tam permütasyonunun (HVTP) kullanılması
önerilmektedir.
Tesadüf parselleri deneme deseni için HVTP yöntemi önerilebilmektedir.
Tesadüf blokları deneme deseni için ise örnek büyüklüğü 10’dan fazla olduğunda
KKP ve 10’dan küçük olduğunda HVTP yöntemlerinin önerilebilmektedir.
Elde edilebilen kaynaklarda daha önce bu konuya değinilmemiş olup
araştırma bulguları Latin kare deneme deseninde kalıntıların kısmi permütasyonu
(KKP) yönteminin önerilmesi gerektiğini ortaya koymaktadır.
Hata terimini oluşturan bileşenlerden biri olan ünite hatasını sıfıra eşitlemesi
ve hata terimi içinde sadece uygulama hatalarına ait faktörlerin kalması permütasyon
testlerinin önerilmesinin en önemli nedenidir.
Biyolojik alanlardan elde edilen verilerin genellikle parametrik yöntemlerin
ihtiyaç
duyduğu
varsayımları
karşılayamadığı
bilinmektedir.
Eğer
veriler
varsayımları karşılamıyor ise ya da verinin yapısı hakkında bilgi sahibi olunamıyor
82
5. SONUÇ VE ÖNERİLER
Hasan ÖNDER
ise permütasyon testlerinin kullanılması daha güvenilir sonuçların elde edilebilmesi
açısından kullanılabilmektedir. Aksi takdirde elde edilen sonuçlar I. ve II. tip hata
yapma olasılığını beraberinde getirebileceğinden, söz konusu istatistik hata analiz
sonuçlarının yanlış yorumlanmasına neden olabilecektir.
Eğer mevcut veri parametrik yöntemlerin ihtiyaç duyduğu varsayımları
karşılıyor ise parametrik yöntemler ile permütasyon testleri benzer sonuçlar
üretmektedir. Bu durumda işlem zamanı açısından parametrik yöntemlerin
kullanılması önerilebilmektedir.
Permütasyon testlerinin de dahil olduğu ve Bootstrap ve Jackknife gibi
testleri de içeren yeniden örnekleme yöntemlerinin birbiriyle ve/veya F ve t testleri
gibi parametrik testlerle karşılaştırılmaları ve gücü yüksek olan testlerin
belirlenmesine yönelik çalışmaların yürütülmesinin gerekli olduğu anlaşılmaktadır.
83
KAYNAKLAR
ABECASIS, G. R., CARDON, L. R., COOKSON, W. O. C., 2000. A General Test
of Association for Quantitative Traits in Nuclear Families. Am. J. Hum.
Genet. 66:279 – 292.
ABNEY, M., OBER, C., McPEEK, M. S., 2002. Quantitive-Trait Homozygosity and
Association Mapping and Emprical Genomewide Significance in Large,
Complex Pedirees: Fasting Serum-Insulin Level in the Hutteries. Am. J.
Hum. Genet. 70: 920 – 934.
ANDERSON, M. J., LEGENDRE, P., 1999. An Emprical Comparison of
Permutation Methods for Tests fo Partial Regression Coefficients in a Linear
Model. J. Statist. Comput. Simul. Vol. 62, 271 - 303
ANDERSON, M. J., 2000. NPMANOVA: A FORTRAN Computer Program for
Non-Parametric Multivariate Analysis of Variance (for any two factor
ANOVA design) Using Permutation Tests. Department of Statistics,
University of Auckland.
ANDERSON, M. J., 2001. Permutation Tests for Univariate and Multivariate
Analysis of Variance and Regression. Can. J. F.sh. Aquat. Sci. 58: 626-639
ANDERSON, M. J., ROBINSON, J., 2001. Permutation Tests For Linear Models.
Aust. N. Z. Stat. 43(1), 2001, 75 – 88
ANDERSON, M. J., 2003. DISTLM: A FORTRAN Computer Program to Calculate
a Distance-Based Multivariate Analysis for a Linear Model. Department of
Statistics, University of Auckland.
ATKINSON, A. C., BAILEY, R. A., 2001. One Hundred Years of the Design of
Experiments on and off the Pages of Biometrika. Biometrika (2001), 88, 1, 53
– 97.
BEK, Y., EFE, E., 1995. Araştırma ve Deneme Metodları. Çukurova Üniverstiesi
Ziraat Fakültesi Ders Kitabı No: 71, 395 sayfa.
BODY, J. P., JONAS, K. J., 2001. Are Social Equivalences Ever Regular?
Permutation and Exact Tests. Social Networks 23 (2001) 87 – 123.
84
BOHDAN, L., 2003. Resampling Tests for Regression Coefficient. 2nd International
Conference APLIMAT.
BULLMORE, E. T., SUCKLING, J., OVERMEYER, S., RABE-HESKETH, S.,
TAYLOR, E. ve BRAMMER, M. J., 1999. Global, Voxel, and Cluster Tests,
by Theory and Permutation, for a Difference Between Two Groups of
Structural MR Images of the Brain. IEEE Transactions on Medical Imaging,
Vol. 18 No. 1, January 1999.
DARCAN, N., 2004. Küçükbaş hayvan yetiştiriciliği alanından elde edilen veriler.
(Kişisel görüşme).
DE MARTINI, D., RAPALLO, F., 2002. Calculating the Power of Permutation
Tests: A Comparison between Nonparametric Estimators. J. Appl. Statist. Sci.
11:2: 111-122.
FORTIN, M., JACQUES, G. M., SHIPLEY, B., 2002. Computer-Intensive Methods.
Encyclopedia of Environmetrics 1: 399-402.
FU, J. C., LOU, W. Y. W., WANG, Y., 1999. On the Exact Distributions of Eulerian
and Simon Newcomb Numbers Associated with Random Permutation.
Statistisc & Probability Letters 42 (1999) 115 – 125.
GOOD, P., 2000. Permutation Tests, A practical Guide to Resampling Methods for
Testing Hypotheses. Springer-Werlag New York Inc. 270 sayfa.
HALL, P., TAJVIDI, N., 2002. Permutation Tests for Equality of Distributions in
High-Dimensional Setting. Biometrika (2002), 89, 2, pp. 359 - 374
HU, T., HU, J., 1999. Sufficient Conditions for Negative Association of Random
Variables. Statistics & Probability Letters 45 (1999) 167 - 173
KAZI-AOUAL, F., HITIER, S., SABATIER, R. ve LEBRETON, J., 1995. Refined
Approximations
to
Permutation
Tests
for
Multivariate
Inference.
Computational Statistics & Data Analysis 20 (1995) 643 - 656
LEGENDRE, P., DESDEVISES, Y., 2002. Independent Contrasts and Regression
Through the Origin. (Kişisel Görüşme, e-posta yolu ile edinilmiştir).
LEHMANN, E. L., 1997. Testing Statistical Hypotheses. Second Edition. SpringerWerlag New York Inc. 600 sayfa.
85
LUDBROOK, J., DUDLEY, H., 1998. Why Permutation Tests are Superiot to t and
F Tests in Biomedical Research. The Americal Statistician. May. Vol. 52,
No. 2, 127 – 132.
LOUGHIN, T. M., NOBLE, W., 1997.
A Permutation Test for Effects in an
Unreplicated Factorial Design. Technometrics Vol 39 No 2, 180 – 190.
MAKARENKOV, V., LEGENDRE, P., 2002. Redundancy Analysis and Canonical
Correspondence Analysis Based on Polynomial Regression. Ecology
83:1146-1161.
MANSUY, R., 2005. An Interpretation and Some Generalizations of the AndersonDarling Statistics in Terms of Squared Bessel Bridges. Statistics &
Probability Letters 72 (2005) 171 – 177.
MILLS,
D.,
1997.
Improved
Mathematical
Methods
For
http://www.cmd.port.ac.uk/immdd/doc/reports/permut.doc
Drug
Design.
(Son
Erişim
Tarihi: 04/07/2004)
NEUHÄUSER, M., 2003. A Note on the Exact Test Based on the BaumgartnerWeiB-Schindler Statistics in the Presence of Ties. Computational Statistics &
Data Analysis 42 (2003) 561 – 568.
NICHOLS, T. E., HOLMES
A. P., 2001. Nonparametric Permutation Test for
Functional Neuroimaging: A Primer with Examples. Human Brain Mapping
15:1-25.
O'GORMAN, T. W., 2001. An Adaptive Permutation Test Procedure for Several
Common Tests of Significance. Computational Statistics & Data Analysis 35
(2001) 335 – 350
O’KEEFE, L. P., MOVSHON, J. A., 1998. Processing of First – and Second – Order
Motion Signals by Neurons in Area MT of the Macaque Monkey, Visula
Neuroscience (1998), 15, 305 – 317.
OPDYKE, J. D., 2002. Fast Permutation Tests, even When One Sample is Large,
that Effiently Maximize Power Under Conventional Monte Carlo Sampling.
Proceedings, PharmaSUG (National Pharmaceutical SAS Users Group),
Statistics and Pharmacokinetics Reporting and Analysis Section,
86
PERES-NETO, P., OLDEN, J. D., 2001. Assessing the Robustness of
Randomization Tests: Examples From Behavioural Studies. Animal
Behaviour, 61: 79-86
PITMAN, E. J. G., 1937a. Significance Tests Which May be Applied to Samples
from Any Population. Royal Staistical Society Supplement. Part I, 1937; 4:
119-130.
PITMAN, E. J. G., 1937b. Significance Tests Which May be Applied to Samples
from Any Population. Royal Staistical Society Supplement. Part II, 1937; 4:
225-232.
PITMAN, E. J. G., 1937c. Significance Tests Which May be Applied to Samples
From Any Population. Part III. The Analysis of Variance Test. Biometrika,
1937; 29: 322-335.
PYCKE, J. R., 2003. Multivariate Extensions of the Anderson-Darling Process.
Statistics & Probability Letters 63 (2003) 387 – 399.
ROUTLEDGE, R. D., 1997. P-values from Permutation and F-tests. Computational
Statistics & Data Analysis 24 (1997) 379 - 386
SCHEFFÉ, H., 1959. The Analysis of Variance, John Willey & Sons, Inc. New
York. 477 sayfa.
SEATON, G., HALEY, C. S., KNOTT, S. A., KEARSEY, M. ve VISSCHER ,P. M.,
2002. QTL Express: Mapping Quantitative Trait Loci in Simple and Complex
Pedigrees. Vol. 18 no. 2 2002 pp:339-340
SERBESTER, U., GÖRGÜLÜ, M., KUTLU, H. R., YURTSEVEN, S, ARIELI, A.,
ve KOWALSKI, Z. M., 2005. The Effects of Sprinkler+Fan, Fish Meal or
Dietary Fat on Milk Yield and Milk Composition of Dairy Cows in Mid
Lactation During Summer. Journal of Animal and Feed Sciences, 14, 2005
(Basımda).
SIERRO, A., 1999. Habitat Selection by Barbastelle Bats (Barbastella barbastellus)
in the Swiss Alps (Valasis), J. Zool., Lond. (1999) 248, 429 – 432.
87
SINHA, S. P., 2000. Construction of a Randomization Test for the Linear Contrast of
Treatment Effects. Modeling, Simulation and Neural Networks [MSNN2000] Proceedings, 11-16, Mérida, Venezuela. 2000
TARDIF, S., BELLAVANCE, F., VAN EEDEN, C., 2002. A Nonparametric
Procedure for the Analysis of Balanced Crossover Design. Les Cahiers du
GEARD 38.
TANIZAKI, H., 2001. On Smal Sample Properties Permutation Tests: An
Independence Test Between Two Samples and A Significance Test For
Regression
Models.
(http://ht.econ.kobe-u.ac.jp/~tanizaki/cv/working/permute.pdf
Erişim Tarihi: 16/05/2003 saat: 21:25)
THAS, O., OTTOY, J. P., 2003. Some Generalizations of the Anderson-Darling
Statistic. Statistics & Probability Letters 64 (2003) 255 – 261.
URL1: http://cset.sp.utoledo.edu/engt6980/engt6980_gbsarry.html (Erişim Tarihi:
09/03/2005 saat: 10:05)
WALTHER, G., 1997. Absence of Correlation between the Solar Neutrino Flux and
the Sunspot Number, Physical Reviev Letters 79(23), 4522 – 4524.
88
ÖZGEÇMİŞ
23/02/1976 tarihinde Ankara’da doğdum. İlk ve orta öğretimimi Bursa’da
tamamladıktan sonra 1994 yılında Ondokuz Mayıs Üniversitesi Ziraat Fakültesi
Zootekni Bölümünü kazanarak kayıt yaptırdım. 1998 yılında aynı bölümden mezun
oldum. 1998 yılında Ondokuz Mayıs Üniversitesi Ziraat Fakültesi Zootekni
Bölümünde araştırma görevlisi olarak atandım. 1998-1999 yılları arasında Ondokuz
Mayıs Üniversitesi Yabancı Diller Eğitim Merkezinde (OYDEM) bir yıl süreyle
İngilizce eğitimi gördüm. 1999 yılında YÖK’ün 35. maddesi gereği Çukurova
Üniversitesi Ziraat Fakültesi Zootekni Bölümü Biyometri ve Genetik Bilim dalında
Yüksek Lisans ve Doktora çalışmalarımı yürütmek üzere araştırma görevlisi olarak
görevlendirildim. 12/09/2001 tarihinde “Lojistik Regresyonlarda Değişken Seçimi”
konulu Yüksek Lisans tezimi tamamlayarak Ziraat Yüksek Mühendisi unvanını
aldım. 2001 Eylül ayında Doktora eğitimime başladım. 2002 Eylül ayında Doktora
yeterlilik sınavında başarılı olarak “Permütasyon Testlerinin Doğrusal Modellerde
Uygulanması ve Karşılaştırılması” konulu tezi üstlendim. Halen aynı anabilim
dalında görevime devam etmekteyim, evliyim ve bir çocuk sahibiyim.
89
EK 1. Analizlerde Kullanılan Veriler ve Yazılımların Kullanımı
Doğrusal Regresyon Analizinde Kullanılan Veriler
Nabız Sayısı
Rektal Sıcaklık
Solunum Sayısı
45.5126
39.4899
90
49.4416
39.625
92.2166
67.525
39.5083
106.1917
44.4583
39.2333
89.6916
37.3166
38.8216
95.125
44.8333
39.0058
103.6167
56.5
38.6258
108.6167
35.5
38.4716
96.75
1. Doğrusal Regresyon Analizinde Kullanılan Yazılım (DISTLM)
DISTLM yazılımı MsDOS tabanlı bir yazılım olup çalıştırma adımları
aşağıda özetlenmiştir;
1.1) Veri Dosyaları
DISTLM yazılımı bağımlı ve bağımsız değişken kümeleri için iki ayrı “txt”
uzantılı dosyaya ihtiyaç duymaktadır. Söz konusu bu dosyaların örnek görüntüleri
aşağıda verilmiştir.
Not: DISTLM yazılımı ve ihtiyaç duyduğu dosyalar aynı klasör içerisinde olmalıdır.
90
Bağımlı değişken dosyası (bli.txt)
Bağımsız değişken dosyası (bsiz.txt)
1.2) Yazılım Komutları
1.2.1 Type the name of the input file containing your data (i.e. response
variables)
Birinci adımda bağımlı değişkenin bulunduğu dosyanın adı istenmektedir.
Giriş değeri: bli.txt
1.2.2 Type a name for output file of results (*.txt)
İkinci adımda analiz sonuçlarının yazılacağı dosyanın adı istenmektedir. Bu
dosya txt uzantılı olmalı ve klasör içinde aynı ismi ve uzantıyı taşıyan başka dosya
olmamalıdır.
Giriş değeri: sonuc.txt
1.2.3 Nature of the data in the input file
1) Raw Data (n x p)
2) Distance Matrix (n x n)
Üçüncü adımda örnekte verilen “bli.txt” dosyasında bulunan verinin yapısı
sorulmakta ve iki seçenek sunulmaktadır. İlk seçenek n x p boyutlu bağımlı değişken
91
vektörü olması, ikinci seçenek ise n x n boyutlu uzaklık matrisi olmalıdır. Teze konu
olan analizin uygulanmasında ham veri kullanıldığı için;
Giriş değeri: 1
1.2.4 Structure of the input file
1) rows are samples and columns are variables
2) columns are samples and rows are variables
Dördüncü adımda örnekte verilen “bli.txt” dosyasında bulunan veri
kümesinde değişkenlerin ve/veya örneklerin düzeni sorulmakta ve iki seçenek
sunulmaktadır; ilk seçenek satırlarda örneklerin ve sütunlarda değişkenlerin
bulunması ve ikinci seçenekte ise sütunlarda örneklerin ve satırlarda değişkenlerin
bulunmasıdır.
Teze
konu
olan
analizin
uygulanmasında
birinci
seçenek
kullanılmıştır.
Giriş değeri: 1
1.2.5 How many variables (columns) are there
Beşinci adımda “bli.txt” dosyasında kaç tane değişken olduğu sorulmaktadır.
Örnekte bir değişken olduğundan;
Giriş değeri: 1
1.2.6 How many observations (rows) are there
Altıncı adımda “bli.txt” dosyasında kaç tane gözlem olduğu sorulmaktadır.
Örnekte sekiz gözlem olduğundan;
Giriş değeri: 8
92
1.2.7 Choice of transformation:
1) none
2) square-root
3) fourth-root
4) ln(x)
5) ln(x+1)
6) log10(x)
7) log10(x+1)
8) presence/absence
Yedinci adımda dönüşüm seçenekleri sunulmakta olup istenilen dönüşüm
uygulanabilmektedir.
Teze
konu
olan
analizin
uygulanmasında
dönüşüm
uygulanmamıştır.
Giriş değeri: 1
1.2.8 Choice of standardisation:
1) none
2) standardise by row (sample) sums
3) standardise by column (variable) sums
4) double standardise by row and column sums
5) standardise each variable to z-scores (normalise)
6) standardise each variable by dividing by its range
Sekizinci adımda standardizasyon seçenekleri sunulmakta olup analizin
uygulanmasında standardizasyon kullanılmamıştır
Giriş değeri: 1
93
1.2.9 Choice of distance measure:
1) Bray-Curtis dissimilarity
2) square root of Bray-Curtis
3) Euclidean distance
4) Orloci''s Chord distance
5) Chi-square metric
6) Chi-square distance
7) Hellinger distance
8) Gower dissimilarity
9) Gower, excluding double zeros
10) Canberra distance
11) square root of Canberra distance
12) CY dissimilarity
13) Deviance based on the binomial
14) Deviance per observation (scale invariant)
15) Kulczynski dissimilarity
Dokuzuncu adımda kullanılacak olan uzaklık ölçüsü için seçenekler
sunulmakta olup analizin uygulanmasında Öklid uzaklığı kullanılmıştır.
Giriş değeri: 3
1.2.10 Do you want to output the distance matrix?
1) Yes
2) No
Onuncu
adımda
uzaklık
matrisinin
gösterilip
gösterilmeyeceği
sorgulanmaktadır. Analizler uygulanırken uzaklık matrisi istenmemiştir.
Giriş değeri: 2
94
1.2.11 Do you wish to output the mean squares for the numerator and
denominator under permutation?
1) No
2) Yes
On birinci adımda pay ve paydanın kareler ortalamalarının permütasyon
altında gösterilip gösterilmeyeceği sorgulanmaktadır. Analizin uygulanmasında bu
soruya Hayır cevabı verilmiştir.
Giriş değeri: 1
1.2.12 Is this test for an ANOVA design or a regression model?
1) Regression model
2) ANOVA design
On ikinci adımda uygulanacak testin varyans analizimi, regresyon mu olduğu
sorgulanmaktadır. Amaç regresyon analizi yapmak olduğu için;
Giriş değeri: 1
1.2.13 Type the name of the file containing the X matrix of regression
(predictor) variables (and for which rows correspond to the n
observations)
On üçüncü adımda regresyon analizinde kullanılacak olan bağımsız
değişkenleri barındıran dosyanın adı ve uzantısı istenmektedir. Örnekte bağımsız
değişkenleri barındıran dosyanın adı uzantısı ile birlikte “bsiz.txt” dir.
Giriş değeri: bsiz.txt
95
1.2.14 What is the number of columns for this X matrix?
On dördüncü adımda kaç tane bağımsız değişken olduğu sorgulanmaktadır.
Teze konu olan veri kümesinde iki adet bağımsız değişken bulunmaktadır.
Giriş değeri: 2
1.2.15 Are there covariables in the model?
1) No
2) Yes
On beşinci adımda modelde yardımcı değişkenlerin bulunup bulunmadığı
sorgulanmaktadır. Eğer modelde yardımcı değişkenler yer alacak ise bunların txt
uzantılı ayrı bir dosyada bulunması gerekmektedir. Analizlerde yardımcı değişken
bulunmadığından bu soruya Hayır cevabı verilmiştir.
Giriş değeri: 1
1.2.16 How many permutations do you want for the test?
(i.e. 99, 499, 999, 4999, etc.)
On
altıncı
adımda
kaç
adet
permütasyon
yapılması
istendiği
sorgulanmaktadır. Sekiz gözlem olduğundan toplam permütasyon sayısı n! = 40320
dir.
Eğer
1012
den
fazla
permütasyon
gerekiyorsa
gerçekleştiremediğinden 9x1012 permütasyon uygulanabilmektedir.
Giriş değeri: 40320
1.2.17 Which general method of permutation do you want?
1) Unresricted permutation of raw data or units
2) Permutation of residuals (full model)
96
yazılım
bunu
On yedinci adımda uygulanacak olan permütasyon yöntemi için seçenekler
sunulmaktadır. Ham verinin tam permütasyonu için 1 ve kalıntıların tam
permütasyonu için 2 seçenekleri kullanılmaktadır. Örnek olarak Ham verinin tam
permütasyonu uygulanır ise;
Giriş değeri: 1
1.2.18 Type an integer to be used as the seed for the random permutations
On sekizinci adımda permütasyon uygulanırken kullanılacak olan bir
çekirdek sayı istenmektedir. Farklı çekirdek sayıların ürettiği sonuçlar önemli
farklılıklar
ortaya
koymamaktadır.
Analizde
çekirdek
sayı
olarak
dokuz
kullanılmıştır.
Giriş değeri: 9
1.2.19 Do you wish to permute units other than the individual observation units
(i.e. groups of units)?
1) No
2) Yes
On dokuzuncu adımda bireysel gözlemlerin dışında kalan ünitelerin
permütasyona tabi tutulup tutulmayacağı sorgulanmaktadır. Analizde bu soruya
Hayır olarak cevap verilmiştir.
Giriş değeri: 1
Bu ifadenin yazılmasının ardından DISTLM yazılımı permütasyon işlemlerini
uygulamaya bağlayacaktır. Örnek görüntü aşağıdaki verilmiştir. İşlemlerin
tamamlanmasından sonra yazılım otomatik olarak sonlanacaktır. Sonuçlar daha önce
adı belirtilen ve örnekte “sonuc.txt” olan dosyaya yazdırılmaktadır.
97
Tesadüf Parselleri Deneme Deseni Analizinde Kullanılan Veriler
2.
Tesadüf
Parselleri
Koyun
Keçi
39.2333
38.2
39.5083
39.9
39.625
39.7
39.4899
39.7
38.4
38.4716
38.8
38.6258
38.9
39.0058
38.9
38.8216
Deneme
Deseni
Analizinde
Kullanılan
Yazılım
(NPMANOVA)
NPMANOVA yazılımı MsDOS tabanlı bir yazılım olup çalıştırma adımları
aşağıda özetlenmiştir;
2.1) Veri Dosyaları
98
NPMANOVA yazılımı değişken kümesi için “txt” uzantılı dosyaya ihtiyaç
duymaktadır. Söz konusu bu dosyanın örnek görüntüsü aşağıda verilmiştir.
Not: NPMANOVA yazılımı ve ihtiyaç duyduğu dosyalar aynı klasör içerisinde
olmalıdır.
parsel.txt
2.2) Yazılım Komutları
2.2.1 Type the name of the input file containing your data
Birinci adımda veri kümesinin bulunduğu dosyanın adı istenmektedir.
Giriş değeri: parsel.txt
2.2.2 Type a name for output file of results (*.txt)
99
İkinci adımda analiz sonuçlarının yazılacağı dosyanın adı istenmektedir. Bu
dosya txt uzantılı olmalı ve klasör içinde aynı ismi ve uzantıyı taşıyan başka dosya
olmamalıdır.
Giriş değeri: parsel_sonuc.txt
2.2.3 Nature of the data in the input file
1) Raw Data (n x p)
2) Distance Matrix (n x n)
Üçüncü adımda örnekte verilen “parsel.txt” dosyasında bulunan verinin
yapısı sorulmakta ve iki seçenek sunulmaktadır. İlk seçenek n x p boyutlu bağımlı
değişken vektörü olması, ikinci seçenek ise n x n boyutlu uzaklık matrisi olmalıdır.
Teze konu olan analizin uygulanmasında ham veri kullanıldığı için;
Giriş değeri: 1
2.2.4 Structure of the input file
1) rows are samples and columns are variables
2) columns are samples and rows are variables
Dördüncü adımda örnekte verilen “parsel.txt” dosyasında bulunan veri
kümesinde değişkenlerin ve/veya örneklerin düzeni sorulmakta ve iki seçenek
sunulmaktadır; ilk seçenek satırlarda örneklerin ve sütunlarda değişkenlerin
bulunması ve ikinci seçenekte ise sütunlarda örneklerin ve satırlarda değişkenlerin
bulunmasıdır.
Teze
konu
olan
analizin
kullanılmıştır.
Giriş değeri: 1
2.2.5 How many variables (columns) are there
100
uygulanmasında
birinci
seçenek
Beşinci
adımda
“parsel.txt”
dosyasında
kaç
tane
faktör
olduğu
sorulmaktadır. Örnekte bir faktör olduğundan;
Giriş değeri: 1
2.2.6 Choice of transformation:
1) none
2) square-root
3) fourth-root
4) ln(x)
5) ln(x+1)
6) log10(x)
7) log10(x+1)
8) presence/absence
Altıncı adımda dönüşüm seçenekleri sunulmakta olup istenilen dönüşüm
uygulanabilmektedir.
Teze
konu
olan
analizin
uygulanmasında
dönüşüm
uygulanmamıştır.
Giriş değeri: 1
2.2.7 Choice of standardisation:
1) none
2) standardise by row (sample) sums
3) standardise by column (variable) sums
4) double standardise by row and column sums
5) standardise each variable to z-scores (normalise)
6) standardise each variable by dividing by its range
Yedinci adımda standardizasyon seçenekleri sunulmakta olup analizin
uygulanmasında standardizasyon kullanılmamıştır
Giriş değeri: 1
101
2.2.8 Choice of distance measure:
1) Bray-Curtis distance
2) Euclidean distance
3) Orloci''s Chord distance
4) Chi-square metric
5) Chi-square distance
6) Hellinger distance
7) Gower metric distance
8) Canberra metric distance
9) Cao distance
Sekizinci adımda kullanılacak olan uzaklık ölçüsü için seçenekler sunulmakta
olup analizin uygulanmasında Öklid uzaklığı kullanılmıştır.
Giriş değeri: 2
2.2.9 Do you want to output the distance matrix?
1) Yes
2) No
Dokuzuncu
adımda
uzaklık
matrisinin
gösterilip
gösterilmeyeceği
sorgulanmaktadır. Analizler uygulanırken uzaklık matrisi istenmemiştir.
Giriş değeri: 2
2.2.10 ANOVA Experimental Design
1) One-way
2) Two-way nested
3) Two-way crossed (i.e. factorial or orthogonal)
Onuncu adımda ne çeşit varyans analizi uygulanacağı sorgulanmaktadır.
Analize uygun olarak One-way seçeneği seçilmiştir.
102
Giriş değeri: 1
2.2.11 What is the name of your single factor?
On birinci adımda faktörün ismi sorulmaktadır.
Giriş değeri: tur
2.2.12 How many levels does it have?
On
ikinci
adımda
belirtilen
faktörün
kaç
seviyesinin
olduğu
sorgulanmaktadır. Tür Koyun ve keçi olarak iki faktörden oluşmaktadır.
Giriş değeri: 2
2.2.13 What is the number of replicates?
On üçüncü adımda her bir faktör seviyesinin kaç tekerrürden oluştuğu
sorgulanmaktadır.
Giriş değeri: 8
2.2.15 How many permutations do you want for the test?
(i.e. 99, 499, 999, 4999, etc.)
On
beşinci
sorgulanmaktadır.
2
adımda
Sekiz
kaç
gözlem
adet
permütasyon
olduğundan
toplam
yapılması
istendiği
permütasyon
12
sayısı
(16!)/[2!(8!) ] = 6435 dir. Eğer 10 den fazla permütasyon gerekiyorsa yazılım bunu
gerçekleştiremediğinden 9x1012 permütasyon uygulanabilmektedir.
Giriş değeri: 6435
2.2.16 Type an integer to be used as the seed for the random permutations
103
On sekizinci adımda permütasyon uygulanırken kullanılacak olan bir
çekirdek sayı istenmektedir. Farklı çekirdek sayıların ürettiği sonuçlar önemli
farklılıklar
ortaya
koymamaktadır.
Analizde
çekirdek
sayı
olarak
dokuz
kullanılmıştır.
Giriş değeri: 9
Bu ifadenin yazılmasının ardından NPMANOVA yazılımı permütasyon
işlemlerini uygulamaya bağlayacaktır. Örnek görüntü aşağıdaki verilmiştir.
İşlemlerin tamamlanmasından sonra yazılım otomatik olarak sonlanacaktır. Sonuçlar
daha önce adı belirtilen ve örnekte “parsel_sonuc.txt” olan dosyaya yazdırılmaktadır.
NPMANOVA yazılımı One-way ANOVA seçeneği için sadece ham verinin tam
permütasyonunu gerçekleştirebildiği için permütasyon seçeneği sorgulanmamıştır.
3.
Tesadüf
Blokları
Deneme
Deseni
Analizinde
Kullanılan
Yazılım
(NPMANOVA)
3.1) Veri Dosyaları
NPMANOVA yazılımı değişken kümesi için “txt” uzantılı dosyaya ihtiyaç
duymaktadır. Söz konusu bu dosyanın örnek görüntüsü aşağıda verilmiştir.
Not: NPMANOVA yazılımı ve ihtiyaç duyduğu dosyalar aynı klasör içerisinde
olmalıdır.
Tesadüf parselleri analizinde kullanılan dosya tesadüf blokları analizinde de
aynı şekilde kullanılabilmektedir. Karışıklığı engellemek amacı ile dosya adı blok.txt
olarak değiştirilmiştir.
104
3.2) Yazılım Komutları
3.2.1 Type the name of the input file containing your data
Birinci adımda veri kümesinin bulunduğu dosyanın adı istenmektedir.
Giriş değeri: blok.txt
3.2.2 Type a name for output file of results (*.txt)
İkinci adımda analiz sonuçlarının yazılacağı dosyanın adı istenmektedir. Bu
dosya txt uzantılı olmalı ve klasör içinde aynı ismi ve uzantıyı taşıyan başka dosya
olmamalıdır.
Giriş değeri: blok_sonuc.txt
3.2.3 Nature of the data in the input file
1) Raw Data (n x p)
2) Distance Matrix (n x n)
Üçüncü adımda örnekte verilen “blok.txt” dosyasında bulunan verinin yapısı
sorulmakta ve iki seçenek sunulmaktadır. İlk seçenek n x p boyutlu bağımlı değişken
vektörü olması, ikinci seçenek ise n x n boyutlu uzaklık matrisi olmalıdır. Teze konu
olan analizin uygulanmasında ham veri kullanıldığı için;
Giriş değeri: 1
3.2.4 Structure of the input file
1) rows are samples and columns are variables
2) columns are samples and rows are variables
Dördüncü adımda örnekte verilen “blok.txt” dosyasında bulunan veri
kümesinde değişkenlerin ve/veya örneklerin düzeni sorulmakta ve iki seçenek
sunulmaktadır; ilk seçenek satırlarda örneklerin ve sütunlarda değişkenlerin
105
bulunması ve ikinci seçenekte ise sütunlarda örneklerin ve satırlarda değişkenlerin
bulunmasıdır.
Teze
konu
olan
analizin
uygulanmasında
birinci
seçenek
kullanılmıştır.
Giriş değeri: 1
3.2.5 How many variables (columns) are there
Beşinci adımda “blok.txt” dosyasında kaç tane sutun olduğu sorulmaktadır.
Örnekte bir sütun olduğundan;
Giriş değeri: 1
3.2.6 Choice of transformation:
1) none
2) square-root
3) fourth-root
4) ln(x)
5) ln(x+1)
6) log10(x)
7) log10(x+1)
8) presence/absence
Altıncı adımda dönüşüm seçenekleri sunulmakta olup istenilen dönüşüm
uygulanabilmektedir.
Teze
konu
olan
analizin
uygulanmasında
uygulanmamıştır.
Giriş değeri: 1
3.2.7 Choice of standardisation:
1) none
2) standardise by row (sample) sums
3) standardise by column (variable) sums
4) double standardise by row and column sums
106
dönüşüm
5) standardise each variable to z-scores (normalise)
6) standardise each variable by dividing by its range
Yedinci adımda standardizasyon seçenekleri sunulmakta olup analizin
uygulanmasında standardizasyon kullanılmamıştır
Giriş değeri: 1
3.2.8 Choice of distance measure:
1) Bray-Curtis distance
2) Euclidean distance
3) Orloci''s Chord distance
4) Chi-square metric
5) Chi-square distance
6) Hellinger distance
7) Gower metric distance
8) Canberra metric distance
9) Cao distance
Sekizinci adımda kullanılacak olan uzaklık ölçüsü için seçenekler sunulmakta
olup analizin uygulanmasında Öklid uzaklığı kullanılmıştır.
Giriş değeri: 2
3.2.9 Do you want to output the distance matrix?
1) Yes
2) No
Dokuzuncu
adımda
uzaklık
matrisinin
gösterilip
gösterilmeyeceği
sorgulanmaktadır. Analizler uygulanırken uzaklık matrisi istenmemiştir.
Giriş değeri: 2
107
3.2.10 ANOVA Experimental Design
1) One-way
2) Two-way nested
3) Two-way crossed (i.e. factorial or orthogonal)
Onuncu adımda ne çeşit varyans analizi uygulanacağı sorgulanmaktadır.
Analize uygun olarak üçüncü seçenek seçilmiştir.
Giriş değeri: 3
3.2.11 Experimental design for two-way crossed analysis
1) Fixed effects – both factor are fixed
2) Random effects - both factor are random
3) Mixed model – factor 1 is fixed, 2 is random
4) Mixed model – factor 1 is random, 2 is fixed
On birinci adımda analizde yer alan faktörlerin durumuna göre seçilmesi
gereken model sorgulanmaktadır. Teze konu olan veri kümesinde her iki faktörde
sabit olduğundan;
Giriş değeri: 1
3.2.12 What is the name of factor 1?
On ikinci adımda birinci faktörün ismi sorulmaktadır.
Giriş değeri: tur
3.2.13 Type the number of levels for factor 1
On üçüncü adımda birinci faktörün seviye sayısı sorgulanmaktadır.
Giriş değeri: 2
108
3.2.14 What is the name of factor 2?
On dördüncü adımda ikinci faktörün ismi sorulmaktadır.
Giriş değeri: zaman
3.2.15 Type the number of levels for factor 2
On beşinci adımda birinci faktörün seviye sayısı sorgulanmaktadır.
Giriş değeri: 4
3.2.16 What is the number of replicates?
On altıncı adımda faktör iki içerisinde gerçekleşen tekerrür sayısı
sorgulanmaktadır.
Giriş değeri: 2
3.2.17 How many permutations do you want for the test?
(i.e. 99, 499, 999, 4999, etc.)
On
yedinci
adımda
kaç
adet
permütasyon
yapılması
istendiği
sorgulanmaktadır. Sekiz gözlem olduğundan toplam permütasyon sayısı
Giriş değeri: 6435
3.2.18 Which general method of permutation do you want?
1) Permutation of raw data
2) Permutation of residuals (redusec model)
3) Permutation of residuals (full model)
On
sekizinci
adımda
hangi
permütasyon
yönteminin
uygulanacağı
sorgulanmaktadır. Örnek için ham verinin tam permütasyonu yapılacaktır.
Giriş değeri: 1
109
3.2.19 Type an integer to be used as the seed for the random permutations
On dokuzuncu adımda permütasyon uygulanırken kullanılacak olan bir
çekirdek sayı istenmektedir. Farklı çekirdek sayıların ürettiği sonuçlar önemli
farklılıklar
ortaya
koymamaktadır.
Analizde
çekirdek
sayı
olarak
dokuz
kullanılmıştır.
Giriş değeri: 9
Bu ifadenin yazılmasının ardından NPMANOVA yazılımı permütasyon
işlemlerini uygulamaya bağlayacaktır. Örnek görüntü aşağıdaki verilmiştir.
İşlemlerin tamamlanmasından sonra yazılım otomatik olarak sonlanacaktır. Sonuçlar
daha önce adı belirtilen ve örnekte “parsel_sonuc.txt” olan dosyaya yazdırılmaktadır.
Latin Kare Deneme Deseni Analizinde Kullanılan Veriler
1
2
3
4
5
A
B
C
D
E
1
10.57
10.46
11.20
12.24
10.97
B
C
D
E
A
2
8.91
9.36
10.38
10.94
10.97
C
D
E
A
B
3
10.68
11.90
10.79
10.54
10.23
D
E
A
B
C
4
11.62
10.48
11.48
10.71
10.72
E
A
B
C
D
5
10.20
11.20
11.10
11.62
11.54
4. Latin Kare Deneme Deseni Analizinde Kullanılan Yazılım (DISTLM)
DISTLM yazılımı MsDOS tabanlı bir yazılım olup çalıştırma adımları
aşağıda özetlenmiştir;
4.1) Veri Dosyaları
DISTLM yazılımı değişken kümesi için “txt” uzantılı dosyaya ihtiyaç
duymaktadır. Söz konusu bu dosyanın örnek görüntüsü aşağıda verilmiştir.
Not: DISTLM yazılımı ve ihtiyaç duyduğu dosyalar aynı klasör içerisinde olmalıdır.
110
Latin kare deneme deseninin analizi için beş farklı txt uzantılı dosyaya ihtiyaç
duyulmaktadır. Bunlar;
1) Veri dosyası
2) Sıra için düzenlenmiş X matrisinin bulunduğu dosya
3) Sütun için düzenlenmiş X matrisinin bulunduğu dosya
4) Muamele için düzenlenmiş X matrisinin bulunduğu dosya
5) Sıra ve sütun için düzenlenmiş X matrisinin bulunduğu dosya
lkareveri.txt
sira.txt
sutun.txt
111
muamele.txt
sira-sutun.txt
4.2) Yazılım Komutları
4.2.1 Type the name of the input file containing your data
Birinci adımda veri kümesinin bulunduğu dosyanın adı istenmektedir.
Giriş değeri: lkareveri.txt
4.2.2 Type a name for output file of results (*.txt)
İkinci adımda analiz sonuçlarının yazılacağı dosyanın adı istenmektedir. Bu
dosya txt uzantılı olmalı ve klasör içinde aynı ismi ve uzantıyı taşıyan başka dosya
olmamalıdır.
112
Giriş değeri: lkare_sonuc_sira.txt
4.2.3 ve 4.2.11 arasındaki adımlar 2.2.3 ve 2.2.11 arasındaki adımların
aynısıdır.
4.2.12 Is this test for an ANOVA design or a regression model?
1) Regression model
2) ANOVA design
On ikinci adımda uygulanacak testin varyans analizimi, regresyon mu olduğu
sorgulanmaktadır. Amaç Varyans analizi yapmak olduğu için;
Giriş değeri: 2
4.2.13 Do you wish to obtain a P-value using a Monte Carlo sample from the
theoretical asymptotic distribution under permutation? (Note: useful if
there are very few possible permutation)
1) Yes
2) No
On üçüncü adımda Monte Carlo örneklemesi ile olasılık değerinin hesaplanıp
hesaplanmayacağı sorgulanmaktadır. Çok küçük örnek büyüklerinde yararlı olabilir.
Giriş değeri: 1
4.2.14 Type the name of the file containing the X design matrix which has the
codes for the TERMS OF THE INTEREST for the TEST
On dördüncü adımda analizde esas ilgilenilen faktöre ait dizayn matrisinin
barındıran dosyanın adı ve uzantısı istenmektedir.
Giriş değeri: sira.txt
113
4.2.15 What is the number of columns for this X matrix?
On beşinci adımda X matrisinin kaç sütundan oluştuğu sorgulanmaktadır.
Giriş değeri: 5
4.2.16 Is the denominator mean square (MS) for the test provided by;
1) The residual MS, with no other terms in the model
2) The residual MS, but there are other terms in the model
3) The MS of another term in the model
On altıncı adımda bölen kareler ortalamasının ne olduğu sorgulanmaktadır.
Latin kare deneme deseninde bölen hata kareler ortalamasıdır ve modelde başka
terimlerde bulunmaktadır, bu durumda;
Giriş değeri: 2
4.2.17 Type the name of the file containing the X design matrix for the full
model
On yedinci adımda Latin kare deneme deseni için Ko-değişken olarak sütun
bulunmaktadır
Giriş değeri: sutun.txt
4.2.18 What is the number of columns for this X matrix?
On sekizinci adımda X matrisinin kaç sütundan oluştuğu sorgulanmaktadır.
Giriş değeri: 5
4.2.19 How many permutations do you want for the test?
(i.e. 99, 499, 999, 4999, etc.)
114
On
dokuzuncu
adımda
kaç
adet
permütasyon
yapılması
istendiği
sorgulanmaktadır.
Giriş değeri: 9999
4.2.20 Which general method of permutation do you want?
1) Unresricted permutation of raw data or units
2) Permutation of residuals (reduced model)
3) Permutation of residuals (full model)
Yirminci adımda uygulanacak olan permütasyon yöntemi için seçenekler
sunulmaktadır. Ham verinin tam permütasyonu için 1, kalıntıların kısmi
permütasyonu için 2 ve kalıntıların tam permütasyonu için 3 seçenekleri
kullanılmaktadır. Örnek olarak Ham verinin tam permütasyonu uygulanır ise;
Giriş değeri: 1
4.2.21 Type an integer to be used as the seed for the random permutations
Yirmi birinci adımda permütasyon uygulanırken kullanılacak olan bir
çekirdek sayı istenmektedir. Dikkat edilmelidir ki farklı çekirdek sayılar farklı
sonuçlar ortaya koyabilmektedir. Analizde çekirdek sayı olarak dokuz kullanılmıştır.
Giriş değeri: 1
4.2.22 Do you wish to permute units other than the individual observation units
(i.e. groups of units)?
1) No
2) Yes
Yirmi ikinci adımda bireysel gözlemlerin dışında kalan ünitelerin
permütasyona tabi tutulup tutulmayacağı sorgulanmaktadır. Analizde bu soruya
Hayır olarak cevap verilmiştir.
115
Giriş değeri: 1
Bu ifadenin yazılmasının ardından DISTLM yazılımı permütasyon işlemlerini
uygulamaya bağlayacaktır. İşlemlerin tamamlanmasından sonra yazılım otomatik
olarak
sonlanacaktır.
Sonuçlar
daha
önce
adı
belirtilen
ve
örnekte
“lkare_sonuc_sira.txt” olan dosyaya yazdırılmaktadır.
Aynı işlemler sütun ve muamele için sadece aşağıda verilen değişiklikler
yordamı ile gerçekleştirilmektedir.
Adım
4.2.2
4.2.14
4.2.17
Sütun
lkare_sonuc_sutun.txt
Sira.txt
Sutun.txt
Muamele
lkare_sonuc_muamele.txt
Muamele.txt
Sira-sutun.txt
116
EK 2. Tahminlerin Varyanslarının Ortalama Değeri
Eğer E (eijk ) = 0 ise karşılaştırmanın (3.66) tahmini yansızdır. Dahası eğer
E(KO) ları için
{ eijk } (3.66) ve (3.62) den bağımsız ise ve eğer
σ e2 = m −3 ∑i ∑ j ∑k Var (eijk ) belirli ise bu şartlar
tahmin edilen farkların
m(m − 1) / 2 varyans ortalamaları hakkındaki aşağıdaki (3.68) sonucu için de
2
yeterlidir. Eğer eijk nın dağılımı k veya σ ABC
= 0 a bağlı değilse
(3.66)
karşılaştırmasındaki tahminin varyansı için belirtilen (3.67) sonucu vardır (Scheffe’,
1959).
117
EK-3. { θ 1 , L ,θ K } Parametrelerindeki Karşılaştırmaların Tahminlerinin
Varyanslarına Ait Varsayımlar
Bu
ekte
karşılaştırmaların
anlatılan
iki
tahminlerinin
varsayım
varyanslarını
{ θ 1 , L ,θ K }
içermektedir.
parametrelerindeki
∑k c k = 0
iken
ψ = ∑k ckθ k olduğu söylenebilir. { θˆk } nın yansız tahminine sahip olduğu varsayımı
altında,
θˆk = θ k + f k
bu durumda E ( f k ) = 0 dır. Bu durumda ψˆ = ∑k ckθˆk , ψ nın yansız bir tahminidir.
Q = ∑ (θˆk − θˆ. ) 2 /( K − 1)
(1)
k
1 numaralı denklemin tanımlanmasıyla;
V = E (Q ) − σ θ2
elde edilebilir. Burada
σ θ2 = ∑ (θ k − θ . ) /( K − 1)
2
k
dir.
118
Varsayım 1
Eğer { θˆk } eşit varyansa ve korelasyon katsayısına sahipse,
Var (ψˆ ) = V ∑ c k2 dir.
k
İspat
E ( f k f k ′ ) = ρ kk ′σ k σ k ′ genel durumunda V için denklem parçalanabilir ve
özelleştirilebilir. Eğer (1) numaralı denklemde aşağıdaki dönüşüm yapılırsa;
θˆk − θˆ. = (θ k − θ . ) + ( f k − f . )
ve beklenen değerler alınırsa,
⎛
⎞
E (Q) = σ θ2 + ( K − 1) −1 E ⎜⎜ ∑ f k2 − Kf . 2 ⎟⎟
⎝ k
⎠
elde edilebilir. Bu durumda;
⎛
⎞
E ⎜⎜ ∑ f k2 ⎟⎟ = ∑ σ k2 dir
⎝ k
⎠ k
ve
⎛
⎞
E ( Kf . 2 ) = K −1 E ⎜⎜ ∑ f k ∑ f k ′ ⎟⎟ = K −1 ∑∑ ρ kk ′σ k σ k ′
k′
k k′
⎝ k
⎠
olur, ve böylece;
119
⎛
⎞
V = ( K − 1) −1 ⎜⎜ ∑ σ k2 − K −1 ∑∑ ρ kk ′σ k σ k ′ ⎟⎟
k k′
⎝ k
⎠
(2)
olur.
k ≠ k ′ ve tüm σ k2 = σ 12
için tüm ρ kk ′ = ρ olması özel durumunda (2)
numaralı denklemdeki çift toplamda k = k ′ için K terimi σ 12 değerine sahiptir ve
kalan K 2 − K terimleri ρσ 12 değerine sahiptir. Böylece;
V = ( K − 1) −1{Kσ 12 − K −1[ Kσ 12 + K ( K − 1) ρσ 12 ]} = σ 12 (1 − ρ )
diğer taraftan,
Var (ψˆ ) = ∑∑ ck ck ′ ρ kk ′σ k σ k ′
k
k′
denkleminde ρ kk ′σ k σ k ′ = σ 12 [ ρ + δ kk ′ (1 − ρ )] dönüşümü yapılırsa,
Var (ψˆ ) = σ 12 [ ρ ∑∑ c k c k ′ + (1 − ρ )∑∑ c k c k ′δ kk ′ ]
k
= σ 12 (1 −
k′
ρ )∑
k
k
c k2
=V∑
k′
c k2
k
olur.
Varsayım 2
(1 / 2) K ( K − 1) adet { θˆk − θˆk ′ } farklarının varyansının ortalama değeri 2V dir.
120
İspat
Ortalama varyansı hesaplamak amacıyla k ≠ k ′ için tüm k , k ′ üzerinden
Var (θˆk − θˆk ′ ) nın toplamı [ K ( K − 1)]−1 kez alınabilir, burada her terim iki kez
meydana gelmektedir, fakat bu toplam k ve k ′ üzerinden alınsa da aynıdır. Çünkü
bu terim k = k ′ için sıfırdır. Ortalama varyans böylece [ K ( K − 1)]−1 kez elde
edildiğinde
∑∑Var (θˆk − θˆk ′ ) = ∑∑ (σ k2 + σ k2′ − 2 ρ kk ′σ k σ k′ )
k
k′
k
k′
= 2 K ∑ σ k2 − 2∑∑ ρ kk ′σ k σ k ′ = 2 K ( K − 1)V
k
k
k′
olur. Son adım (2) numaralı denklemi izlemektedir. Böylece ortalama varyans 2V
olur (Scheffe’, 1959).
121
Download

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ