10/2/2014
PAÜ
ENDÜSTRİ MÜHENDİSLİĞİ
IENG 461 – Deneysel Tasarım
TEMEL İSTATİSTİKSEL YÖNTEMLER
2014-2015 Güz Yarıyılı
Yrd. Doç. Dr. Leyla Demir
10/2/2014



IENG 461-Dr. Leyla Demir
2
Tanımlar
İki farklı çimento harcı formülasyonunun harcın sertleşme zamanı ve harcın
yapışma gücü üzerindeki etkisi
10/2/2014
IENG 461-Dr. Leyla Demir
3
Run: Çimento deneyindeki her bir gözlem
birer run’dır.
Her bir gözlem birbirinden farklıdır yani
verilerde bir değişkenlik söz konusudur. Bu
değişkenlik gürültü (noise)/deneysel hata
(experimental error)/error(hata) olarak
isimlendirilir.
Bu bir istatistiksel hatadır ve genellikle kontrol
edilemeyen ve sakınılamayan değişkenlikten
kaynaklanır.
10/2/2014
IENG 461-Dr. Leyla Demir
4
1
10/2/2014
Tanımlar




Verilerin grafiksel görünümü
Nokta diyagramı
Hatanın veya gürültünün varlığı ilgilenilen çıktı
değişkeninin rassal değişken (r.d.) (random variable)
olduğunu işaret eder.
Bir rassal değişken kesikli (discrete) ya da sürekli
(continuous) olabilir.
Eğer bir değişkenin alabileceği tüm değerler sonlu ya da
sayılabilir sonsuz ise bu değişken kesikli r.d.’dir.
Eğer bir değişkenin alabileceği olası tüm değerler bir
aralık oluşturuyorsa yani zaman içinde bir süreklilik
oluşturuyorsa bu değişken sürekli r.d.’dir.
10/2/2014
IENG 461-Dr. Leyla Demir
Burada iki formülasyonun birbirinden gerçekten farklı olduğunu
söylemek güçtür. Aradaki farkın istatistiksel olarak anlamlı olup
olmadığını anlamak için HİPOTEZ TESTlerinden yararlanırız.
5
10/2/2014
IENG 461-Dr. Leyla Demir
6
Kutu Diyagramları
Eğer örnekleminiz geniş ise verilerin dağılımı
için histogram yararlı bir araçtır.
75-100 gözlemden az verinin olduğu durumlarda histogram önerilmez!
10/2/2014
IENG 461-Dr. Leyla Demir
7
10/2/2014
IENG 461-Dr. Leyla Demir
8
2
10/2/2014
Kesikli ve sürekli r.d’lere ait olasılık dağılımları
Kesikli ve sürekli r.d’lere ait olasılık dağılımları


Bir r.d’nin olasılık yapısı onun olasılık dağılımı ile açıklanır.
10/2/2014
IENG 461-Dr. Leyla Demir
9
Örneklem ve örneklem dağılımları




Rassal örneklem (random sample): Her bir olası
örneklemin eşit seçilme olasılığına sahip olacak şekilde
bir popülasyondan seçilen örneklerdir.
Bir popülasyondan rassal örneklem elde etmek için
rassal sayılardan faydalanılabilir.
Rassal örneklemden elde edilen gözlemler popülasyon
hakkında istatistiksel çıkarımlar yapmak için kullanılırlar.
10/2/2014
IENG 461-Dr. Leyla Demir
10/2/2014
IENG 461-Dr. Leyla Demir
10
İstatistik (Statistic)
Genellikle bir popülasyon hakkında objektif sonuçlara
ulaşabilmek için popülasyondan rasgele bir örneklem alıp
incelenir.

Eğer y kesikli bir r.d. ise y’nin olasılık dağılımı
p(y) y’nin olasılık kütle fonksiyonu
(probability mass function) olarak
isimlendirilir.
Eğer y sürekli bir r.d. ise y’nin olasılık
dağılımı f(y) y’nin olasılık yoğunluk
fonksiyonu (probability density function)
olarak isimlendirilir.

11
Hiçbir bilenmeyen içermeyen bir örneklemden
alınan gözlemlerin bir fonksiyonudur.
Örneğin bir örnekleme ait ortalama ya da
standart sapma değerlerinin her biri bir
istatistiktir.
Bu istatistikler ise popülasyon ortalaması ve
popülasyonun standart sapması için birer
nokta tahminleyicisidirler.
10/2/2014
IENG 461-Dr. Leyla Demir
12
3
10/2/2014
Tahminleyici (Estimator)
İyi bir nokta tahminleyicisinin özellikleri



Bilinmeyen bir parametrenin tahminleyicisi o
parametreye karşılık gelen bir istatistiktir.
Nokta tahminleyicisi (point estimator) rassal
bir değişkendir.

Tarafsız (unbiased) olmalıdır. Yani uzun dönemde
alacağı ortalama değer ya da beklenen değeri
parametrenin tahmin edilen değerine eşit olmalıdır.
Tarafsız bir nokta tahminleyicisi minimum varyansa
sahip olmalıdır. Yani aynı parametrenin farklı
tahminleyicileri arasında en az varyansa sahip olanıdır.
Örneklem ortalaması ve örneklem varyansı popülasyon
ortalaması ve popülasyon varyansı için tarafsız
tahminleyicilerdir.
10/2/2014
IENG 461-Dr. Leyla Demir
13
10/2/2014
Serbestlik derecesi (Degrees of freedom)

Bir istatistiğin kesin olarak hesaplanmasında
kullanılan değerlerin sayısının ne kadar
değişme serbestliği olduğunu ifade eder.
IENG 461-Dr. Leyla Demir

15
14
Merkezi Limit Teoremi
(The Central Limit Theorem)

10/2/2014
IENG 461-Dr. Leyla Demir
Birbirinden bağımsız ve eş dağılmış n tane rassal
değişkenin toplamı olan X rassal değişkeni, n
sonsuza yakınsadığında standart normal dağılıma
yakınsar.
Bu teorem bize şunu söyler: Birbirinden bağımsız
ve eş dağılan rassal değişkenlerin toplamı
yaklaşık olarak normal dağılmaktadır.
10/2/2014
IENG 461-Dr. Leyla Demir
16
4
10/2/2014
Merkezi Limit Teoremi
(The Central Limit Theorem)


Hipotez Testi
Deneysel tasarımda bir deneydeki hataların
birbirinden farklı ve bağımsız kaynaklardan
üretildiği ve bunların toplamının deney hatasını
oluşturduğu düşünüldüğünde deney hatalarının
normal dağıldığı varsayımı yapılabilir.
Bu da deneysel tasarımın temel varsayımlarından
biridir.
10/2/2014
17
IENG 461-Dr. Leyla Demir
 İstatistiksel hipotez testi birçok deneyin
analizinde kullanılan faydalı bir yöntemdir.
 Yöntemin çıkışı 1900’lerin başlarında olmuştur.
 Hipotez testlerinde tamamen rassal bir deney
tasarımı kullanıldığı varsayımı yapılmaktadır.
Yani veriler normal dağılımdan elde edilmiş bir
rassal örneklemden toplanmıştır.
10/2/2014
18
Hipotez Testi
Hipotez Testi



Normal dağılımdan örnekleme
İstatistiksel hipotezler:
IENG 461-Dr. Leyla Demir
H 0 : 1  2
H1 : 1  2

Bir hipotezi test etmek için popülasyondan
rassal bir örneklem alınır,
Uygun test istatistiği hesaplanır,
Hesaplanan test istatistiğinin değerine göre
hipotez reddedilir ya da reddedilemez.
Hipotezin reddedileceği bölge kritik alan
(critical region) olarak isimlendirilir.
10/2/2014
IENG 461-Dr. Leyla Demir
20
5
10/2/2014
Özet İstatistikler
Parametre Tahmini
Modifiye edilmiş harç
formülasyonu
“Yeni reçete”
1 n
y   yi estimates the population mean 
n i 1
S2 
1 n
 ( yi  y )2 estimates the variance  2
n  1 i 1
Modife edilmemiş harç
formülasyonu
“Orijinal reçete”
y1  16.76
y2  17.04
S12  0.100
S 22  0.061
S1  0.316
S 2  0.248
n1  10
10/2/2014
IENG 461-Dr. Leyla Demir
21
İki-örneklem Z-testi
n2  10
10/2/2014
IENG 461-Dr. Leyla Demir
22
Eğer iki örneklemin de varyansı biliniyorsa H0 hipotezini test etmek izin
Z-testini nasıl kullanırız?
İki örneklem varyansının da birbirine eşit σ1 = σ2 = 0.30 olduğunu
varsayalım. Bu durumda Z-istatistiği şu şekilde hesaplanır:
Use the sample means to draw inferences about the population means
y1  y2  16.76  17.04  0.28
Difference in sample means
Standard deviation of the difference in sample means
 y2 
2
n
, and  y21  y2 =
 12
n1

 22
n2
Z0 
n1
n1

 22
n2

0.28
0.32 0.32

10
10

0.28
 2.09
0.1342
Eğer iki populasyonun ortalaması birbirine eşitse bulunan Z değerinin standart
normal eğride %95 olasılıkla Z0.025 = 1.96 ve - Z0.025 = -1.96 değerlerinin
arasında yer alması gerekirdi. Bulunan Z0 değeri bu iki değer arasında yer
almadığından iki populasyonun ortalamasının eşit olduğu söylenemez.
y1  y2
 12

, y1 and y2 independent
This suggests a statistic:
Z0 
y1  y2
 12
 22
n2
If the variances were known we could use the normal distribution as the basis of a test
Z0 has a N(0,1) distribution if the two population means are equal
10/2/2014
IENG 461-Dr. Leyla Demir
23
10/2/2014
IENG 461-Dr. Leyla Demir
24
6
10/2/2014
Standard Normal Dağılım Tablosu (bknz appendix)
Eğer varyanslar biliniyorsa H0 hipotezi % 5 anlamlılık
seviyesinde reddedilmelidir. Bu durumda alternatif
hipotezin doğru olduğu sonucuna varılır.
H 0 : 1  2
H1 : 1  2
Z0.025 = 1.96
Bu test sabit anlamlılık seviyesinde test olarak adlandırılır çünkü
test istatistiğinin değerini deneyleri yapmadan önce belirlediğimiz
bir kritik değer (1.96) ile karşılaştırıyoruz.
Bu test için referans dağılım standart normal dağılımdır.
Diğer bir yöntem ise P-değeri yaklaşımıdır. P-değeri H0
hipotezinin reddedileceği en düşük anlamlılık seviyesidir.
Z-testi için P-değerini bulmak kolaydır.
10/2/2014
25
IENG 461-Dr. Leyla Demir
10/2/2014
Normal Dağılım Tablosu
IENG 461-Dr. Leyla Demir
26
t -testi
Normal dağılım tablosundan
Z0 = -2.09 değeri bulunur.
Bu değer: 1 – 0.98169 =
0.01832
P-değeri bu olasılığın 2 katıdır,
yani 0.03662’dir.
Bu durumda H0 hipotezi
anlamlılık seviyesi 0.03662
veya daha üstünde olan
herhangi bir anlamlılık seviyesi
için reddedilecektir. Genellikle
sınır anlamlılık seviyesi olarak
0.05 değeri kullanılmaktadır.
10/2/2014
IENG 461-Dr. Leyla Demir
27
 Eğer iki populasyonun varyansı biliniyorsa ortalamaları
karşılaştırmak için Z-testi en uygun yöntemdir.
 Fakat gerçekte populasyon varyanslarının ne olduğu
genellikle bilinmez.
 Sadece örneklem varyanslarının bilindiği durumda ne
yapılmalıdır?
 Eğer örneklem büyüklüğü yeterince genişse (n > 30 veya 40)
Z-testini kullanmak doğru olacaktır.
 Fakat uygun büyüklükte örneklemler her zaman mümkün
olmayabilir. Bu durumda standart normal dağılım testi
kullanılamaz.
10/2/2014
IENG 461-Dr. Leyla Demir
28
7
10/2/2014
İki örneklem t-testi
İki örneklem t-testi
The test statistic is
Use S12 and S 22 to estimate  12 and  22
The previous ratio becomes
y1  y2
2
1
t0 
2
2
S
S

n1 n2
However, we have the case where  12   22   2
Pool the individual sample variances:
S p2 
Ortak
varyans
10/2/2014
(n1  1) S12  (n2  1) S 22
n1  n2  2
IENG 461-Dr. Leyla Demir
0’a yakın t0 değerleri H0 hipotezi ile tutarlıdır.
0’dan çok farklı t0 değerleri alternatif hipotez ile tutarlıdır.
t0 ortalamaların birbirinden uzaklığının standart sapmalarla
ifade edilen ölçüsüdür.
t0 bir sinyal-gürültü oranı olarak yorumlanabilir.
29
İki-örneklem t-testi
İki-örneklem t-testi
S p2 
Hesapladığımız t0 test
istatistiğinin gerçekten ne
kadar büyük olduğuna karar
vermemiz için referans
dağılıma ihtiyaç duyarız.
Bu referans dağılım t
dağılımıdır.
(n1  1) S12  (n2  1) S 22 9(0.100)  9(0.061)

 0.081
n1  n2  2
10  10  2
S p  0.284
t0 
y1  y2
1 1
Sp

n1 n2
y1  y2
16.76  17.04

 2.20
1 1
1 1
Sp

0.284

n1 n2
10 10
t0 = -2.20
The two sample means are a little over two standard deviations apart
Is this a "large" difference?
10/2/2014
IENG 461-Dr. Leyla Demir
31
10/2/2014
IENG 461-Dr. Leyla Demir
32
8
10/2/2014
t-testi için P-değeri
İki-Örneklem t-Testi
–2.101 ile 2.101
arasındaki t0 değeri
ortalamaların eşit olduğu
hipotezi ile tutarlıdır.
t0 değerinin [2.101, –
2.101] aralığının dışında
olması ortalamaların
birbirinden farklı
olduğuna işaret eder.
Z-testinde olduğu gibi
burada da P-değeri
yaklaşımı kullanılabilir.
10/2/2014
■ t-tabloları bir t’nin pozitif değerlerinden büyük olasılıkları
verir yalnızca. Dolayısıyla test yapılırken negatif değerlerin
mutlak değerleri dikkate alınır.
■ |t0|= 2.20.
■ 18 serbestlik derecesi için tablodan 2.20’yi kapsayacak alfa
değerine bakılır.
■ 2.101 < |t0|= 2.20 < 2.552.
■ t = 2.101 için bu değer 0.025, t = 2.552 için 0.01’dir.
■ İki-yönlü test yapıldığı için bu değerlerin 2 katı alınır. Bu
yüzden P-değeri aşağıdaki iki olasılık değeri arasındadır:
0.05 < P-değeri < 0.02
■ Bu değerler P-değeri için alt ve üst sınırlardır.
■ Bu örnek için hesaplanmış gerçek P-değeri 0.042’dir.
t0 = -2.20
IENG 461-Dr. Leyla Demir
33
10/2/2014
IENG 461-Dr. Leyla Demir
34
Güven Aralığı
Varsayımları Doğrulama: Normal
Olasılık Eğrisi
Hipotez testi bize ortalamaların birbirinden farklı
olup olmadığına dair objektif bir sonuç çıkarma şansı
verir.
Fakat ortalamalar birbirinden ne kadar farklıdır?
Bununla ilgili bir şey söylemez.
Bir güven aralığının genel formu:
L    U where P( L    U )  1  
İki ortalama arasındaki fark için 100(1- α)%
düzeyinde güven aralığı:
y1  y2  t / 2,n1  n2 2 S p (1/ n1 )  (1/ n2 )  1  2 
y1  y2  t / 2,n1  n2 2 S p (1/ n1 )  (1/ n2 )
10/2/2014
IENG 461-Dr. Leyla Demir
35
10/2/2014
IENG 461-Dr. Leyla Demir
36
9
10/2/2014
Güven Aralığı
Popülasyon varyansları
birbirinden farklı ise:
Aminoasit ihtiva eden
bir proteinin ışınım yolu
ile sinir ve kas dokuları
üzerinde tutunmasını
inceleyen bir deney.
10/2/2014
IENG 461-Dr. Leyla Demir
37
10/2/2014
IENG 461-Dr. Leyla Demir
38
10/2/2014
IENG 461-Dr. Leyla Demir
39
10/2/2014
IENG 461-Dr. Leyla Demir
40
10
10/2/2014
10/2/2014
IENG 461-Dr. Leyla Demir
41
10/2/2014
IENG 461-Dr. Leyla Demir
42
Ödev

10/2/2014
IENG 461-Dr. Leyla Demir
43
Bir elektronik hesap makinesi üreticisi üretimde
kullanmak üzere 2 farklı plastik çeşidi belirlemiştir. Bu
plastiklerin kopma mukavemeti üretici açısından kritiktir.
Her iki plastiğin kopma mukavemetine ait standart
sapma değerleri birbirine eşit ve 1.0 psi’dir. Birinci
plastikten 10 birim ikinci plastiktense 12 birim
büyüklüğünde örneklemler alınarak ortalama kopma
mukavemetleri sırasıyla 162.5 psi ve 155.0 psi olarak
bulunmuştur. Üretici birinci plastiğin mukavemet değeri
ikinci plastiğin mukavemet değerini en az 10 psi
geçmedikçe birinci plastiği kabul etmeyecektir. Bu
verilere göre üretici birinci plastiği kullanmalı mıdır? %99
güven seviyesinde test edip yorumlayınız.
10/2/2014
IENG 461-Dr. Leyla Demir
44
11
Download

Sunu 2 - LEYLA DEMIR