KORELASYON VE REGRESYON UYGULAMASI
• Örnek: En az 1 canlı doğum yapmış kadınlara
ilişkin veri matrisi ile S ,R ilişkisini bulmak
• X1:Kadının hemoglobin düzeyi
• X2:Canlı doğum sayısı
• X3:Kadının yaşı
• X4:Çocuk bakım bilgi Puanı
SPSS’te veri girişi
Aşırı değerler olduğunda neler oluyor?
16. Anne’nin verilerini girelim:
X1:15 ;
X2: 7;
X3:75;
X4:43 olacak şekilde yeni bir gözlem eklendiğinde
n=16 için korelasyon matrisini bulalım.
Tanımlayıcı İstatistikler (Descriptive)
Statistics
Hemoglobin düzeyi
N
Valid
15
Mean
Std. Deviation
11,4000
1,35225
Hemoglobin düzeyi
9,00
FrekansPercent Cump
1
6,7
6,7
10,00
3
20,0
26,7
10,50
1
6,7
33,3
11,00
2
13,3
46,7
11,50
1
6,7
53,3
12,00
3
20,0
73,3
12,50
2
13,3
86,7
13,00
1
6,7
93,3
14,00
Toplam
1
15
6,7
100
Hemoglobin değerlerinin Histogram Grafiği
Frekanslarla canlı doğum sayısı
Canli dogum sayisi
1,00
Frekans Yüzde Küm yüzde
3
20,0
20,0
2,00
3
20,0
40,0
3,00
2
13,3
53,3
4,00
3
20,0
73,3
5,00
2
13,3
86,7
6,00
2
13,3
100,0
Total
15
100,0
Normallik Kontrolü-Kolmogorov-Smirnov
Tests of Normality
Tests of Normality
Kolmogorov-Smirnova
Statistic
Hemoglobin düzeyi
,138
df
Shapiro-Wilk
Sig.
15
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
,200*
Statistic
,974
df
Sig.
15
,917
Hemoglobin’in Kutu Grafiği
Verilere yeni bir hasta ekleyelim
Ekleyeceğimiz Uç değer
Normallik testinin yeni değerleri
Tests of Normality
Kolmogorov-Smirnova
Statistic
Hemoglobin düzeyi
,103
df
Shapiro-Wilk
Sig.
16
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
,200*
Statistic
,970
df
Sig.
16
,832
Değişkenler arasında korelasyon hesaplayalım
Kadının Yaş ve Çoc. Bak. Bilgisi değişkenlerinin
Dağılım grafiği
r(yaş, hemoglobin du)=0.334 P=0.20 ilişki önemli değildir.
Yaş ve hemoglobin düzeyine ilişkin REGRESYON
r(yaş, hemoglobin du)=0.334 P=0.20
ilişki önemli değildir.
Korelasyon
r=0.334
R2 Belirtme
katsayısı
Model Summaryb
Model R
R Square Adjusted R Square Std. Error of the
Estimate
1
,334a
,112
,048
1,54775
a. Predictors: (Constant), Kadin'in Yasi
b. Dependent Variable: Hemoglobin düzeyi
ANOVAb
Model Sum of Squares
df
Mean Square
1
Regression
4,213
1
4,213
Residual
33,537
14
2,396
Total
37,750
15
a. Predictors: (Constant), Kadin'in Yasi
b. Dependent Variable: Hemoglobin düzeyi
F
1,759
Hemoglobin bağımlı değişken alındığında; Model önemli bulunmadı.
Sig.
,206a
Çanlı doğum sayısı ile
Kadının Yaşına ilişkin REGRESYON
Korelasyon
R2 Belirtme
r=0.53
katsayısı
R Square Adjusted R Square Std. Error of the
Model Summaryb
Model R
Estimate
1
,530ª
,280
,229
a. Predictors: (Constant), Kadin'in Yasi
b. Dependent Variable: Canli dogum sayisi
ANOVAb
1,69652
R=r=(Canlıdoğum, Kadının Yaşı)=0.53 P=0.035 ilişki önemli bulundu.
Model
1
Sum of Squares
df
Mean Square
Regression
15,706 1
15,706
Residual
40,294 14
2,878
Total
56,000 15
a. Predictors: (Constant), Kadin'in Yasi
b. Dependent Variable: Canli dogum sayisi
Y=a+b0+e
F
5,457
Sig.
,035a
Y(Canlı doğum sayısı)=0.936+0.078*Yaş+e
Çanlı doğum sayısı X kadının Yaşına
ilişkin REGRESYON
Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients
B
Std. Error Beta
1
(Constant)
,936
1,177
Kadin'in Yasi
,078
,033
,530
a. Dependent Variable: Canli dogum sayisi
Y=a+b0+e
t
Sig.
,795
2,336
,440
,035
Y(Canlı doğum sayısı)=0.936+0.078*Yaş+e
Canlı doğum sayısı(bağımlı) ,Kad. Yaşı nın dağılımı
R=r=(Canlıdoğum, Kadının Yaşı)=0.53 P=0.035 ilişki önemli bulundu.
Download

KORELASYON VE REGRESYON UYGULAMASI • Örnek: En az 1