ÖLÇME ARAÇLARINDA BULUNMASI
İSTENEN NİTELİKLER
Ölçme, bir niteliğin gözlenip gözlem sonuçlarının sayı
ya da sembollerle gösterilmesidir.
Ölçme yapabilmek için ölçülen niteliğe uygun ölçme
aracına ihtiyaç vardır. Özellikle eğitimde öğrencilerin
yetenek, tutum gibi özelliklerini bir dersle ilgili sahip
oldukları
davranışları
duyu
organlarımızla
gözleme
imkânımız yoktur. Bu nedenle eğitimdeki ölçmelerde bu
gözlemleri yapabilmek için soru ya da sorulardan oluşan
ölçme araçlarından yararlanırız.
Kullanılan ölçme aracının ölçülen özelliğin gerçek
değerine yakın ölçüler vermesi istenir.
Fen bilimlerinde yapılan ölçmelerde ölçülen özellikler
daha çok görülebilir olduğundan ve bu özelliği
ölçmede standart bir araç kullanıldığından (metre
vb.) yapılan hata miktarı azdır.
Sosyal bilimlerde ölçmeye konu olan özellikler
doğrudan
gözlenemediğinden
sınavlar
gibi
göstergeler yardımıyla dolaylı ölçme yapılır. Özelliğin
doğrudan
ölçülememesi
ve
aynı
özellik
için
geliştirilmiş standart bir ölçme aracının olmaması
ölçme işlemindeki hata miktarını artırır.
Eğitimde öğrenciler hakkında alınan kararların
doğruluğu ve isabetliliği için kullanılan ölçme
araçlarının
bazı
niteliklere
sahip
olması
gerekir.
Bu nitelikler;
GEÇERLİK
GÜVENİRLİK
KULLANIŞLILIK
Güvenilir, geçerli ve kullanışlı olmayan ölçme
araçları bireyler hakkında yanlış kararların
alınmasını sağlamaktadır.
GÜVENIRLIK

Ölçme
araçlarında
bulunması
niteliklerden ilki güvenirliktir.
istenen

Güvenirlik çeşitli anlamalarda kullanılır. Bunlar
duyarlık , kararlılık ve tutarlılıktır.
GÜVENIRLIK
Duyarlılık, bir ölçme işleminin küçük farkları
görebilme özelliğidir. Duyarlılık ölçme aracının
birimi ile ilgilidir. Birimi küçük olan araçlarla yapılan
ölçmeler birimi büyük olan araçlardan daha
duyarlıdır.
Örneğin, cm bölmeli bir araçla elde edilen ölçmeler metre bölmeli bir
araçla elde edilen ölçmelerden daha duyarlıdır. Eğitimde 10luk not
verme ölçeği 5lik not verme ölçeğinden daha duyarlıdır. Ölçme
aracındaki soru sayısını artırmak duyarlığı artırır.
GÜVENIRLIK
Kararlılık anlamında güvenirlik, bir özelliğin benzer
koşullar altında aynı araçla birden fazla ölçülmesiyle
elde edilen ölçme sonuçlarının birbirini tutmasıdır.
Aynı bireylere ait bir nitelik aynı araçla farklı
zamanlarda ölçülmüş, farklı ölçme sonuçları alınmış
ise bu ölçme sonuçları kararsızdır.
GÜVENIRLIK
Fiziksel özelliklerin aynı araçla farklı zamanda
ölçülmesinde
ölçülen
nitelikte
bir
değişme
olmadığından iki ölçme arasında fark çıkıyorsa bu
ölçmeyi yapan kişiden, araçtan kaynaklı olabilir. Fakat
eğitim ve psikolojide bu fark ölçülen nitelikteki
değişme, ölçmeyi yapan kişi ya da araçtan kaynaklı
olabilir.
GÜVENIRLIK
Tutarlılık anlamında güvenirlik, ölçme
aracının
kısa
aralıklarla
uygulanmasından elde edilen sonuçların
tutarlılığıdır.
Testte bulunan soruların
testin bütünü ile tutarlılığıdır.
(Cronbach alpha, KR-20,21)
GÜVENIRLIK
Aynı zamanda güvenirlik, bir ölçme aracı hangi
özelliği ölçüyorsa ölçsün, aracın ve yapılan
ölçmenin hatasızlığıyla ilgilidir. Bu anlamdaki
güvenirlik
hatalarından
tanımlanır.
ölçme
arınıklık
sonuçlarının
ölçme
derecesi
olarak
HATA
Ölçme ve değerlendirme hangi amaç için
yapılırsa yapılsın elde edilen ölçümlerin hatasız
ya da az hatalı olması beklenir. Ancak, gerek
fiziksel bilimlerdeki ölçmelerde gerekse eğitim
ve psikolojide ölçme sonuçlarına bir miktar
hata karışır.
HATA

Ölçmede amaç, ölçülen özelliğin gerçek
değerini ortaya koymak, yani hatasız ölçme
sonucu elde etmektir.

Hata bir özelliğin gerçek değeri ile ölçülen
değeri arasındaki farktır.
HATA
Ölçme Hataları;

Ölçmede kullanılan araçtan,

Ölçme yönteminden,

Ölçmeyi yapan kişiden,

Ölçmenin yapıldığı ortamdan

Bireyden kaynaklanabilir.
HATA
Bir ölçme sonucunda bu hataların biri ya da birden
fazlası bulunabilir. Oysaki eğitimdeki ölçmeler,
değerlendirmelere veri sağlamak amacı ile yapılır.
Bu
nedenle
kararın
isabetli
olabilmesi
için,
ölçmelerin belli bir dereceye kadar hatalardan
arınmış olması gerekir.
HATA TÜRLERI
Eğitimdeki ölçmelerde;

Sabit,

Sistematik,

Tesadüfi hatalar mevcuttur.
SABIT HATA:
Bir ölçmeden diğerine miktarı
değişmeyen hatadır.
Sınıftaki herkese 2
puan verme,
Ölçme sonuçlarına
cetveldeki bölmenin
aynı miktarda
karışan hatalar sabit sıfır yerine 1 den
hatadır.
başlaması (ucu kırık
cetvel) gibi.
SABIT HATA:
Örneğin; toplam puanı 5 olan bir yazılı yoklamada 2
puanlık bir soru, verilen zamanın yeterli olmaması
nedeniyle, tüm sınıf tarafından bos bırakılmış olsun.
Öğretmen, tüm öğrenciler bu soruyu doğru cevaplamış
gibi her birine 2 puan verirse bu türden bir hata
yapmış
olur.
Böylece,
bu
soruyu
doğru
cevaplayamayacak bir öğrenci de 2 puan almış olur.
SISTEMATIK HATA
Ölçülen büyüklüğe, ölçmeye veya ölçme koşullarına
bağlı olarak sistematik olarak değişen hata türüdür.
Öğretmenin kız öğrencilere
Yazı güzelliğinin puanı
erkeklerden daha fazla puan
etkilememesi gereken bir
vermesi durumunda öğretmen
durumda öğretmenin yazısı
cinsiyete bağlı olarak
güzel olan öğrencilere daha
sistematik hata yapmış olur.
fazla puan vermesi
TESADÜFI HATA
Yönü ve miktarı belli olmayan, ölçme sonuçlarına
gelişigüzel karışan hatalardır.
Tesadüfi hatalar ölçmenin
yapıldığı ortam, ölçmeyi
yapan kişinin dikkatsizliği,
ölçme aracı vb. hata
kaynaklarından gelen hata
türüdür.
Şans başarısı (atıp tutturma), sınav
günü öğrencinin hastalanması, sınav
koşullarının elverişsizliği veya tüm
öğrenciler için eşit olmayışı,
öğretmenin cevapları puanlarken
dikkatsizlik yapması gibi etkenler bu
türde hatalara yol açar.
GÜVENIRLIK KESTIRME YÖNTEMLERI:
1.
Test-tekrar test yöntemi
2.
Paralel formlar yöntemi
3.
Eşdeğer yarılar yöntemi
4.
İç tutarlılık yöntemi
TEST TEKRAR TEST YÖNTEMI
TEST A
Birinci uygulama
ZAMAN
TEST A
İkinci uygulama
GRUP
Test tekrar test güvenirliği testin 1. ve 2. uygulamasından elde
edilen puanların tutarlık düzeyini ve testin zamandan zamana ne
düzeyde kararlı ölçmeler yapabildiğini gösterir.
PARALEL FORMLAR YÖNTEMI
FORM A
ZAMAN
FORM B
GRUP
FORM A ve FORM B arasındaki korelasyon testin güvenirlik katsayısını
gösterir
PARALEL FORMLAR YÖNTEMI

Paralel
formlar
yöntemi
test-tekrar
test
yönteminde ortaya çıkan hatırlama ve gerçek
puanın değişmesi etkilerini azaltır.

Paralel formların hazırlanmasının güçlüğü ve iki
uygulama gerektirmesi bu yöntemin olumsuz
yanlarındandır.
EŞDEĞER YARILAR YÖNTEMI:
TEST
GRUP
1. Yarı
puanları

2. Yarı
puanlar
ı
Birinci yarı ve ikinci yarı puanları arasındaki korelasyon
yardımıyla güvenirlik katsayısı hesaplanır.
EŞDEĞER YARILAR YÖNTEMI:

Bu yöntem test-tekrar test ve paralel formlar
yönteminin taşıdığı iki test ve iki uygulamanın
getirdiği sakıncaları ortadan kaldırır.
İÇ TUTARLILIK YÖNTEMI

Testte bulunan soruların testle olan tutarlılığıdır.

Bu
yöntemde
test
bir
gruba
uygulanır.
Test
maddelerinin birbirleri ile tutarlı olup olmadığına
bakılır.

Testin iç tutarlılığı Cronbach Alpha katsayısı, KR-20 ve
KR-21 güvenirlik katsayıları ile hesaplanır.
İÇ TUTARLILIK YÖNTEMI

Cronbach Alpha tüm sınav türleri için kullanılır.

Çoktan
seçmeli
testlerin
güvenirliğini
hesaplamak için ise KR-20 ve KR-21 kullanılır.
İÇ TUTARLILIK KATSAYILARI
K
 

K
K 1
(1 
s
2
j
j 1
S
)
2
X
K
KR  20 
KR  21 
K
K 1
K
K 1

(1 
p jq
j 1
S
(1 
j
)
2
X
K X  (X )
KS
2
X
2
)
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Ölçmede hata kaynaklarından biri ölçme
aracını oluşturan sorulardır. Sorular iyi
ifade
edilmemişse
performanslarını
öğrenciler
gösteremez.
gerçek
Böylece
güvenirlik düşer. Soruların açık ve anlaşılır
olması ölçme aracının güvenirliğini artırır.
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Sınavın yapıldığı ortam öğrencilerin soruları
cevaplama durumlarını etkiler. Işık, ısı ,ses
gibi
nedenler
öğrencilerin
soruları
yanıtlayamamalarına neden olur. Bu durum
sınavın güvenirliğini düşürür.
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Sınavda kullanılan soru sayısı da güvenirliği
etkiler. Soru sayısının belli bir noktaya kadar
artırılması güvenirliği artırır.
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Sınav süresi güvenirliği etkiler. Süre yetersiz
olduğunda
öğrenciler
bazı
maddeleri
cevaplayamayacaktır. Buda soru sayısının
azalmasını sağlar. Aynı zamanda öğrencilerin
gerçek
engeller.
performanslarını
göstermesini
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Sınavlara karışan hataların bir başka nedeni de
öğrencinin
psikolojik
heyecanlanma
vb.
özellikleridir.
özellikler
Kaygı,
nedeniyle
öğrenciler doğru bildiklerini yapamazlar. Bu
durum
artırmak
da
güvenirliği
için
sınav
düşürür.
Güvenirliği
öncesi
öğrenciler
güdülenmeli kaygı düzeyleri azaltılmalıdır.
GÜVENİRLİĞİ ARTIRMADA ALINABİLECEK ÖNLEMLER

Sınav sonuçlarının güvenirliğini etkileyen bir
başka yöntemde puanlama şeklidir. Eğer
sınavlar puanlanırken yazı güzelliği, dilin
akıcılığı vb. nedenlerle puanlama etkilenirse
güvenirlik düşer.
GEÇERLIK
Bir ölçme aracının ölçülmek istenen özelliği başka
özellikler ile karıştırmadan ölçme derecesidir.
Kullanılan ölçme aracının ölçme amacına hizmet etmesidir.
Kullanılan ölçme aracı özelliği ölçerken amacı haricinde
başka değişkenleri ölçüyorsa, ölçmede yetersiz kalıyorsa
amacına hizmet etmiyor demektir.
GEÇERLIK

Geçerlik, bir ölçme aracının ölçmeyi amaçladığı özelliği,
başka herhangi bir özellikle karıştırmadan, doğru olarak
ölçebilme derecesidir.

Örneğin bir sınıfın Türkçe dersindeki başarısının ölçülmesi
için bir sınav yapılacaksa, bu sınavın Türkçe dersindeki
başarıyı
tanımlayan
tüm
değişkenleri
ölçmesi,
değişkenler dışındaki değişkenleri ölçmemesi istenir.
bu
GEÇERLIK
Güvenirlik ve
• Örneğin; öğrencilerin sayısal
geçerlik bir
yeteneklerini belirlemek isteyen bir
ölçme aracında
öğretmen güvenirliliği kanıtlanmış
bulunması
bir sözel yetenek testi kullandığını
varsayalım. Kullanılan test
gereken en
güvenilir fakat geçerli değildir.
önemli
özelliklerdendir.
Bu durumda testin kullanış
Geçerli olmayan • amacına
hizmet etmediği
bir ölçme aracı
söylenebilir. Çünkü geçerlik, ölçme
güvenilir olsa
aracının ölçmek istediği özelliği
başka değişkenlere karıştırmadan
bile bu bir
ölçebilme derecesidir.
anlam ifade
etmez.
GEÇERLIK

Eğitimde
değişik
başvurulur.
belirlenmesi,
amaçlarla
Öğrencinin
bir
okula
öğrenci
ölçmeye
başarısının
alınması,
öğrencilerin duyuşsal özelliklerinin belirlenmesi
gibi. Bu nedenle farklı geçerlik türleri vardır.
GEÇERLIK
Testin kullanılış ve geliştirilme amacına bağlı olarak
farklı geçerlik türleri söz konusudur.

1.KAPSAM GEÇERLİĞİ

2. BİR ÖLÇÜTE DAYALI GEÇERLİK

3. YAPI GEÇERLİĞİ
KAPSAM GEÇERLIĞI
Bir ölçme aracının bu araçla ölçülmek istenen
davranışları ne derece kapsadığıdır.
Ne amaçla kullanılırsa kullanılsın, ölçme aracı
kapsam açısından ölçmeye konu olan davranışları
yeterli derecede temsil etmelidir.
Örneğin bir dersin iki ünitesindeki öğrenci başarısını belirlemek
için yapılacak sınavın iki üniteye ait soru içermesi gerekir. Eğer bir
üniteye ait soru sorulmuşsa sadece o ünitedeki başarı yoklanmış
olur, böylece kapsam geçerliği düşer.
KAPSAM GEÇERLIĞI
Kapsam geçerliği belirlerken kullanılan yöntemler:
1. Uzman kanısına başvurma
2. Belirtke tablosu (ölçülecek davranışlar, konu
kapsamı
açıkça
bellidir.)
kullanarak
sınav
hazırlama
3. Aynı kapsamı ölçtüğü bilinen bir testle
korelasyona bakmakta geçerlik kanıtıdır.
BIR ÖLÇÜTE DAYALI GEÇERLIK:
Bir testle doğru kararlar verilip verilmediğini
inceler.
Bir işe elaman alırken, işin ölçülerine uygun eleman
seçmede kullanılan testlerde ya da okula öğrenci
alırken okulun gerektirdiği yetenek ve bilgi düzeyine
sahip bireyleri seçme ve yerleştirmede kullanılan
testlerin geçerliği ölçüte dayalı geçerlik ile bulunur.
BIR ÖLÇÜTE DAYALI GEÇERLIK:
Ölçüte dayalı geçerlik ölçütün elde ediliş
zamanına bağlı olarak zamandaş ve yordama
geçerliği olarak ikiye ayrılır.
BIR ÖLÇÜTE DAYALI GEÇERLIK:
Zamandaş Geçerliği: Ölçütten elde edilen puanlar
ölçme aracından elde edilen puanla aynı
zamanda ya da daha önce elde edilmiş ise bu
puanlar
arasındaki
korelasyon
zamandaş
geçerliğidir.

LYS sınavının geçerliği için sınavdan alınan puan ve
öğrencilerin ortaöğretim başarı puanları (ölçüt)
arasındaki korelasyona bakılabilir.
BIR ÖLÇÜTE DAYALI GEÇERLIK:
Yordama Geçerliği: Ölçüt durumundaki puanlar
ölçme aracından elde edilen puanlardan
daha sonra elde edişmiş ise bu puanlar
arasındaki korelasyon yordama geçerliği
kanıtıdır.
LYS sınavının yordama geçerliği öğrencilerin
yerleştirildikleri üniversitedeki akademik
ortalamaları arasındaki korelasyondur.
YAPI GEÇERLIĞI:
Testin ölçmek istediği yapıyı ölçme derecesidir.
Burada yapı zeka, tutum, ilgi vb. olabilir.
Belirleme Yöntemleri:

Aynı yapıyı ölçtüğü bilinen başka testlerle korelasyon

Ölçülmek istenen yapı bakımından farklı olduğu bilinen gruplara
uygulama

Uzman görüşü

Faktör analizi
GEÇERLIĞI ARTIRMADA ALINACAK ÖNLEMLER

Bir ölçme aracı kapsadığı soruların geçerliği
oranında geçerli olabilir. Bu nedenle, her bir
sorunun o araçla ölçülmek istenen bilgi,
beceri ve yeteneklerden en az bir tanesini
ölçmesi sağlanmalıdır.
GEÇERLIĞI ARTIRMADA ALINACAK ÖNLEMLER

Her soru, o soruyla ölçülmek istenen bilgi ve
becerilere sahip öğrencilerin tereddütsüz
olarak doğru cevaplandırabileceği; bu bilgi ve
becerilere
sahip
olmayanların
doğru
cevaplandıramayacağı nitelikte olmalıdır.
GEÇERLIĞI ARTIRMADA ALINACAK ÖNLEMLER

Test, belli bir sürede kazandırılması hedeflenen
bütün konuları, bilgi, beceri ve yetenekleri
temsil etmelidir.

Bunların yanı sıra, güvenirliği artırmaya yönelik
tüm önlemler geçerliği de artırır.
KULLANIŞLILIK

Bir ölçme aracında güvenirlik ve geçerliğin yanı sıra bulunması
gereken bir başka nitelik ise kullanışlılıktır.

Kullanışlılık bir testin kullanılmasındaki kolaylık ile yakından
ilişkilidir.

Bir ölçme aracının veya yönteminin, geliştirilme, çoğaltılma,
uygulanma
ve
puanlama
yönünden
kolaylık,
ekonomiklik özelliklerine sahip olması anlamına gelir.
nesnellik
ve
KULLANIŞLILIK

Ölçme araç ve yöntemlerinin kullanışlılığı hakkında yargıya varılırken
şu noktalar dikkate alınmalıdır.
1.
Ekonomi: kullanılacak araç maliyet yönünden ekonomik olmalıdır.
2.
Hazırlanma süresi
3.
Uygulama süresi
4.
Uygulama kolaylığı
5.
Puanlama kolaylığı
6.
Puanları yorumlama kolaylığı
Bir araştırmacının bir tutum ölçeğinden elde ettiği puanların güvenirliğini kestirmek için
aşağıdakilerden hangisini hesaplaması beklenmez?
A) Ölçeğin belirli bir zaman aralığının ardından aynı gruba ikinci kez uygulanmasıyla elde
edilen puanlar arasındaki korelasyonu
B) Ölçeğin denk iki yarısından alınan puanlar arasındaki korelasyonu
C) Ölçeğin, eşdeğer bir formu ile birlikte aynı gruba uygulanmasıyla elde edilen puanlar
arasındaki korelasyonu
D) Ölçekten elde edilen puanlara dair iç tutarlılık katsayısını
E) Ölçekteki maddelerin uygunluğunu iki uzmanın puanlaması sonucunda elde edilen
puanlar arasındaki korelasyonu
Bir öğretmen, dönem sonu sınavını hazırlarken soruları;
dersin dönem içindeki tüm kritik kazanımlarını konu ve
bilişsel beceri boyutuyla temsil eden bir örneklem
oluşturacak biçimde seçmiştir. Öğretmenin bu
uygulaması, sınavın en çok hangi özelliğini iyileştirir?
A) İç tutarlılığını
B) Yapı geçerliğini
C) Kararlılığını
D) Kapsam geçerliğini
E)Yordama geçerliğini
Aşağıda belirtilen değişkenler arasındaki ilişkilerden hangisi, kamu personel seçme sınavı
eğitim bilimleri testinin yordama geçerliği hakkında bilgi verir?
1. Değişken
2. Değişken
A) Testten alınan toplam puanlar
Lisans mezuniyet not ortalamaları
B) Testten alınan toplam puanlar
Yeni atanan öğretmenlerin ilk yıl sonundaki yeterlik puanları
C) 2010 yılında uygulanan testin
madde ayırt edicilik indeksleri
2011 yılında uygulanan testin madde ayırt edicilik indeksleri
D) Testin 2010 yılı uygulamasından
alınan toplam puanlar
Testin 2011 yılı uygulamasından alınan toplam
puanlar
E) 2010 yılında uygulanan testin
madde güçlük indeksleri
2011 yılında uygulanan testin madde güçlük indeksleri
Geniş ölçekli sınavlar yapan bir kurumda çalışan bir uzman, eğitim bilimleri testiyle ilgili olarak
aşağıdaki açıklamayı yapmaktadır: “Çoktan seçmeli madde formatıyla üst düzey düşünme becerilerinin
ölçülmesinin zor olduğunun farkındayız. Örneğin bir kişinin ne kadar iyi bir öğretmen olduğunun en
geçerli değerlendirmesi için açık uçlu maddeler kullanılmasına ve performans değerlendirme
uygulamalarına ihtiyaç vardır. Ancak bizim sınavımıza yaklaşık bir milyon aday katılmaktadır.
Geliştirilecek performans görevleriyle değerlendirme süreci, en az bir yıllık bir zaman dilimine ve
sınırsız ölçüde kaynağa ihtiyaç duyacaktır.”
Uzmanın açıklamasına göre, belirtilen sınavda açık uçlu madde formatı ve performans
değerlendirmenin
yerine
çoktan
seçmeli
madde
formatının
kullanılmasının
gerekçesi
aşağıdakilerden hangisidir?
A) Kapsam geçerliği B) Kullanışlılık C) Ölçme hassasiyeti D) İç tutarlılık E) Yordama geçerliği
Download

olcme-araclarinda-bulunmasi-istenen