Ölçme ve Değerlendirme
Tuncay hoca
Temel Kavramlar
•
Ölçme: Herhangi bir niteliği gözlemek ve gözlem sonucunu sayılarla ifade
etmektir.
Nesne özelliğiGözleSayı yada Sembolle ifadeÖLÇME
•
•
•
•
Değerlendirme:Ölçme Sonucunda elde ettiğimiz sonucu bir ölçüt ile
karşılaştırarak bi karar yada yargıya varmadır.
Ölçme Türleri: Doğrudan ve Dolaylı, türetilmiş
Eğitimde ölçme konusu olan özelliklerin çok azı doğrudan gözlenebilir. Psikomotor beceriler, yanlışsız ve güzel okuma, iyi konuşma becerisi gibi.
Değerlendirme Türleri: Mutlak ve Bağıl Değerlendirme
Ölçme ve Değerlendirme: Eğitimde hedeflere ne düzeyde ulaşıldığı,
gerçekleşmeyen hedeflerin nedenlerini sorgulama, öğrenme sürecinin
etkililiğini arttırma ve öğrenci gelişimi hakkında bilgi verir
Temel Kavramlar
• Türetilmiş Ölçme: Değişkenlerin ortak noktası, kendi başlarına bir
tanımlarının olmaması ve başka değişkenler ve bu değişkenler
arasındaki ilişkiyi yansıtan aritmetik işlemlerle tanımlanmış
olmasıdır. Yoğunluk değişkeni, kütle/hacim olarak; hız değişkeni ise
yol/zaman olarak; nüfus yoğunluğu ise, kişi sayısı/alan şeklinde iki
değişken ve bu değişkenler arasındaki aritmetik işlemlerle
tanımlanmıştır.
• Birimli ölçme, ölçülecek büyüklüğün miktarının sayısal
olarak gösterilmesi işlemidir.
• Eşitlik; kullanılan ölçme işlemindeki birimlerin birbirine
eşit olmasını ifade eder.
• Genellik; birimlerin herkes tarafından aynı biçimde
anlaşılmasını, kişiden kişiye, yerden yere değişmemesini
ifade eder.
• Kullanışlılık; birimlerin, kullanılış amacına hizmet etmesi
anlamına gelmektedir.
Temel Kavramlar
• Ölçüm: Ölçme İşlemi Sonucunda elde edilen sembol-sayıdır.
• Ölçme Kuralı: Ölçme işleminde ölçülen özelliğin ne kadarlık
miktarına ne kadar puan verileceğidir.
(bu soruya tam puan verenlerin 10 puan alması)
• Ölçmede Sıfır: Doğal ve tanımlanmış sıfır olarak belirlenir.
• Ölçmede Hata: Ölçülen nesnenin gerçek değeri ile gözlenen
değeri arasındaki farktır.
(Hata Türleri; Sabit, Sistematik ve Tesadüfi olarak değişir).
Hata Türleri
• Sabit Hata:
Ölçümden Ölçüme değişmez, aynı oranda hata
vardır ve testin geçerliliğini etkileyecektir.
• Sistematik Hata:
Hata miktarı ölçümden ölçüme belli oranda
artar yada azalır ve testin geçerliliğini etkileyecektir.
• Tesadüfi Hata:
Hatanın kaynağı bilinmez yada hata miktarı
kuralsız olarak artar-azalır ve ve testin güvenilirliliğini etkileyecektir.
Ölçek:
Cetvel, metre gibi ölçme araçları üzerinde yapılan
bölmelendirme işlemlerinde kullanılır. Ayrıca; Sınıflama(), Sıralama,
Eşit
Aralıklı
ve
Oranlı
ölçek
olarak
kullanılmaktadır.
ÖLÇEK ve ÖLÇEK TÜRLERİ
Ölçmede gözlem sonuçlarının sayılarla ifade
edilmesinde uyulan kısıtlamalardır.
Nesnelere verilen sayıların anlamıdır..
Cetvel ve metre gibi araçlar üzerindeki
bölümlemelerdir.
Dört tür ölçek vardır:
1. Sınıflandırma Ölçeği
2. Sıralama Ölçeği
3. Eşit Aralıklı Ölçek
4. Oranlı Ölçek
ÖLÇEK TÜRLERİ-1
1. Sınıflandırma (Nominal, Adlandırma ) Ölçeği:
Nesnelerin
belli
bir
yönden
benzeyip,
benzemediklerine göre sınıflandırılmasıdır.
Kadın-erkek; evli-dul-boşanmış kategorisi gibi.
Gözlemin en basit biçimidir. Bu ölçekle nesnelere
verilen sayıların sayısal anlamları yoktur,
miktar belirmezler (plaka numaraları, il
kodları gibi). Bu ölçekle yapılan iş, ölçmeden
çok anlamlandırmadır.
Bu ölçekle elde edilen sayılar üzerinde
matematiksel işlem yapılmaz.
ÖLÇEK TÜRLERİ-2
Sınıflandırma ölçeğinin iki özelliği vardır:
1- Simetriklik: A=B ise, B=A dır. Ali ,Veli’nin
kardeşi ise, Veli de Ali’nin kardeşidir.
2-Geçişlilik: Ali, Veli’nin kardeşi, Veli’de
Ayşe’nin kardeşi ise, Ali, Ayşe’nin de
kardeşidir.
A=B ve B=C ise, A= C dir.
ÖLÇEK TÜRLERİ-3
2. Sıralama Ölçeği:
Nesneleri belli bir özelliğine sahip oluş miktarı
bakımından sıraya koymaktır. Öğrencileri boy
sırasına göre sıralamak veya bir dersten alınan
puanlara göre başarı sırasına koymak.
Sıralamada başlangıç noktası ve sıralar sabit
değildir. Gruba yeni üyelerin katılımıyla
sıralama değişir.
Eğitimde kullanılan bir ölçek türüdür.
Bu ölçekle elde edilen sonuçlar üzerinde, ortanca
(medyan) ve yüzdelik hesapları yapılabilir.
ÖLÇEK TÜRLERİ-4
Sıralama Ölçeğinin İki Özelliği Vardır:
• Geçişlilik
Ali, Veliden daha boylu, Veli de Can’dan daha
boylu ise, Ali Can’dan daha boyludur
A>B ise B>C ise A>C dir.
2. Asimetriklik
Ali Veliden boylu ise, Veli’de Ali’den boyludur
denilemez.
A>B ise B>A değildir.
ÖLÇEK TÜRLERİ-5
3. Eşit Aralıklı Ölçek:
Ya iki noktası belirlenip bu iki nokta arası eşit
aralıklara bölünerek ya da bir noktası
belirlenip bu noktadan itibaren tanımlanmış
bir birimle bölümlenerek geliştirilen ölçektir.
Bu ölçekte, tanımlanmış, saymaca, keyfi bir sıfır
noktası ve tanımlanmış, değişmez bir birim
vardır.
Termometre, Takvim ve standart puanlar.
Eğitimde kullanılan bir ölçek türüdür.
Bu ölçekle elde edilen sonuçlar üzerinde, ortanca
(medyan) ve yüzdelik hesapları yapılabilir.
ÖLÇEK TÜRLERİ-6
Eşit Aralıklı Ölçekle elde edilen sonuçlar
toplanıp, çıkarılabilir, ancak çarpma ve bölme
(oran belirten) yapılamaz. Aritmetik ortalama,
standart kayma ve korelasyon hesaplanabilir.
20 derece sıcaklık, 10 derece sıcaklığın iki katı
değildir, 10 fazlasıdır denilebilir.
0-100 arası 100 eşit parçaya bölünerek ölçek elde
edilir.
Bu ölçekte sıfır, ölçülen özelliğin hiç olmadığı
anlamına gelmez
ÖLÇEK TÜRLERİ-7
4. Oranlı Ölçek:
Saymaca sıfırın yerine doğal/gerçek
konulmasıyla elde edilen ölçektir.
sıfırın
Bu ölçekle elde edilen sonuçlar üzerinde, her
türlü matematiksel işlem yapılabilir.
Metre, Kilogram gibi.
Saat?
ÖLÇEKLER
ÖZELLİK
Sınıflama
Sıralama
Aralık
Oran
Eşit Ölçme Birim
Yok
Yok
Var
Var
Sıfır Noktası
Yok
Yok
Tanımlı
Gerçek
Dört İşlem
Yok
Yok
+, -
+, -, x, /
Ölçme Duyarlılığı
Düşük
Yüksek
Değerlendirme Türleri
• Summative (Özetleyici) Değerlendirme
Bu değerlendirmede geçti-kaldı, başarılı-başarısız kararları, eğitimde
çok kullanılması, başarı ve erişi testlerinde kullanılması, ara-son
sınavlarda kullanılmaktadır.
• Formative / Geliştirici (Biçimlendirici)
Değerlendirme
Bu değerlendirmede öğrenme eksiklikleri üzerinde durulur, ünite yada
konu sonlarında izleme şeklinde kullanılır.
• Eğitim Programlarının Değerlendirilmesi
Programın bütün halinde her bir öğesinin etkinliği değerlendirilir.
• Hazır Bulunuşluk Düzeyinin Değerlendirilmesi
Ön koşul davranışlarının belirlenmesine dönüktür: Giriş Sınavları vb.
• Öğretmenin Değerlendirmesi
Tüm değerlendirme tür ve ölçme işlemlerini yaparak öğretmenin
öğretimi gerçekleştirmesidir
Ölçme değerlendirme amaçları
• Tanımaya Yönelik Değ:
Bir davranışın önceden edinilip
edinilmediğini yoklamak, öğretim sürecinin başında yada dersin giriş
bölümünde yapılan değerlendirme, bir ders yada kursun ön koşulu
niteliğindeki giriş davranışlarına sahip olma derecesidir.
* ÖSS sınavı, ingilizce kur belirleme sınavı, seviye tespit, hazır bulunuşluk,
yetenek testi, tanıma testi
• Formatif
(Biçimlendirmeye
yönelik)
Değ:
Bu
değerlendirme yaklaşımında kullanılan testler formatif, izleme ve ünite
testleri olarak 3’e ayrılır. Biçimlendirme ve yetiştirmeye yöneliktir.
Öğretim süreci içerisinde öğrenme eksikliklerini belirlemek ve gidermek
amacıyla kullanılır. Not verme amaçlı değildir.
• Değer biçmeye dönük (Summatif) Değ: Birkaç ünitede
bir yada öğretim sonunda yapılan değerlendirmedir. Ders-kurs sonunda
yapılan sınavlar, öğrenme düzeyi ve başarı düzeyini belirlemek, erişi
testleri için kullanılır.
Değişken
• Bir durumdan diğerine farklı değerler alabilen özelliktir.
• Nicel Değişken: Sayılarla ifade edilir  Boy uzunluğu, Ağırlık düzeyi
• Nitel Değişken: Semboller ve sıfatlarla ifade edilen değişkenlerdir.
Cinsiyet, Milliyet, Din
• Sürekli Değişken: İki değer arasında başka bir değer bulabilen
değişkendir. Kilometre, metre, ağırlık, zeka v.b
• Süreksiz Değişken: İki değer arasında sınırlı sayıda değer alan
değişkendir. Cinsiyet, okul türü v.b
Ancak araştırmanın amacına göre bağımlı-bağımsız olarak ikiye ayrılır;
Bağımlı Değişken: Bir başka değişkene bağlı olarak değişir.
• Kanserin
Depresyon üzerindeki Etkisi
Bağımsız
Bağımlı
• Sigaranın kanser üzerindeki etkisi
Güvenilirlik
• Bir ölçme aracının tesadüfi hatalardan arınık olma derecesidir. Yani
ölçme aracının hatalardan arınık, duyarlı, kararlı ve tutarlı olmasıdır.
Bir ölçme aracının güvenilirliğini etkileyen hata kaynakları;
*Ölçme aracından kaynaklanan hatalar: Ölçme aracının birden fazla
davranışı karışık ölçmesi yada soruların anlaşılmaması
*Ölçmeciden kaynaklanan hatalar: Motivasyon, yaş, taraflılık, bilgi düzeyi
*Ortamdan kaynaklanan hatalar: Sınav yerinin ısı, ışık v.s.
*Ölçülen kişiden kaynaklana Hatalar: Tutum, sorumluluk, yorgunluk v.s
*Ölçme aracı çeşidinden kaynaklanan: Sözlü sınav yerine yazılı kullanma
Güvenilirliliği Etkileyen Faktörler
•
•
•
•
•
•
•
Testin uzun olması
Test sorularının ayırt edicilik gücü (0-1)
Testin anlaşılır olması, güçlük düzeyi
Sınavın yapıldığı ortam, Maddelerin homojenliği
Zaman, Şans başarısı, Testin uygulama koşulları, Kopya çekme
Öğrenci tutumları – Puanlamada nesnellik –
Davranışları ölçülen grubun normal dağılım göstermesi ve heterojen
olması güvenilirliliği yükseltir.
Örnek: Test maddeleri ne kolay ne de zor olacak, bilenle bilmeyeni ayırt
edecek,
• Bir ölçme aracının güvenilirliliğini belirlemede
• 1 Test tekrar yöntemi, 2 Paralel testler, 3 Testi yarılama yöntemi
kullanılır.
Ayrıca, KR-20, 21 ve Alpha güvenilirlik katsayılarından faydalanılır.
ÖLÇMEDE TUTARLILIK-1
Ölçmede tutarlılığı sağlamanın iki yolu:
1-Birbirini izleyen ölçmelerde, bireyin grup içindeki pozisyonundaki
tutarlılık. Grup içinde sırasının değişmezliği. Bu yaklaşımda aynı
nesnelerle ilgili iki ölçüm takımı arasındaki korelasyon hesaplanır
ve bulunan katsayı, güvenirlik katsayısı olarak isimlendirilir.
2-Bireysel
ölçümlerde
görülen
ölçme
hatasının
büyüklüğüyle ilgilidir. Bir nesne tekrar tekrar
ölçülecek olursa ele edilen ölçümler birbirinden farklı
olacak ve onlar belli bir dağılım gösterecektir.
Ölçümlerdeki değişme, standart kayma olarak
isimlendirilir ve bu ölçümdeki hata payını gösterir. Bu
durumda ona ölçmenin standart hatası denir.
GÜVENİRLİK KATSAYISI-1
Gerçek ölçümlerin bilinmemesi, dolaylı yoldan güvenirlik
katsayısı hesaplamayı gündeme getirmiştir.
Güvenirlik katsayısı hesaplama yolları
1- Test Tekrar Yöntemi:
Aynı test formunu, aralıklı olarak iki ayrı zamanda aynı
gruba uygulanması ve iki uygulamadan elde edilen
puanlar arasındaki korelasyonun bulunması.
Bu test ile elde edilen katsayıya İstikrarlılık / Kararlılık /
Tutarlılık katsayısı denir.
Temel sorun, zamandır (2-8 hafta). Bu durum zor
olmakla birlikte eşleştirilmiş grupla aşılabilir.
Maddelere verilen cevapların tutarlılığının önemli olduğu
durumlara uygundur. Başarının yordanması için
kullanılacak
testlerin
güvenirlik
katsayısını
hesaplamada kullanılır (İlgi ölçeği gibi).
GÜVENİRLİK KATSAYISI-2
2- Paralel Testler Yöntemi:
İki eşdeğer testin yada bir testin iki eşdeğer formunun
aynı gruba aynı zamanda /belli zaman aralığı ile
uygulanması ve iki eşdeğer testten elde edilen puanlar
arasındaki korelasyonun bulunması.
Bu test ile elde edilen katsayıya Eşdeğerlik katsayısı denir.
Bu yöntemle elde edilen güvenirlik katsayısı genellikle
düşüktür.
Pearson Çarpım Momentler katsayısı olarak da bilinen
bu yolla elde edilen katsayı, yarı testin katsayısı olup,
Spearman-Brown formülü ile tam testin güvenirlik
katsayısına dönüştürülür.
GÜVENİRLİK KATSAYISI-3
3- Testi Yarılama Yöntemi:
Bir testin iki eşdeğer yarıya bölünmesi ve öğrencilerin bu
iki eşdeğer yarıdan aldıkları puanlar arasındaki
korelasyonun bulunması.
Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı
denir.
En çok kullanılan yöntemdir. Çünkü tek test, tek öğrenci
grubu ve tek form vardır.
Bu yöntemle elde edilen güvenirlik katsayısı da yarı testin
katsayısı olup, Spearman-Brown formülü ile bütün
testin güvenirlik katsayısına dönüştürülür.
Temel sorun, testi eşdeğer iki yarıya bölmektir. Testteki
tek ve çift nolu soruları ayrı ayrı puanlamak bir yol
olabilir.
Stanley formülü de bu amaçla kullanılır.
GÜVENİRLİK KATSAYISI-4
4- Kuder-Richardson 20-21 Formülü ile Hesaplama
Yöntemi:
Testteki her bir maddeye doğru cevap veren öğrenci
yüzdesi hesaplanmışsa, bu yöntem kullanılabilir.
Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı
denir.
Bu yöntem;
-Testteki her maddenin aynı değişkeni ölçtüğü sayıltısına
dayanır (Homojen test)
-Yalnızca doğru cevaplara puan verilmesi, yanlış /boş
cevaplara puan verilmemesi durumunda kullanılır
(KR-20)
-Testteki her maddenin güçlük derecesi birbirinden
önemli ölçüde farklı değilse, maddelerin güçlük
dereceleri eşitse KR-21 kullanılır.
GÜVENİRLİK KATSAYISI-5
4- Kuder-Richardson 20-21 Formülü ile Hesaplama
Yöntemi (devam)
KR-20 ile hesaplanan güvenirlik katsayısı yüksek ise:
a) Puanlar tesadüfi hatadan arınıktır,
b) Ölçülen değişken tek boyutludur,
c) Grup heterojendir (test grubu birbirinden iyi
ayırmıştır),
d) Test maddeleri homojendir,
f) Testin yapı geçerliği yüksektir.
GÜVENİRLİK KATSAYISI-6
Alpha (α) güvenirlik katsayısı: Tek uygulama gerektiren
güvenirlik bulma tekniğidir (KR-20’nin genişletilmiş
şeklidir ve iç tutarlılıkla ilgilidir).
Psikomotor becerileri ölçmek amacıyla geliştirilmiş testler
ve tutum ölçeklerini puanlamada kullanılır.
Güvenirlik katsayısı (– 1) ile (+1) arasında değişirse de,
her zaman (0,00) ile (+1) arasında değişir. Rastgele
hatalardan arındırıldığında bu katsayı üst sınıra (+1)
yaklaşır. 0,90 olması istenir.
Ancak eğitim ve psikolojide bu sınırda test geliştirmek
imkansızdır.
TEST GÜVENİRLİĞİ-1
Güvenirliği Etkileyen Faktörler
A- Testin Kendisiyle İlgili Faktörler
1-Testin uzunluğu: diğer etkenler kontrol edilmek
şartıyla, soru sayısı artırılarak güvenirlik artırılabilir.
2-Test yönergesi ve testteki maddelerin ifadesi: testin
aşında yönerge olmalı. Sorular açık-anlaşılır olmalı
(Anlaşılmaz sorulara değişik zamanlarda değişik
cevaplar verilir).
3- Test içeriğinin benzeşikliği: ölçülecek davranış veya
konu bakımından homojen maddelerden oluşan test,
heterojen bir testten daha güvenilirdir (100 maddelerin
bir fizik testi, 100 maddelik bir fen bilgisi testinden
daha güvenilirdir.
TEST GÜVENİRLİĞİ-2
Güvenirliği Etkileyen Faktörler
A- Testin Kendisiyle İlgili Faktörler
3- Test içeriğinin benzeşikliği:
Aşamalılık özelliği olan konuları ölçen test, homojen.
Ayırt edici maddelerden oluşan bir test, heterojen.
4- Puanlamadaki nesnellik: Bir testin değişik kişilerce
yada aynı kişi tarafından değişik zamanlardaki
puanlanmasından elde edilen puanlar arasındaki
tutarlılığa puanlama güvenirliği denir.
Puanlama güvenirliği, puanlamanın nesnel olmasına ve
puanlayıcının öznel kanısının puanlamaya etki
etmesine bağlıdır.
Objektif testler en yüksek puanlama güvenirliğine
sahiptir.
TEST GÜVENİRLİĞİ-3
Güvenirliği Etkileyen Faktörler
B- Uygulama Koşulları
Ana Kural: uygulama koşullarının her öğrenci için aynı
olmasıdır.
Sınavdan önce kopya çekme önlemleri alınmalı
Soruların basımı, çoğaltılması ve dağıtımı güvenli
yapılmalı.
TEST GÜVENİRLİĞİ-4
Güvenirliği Etkileyen Faktörler
C- Testi Alan ve Testin uygulandığı Grup ile İlgili
Etkenler
Öğrencinin ölçülen özelliği bakımından değişken olması.
Eğitimde ölçülen özellik çoğu zaman kararlı değildir.
Öğrencinin test puanının değişmesine neden olan bireysel etkenler:
1-Bireyin sürekli ve genel karakteristikleri: Hızlı okuyabilme,
kendine güven/güvenmeme, heyecan.
2-Bireyin sürekli ve özel karakteristikleri: Öğrencinin testte yer alan
metni daha önce okumuş olması.
TEST GÜVENİRLİĞİ-5
Güvenirliği Etkileyen Faktörler
C- Testi Alan ve Testin uygulandığı Grup
ile İlgili Etkenler
3-Bireyin geçici ve genel karakteristikleri: Sınav
günü hasta, uykusuz, yorgun, sinirli olma,
önceden alıştırma yapma, güdülenmiş olma,
sınav yerindeki ışık, ısı, havalandırma durumu.
4-Bireyin geçici ve özel karakteristikleri: Doğru
cevabı bilmeden işaretleme, güdülenme
eksikliği
GEÇERLİK ile GÜVENİRLİK
Sistemli, sabit, rastgele hatalar testin geçerliğini
düşürür.
Güvenirlik ise, sabit ve sistemli hatalardan
etkilenemez, sadece rastgele hatalardan
etkilenir. Çünkü, kararsızlık rastgele ve geçici
hatalardan kaynaklanır.
Bir testin geçerliği, onun güvenirliğini sınırlar.
Bir testin geçerliği en çok √ güvenirlik olabilir
GÜVENİRLİK-1
Nasıl ölçülecek?
Güvenilir bir ölçme aracı, aynı özellikle ilgili
olarak arka arkaya yapılan ölçümlerde
yaklaşık aynı sayısal sonucu verir.
Güvenilir bir test, aynı gruba iki/üç kez
uygulandığında, gruptaki her kişi bütün
uygulamalarda yaklaşık olarak aynı puanı
almalıdır.
Güvenirlik, geçerliğin bir parçasıdır. Bir test,
ölçmek istediği özelliği doğru olarak ölçmek
için, söz konusu özelliği tutarlı olarak
ölçmelidir.
Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-2
Pratikte bir nesne/özellik değişik zamanlarda
ölçüldüğünde, ölçmelerin hepsinde aynı sonucu
elde etmek hemen hemen imkansızdır.
Çünkü çeşitli nedenlerden dolayı hatalardan
arınık ölçme yapılamaz.
Ölçme hatası: Elde edilen puan ile gerçek puan
arasındaki fark.
Gözlenen puan = gerçek puan + hata
GÜVENİRLİK-3
Hata kaynakları:
-Ölçmeci
-Araç
-Yöntem
-Ortam
-Ölçülen özellik
-Testin evreni örnekleme derecesi
-Testi uygulama koşulları
-Testi alan öğrencinin durumu (hastalık, güdü,
yorgunluk vb.) sonucu bilmediği maddelerde
tahmine gitmesi. Şans başarısı
Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-4
Hata Türleri:
1-Sabit Hata: Hata miktarının her bir ölçüm için
değişmemesidir. Bu tür hata, standart kayma
ve varyansı etkilemez. Ancak puanları
olduğundan büyük /küçük gösterir.
Örnek: Bir öğretmenin bütün öğrencilerin cevap
kağıdına +10 puan vermesi.
Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-5
Hata Türleri:
2-Sistemli Hata: Bütün ölçümler için sabit
olmayan hatadır.
Örnek: Sadece kız öğrencilere +10 puan veren bir
öğretmen sistemli hata yapmaktadır. Yazılı
yoklamada yazısı güzel ve düzgün olan
öğrenciye fazla puan verilmesi.
Puanlama yanlılığı (Subjektiflik)
GÜVENİRLİK-6
Hata Türleri:
3-Rastgele-Tesadüfi Hata: Şans ile ortaya çıkan
ve ne yönde etki ettiği bilinemeyen hatadır.
Ölçme sonuçlarına gelişigüzel karışan hatadır.
Örnek: Sınav günü öğrencinin hasta olması, sınav
koşullarının elverişsizliği /bütün öğrenciler için
eşit olmayışı, şans başarısı, öğretmenin yaptığı
teknik hatalar.
ÖLÇMEDE TUTARLILIK-1
Ölçmede tutarlılığı sağlamanın iki yolu:
1-Birbirini izleyen ölçmelerde, bireyin grup içindeki pozisyonundaki
tutarlılık. Grup içinde sırasının değişmezliği. Bu yaklaşımda aynı
nesnelerle ilgili iki ölçüm takımı arasındaki korelasyon hesaplanır
ve bulunan katsayı, güvenirlik katsayısı olarak isimlendirilir.
2-Bireysel
ölçümlerde
görülen
ölçme
hatasının
büyüklüğüyle ilgilidir. Bir nesne tekrar tekrar
ölçülecek olursa ele edilen ölçümler birbirinden farklı
olacak ve onlar belli bir dağılım gösterecektir.
Ölçümlerdeki değişme, standart kayma olarak
isimlendirilir ve bu ölçümdeki hata payını gösterir. Bu
durumda ona ölçmenin standart hatası denir.
GÜVENİRLİK KATSAYISI-1
Gerçek ölçümlerin bilinmemesi, dolaylı yoldan güvenirlik
katsayısı hesaplamayı gündeme getirmiştir.
Güvenirlik katsayısı hesaplama yolları
1- Test Tekrar Yöntemi:
Aynı test formunu, aralıklı olarak iki ayrı zamanda aynı
gruba uygulanması ve iki uygulamadan elde edilen
puanlar arasındaki korelasyonun bulunması.
Bu test ile elde edilen katsayıya İstikrarlılık / Kararlılık /
Tutarlılık katsayısı denir.
Temel sorun, zamandır (2-8 hafta). Bu durum zor
olmakla birlikte eşleştirilmiş grupla aşılabilir.
Maddelere verilen cevapların tutarlılığının önemli olduğu
durumlara uygundur. Başarının yordanması için
kullanılacak
testlerin
güvenirlik
katsayısını
hesaplamada kullanılır (İlgi ölçeği gibi).
GÜVENİRLİK KATSAYISI-2
2- Paralel Testler Yöntemi:
İki eşdeğer testin yada bir testin iki eşdeğer formunun
aynı gruba aynı zamanda /belli zaman aralığı ile
uygulanması ve iki eşdeğer testten elde edilen puanlar
arasındaki korelasyonun bulunması.
Bu test ile elde edilen katsayıya Eşdeğerlik katsayısı denir.
Bu yöntemle elde edilen güvenirlik katsayısı genellikle
düşüktür.
Pearson Çarpım Momentler katsayısı olarak da bilinen
bu yolla elde edilen katsayı, yarı testin katsayısı olup,
Spearman-Brown formülü ile tam testin güvenirlik
katsayısına dönüştürülür.
GÜVENİRLİK KATSAYISI-3
3- Testi Yarılama Yöntemi:
Bir testin iki eşdeğer yarıya bölünmesi ve öğrencilerin bu
iki eşdeğer yarıdan aldıkları puanlar arasındaki
korelasyonun bulunması.
Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı
denir.
En çok kullanılan yöntemdir. Çünkü tek test, tek öğrenci
grubu ve tek form vardır.
Bu yöntemle elde edilen güvenirlik katsayısı da yarı testin
katsayısı olup, Spearman-Brown formülü ile bütün
testin güvenirlik katsayısına dönüştürülür.
Temel sorun, testi eşdeğer iki yarıya bölmektir. Testteki
tek ve çift nolu soruları ayrı ayrı puanlamak bir yol
olabilir.
Stanley formülü de bu amaçla kullanılır.
GÜVENİRLİK KATSAYISI-4
4- Kuder-Richardson 20-21 Formülü ile Hesaplama
Yöntemi:
Testteki her bir maddeye doğru cevap veren öğrenci
yüzdesi hesaplanmışsa, bu yöntem kullanılabilir.
Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı
denir.
Bu yöntem;
-Testteki her maddenin aynı değişkeni ölçtüğü sayıltısına
dayanır (Homojen test)
-Yalnızca doğru cevaplara puan verilmesi, yanlış /boş
cevaplara puan verilmemesi durumunda kullanılır
(KR-20)
-Testteki her maddenin güçlük derecesi birbirinden
önemli ölçüde farklı değilse, maddelerin güçlük
dereceleri eşitse KR-21 kullanılır.
GÜVENİRLİK KATSAYISI-5
4- Kuder-Richardson 20-21 Formülü ile Hesaplama
Yöntemi (devam)
KR-20 ile hesaplanan güvenirlik katsayısı yüksek ise:
a) Puanlar tesadüfi hatadan arınıktır,
b) Ölçülen değişken tek boyutludur,
c) Grup heterojendir (test grubu birbirinden iyi
ayırmıştır),
d) Test maddeleri homojendir,
f) Testin yapı geçerliği yüksektir.
GÜVENİRLİK KATSAYISI-6
Alpha (α) güvenirlik katsayısı: Tek uygulama gerektiren
güvenirlik bulma tekniğidir (KR-20’nin genişletilmiş
şeklidir ve iç tutarlılıkla ilgilidir).
Psikomotor becerileri ölçmek amacıyla geliştirilmiş testler
ve tutum ölçeklerini puanlamada kullanılır.
Güvenirlik katsayısı (– 1) ile (+1) arasında değişirse de,
her zaman (0,00) ile (+1) arasında değişir. Rastgele
hatalardan arındırıldığında bu katsayı üst sınıra (+1)
yaklaşır. 0,90 olması istenir.
Ancak eğitim ve psikolojide bu sınırda test geliştirmek
imkansızdır.
• Testi yarılama yönteminde aşağıdaki formül kullanımı yaygındır
KR-20 / KR-21 & Cronbach Alfa Güv. Katsayısı
• KR20 & 21 testin iç tutarlılık katsayısıdır. Testin tüm soruları
arasındaki uyumu incelenir.
• KR-20 testteki doğru cevaba 1, yanlış cevaba 0 verildiği durumlarda
kullanılır.
• KR-21 testte madde analizi yapılmamışsa ve testteki maddelerin
güçlük dereceleri önemli ölçüde birbirine yakınsa (homojen) kullanılır.
*
Ancak KR-20 ile yapılan ölçümler daha güvenilirdir.
• Cronbach Alfa: İç güv. katsayısıdır. Ancak 1-0 şeklinde puanlanmaz
fakat tutuma yönelik ölçme araçları içindir.
Ölçme Standart Hata
• Ölçmede yapılan hataların standart değerini hesaplamak için,
güvenirliğe ve test puanlarının standart sapmasına dayalı olarak
ölçmenin standart hatasının hesaplanması gerekir
• Test puanlarına karışan hatanın yönü (negatif ya da pozitif) bilinmez.
Bu nedenle bir bireyin testten aldığı gerçek puan bir aralık değeri
olarak hesaplanır.
• Bu aralık değerinin hesaplanması için, ölçmenin standart hatası
bireyin aldığı puana bir eklenip bir çıkarılır. Ancak bu işlemle de
bireyin gerçek puanı % 68 olasılıkla belirlenen aralıkta olur.
• Normal olasılık dağılım eğrisine dayalı olarak bir standart hata ile
yapılan kestirimlerin olasılıkları % 68, iki standart hata ile yapılan
kestirimlerin olasılıkları % 95 ve üç standart hata ile yapılan
kestirimlerin olasılıkları % 99 olur.
• Güvenilirliliğin yüksek, standart sapmanın düşük olması standart
hatanın küçük olduğunu gösterir.
Testin Güvenilirlik Katsayısını İstenilen Düzeye Yükseltme
• Spearman-Brown formülü
• Örnek : Güvenirliği (0.60) olan bir testin güvenirliğini
(0.90) çıkarmak için bu teste ne kadar soru eklenmelidir?
• Çözüm: = (1-egk)x ygk
(1-ygk)xegk
6 (testin yeni soru sayısı başlangıçtakinin 6 katı olmalıdır.)
Geçerlilik
• Bir ölçme aracının geçerliği, o aracın kendi amacına (ölçmek istediği
değişkeni ölçmesi) hizmet etmesi ile ilgilidir. Bu nedenle bir ölçme
aracı amaçladığı işlevi yerine getirebildiği ölçüde geçerlidir.
• Bir ölçme aracının ölçmek istediği özelliği başka değişkenlere
veya özelliklere karıştırmadan ölçmesine geçerlik denir.
• Güvenirliği artırmak için yapılacak her türlü çalışma geçerliği de
artırır. Güvenirlik sınavda yapılan hatalarla ilgili iken geçerlik sınavın
amacıyla ilgilidir.
• Geçerlik, ölçme sonucunda elde edilen puanların kullanılış
amaçlarına göre kapsam, yordama, yapı, görünüş gibi çeşitli
türlere ayrılmıştır. Güvenirlik katsayısı 0.00 ile +1.00 arasında
değerler alırken geçerlik katsayısı ise – 1.00 ile +1.00 arasında
değerler alır.
• Geçerlilik=güvenilirlilik karekökü
• Kapsam Geçerliliği, ölçme aracının ölçülmek istenen konu, ünite
yada davranışları kapsama derecesidir.
• Ölçüte Dayalı Yordama: Geleceğe yönelik tahmin amacı güden
testin, bu tahminin düzeyde gerçekleştiğidir.
ÖSS (Yordayıcı)  Akademik Başarı (Ölçüt)
• Ölçüte Dayalı Uygunluk: yordamadan farkı ölçüt yordayıcıdan
hemen önce elde edilmiştir
Deneme Sınavı (Ölçüt)  ÖSS (Yordayıcı)
• Yapı Geçerliği: ölçmeye dayanak olan kuramların geçerliği
sorunudur. Örneğin bir iş yerinde iş doyumunu ölçmek isteriz. Buna
yönelik iş doyumunu ölçen kuramlar oluştururuz. (“iş doyumlu insan
üretken olur” “İş doyumlu insan daha uyumlu olur.”vb.) Bu kuramlar
insanların iş doyumunu ifade edebiliyor mu? Bu sonuç bize yapı
geçerliğini verir.
• Görünüş Geçerliği: Bazı hallerde bir testin görünüşte neyi ölçüyor
olduğu önemli olur. Bir testin ya da bir maddenin ölçmek istediği
değişkeni ölçebiliyor görünmesi, o testin ya da maddenin görünüş
geçerliği olarak adlandırılır
Geçerliği Artırma Yolları
Güvenirliği artırmak için yapılacak tüm çalışmalar geçerliği de artırır
Her sorunun belirtke tablosuna dayalı olarak bir davranışı ölçmesi
geçerliği artırır
Sınavda; kopya çekme, ipuçlarından yaralanma, tahminle doğru
yanıtlanama gibi geçerli olmayan davranışların ya da yolların
kullanılması geçerliği düşürür
Aynı soruların daha sonraki yıllarda tekrar tekrar sorulması, soruların
öğrencilerin bildiği bir kaynaktan aynen alınıp kullanılması,
sınavdan önce soruların verilmesi, kopya çekilmesi, sınav
süresinin kısa oluşundan bazı soruların yanıtlanamaması, sınav
süresinin gereğinden uzun olması durumunda kopya çekilmesine
fırsat verilmesi gibi durumlarda geçerliği düşüren nedenler olarak
sayılabilir.
KULLANIŞLILIK
Bir ölçme aracının ekonomik olması, uygulama süresinin kısalığı,
ölçmeyi yapandan istenen becerinin az olması, hazırlanmasının
ve uygulanmasının kolay olması, puanlanmasının pratik olması ve
puanların yorumlanmasının kolay olması gibi etmenler kullanışlılık
olarak ifade edilebilir. Bir ölçme aracının kullanışlı olması da
aracın güvenirlik ve geçerliğini yükselten etmenlerden biridir.
Sınav Planı Hazırlama
•
•
•
•
•
•
•
•
•
Test Amacının ve Kapsamının Belirlenmesi
Ölçülecek Davranışların Belirlenmesi
Belirtke Tablosu Hazırlama
Soru sayısı belirleme
Soru tipini belirleme
Sınavın güçlük derecesini belirleme
Sınav süresi belirleme
Soruları yazma
Puanlamanın nasıl olacağını belirleme
Testleri Sınıflandırılması
Öğretmen yapımı testler: standart testler objektiftir, ÖSS tarzı testler örnektir,
geçerli ve güvenilirdir
Hız ve güç testleri
Objektif ve Subjektif testler
Kağıt kalem testleri: Geçerlilik-güvenilirliği en düşük testlerdir (yazılıyoklama)
Seçmeli Testler: Geçerlilik-güvenilirliği en yüksek testlerdir.
Öğrenci Özelliklerini Değerlendirmede:
Psikometrik yaklaşım: Öğrencinin hangi özelliklere sahip olduğu ve sentez
düzeyinde olan, sonu ağırlıklı objektif bir yaklaşımdır.
İzlenimci yaklaşım: Öğrencinin hangi özelliklere sahip olduğunun iyi-kötü şeklinde
betimlendiği, subjektif ve sadece sentez değerlendirme düzeyinde yarıyapılandırılmış yaklaşımdır.
Uzlaştırıcı: Klasik değerlendirmelere alternatif olarak üretilen, üst düzey zihinsel
becerileri objektij olarak puanlayan portfolyo değerlendirmeyi baz alan en çağdaş
yaklaşımdır.
Portfolyo (Bireysel Gelişim Dosyaları) İle
Değerlendirme
• Portfolyo; öğrenciye ve başkalarına, öğrencinin bir ya da daha fazla
alandaki başarılarını sunmak için, amaçlı olarak öğrenci
çalışmalarının toplanmasıdır.
• Bu bağlamda, portfolyo öğrenci gelişimini takip edebilmek ve
değerlendirmek için bireyin öğrenme sürecinin göstergesi olarak,
öğrenci çalışma örneklerinin toplanması için kullanılır.
• Bireysel Gelişim Dosyaları (portfolyo); öğrencinin kendi
çalışmalarının değerlendirilmesine katılmasını, her bir öğrencinin
kendi ilerleyişini izlemesini ve bireysel olarak öğrencilerin
performansının izlenmesini sağlar.
• Geleneksel testler öğrenciyi sınırlı bir açıdan ve belli bir zamanda
değerlendirirken portfolyo, öğrencinin gerçekçi koşullar altında,
öğrenmelerini bir süreç olarak değerlendirir.
• Portfolyo, öğrencilerimizin nasıl düşündüğünü, çalıştığını ve ne
kadar öğrendiğini gösterebilmesi için ilk karalamalarından en son
halini almış tüm çalışmaları kapsar.
• Veliler sene boyunca öğrencilerin dosyalarını inceleyebilirler.
Portfolyoların Genel Amaçları
1. Öğrencinin öğrenmelerini süreç içinde ve sağlıklı izlemek,
2. Öğrencide, öğrenme sorumluluğu alabilmeyi ve öz disiplini geliştirmek,
3. Değerlendirme becerisi kazandırmak,
4. Öğrenciyi gerçekçi koşullarda değerlendirmek,
5. Öğrencilerin yeteneklerini sergilemelerine ve ilgi alanlarını keşfetme ve
çoğaltmak,
6. Öğrenme ve değerlendirmeyi birleştirmektir
7. Bir sınav kağıdındaki başarı yerine bir öğretim süreci içinde öğrenci
gelişimini takip etmek,
8. Bir öğrenme süreci içinde öğrencinin, harcadığı zamanı, taslakları,
eksikliklerini, düzeltmelerini, performansını ve çalışmalarını (yani tüm bir
süreci) değerlendirmek,
9. Öğrencinin çalışmasının müsvedde, karalama, düzeltme gibi her
aşamasının önemli ve birbiri ile ilişkili olduğunu fark etmelerini sağlamak,
10. Öğrencinin çalışmalarının en iyilerini seçip portfolyolarına koyarak,
iftihar etmeleri ve çalışmaları için daha çok sorumluluk almalarını
sağlamak,
11. Öğrencinin yaratıcılığını geliştirmek,
Puanlama Anahtarı (Rubric)
• Rubric, bir ölçme veya etkinliğin tamamının ya da bölümlerinin nasıl
puanlanacağının ana hatlarıyla gösterilmesidir. Başka bir tanımıyla
rubric; kabul edilebilir ya da edilemez performans sınırlarının öğretmen
ve öğrenciler için açıkça belirtildiği kriter grubu ölçeğidir. Daha çok yazılı
performansın ve portfolyonun puanlanılmasında kullanılır.
• Avantajları:
• Daha objektif ve tutarlı ölçmeye izin verir,
• Öğretmenler belirli zamanlarda kriterlerini açıklayabilirler,
• Öğrenci, çalışmasının nasıl değerlendirileceğini ve ne beklendiğini
görür,
• Öğrenci kendi performansının değerlendirilmesinde kullanılacak kriterler
hakkında bilgi sahibi olduğundan ilerlemesini sağlayabilir,
• Eğitimin etkisine ilişkin dönüt vermede yardımcı olur,
• Gelişmeyi ölçmek ve belgelendirmek için ölçütler sağlar,
• Öğrenme ve değerlendirme için ortak bir araçtır
“Analitik” ve “Holistik” olmak üzere iki tür rubric bulunmaktadır. Analitik
süreçle ilgilidir. Holistik ise süreçten çok sonuçla ilgilidir.
• Rubric, farklı olarak her bir basamak için kriterlerin mükemmelden
kötüye kadar derecelenmesi söz konusudur ve her derece için
performans kriterlerinin ayrıntılı tanımlanması gerekir
Madde Analizi
Aritmetik ortalama ve Standart Sapma Hes.
O maddeye doğru cevap verenlerin oranı il
yanlış cevap verenlerin oranının çarpımıyla
bulunur.
Madde Güçlük İndeksi ve Ayırt edicilik İndeksi
Madde Güçlük İndeksi
Pj>0,50 Sorular kolay
Pj=0,50 Sorular ideal
Pj<0,50 Sorular zor yada
Öğretim Yetersiz
- Değer testten direkt atılır
0 - 0,19 Zayıf
.20 - .29 Geliştirilmeli
.30 - .39 İyi
.40 ve üzeri Mükemmel
Bağıl Değişkenlik Katsayısı (V):
Hem aritmetik ortalamayı hem de standart sapmayı içeren ve daha çok
bilgi, verici bir değişkenlik katsayısı bağıl değişkenlik katsayısıdır.
V=
Sx
X
100
Kayışlılık (Çarpıklık)
• Çarpık dağılımlarda aritmetik ortalama, tepe değer (mod) ve ortanca
(medyan) arasında çok çeşitli ilişkilerin gözlenmesinin nedeni,
ortalamanın çok yüksek ya da çok düşük puanlardan etkilenerek bu
puanlara doğru kaymasıdır. Bir tek modu bulunan düzgün bir dağılımda
kayışlılığın yönü ve derecesi yaklaşık olarak;
• Ortalama öğrenme düzeyi ve grup başarısı düzeyini gösteren
Aritmetik ortalamadır.
• Aritmetik ort: eşitse Grup başarısı yada en başarılı grubu gösteren
SS ‘dır.
• SS küçükse grup homojen, farklılaşma düşük ve öğrenme düzeyi
birbirine yakındır.
Download

141-14321133681-tuncay_olcme