Uludağ Üniversitesi Eğitim Fakültesi
Hafta Sonu Yoğunlaştırılmış
Pedagojik Formasyon Sertifika Programı
Kasım-Ocak Dönemi 7, 15, 23 ve 31. Gruplar için
Ders Notları
Dr. Abdullah Can
Bir ülkede, güvenlik, sağlık ve EĞİTİM politikaları, aklın ve bilimin rehberliğinde, uzun vadeli bir şekilde değil de,
diğer konularda olduğu gibi, günlük yaşamın getirdiği sıradan gereksinimlerle, günü kurtarmak için belirlenirse,
bu adımların faturası, bir gün, başta gününü kurtarmış nesillerin çoluğuna çocuğuna olmak kaydıyla, gelecek
kuşaklara kesilir…
Görükle’deki bir “konfeksiyon” atölyesinde çalışan bir son ütücünün kahvedeki söylemlerinden…
ÖLÇME ve DEĞERLENDİRME
DERSİN ZAMANI VE SÜRESİ
Ders, 2014-2015 Akademik Yılı Kasım-Ocak dönemi Hafta Sonu Yoğunlaştırılmış Pedagojik Formasyon Sertifika
Programında, 7 haftalık ders programlarında gösterilen zamanlarda, A 324 numaralı derslikte yapılacaktır.
Ders öğleden önceki gruplarda
09.00-10.30 arası bir oturum, 15 dakika ara, 10.45-12.15 arası ikinci oturum şeklinde,
Öğleden sonraki gruplarda ise 13.00-14.30 arası bir oturum, 15 dakika ara, 14.45-16.15 arası ikinci oturum şeklinde
yapılacaktır.
ÖĞRETİM ELEMANI
Öğr. Gör. Dr. Abdullah CAN
Çalışma Odası : B Blok 2’nci Kat 209 numaralı oda
Telefon
: 294 22 33
e-posta
: [email protected]
WEB Sayfası
: http://www.abdullahcan.com
DERSİN VERİLME GEREKÇESİ:
Öğretmen adaylarının sürdürecekleri eğitim öğretim etkinliklerinde, sürecin gerektirdiği ölçme ve değerlendirme işlemlerini doğru
şekilde yapabilmelerine ve değerlendirme sonuçlarını daha nitelikli öğretim süreçleri oluşturmak için kullanabilmelerine olanak
sağlayacak öğretmen yeterliklerini kazandırmak
DERSİN YÜKSEKÖĞRETİM KURULU DOKÜMANLARINDAKİ TANIMI
Eğitimde ölçme ve değerlendirmenin yeri ve önemi, ölçme ve değerlendirme ile ilgili temel kavramlar, ölçme araçlarında
bulunması istenen nitelikler (güvenirlik, geçerlik, kullanışlılık), eğitimde kullanılan ölçme araçları ve özellikleri, geleneksel
yaklaşımlara dayalı olan araçlar (yazılı sınavlar, kısa yanıtlı sınavlar, doğru-yanlış tipi testler, çoktan seçmeli testler, eşleştirmeli
testler, sözlü yoklamalar, ödevler), öğrenciyi çok yönlü tanımaya dönük araçlar (gözlem, görüşme, performans değerlendirme,
öğrenci ürün dosyası, araştırma kağıtları, araştırma projeleri, akran değerlendirme, özdeğerlendirme, tutum ölçekleri), ölçme
sonuçları üzerinde yapılan temel istatistiksel işlemler, öğrenme çıktılarını değerlendirme, not verme, alanı ile ilgili ölçme aracı
geliştirme.
DERSİN KAZANIMLARI
Öğretmen adayları bu dersin sonunda
— Amaca uygun ölçme ve değerlendirme yöntem ve tekniklerini belirler
— Değişik ölçme tekniklerini kullanarak öğrenenin konu alanına ilişkin öğrenmelerini ölçer
— Ölçme sonunda elde edilen verileri analiz ederek yorumlar, öğrencinin gelişimi ve öğrenmesi hakkında dönüt
sağlar
— Ölçme değerlendirme sonuçlarına göre öğretme-öğrenme süreçlerini yeniden düzenler
— Bilgi ve iletişim teknolojilerini kullanarak ölçme değerlendirme sonuçlarını veliler, okul yönetimi ve diğer ilgililer ile
paylaşır.
DEĞERLENDİRME
Dersin yarıyıl sonu başarısına esas değerlendirmesi bir ara sınavı ve bir yarıyıl sonu sınavı ile yapılacaktır. Ara sınavın dönem
başarısına katkısı %40, yarıyıl sonu sınavının ise %60’tır.
DERS İÇİN GEREKENLER
Dersin daha verimli olabilmesi için, öğrencilerin
 Derse, ders notlarını gözden geçirmiş olarak gelmeleri
 Ders süresince derse katılarak, derse ve dersin işleniş tarzına katkı getirmeleri
 Ders içinde veya ders sonrasında (varsa) sorularını, anlaşılamayan ya da açıklanmasına gerek duyulan noktaları
çekinmeden belirtmeleri
kendi başarılarına katkı getireceği düşünüldüğünden önemle istenmektedir.
i
DERSE DEVAM
Dersin değerlendirme etkinliklerine alınabilmek için yarıyıldaki toplam ders saati sayısının %70’ine katılmış olma koşulu, derse
katılan öğrencilerin imzaladığı ders devam çizelgesi ile izlenecektir.
ETİK KONULAR
Öğrencilerin, ders süresince bağlı oldukları yönerge ve yönetmeliklerin koşullarını yerine getirecekleri, her türlü çalışmalarında
ve dönem sonu başarılarına esas tüm değerlendirmelerde kendilerine ait çalışma ve birikimlerini sunacakları kabul
edilmektedir.
DANIŞMA
Öncelikle derse ilişkin konularda olmak üzere, her türlü soru, sorun ve önerilerinizi görüşmek için haftalık ders programımda
belirtilen danışma saatlerinde çalışma odama gelebilirsiniz. Önemli ve ivedi konularda, bu zamanın dışında da görüşme
talebinde bulunmanız, e-posta aracılığı ile soru ve sorunlarınızı iletmeniz mümkündür.
DERSİN GENEL İÇERİĞİ
Ölçme ve değerlendirmenin eğitim öğretim süreçlerindeki
yeri
Planlı öğretim süreçlerinin genel yapısı
Ölçme değerlendirmenin eğitim sürecindeki işlevleri
Ölçme değerlendirme sonuçlarına göre verilecek eğitsel
kararlar
Yapılış amaçlarına göre ölçme türleri
Ölçülebilir amaçların oluşturulması ve ölçülebilir amaç ifade
etme yaklaşımları
Amaçların ifadesinde önemli noktalar
Davranışların aşamalı sınıflandırılması
Yeterliğe dayalı amaç ifadesi
Aşamalı amaç ifadesi
Duyuşsal amaçların ölçülmesinin önemi
Gözlem, görüşme ve Kendini Anlatma
Ölçme değerlendirme ile ilgili temel kavramlar
Ölçme ve değerlendirme kavramları
Ölçmede birim ve sıfır noktası
Doğrudan ve dolaylı ölçme
Mutlak ve bağıl değerlendirme
Değişken kavramı ve özellikleri (Sınıflaması)
Ölçek kavramı ve ölçek çeşitleri
Sınıflama Ölçeği
Sıralama Ölçeği
Aralık Ölçeği
Oran Ölçeği
Ölçmede birim ve ölçmede sıfır kavramları
Ölçme değerlendirme sürecinin basit analizi
Testlerin değişik ölçütlere göre sınıflandırılması
Standart testlerin özellikleri
Öğretmen yapımı sınavların hazırlanması ve uygulanması
Sözlü sınavlar
Yazılı sınavlar
Kısa cevaplı sorulardan oluşan sınavlar
Doğru yanlış tipi sınavlar
Çoktan seçmeli sınavlar
Ölçme Değerlendirmede Yeni Yaklaşımlar
Alternatif Değerlendirme
Özgün (otantik) değerlendirme
Performans değerlendirmesi
Gözlem Formu,
Anekdot Kaydı,
Öz Değerlendirme Formu
Akran Değerlendirme Formu
Performans Ödevi (Bütüncül ve analitik dereceleme
ölçekleri)
Öğrenci Ürün Dosyası (İçeriği ve Değerlendirilmesi)
Sınav planı
Testin Planlanması ve uygulanması
Kopya davranışı ve önlemek için öneriler
Ölçme sonuçlarının anlamlı hale getirilmesinde kullanılan
işlemler
Yüzde
Aritmetik (ve Ağırlıklı) Ortalama
Ortanca
Tepedeğer
Çarpıklık
Genişlik
Çeyrek Sapma
Standart Sapma
Histogram Frekans Poligonu
Gruplandırılmış verilerle işlemler
Ortalama
Ortanca
Tepedeğer
Yüzdelik
Histogramın basit analizi
Sağa çarpıklık
Sola çarpıklık
İlişkinin Analizi (Korelasyon)
Basit doğrusal korelasyon
Nokta çift serili korelasyon
Sıra farkları korelasyonu
Uyum
Standart puanlar
z ve T puanları
Bağıl değerlendirmede standart puanların kullanımı
Uludağ Üniversitesi Bağıl Değerlendirme Sisteminin
kuramsal altyapısı
ii
Normal Dağılım
Olasılık ve normal dağılım
Birim normal dağılım ve özellikleri
Puanların Nota Dönüştürülmesi
Mutlak Değerlendirme sonucu not verme yöntemleri
Bağıl değerlendirmeye dayalı not verme yöntemleri
Ölçümlerin geçerliği
Kapsam geçerliği
Ölçüt geçerliği
Yapı geçerliği
Görünüş geçerliği
Sonuçsal geçerlik
Geçerliği etkileyen faktörler
Ölçme Hataları ve Güvenirlik
Ölçmede hata kaynakları
Hata türleri
Ölçümlerin güvenirliği
Güvenirliğin Kestirilmesi
Test Tekrar test yöntemi
Eşdeğer (paralel) testler yöntemi
Testi yarılama yöntemi
KR–20 güvenirlik katsayısı
KR–21 güvenirlik katsayısı
Cronbach ()güvenirlik katsayısı
Güvenirliği etkileyen faktörler
Geçerlik güvenirlik ilişkisi
Ölçmenin standart hatası ve güven aralığı
Standart hata kavramı
Gerçek puanların güven aralığı
İki test puanı arasındaki farkın güvenirliği
Başarı testlerinde madde analizleri
Madde güçlüğü
Madde ayırıcılığı
Madde güvenirliği
Kısaca Bilimsel Araştırma
Bilimin tanımı
Bilimselliğin ölçütleri
Bilimin işlevleri
Tarama ve Deneysel Araştırma Tipleri
Nitelikli bir araştırma için dikkat edilecek noktalar
Öğretim Programlarının Değerlendirilmesi
Programın Değerlendirilmesi
Öğretimin Değerlendirilmesi
Program Değerlendirmede Felsefi Yaklaşımlar
Program Değerlendirme Modelleri
Testlerin Kullanımına ilişkin Etik Konular
Yeterlik ilkesi
Gizlilik ilkesi
Test güvenliği ilkesi
Test yorumlama ilkesi
Test yayımlama ilkesi
KAYNAKLAR
Anderson David R., et al. (1986) Statistics Concepts and Applications New York: West Publishing Company
Bahar Mehmet, Zekeriya Nartgün ve diğerleri (2006) Geleneksel-Alternatif Ölçme ve Değerlendirme. Ankara :
Pegem A yayıncılık
Baykul Yaşar (2000) Eğitimde ve Psikolojide Ölçme. Ankara : ÖSYM yayınları
Erkan, Serdar ve Gömleksiz Müfit [Editörler] (2008) Eğitimde Ölçme ve Değerlendirme Ankara: Nobel Yayınları
Karip Emin [Ed] (2007) Ölçme ve Değerlendirme. Ankara : Pegem A yayıncılık
Linn,Robert L. & Gronlund Norman E. (1995) Measurement and Assessment in Teaching. New Jersey : Prentice
Hall Inc.
Özçelik, Durmuş Ali (1989) Test hazırlama Kılavuzu Ankara: ÖSYM Eğitim Yayınları 8
Özçelik Durmuş Ali (2010) Ölçme ve Değerlendirme. Ankara : Pegem A yayıncılık
Tan Şeref (2008) Öğretimde Ölçme ve Değerlendirme. Ankara: Pegem Akademi
Tekin Halil (2007) Eğitimde Ölçme ve Değerlendirme. Ankara: Yargı Yayınları
Yıldırım, Cemal (1999) Eğitimde Ölçme ve Değerlendirme. Ankara: ÖSYM Yayınları 4
Yurtseven, Gürcan (2006) Ölçme ve Değerlendirme. Ankara: Nobel yayın Dağıtım
iii
iv
ÖLÇME DEĞERLENDİRMENİN
EĞİTİM-ÖĞRETİM SÜREÇLERİNDEKİ YERİ
PlanlanmıĢ öğretim sürecinin temel ögeleri
Amaçlar
Ġçerik
Süreç
Değerlendirme
EĞĠTĠMDE SĠSTEM YAKLAġIMI
GĠRDĠ
SÜREÇ
ÇIKTI
DÖNÜT
GĠRDĠ
Öğrenci
Öğretmen
Program
Kaynaklar
Yönetim
SÜREÇ
Öğrenci katılımı ve performansı
Öğretmenin performansı
Programın yürütülmesi
Kaynakların rasyonel kullanımı
Yönetimin iĢlevini yerine getirmesi
ÇIKTI
Öğrenci kazanımları
(Program aracılığı ile
kazandırılması/değiĢtirilmesi
öngörülen eğitsel davranıĢlar
DÖNÜT
Mevcut girdilerle baĢlatılan süreç sonunda, öngörülen çıktının elde edilip edilemediği,
edilememiĢ ise bunun nedenleri ve öngörülen çıktının elde edilebilmesi için nelerin yapılması
gerektiği.
Ölçme değerlendirme
Sistemin sistem yaklaĢımı ile iĢletilmesinin en önemli etkenidir
Bir öğretmen yeterliğidir.
Öğretmen öğrenci iliĢkilerinin önemli düzenleyicilerindendir
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
1
ÖLÇME DEĞERLENDĠRMENĠN EĞĠTĠMDEKĠ ĠġLEVLERĠ
Hedeflerin gerçekleĢme düzeyini belirler
Eksik öğrenmeler hakkında bilgi vererek, giderilmesine olanak sağlar
Öğrenme sürecinin etkinliğinin artırılmasını sağlar
Öğrenci geliĢimi hakkında bilgi verir
Kullanılan yöntemlerin, tekniklerin etkililiği hakkında bilgi sunar
Öğrenciye davranıĢın ne Ģekilde değiĢtireceği hakkında dönüt verir
BaĢarı için güdülenme sağlar
Okul baĢarısı hakkında bilgi verir ve okulların etkililiğini kıyaslar
Ailenin öğrenciyi tanımasını sağlar
Öğrencinin kendisini (nesnel olarak) tanımasını sağlar
Bireysel farklılıkların belirlenmesine olanak sağlar
ÖLÇME DEĞERLENDĠRMENĠN KULLANIM YERLERĠ
Ölçme Değerlendirme eğitim öğretim süreçlerinde değiĢik kararlarda kullanılır.
Verilecek kararlar eğer verilere dayanırsa isabetli olur
Ölçme değerlendirme sonucunda elde edilen bilgiler, öğrenciler ve öğretim süreciyle ilgili pek
çok kararda veri olarak kullanılır
Öğretimle ilgili kararlar
Belli konular üzerinde daha fazla durmak
Konu ekleyip çıkarmak / içeriği düzenlemek
Not verme ile ilgili kararlar
DavranıĢın ve baĢarının değerlendirilmesi
Uygun ölçme araçları / ölçme süreçleri kullanmak
Öğrencilerin geliĢim düzeyleri, yeteneklerinin saptanmasının gerekli olduğu kararlar
Sadece test sonuçları öğrenme eksikliklerini belirlerken nasıl giderilebileceği konusunda
bilgi veremeyebilir.
Öğrenci seçimi ve yerleĢtirilmesi ile ilgili kararlar
SBS, LYS, YDS benzeri sınavlarla programlara o programları izleyecek öğrencilerin
seçimi ve yerleĢtirilmesi
Rehberlik ve mesleki yönlendirme ile ilgili kararlar
Tutum ölçekleri, anketlerle kiĢilerin yetenek ve eğilimlerini saptamak
Öğretim programları ile ilgili kararlar
Programların iĢlevselliğinin (hazırlanma amaçlarına ne derece hizmet edebildiğinin)
belirlenmesi [program değerlendirme  baĢarının değerlendirilmesi]
Yönetim ile ilgili kararlar
Okullar arası baĢarı farklılıklarının nedenlerini saptama, öğretmen performansını
değerlendirme
2
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
EĞĠTĠM SÜREÇLERĠNDE ÖLÇME YAPILAN GENEL ALANLAR
BaĢarı: Program aracılığı ile süreçte kazandırılan yeni davranıĢlar, kaydedilen ilerleme
Zekâ: Genel yetenek (Kavrama, öğrenme, sorun çözme)
Özel Yetenek: Müzik, resim, spor gibi alanlardaki yetenekleri
KiĢilik: Ġlgi, uyum, dıĢadönüklük, içedönüklük gibi özellikler
Sağlık: Ruh sağlığı baĢta genel sağlık durumu
YAPILIġ AMAÇLARINA GÖRE ÖLÇME-DEĞERLENDĠRME
Tanıma ve YerleĢtirme için Ölçme Değerlendirme
Ġlgi, yetenek, hazır bulunuĢluluk, kur belirleme, muafiyet gibi nedenlerle, bir sürece ya da
programa baĢlamadan önce (öğrencilerin, izleyen aĢama için gereken önkoĢul niteliğindeki
yeterliklere sahip olup olmadıklarını belirleme ya da aĢamalı süreçlerde bitirilen bir önceki
aĢamanın kazanımlarının elde edilip edilmediğini belirleme amacıyla) gerçekleĢtirilen ölçme
değerlendirme
YetiĢtirme ve Biçimlendirme için Ölçme Değerlendirme
Planlanan süreç boyunca, sürecin planlandığı Ģekilde sürüp sürmediğini saptamak amacıyla
öğrenci geliĢimini ve öğrenme düzeyini izlemek ve gerekirse eksikliklerin giderilmesi için
müdahaleler yapmak amacıyla gerçekleĢtirilen ölçme değerlendirme
Sonuç Görmeye Yönelik (Toptan /Nihai) Ölçme Değerlendirme
Süreç sonunda öğretimin etkililiğini saptamak için, nihai baĢarı ya da performans düzeyini
belirlemek için (Sınıf geçme/ diploma-sertifika ya da sınıf tekrarı gibi nihai kararlar amacıyla)
gerçekleĢtirilen ölçme değerlendirme
ÖLÇÜLEBĠLĠR ÖĞRENME AMAÇLARI BELĠRLEMENĠN YARARLARI
BaĢarının, ilerlemenin gerçekleĢip gerçekleĢmediğini ortaya koyar
Öğrenmenin amaçlarının neler olduğunun açıkça anlaĢılmasını sağlar
Öğrenme sürecinin yönünü belirler ve öğrenenleri güdüler
Kullanılacak strateji, yöntem, araç gereç ve materyallerin belirlenmesine katkı sağlar
ÇeĢitli ölçme araçlarının geliĢtirilmesini sağlar
Öğretim süreçleri sonunda öğrenene kazandırılacak eğitsel davranıĢların olabildiğince ölçülebilir,
bunun için de doğrudan ya da dolaylı olarak gözlenebilir, yani öğrenen tarafından “performans”
olarak sergilenebilecek biçimde olması gerekir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
3
AMAÇLARI ĠFADE EDERKEN
DavranıĢı, onu gerçekleĢtirecek kiĢi (öğrenen) açısından ifade edin [Bir cümle olarak
düĢünecek olursak, cümlede, sergilenecek performansın karĢılığı olan eylemi gerçekleĢtiren öge,
öğreneni ifade etsin]
(+) GeniĢ açının 90 dereceden büyük olduğunu söyleme
(+) Bir değiĢim grafiği üzerindeki noktanın değerini yazma
(+) Verilen bir atasözünü iyi organize edilmiĢ bir paragraflık yazı ile açıklama
( - ) GeniĢ açının 90 dereceden büyük olduğunu öğretme (Öğretmen açısından)
( - ) Cümlenin öznesini doğru Ģekilde buldurma. (Öğretmen açısından)
DavranıĢı olabildiğince gözlenebilir / değerlendirebilir bir eylem ile ifade etmeye çalıĢın
TERCĠH ETMEYĠN
bilme
anlama
önemini fark etme
farkında olma
inanma
ilgilenme
takdir etme
KULLANMAYA ÇALIġIN
listeleme / söyleme / yazma
(sözle yazıyla) tanımını yapma / açıklama
farklı yanlarını söyleme / yazma
(sözle / yazıyla) belirtme
savunma
gösterme
destekleme
Süreci ya da süreçle ilgili konuları değil, süreç sonunda değiĢecek davranıĢı (öğrenme
ürününün kendisi) belirtin
…………ile ilgili uygulamalar yapma
…………yapmaya çalıĢma.
Cümlenin öznesinin doğru biçimde bulunmasına yönelik uygulamalar yapmak
DAVRANIġLARIN (AMAÇLARIN) AġAMALI SINIFLANDIRILMASI (TAKSONOMĠSĠ)
Programın amaçladığı istenen davranıĢların, basitten karmaĢığa, kolaydan zora, somuttan soyuta,
birbirinin ön koĢulu olacak Ģekilde aĢamalı olarak sınıflandırılmasına TAKSONOMĠ
denmektedir.
Eğitim alanında yaygın bir sınıflamaya göre, zihinsel etkinliklerin ağır bastığı davranıĢlar
BĠLĠġSEL, öğrenilmiĢ duyguların kodlandığı davranıĢlar DUYUġSAL, içinde eyleme dayalı
becerilerin yer aldığı davranıĢlar da DEVĠNĠMSEL (PSĠKOMOTOR) davranıĢlar olarak
adlandırılır.
Böyle de olsa, gerçek yaĢamdaki davranıĢlarımız arasında, ait oldukları alanlar açısından, kesin
ayrımlar YOKTUR ve bir davranıĢın aynı zamanda BĠRDEN FAZLA ALANA GĠREN değiĢik
boyutları vardır.
4
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Benjamin Bloom (1956:62–195)‟un BĠLĠġSEL alanı sınıflaması
Bilgi (knowledge)
Kavrama (comprehension)
Uygulama (application)
Analiz (analysis)
Sentez (synthesis)
Değerlendirme (evaluation)
Bloom, B.S;M.S. Engelhart, E.F.Fruist; W.Hill and O.Kratwohl (1956) Taxonomy of Educational Objectives: The
Classification of Educational Goals: Handbook 1. The Cognitive Domain. New York: Longman
Krathwohl (1964:98-175)‟un DUYUġSAL alanı sınıflaması
Alma (receiving)
Tepkide bulunma (responding)
Değer verme (valuing)
Örgütleme (organizing)
KiĢilik haline getirme/ NitelenmiĢlik (characterization by a value or value complex)
Krathwohl, D.R.; B.S.Bloom and B.B.Masia (1964) Taxonomy of Educational Objectives Handbook II: Affective
Domain: New York
Simpson (1966)’ un DEVĠNĠMSEL (PSĠKOMOTOR) alanı sınıflaması
Algılama (perception)
Kurulma (set)
Kılavuzla yapma (guided response)
MekanikleĢme (Mechanism)
Beceri haline getirme (Complex overt response)
Duruma uyma (Adaptation)
Yaratma (Creation)
Simpson E.J.(1966) The Classification of Educational Objectives, Psychomotor Domain. Illinois
BLOOM’UN YENĠDEN DÜZENLENMĠġ BĠLĠġSEL ALAN TAKSONOMĠSĠ
Benjamin Bloom‟un yaptığı BiliĢsel Alanın sınıflaması, fazlasıyla davranıĢçılığın izlerini taĢıdığı
gerekçesiyle ve daha sağlıklı ölçme sonuçları elde etme adına, Bloom‟un eski öğrencisi Lorin
Anderson‟un giriĢimciliğinde, öğrenme psikologları, program geliĢtirmeciler ve ölçme
değerlendirmecilerden oluĢmuĢ bir grubun 6 yıllık çalıĢması sonunda, 2001 yılında yeniden
düzenlenmiĢtir.
Bu düzenlemeye göre biliĢsel alanın basamakları aĢağıdaki Ģekildedir (Anderson & Krathwohl,
2001, s. 67–68).
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
5
Hatırlama (remembering) [Gördüğünde tanıma, bellekten geriye çağırma]
Verilen bir dizi şekilden, konuyla ilgili olan şekli diğerleri arasından seçerek işaretleme
Anlama (understanding) [Öğrendiklerini kendi ifadeleriyle açıklama, yorumlama, özetleme,
örneklendirme, karĢılaĢtırma, çıkarımda bulunma]
Geçen 10 yılın nüfus kayıtlarını kullanarak, ülkenin nüfus artışını bir grafikle ifade etme
Uygulama (applying) [Öğrenilenleri uygulama, bilinenleri kullanarak belli iĢlemleri
gerçekleĢtirme, sorunlara çözüm getirme]
Verilen konuya ilişkin bir paragraf yazımında yazım kurallarını doğru olarak kullanma.
Analiz (analyzing) [Bütünü, onu oluĢturan parçalara ayırma; ayrıĢtırma, örgütleme ve atfetme ile
parçaların birbirleriyle ve oluĢturdukları bütünle iliĢkilerini görme]
Verilen bir cümleyi ögelerine ayırıp, her birisinin hangi öge olduğunu gösterme
Değerlendirme (evaluating) [Ölçütlere, standartlara dayalı olarak yargıda bulunma, eleĢtirme]
Verilen iki öğretim yöntemini uygulama maliyeti ile sağladığı yarar açısından değerlendirilerek
yöntemlerden daha uygun olanını belirleme
Yaratma (creating) [Anlamlı ve iĢlevsel bir bütün oluĢturma, özgün bir eser ortaya koyma,
üretme]
Verilen bir konuya ilişkin duygu ve düşüncelerini, belli bir edebi türe uygun olarak yazma.
Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). A taxonomy for learning, teaching and assessing: A revision of
Bloom's Taxonomy of educational objectives: Complete edition, New York : Longman.
BiliĢsel alanın yeni yorumunda bilgi, 4 boyutta ele alınmıĢtır. Bunlar
OLGUSAL BĠLGĠ
KAVRAMSAL BĠLGĠ
ĠġLEMSEL BĠLGĠ
BĠLĠġÜSTÜ BĠLGĠ dir.
BĠLGĠ
BOYUTU
OLGUSAL
BĠLGĠ
KAVRAMSAL
BĠLGĠ
ĠġLEMSEL
BĠLGĠ
BĠLĠġÜSTÜ
BĠLGĠ
6
Hatırlama
Anlama
BĠLĠġSEL SÜREÇ BOYUTU
Uygulama Analiz
Değerlendirme Yaratma
Listeleme
Özetleme
Sınıflama
Sıralama
Derecelendirme
BirleĢtirme
Tanımlama
Yorumlama
Deneme
Açıklama
Değer biçme
Tasarlama
TablolaĢtırma
Kestirme
Hesaplama
Sonuçlandırma
OluĢturma
Uygun biçimde
kullanma
Yürütme
Yapılandırma
Farkını
görme
Elde etme
Eyleme dökme
GerçekleĢtirme
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
AMAÇ ĠFADE ETMEDE YAKLAġIMLAR
Yeterliğe Dayalı Amaç Yazma YaklaĢımı (Robert Mager)
Bu yaklaĢımda, süreç sonunda öğrenenlerin neyi hangi standartta yapabileceklerinin açık ve
net olarak ifade edilmesi amaçlanmaktadır. Bu yaklaĢıma göre, amaç olarak ifade edilecek
eğitsel bir davranıĢın Ģu üç konuyu içermesi istenir. Bunlar
DAVRANIġ Öğrenenin değerlendirilebilir performans olarak sergileyeceği davranıĢın ne olduğu
KOġUL DavranıĢın hangi ortamda ya da koĢullar altında sergileneceği
ÖLÇÜT Verilen koĢullar altında sergilenen davranıĢın yeterli ya da kabul edilebilir sayılmasının
asgari derecesi
İçinde sıfatlar bulunan cümlelerin oluşturduğu bir paragrafta, sıfatların %75’inin altını çizme
Köy Enstitüleri ile ilgili bir belgesel izlemenin ardından, Köy Enstitülerinin kapatılış nenlerinden
üç tanesini söyleme
Asal ve asal olmayan sayılardan oluşan 20 elemanlı bir sayı kümesinde, asal sayıların yarısını
seçme
AĢamalı Hedef Yazma YaklaĢımı (Norman Gronlund ve Robert Linn)
Bu yaklaĢımda amaç iki aĢamalı olarak ifade edilir.
Birinci aĢama üst düzey amaç, yani HEDEF (öğrencinin süreç sonunda sergilemesi beklenen
TEMEL BECERĠ ya da sahip olması gereken TEMEL BĠLGĠ) olarak ifade edilir. Bu, daha çok,
öğrenenin süreç sonunda ULAġACAĞI DURUMU BETĠMLER.
Ġkinci aĢama, geliĢimsel amaçlar ise, öğrencinin o duruma ulaĢabilmesi için sergilemesi gereken
bir dizi davranıĢı içerir.
Alan :DuyuĢsal
Düzey: Değer Verme
Hedef :Sınıfını temiz tutmayı kendine iĢ edinme
DavranıĢlar:
Yeri ve zamanı geldiğinde konuyu savunan konuĢmalar yapma
Konu ile ilgili tartıĢmalara girme
Konuyu savunan yazılar yazma
Konuyla ilgili toplantılar düzenleme
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
7
Alan :BiliĢsel
Düzey: Uygulama
Hedef : Sıfatları kullanma
DavranıĢlar:
Cümle içinde geçen sıfatları belirler.
DeğiĢik tipteki sıfatları birbirinden ayırarak her birisi için örnekler verir.
Sıfatları kullanarak cümleler yazar.
DeğiĢik özellikleri ifade etmek için uygun sıfatların kullanıldığı cümleler yazar
DUYUġSAL AMAÇLARIN ÖLÇÜLMESĠ
Bir öğretmen olarak kuĢkusuz değiĢik alanların değiĢik basamaklarında davranıĢları amaçlayacak
ve bunların gerçekleĢip gerçekleĢmediğini ölçeceksiniz. Ancak, ihmal edildiğini düĢündüğüm
DUYUġSAL ALAN ile KĠġĠSEL ÖZELLĠKLERE dikkat çekebilmek için bu kısa bölümü
buraya koyuyorum.
DuyuĢsal niteliklerin ölçülmesinde (STANDART ÖLÇME ARAÇLARI KULLANMA DIġINDA) sık
kullanılan teknikler GÖZLEM, GÖRÜġME ve KENDĠNĠ ANLATMA Ģeklinde sıralanabilir. Bu
tekniklerle ölçülecek kiĢisel özellikleri ortaya koymak için de Ģu tanımlar yararlı olabilir:
Tutum: Bireye atfedilen, onun duygu ve düĢünceleri ile iliĢkilendirilebilecek bir nesne ya da
olaya karĢı, duygu, düĢünce ve davranıĢlarını oluĢturan eğilimdir. ĠĢlevsel anlamda örneklemek
gerekirse, bireyin yabancı dili sevmesi, yabancı dil öğrenmekten zevk alması, yabancı dil
derslerine isteyerek katılması, bireyin yabancı dile karĢı OLUMLU TUTUMUNUN bir
sonucudur.
Değer: Bireylerin, “doğru” veya “iyi” ya da “yanlıĢ” veya “kötü” ile ilgili temel düĢünce ve
inançlarıdır. Bu değerler çok geniĢ bir yelpaze oluĢtururlar. Örneğin, “başarı, dürüstlük, adalet,
barış, işbirliği, bilgi, düzen, güven, sorumluluk, yenilik, açıklık, para, statü, liderlik, yaratıcılık,
vatan sevgisi, bağımsızlık, şeref, sağlık” değer örnekleri arasında sayılabilir.
Ġlgi: Bireyin güdüleriyle ve gereksinimleriyle iliĢkili olarak, özel bir çaba sarf etmeden,
zorlamasız bir Ģekilde, serbestçe, seçtiği, dikkat ettiği, gözlediği, üzerinde düĢündüğü ve
uğraĢmaktan haz duyduğu etkinlikler ya da etkinlik alanlarıdır. Eğer bir öğrenci ders aralarında
zevk aldığı için matematik problemi çözüyorsa matematiğe ilgisi olduğu söylenebilir.
Bireyi diğer bireylerden ayıran, bireyin tutarlı olarak sergilediği, bireye özgü özellikler
bütünü KĠġĠLĠK olarak adlandırılır.
GÖZLEM:
KiĢiyi daha iyi tanımak, geliĢimini ve öğrenmelerini daha yakından görebilmek amacıyla değiĢik
zamanlarda bireylerin (gözleme esas) davranıĢlarını, becerilerini, tutumlarını, alıĢkanlıklarını,
çevresiyle iliĢkilerini izlemek.
Planlı (düzenlenmiĢ) ve rastgele (tesadüfi) olmak üzere iki tür gözlem yapılır.
Planlı gözlemde ise kimin nerede, hangi davranıĢ(lar)ının, ne Ģekilde gözleneceği, gözlem
yapılırken ne tür bir form kullanılacağı önceden belirlenmiĢtir.
8
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GÖZLEM YAPILIRKEN;
Gözlemci tarafsız ve objektif olmalıdır.
Gözlemci psikoloji ve öğretim konularında yeterli bilgiye sahip olmalıdır.
Gözlemcinin duyu organlarında sorun olmamalıdır.
Gözlenen davranıĢ, “olduğu gibi” doğal bağlamında gözlemelidir.
Gözlemci, öğrencileri yalnız bireysel durumlarda değil grup içinde de gözlemelidir.
Gözlemci, gözlemi geniĢ bir zamana yaymalı, gözlemi mümkün olduğu kadar (değiĢik durum ve
yerde) tekrarlamalıdır
Gözlemci kayıt tutmalı gözlenen kiĢinin söylediklerinden çok yaptıklarını kaydetmelidir.
Gözlemci kayıt tutarken, yapacağı gözlem için hazırlanmıĢ GÖZLEM FORMU kullanmalıdır,
Kayıtlar kısa, açık ve sonradan hatırlanabilecek Ģekilde olmalıdır.
Gözlemci, gerçek davranıĢlar ile gösteriĢ için yapılan davranıĢları birbirinden ayırt edebilmelidir.
Gözlem sonuçları öğrencileri etiketlemek için kullanılmamalı, sonuçlar herkesle
paylaĢılmamalıdır
GÖRÜġME
GörüĢme belli bir amaçla, yüz yüze gelen iki veya daha fazla kiĢinin, sözel ve sözel olmayan
davranıĢlarıyla gerçekleĢtirdikleri bir etkileĢim sürecidir. Ġyi bir görüĢme, teknik ve beceriyi ve
uzmanlığı gerektirir.
GörüĢmenin üstün yanlarından birisi, oldukça fazla bilgi sağlamasıdır. Edinilecek bilginin yanı
sıra, görüĢülen bireylerin giyim-kuĢamı, beden dili, ses tonu ve genel davranıĢları da doğrudan
gözlenmiĢ olur.
Okuma yazma bilmeyen bireylere de uygulanabilir (Okul öncesi çocuklar)
GörüĢmede bilinçli olarak saptanmıĢ bir amaç vardır.
Belli bir amacı olduğu için görüĢmenin kapsamı bu amaca yönelik bir plan ve düzen içinde
yürütülür.
GörüĢmeci amacın gerçekleĢtirilebilmesi için etkileĢimi düzenler
GörüĢmeler çoğunlukla rastgele değil belli bir zamanda, yerde ve sınırlı bir süre için düzenlenir
GörüĢülen kiĢinin konu hakkındaki duygu ve düĢüncelerini rahat bir Ģekilde ifade etmesine fırsat
verilmelidir
GörüĢme sonuçlarının kayıt edilmesi gerekir. Kayıt amacı ile önceden hazırlanmıĢ araçlar ve
ölçekler kullanılacağı gibi düz yazılı raporlarda düzenlenebilir. Duruma ve kullanılan aracın
niteliğine bağlı olarak, bazı bilgiler görüĢme sırasında kaydedilebilir; bazı bilgilerin ise
görüĢmeden sonra yazılması gerekli olabilir.
GörüĢmede elde edilen bilgiler görüĢülen bireyin vermek istedikleri bilgiler ile sınırlıdır
Otobiyografi, günlük yazma, sosyometri, drama, arzu listesi KENDĠNĠ
ANLATMA teknikleri arasında sayılabilir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
9
ÖLÇME DEĞERLENDİRME İLE İLGİLİ
TEMEL KAVRAMLAR
ÖLÇME: Bir varlığın ölçmeye konu olan belli bir özelliğe sahip olup olmadığının, sahipse sahip
oluĢunun ya da sahip oluĢ derecesinin belirlenip, bunun sayı ya da sembollerle ifade edilmesidir.
Sınıfın mevcudu
Kalemin boyu
AyĢe‟nin ağırlığı
Suyun sıcaklığı
Orhan‟ın problem çözme becerisi
Sıvının yoğunluğu
Arabanın hızı
Duvarın rengi
Ölçülecek özelliklere, sayı ve sembol atama iĢlemidir.
DEĞERLENDĠRME: Ölçme sonuçlarının bir kriter (ölçüt) ile kıyaslanarak sonuçta bir yargıya
varılması iĢlemidir.
Bir sınav yapılarak öğretim süreci sonunda gerçekleĢen davranıĢ değiĢikliği miktarının sayı ile
ifade edilmesi yani 100 tam not üzerinden bir sınav yapılarak, bir sınav kâğıdının puanlanması
ÖLÇMEDĠR. Öğrencinin sınavdan aldığı bu puanı, baĢarılı sayılma ölçütü olarak belirlenmiĢ 50
puanla kıyaslayarak, öğrencinin baĢarılı ya da baĢarısız sayılması ise değerlendirmedir.
ÖLÇMEDE BĠRĠM: Ölçmede ilgilendiğimiz özellikleri sayı ya da sembollerle ifade ederken,
ölçme sonuçlarını daha anlaĢılabilir kılmak için kullandığımız tanımlanmıĢ özellik miktarına
birim denir. Uzunluğu sayı ile ifade ederken tanımlanmıĢ bir uzunluk ile karĢılaĢtırıp, o
uzunluğun kaç tanımlanmıĢ uzunluktan ibaret olduğunu söyleriz. Doğal ve tanımlanmıĢ birim
olmak üzere iki tür birimden söz edilebilir.
Doğal ya da kendiliğinden bir bütünlüğü olan varlıklara iliĢkin birimler doğal birim olarak
adlandırılır. Sınıftaki öğrencilerin sayısını, ağaçtaki elmaların miktarını, otoparktaki araçların
adedini, bir sayfada yazılı olan kelimelerin sayısını belirlemede kullanılan birim doğal birimdir.
Bir değiĢkenin hangi miktarına bir (1) birim deneceği kiĢilerce kararlaĢtırılmamıĢ, varlığın kendi
bütünlüğünce belirlenmiĢtir.
TanımlanmıĢ birimde ise, ölçülecek varlığın özelliğinin ne kadarına bir (1) birim deneceği
kiĢiler tarafından belirlenmiĢtir. Zamanın belli bir miktarına saat, dakika, saniye denmesi,
uzunluğun belli bir miktarına metre, inç denmesi, kütlenin belli bir miktarına gram, kilogram
denmesi kiĢilerce yapılmıĢ tanımlara dayalıdır.
(TanımlanmıĢ) birimlerin, eĢitlik, genellik (yaygınlık), amaca uygunluk gibi özelliklerinin
olması istenir.
1-Birimlerin eĢitliği: Ölçülen değiĢkende, bir (1) birim olarak adlandırılan miktarın, birden
fazlası söz konusu olduğunda, bunların miktarca birbirinin aynı olması demektir. Uzunluk
değiĢkeni için metre ya da santimetre olarak tanımlanan miktar her ölçme aracında aynı
olmalıdır. Uzunluk ölçümünde kullanılan karıĢ birimi (tam anlamıyla) eĢitlik özelliğini
karĢılamaz.
10
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
2-Birimlerin genelliği: Bir birimin genelliği, yaygın olması, pek çok kiĢi tarafından bilinmesi ve
kabul görmesi anlamına gelir. Uzunluk birimi olarak santimetre inçten daha geneldir. Kütle
birimi olarak da kilogram, pound‟dan daha geneldir.
3-Birimlerin amaca uygunluğu: Birimin ölçülecek değiĢkenin özelliğine uygun olmasıdır.
Gökcisimlerinin kütleleri için “ton”, aralarındaki mesafe için “ıĢık yılı” kullanılırken, altın bir
yüzüğün kütlesi için “miligram”, fiberoptik kablonun çapı için mikrometre gibi birimler
kullanılır.
ÖLÇMEDE SIFIR NOKTASI
Ölçeklerin baĢlangıçlarını ifade eden iki tür sıfırdan söz edilebilir. Eğer sıfır, değiĢkenin
ilgilenilen özelliğinin gerçek anlamda yokluğunu, hiç olmamasını ifade ediyorsa, buna doğal /
gerçek / mutlak sıfır denir. Sınıftaki öğrencilerin sayısının, kiĢinin boyunun, otoparktaki araç
sayısının ifadesinde kullanılan sıfır doğal / gerçek / mutlak sıfırdır.
Eğer ölçmede sadece referans olsun diye bir baĢlangıç noktası belirlemek için kiĢilerce bir sıfır
noktası seçilmiĢse, buna da tanımlanmış / bağıl / keyfi / itibari sıfır denir. Sıcaklık ölçerken
kullanılan sıfır, zamanı ölçerken kullanılan sıfır (gece saat 00.00), coğrafyada rakımı ölçerken
kullanılan sıfır tanımlanmış / bağıl / keyfi / itibari sıfır için örnektir. Sıcaklık için suyun donma
derecesi, yükseklik için deniz seviyesi gibi keyfi referanslar alınmıĢtır. Sınav puanlamada
kullanılan sıfır tanımlanmış / bağıl / keyfi / itibari sıfırdır ve bu sıfır ölçülen özelliğin olmadığı
anlamına gelmez.
Ölçme iĢleminde baĢlangıç noktası olarak kullanılan sıfır (0) gerçek /mutlak sıfır ise, bu tür
ölçmeye MUTLAK ÖLÇME denebilir. TanımlanmıĢ, bağıl, keyfi sıfır noktasını baĢlangıç alan
ölçmelere BAĞIL ÖLÇME denebilir. Ancak, ölçme ve değerlendirme kavramlarının
FARKINDAN DOLAYI, bu ifadelerin “Mutlak Değerlendirme” ve “Bağıl Değerlendirme” ile
KARIġTIRILMAMASINA ÖZEN GÖSTERĠLMELĠDĠR.
Ölçme DOĞRUDAN ya da DOLAYLI olarak yapılır..
DOĞRUDAN (Temel) ÖLÇME: Varlığın ölçülecek özelliğinin dolaysız biçimde gözlendiği
durumda, varlığın özelliğinin doğrudan birimle kıyaslanarak gerçekleĢtirilen ölçmedir.
Kalemin boyu = cetvel ile [tanımlanmıĢ bir “boy” birimi (cm) ile kıyaslanıp, kalemin kaç birim
boyunun olduğunun doğrudan gözlenmesi ]
AyĢe‟nin kütlesi = terazi ile [tanımlanmıĢ bir kütle birimi (kg) ile kıyaslanıp, AyĢe‟nin kaç birim
kütleye karĢılık geldiğinin gözlenmesi ]
Sınıfın mevcudu = belli bir araç kullanmadan [doğal birimi olan varlığı sayılarla eĢleĢtirme]
DOLAYLI ÖLÇME Varlığın ölçmeye esas olan ancak doğrudan gözlenemeyen özelliği ile
aralarında iliĢki olan ve gözlenemeyen özelliğin göstergesi olan ama gözlenebilen baĢka bir
özellik aracılığı ile ölçmenin gerçekleĢtirilmesine dolaylı ölçme denir.
Kuvvet gözlenebilen bir özellik değildir.
Ancak bir yaya uygulandığı zaman, yayda gözlenebilir bir değiĢim (uzama) oluĢturur.
Uygulanan kuvvet ile yayın uzaması arasında bir iliĢki olduğu için uzamaya bakarak kuvvetin
miktarına iliĢkin bir gözlemde bulunulabilir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
11
Sıcaklık doğrudan gözlenebilen bir özellik değildir. Ancak içinde cıva ya da alkol olan ince bir
borudaki cıvayı ya da alkolü genleĢtirerek, gözlenebilir bir değiĢime yol açabilir. Sıcaklık ile
alkoldeki genleĢme arasında bir iliĢki olduğu için, genleĢmeye bakarak sıcaklığın miktarını
gözleyebiliriz.
Bilgi gözlenebilen bir özellik değildir
Öğrenciye verilen bir sınavda soruları yanıtlaması bilgisinin bir göstergesi olarak düĢünülür.
Dolaylı Ölçmede, termometre, yay, sınav örneklerinden olduğu gibi, gözlenebilir baĢka bir
değiĢken kullanılırsa, buna GÖSTERGEYLE ÖLÇME de denir.
Dolaylı ölçmenin baĢka bir türü de, özelliğin kendisini ölçmek yerine, ilgili baĢka özellikleri
ölçerek, bu değiĢkenler arası bağıntıdan yararlanmaktır. Buna da TÜRETĠLMĠġ ÖLÇME denir.
Hareketli bir cismin ortalama hızını belirlerken, zamanı ve mesafeyi ölçüp, hızı bu sonuçlardan
yararlanarak buluruz. Bir cismin yoğunluğunu ölçmek istediğimizde, hacmini ve kütlesini ölçeriz.
Bir öğrencinin yarıyıl sonu baĢarısını ölçmek için ara sınav ve yarıyıl sonu sınav puanlarıyla
iĢlemler yaparız.
DEĞERLENDĠRME BĠÇĠMLERĠ
Değerlendirme biçimleri, ölçütün belirlenme biçimine göre, MUTLAK DEĞERLENDĠRME ve
BAĞIL DEĞERLENDĠRME olarak iki türlü yapılabilir.
MUTLAK DEĞERLENDĠRME
Eğer değerlendirmede, daha ölçüm sonuçları ortaya çıkmadan önce belirlenmiĢ, değiĢmeyen
bir ölçüt varsa, bu tür değerlendirme mutlak değerlendirmedir. BaĢarılı sayılmak için, 100 puan
üzerinden bir sınavdan 50 ve üzeri not almak ya da 100 metreyi 12 saniyenin altında koĢmak,
mutlak değerlendirmeye örnektir.
BAĞIL DEĞERLENDĠRME
Değerlendirme ölçütü, grubun performansına bağlı olarak ölçme sonuçları elde edildikten sonra
buna bağlı ortaya çıkıyorsa, bu tür değerlendirme bağıl değerlendirmedir. BaĢarılı sayılmak için,
sınıf ortalamasının üzerinde puan almak, 100 metrelik koĢuyu ilk 5 kiĢinin içinde tamamlamak
bağıl değerlendirmeye örnektir.
MUTLAK DEĞERLENDĠRMENĠN ÖNERĠLDĠĞĠ DURUMLAR
Konular arasında aĢamalılık iliĢkisi varsa ve bir bölüm izleyen bölümün önkoĢulu niteliğindeyse
Aralarındaki yoğun sayısal ve mantıksal iliĢkiler olan konularda bu iliĢkilerin tümüyle
kavranması gerekiyorsa
Dil öğrenme baĢta olmak üzere, amaca ulaĢmak için belli bir düzeyde performans sergilenmesi
gerekiyorsa
Tıp, bazı mühendislik alanları, pilot yetiĢtirme, askerlik gibi, görevin yapılması için belli bir
düzeyde becerinin mutlaka kazanılması gereken kritik alanlarda
Niteliğin yüksek tutulmak istendiği, uygulamaların belli standartlara göre yürütüldüğü öğrenme
ortamlarında
12
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
SINAV / TEST
DavranıĢ bilimlerinde dolaylı ölçme yapılır. Eğitim öğretim süreçleriyle kazandırdığımız
davranıĢları ölçmede kullandığımız araca test ya da sınav denir. Her ne kadar, günlük kullanımda
TEST ve SINAV terimleri birbirlerinin yerine kullanıyor olsa da, terminolojik açıdan, SINAV
teriminin TEST terimine göre daha geniĢ bir anlamı vardır.
Bir SINAV içinde farklı TESTLER bulunabilir.
LES (Lisansüstü Eğitim Sınavı) içinde SÖZEL ve SAYISAL TESTLER vardır.
DEĞĠġKEN
Üzerinde ölçüm yapılacak varlığın nitel ya da nicel olarak değiĢiklik gösterebilen özelliğine
DEĞĠġKEN denir. Uzunluk, ağırlık, sıcaklık, medeni hal, saç rengi gibi, farklı varlıklar için
değiĢik değiĢik değerler alabilen bu özelliklerine değiĢken denir.
NĠCEL DEĞĠġKENLER
DeğiĢkenin aldığı değer SAYI ya da MĠKTAR olarak ifade edilebiliyorsa, bu sayı değer
derecelendirilebiliyor ve sıralanabiliyorsa, buna tip değiĢkenler NĠCEL değiĢkenler denir.
Boy, kilo, aylık gelir, matematik puanı, öğrenci sayısı nicel değiĢkenlere örnektir.
NĠTEL DEĞĠġKENLER
DeğiĢkenin özelliği onu diğerlerinden ayırt ediyorsa, sınıflıyorsa, belli bir kategoriye dahil
ediyorsa, bu tip değiĢkenler NĠTEL değiĢken olarak adlandırılır.
Cinsiyet, medeni hal, inandığı dini, saç rengi, doğum yeri nitel değiĢkenlere örnektir.
Takım oyunlarındaki forma numaraları, adres göstergesi olan sokak kapı numaraları, rakamlarla
ifade edilseler bile iĢlevleri sınıflamak olduğu için nitel değiĢkenlerdir.
Nitel değiĢkenlerin KATEGORĠLERĠ vardır. Cinsiyet 2 kategorili, medeni hal 3 kategorili, bir
Türk vatandaĢı için nüfusa kayıtlı olduğu il 81 kategorili nitel değiĢkenlerdir. Nitel değiĢkenler
derecelendirilemezler ve sıralanamazlar.
SÜREKLĠ VE SÜREKSĠZ DEĞĠġKENLER
NĠCEL değiĢkenler aldıkları değere göre de sınıflandırılabilirler.
Eğer bir değiĢken ölçümde sadece TAM SAYILARLA ölçülen belli değerler alabiliyorsa buna
SÜREKSĠZ değiĢken denir. Sınıftaki öğrenci sayısı, bir yarıyılda kayıt yaptırılabilecek ders
sayısı, bir otoparktaki araba sayısı, bir kütüphanedeki kitap sayısı nicel ancak süreksiz
değiĢkenlerdir.
Eğer değiĢken ölçüm esnasında rasyonel sayılarla (KESĠRLĠ SAYILARLA) ifade edilebilen
sonsuz sayıda değer alabiliyorsa, buna SÜREKLĠ DEĞĠġKEN denir. Uzunluk, zekâ, ağırlık gibi
değiĢkenler sürekli değiĢkenlerdir.
ÖLÇEK KAVRAMI
Ölçek sözcüğünün, belli bir büyüklüğü küçültme oranı (haritanın ölçeği 1/1000) cetvel, metre
gibi ölçme aracının üzerindeki bölümler (milimetre / santimetre) davranıĢ ya da tutumları
belirlemek için geliĢtirilen ölçme aracı (tutum ölçeği) gibi anlamları olsa da, buradaki anlamı
ölçme iĢleminde ölçülen nitelikleri sembollerle ya da sayılarla ifade etmede kullandığımız
sistemdir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
13
SINIFLAMA ÖLÇEKLERĠ (Nominal / Categorical Scales)
Üzerinde ölçüm yapılan varlıkları, belli özelliklerine göre sınıflayan, kategorilere ayıran, sadece
tanımlama ve ayırt etme amacına yönelik ölçektir. Cinsiyet, doğum yeri, medeni hal, gözlük
kullanma/kullanmama gibi nitel değiĢkenlerin kullanıldığı ölçek sistemidir. Bu ölçekte ölçülen
özellikler miktar göstermez. Bu ölçekler, simetriktir [A ile B aynı kategoride ise, Ali Veli‟nin
akrabası ise Veli de Ali‟nin akrabasıdır. (A=B ise B=A‟dır)] ve geçiĢlidir [A, B, C aynı
kategorideyse, AyĢe Fatma‟nın kardeĢiyse ve Oya‟da Fatma‟nın kardeĢiyse, AyĢe Oya‟nın da
kardeĢidir. (A=B ve B=C ise A=C‟dir) ]
SIRALAMA ÖLÇEĞĠ (Ordinal Scales)
DeğiĢkenlerin aldıkları değerlere göre, sadece büyükten küçüğe ya da küçükten büyüğe doğru
sıralanması esasına dayanan bir ölçektir. Bu ölçekte özellikler sadece sıra gösterir ancak birisinin
diğerinden kaç kat fazla / büyük ya da az/küçük olduğu hakkında bilgi veremezler.
Okulların itibarı
Öğretim kademeleri (okul öncesi, ilköğretim, lise, üniversite, yüksek lisans, doktora)
Bu ölçekle değiĢkene atanan sayı, onun asıl aldığı değeri (puan, yaĢ, zeka vs) değil, grup içinde
bu değerlere göre yapılan sıralamadaki yerini belirtir. Bu nedenle, bu ölçekteki değerlerle,
adlandırma, sınıflandırma, büyüklük-küçüklük kıyaslamaları yapılabilirken, toplama çıkarma
bölme işlemleri ve miktar kıyaslamaları yapılamaz.
GeçiĢlidir: A>B ise B>C ise A>C‟dir ancak asimetriktir.
Sıralama ölçekleri oluĢturulurken, tekrarlanan değerlere, o değerlerin normal sıralarının aritmetik
ortalaması verilir.
ARALIK ÖLÇEĞĠ (Interval Scales)
Verilerin (ölçmeyi yapana ya da kullanılan ölçme aracına göre değiĢebilen) göreceli bir baĢlangıç
noktası saptanarak ve eĢit aralıklarla bölünerek sayısallaĢtırıldığı bir ölçek tipidir. Bu ölçekle
ölçülen özellikler eĢit aralıklarla birimlenmiĢ bir ölçekle belirlenir ve aynı ölçekle ve birlikte
ölçülen varlıkların özellikleri birbirleriyle kıyaslanabilir. Aralık ölçeğinde herhangi iki değer
arasındaki fark eĢittir. (20 ile 30 arası fark, 70 ile 80 arası farka eĢittir ve bu nedenle, miktar
kıyaslamaları yapmak olasıdır.) Bu ölçekte göreceli olarak alınan ve sıfır ile tanımlanan
baĢlangıç değeri, ölçülen obje ya da kavramın ölçmeye esas özelliğinin hiç olmadığı
anlamına gelmez.
Deniz düzeyinin sıfır olarak alındığı rakım (yükseklik) ölçümü,
Gece yarısının, Ġsa‟nın doğumunun baĢlangıç olarak alındığı zaman ölçümleri,
Suyun donmasının baĢlangıç olarak alındığı sıcaklık ölçümü
Sınav baĢarısını, zekâyı, yetenek özelliklerini ölçen standart testlerin kullandığı ölçekleri bu
kategoriye girer.
14
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ORAN ÖLÇEĞĠ (Ratio Scales)
Aralık ölçeğinin bütün özelliklerini taĢıyan ancak, baĢlangıç olarak alınan 0 (sıfır) noktasının
gerçekten ölçülen özelliğin hiç olmadığını gösteren bir ölçektir.
Örneğin, yaĢ, boy, ağırlık, kardeĢ sayısı gibi değerler oran ölçeği ile ifade edilirler ve bu ölçekte
her zaman geçerli miktar kıyaslamaları yapmak olasıdır.
A kiĢisinin boyunun B kiĢisinin boyundan iki kat uzun olduğu her zaman söylenebilir.
ÖLÇEK TÜRLERĠNĠN ÖZELLĠKLERĠ
Özellik
Ölçek
Türü
SINIFLAMA
SIRALAMA
ARALIK
ORAN
Birimlerde
EĢitlik
Yok
Var
Var
Merkezi Eğilim Ölçüleri
Dağılım Ölçüleri
SIFIRın
Std.
Ortalama
Ortanca Tepedeğer GeniĢlik
anlamı
Sapma
()
()
()
()
()
()
()
()
()
()
TanımlanmıĢ
()
()
()
()
()
Mutlak
()
()
()
()
()
ÖLÇME DEĞERLENDĠRME SÜRECĠNĠN BASĠT ANALĠZĠ
Ölçülecek niteliklerin özelliklerin belirlenmesi
Hangi davranıĢların ölçüleceğinin belirlenmesi
Ölçme Kuralının Konması
(Niteliğin / özelliğin ne kadarına hangi değerin verileceğinin belirlenmesi)
[ 4 soruluk bir sınavda, 1nci ve 2nci sorular 30‟ar puan, 3ncü soru 15 puan, 4ncü soru 25 puan]
[40 soruluk bir sınavda her soru 2,5 puan]
Ölçmenin yapılması
Kurala göre özellik/nitelik ile niceliğin eĢleĢtirilmesi
Ölçümlerin elde edilmesi
(Ölçüm, ölçme sonunda elde edilen sayı ya da sembol, baĢka bir ifadeyle ölçme sonucudur.)
Ölçütün belirlenmesi
Ölçüm sonuçlarının değerlendirilmesinde baĢarılı sayılmayı olanaklı kılan asgari ölçümün (ölçüt /
kriter) belirlenmesi
Değerlendirmenin yapılması
Ölçümün ölçütle karĢılaĢtırılarak bir yargıya varılması
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
15
TESTLER (Sınıflama)
Testler değiĢik ölçütlere göre değiĢik biçimlerde sınıflandırılabilir.
BĠREYĠ TANIMA AMACINA GÖRE
Tipik DavranıĢ Testleri
Maksimum Yeterlik Testleri
Yetenek Testleri
BaĢarı Testleri
UYGULANMA SÜRESĠNE GÖRE
Hız Testleri
Güç Testleri
UYGULANAN KĠġĠ SAYISINA GÖRE
Bireysel Testler
Grup Testleri
CEVAPLANMA BĠÇĠMĠNE GÖRE
Cevapları hazır testler
Cevapları cevaplayana bağlı testler
SERGĠLENEN DAVRANIġA GÖRE
TESTLER
ÖzdeĢ Ögeler Testleri
Ġlgili DavranıĢ Testleri
SözelleĢtirilmiĢ DavranıĢ Testleri
Bilgi Testleri
HAZIRLANIġ ġEKLĠNE GÖRE
Standart Testler/Sınavlar
Öğretmen /(Uygulayıcı) Yapımı Testler
PUANLAMA BĠÇĠMĠNE GÖRE
Objektif /Nesnel Testler
Sübjektif /Nesnel Olmayan Testler
BĠREYĠ TANIMA AMACINA GÖRE
TĠPĠK DAVRANIġ TESTLERĠ
Amacı, kiĢinin günlük yaĢamda sergilediği davranıĢlar ile kiĢilerin belirli olaylara karĢı gösterdiği
tepkileri belirlemek olan testlerdir. Bu tip testlere verilen yanıtların doğru ya da yanlıĢ olarak
değerlendirilmesi söz konusu değildir ve çoğu kez sonuçlar belli düzenlemeler için veri
olarak kullanılır.
Bu tip testlerle, kiĢilerin, ulaĢım tercihleri, ders çalıĢma süre ve zamanları, baĢarı testlerinden
düĢük puan aldıklarında gösterdikleri tepkiler, belli derslere karĢı tutumları, ilgi duyduğu
alanlar, gibi konulara iliĢkin veri elde edilir.
KiĢilik Ölçekleri
Ġlgi Ölçekleri
Tutum Ölçekleri
MAKSĠMUM YETERLĠK TESTLERĠ
KiĢilerin, belli bir performansı, belli bir durumda ya da koĢulda, ne derece iyi ya da doğru
biçimde sergileyebileceğini belirlemeye yönelik olarak hazırlanan testlerdir.
Test edilen kiĢi, kendisinden istenen davranıĢı, elinden geldiğince, en iyi ve en doğru biçimde
sergilemeye çalıĢır. Bu tip testlerde önceden belirlenmiĢ doğru ya da iyi olduğu bilinen
(öngörülen) belli cevaplar beklenir. Maksimum Yeterlik Testleri, Yetenek Testleri ve Başarı
Testleri olmak üzere ikiye ayrılır.
16
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Yetenek Testleri, doğuĢtan var olan, kiĢinin baĢarısının göstergesi olabilecek zihin gücünü
ölçme amacına yönelik testlerdir. KiĢiye fırsat sunulduğunda ne kadar baĢarılı olabileceğini ve
ne kadar öğrenebileceğini belirlemek amacıyla kullanılır. ALES içindeki sözel ve sayısal
bölümler, KPSS içindeki genel yetenek testi bu tip testler için örneklerdir. Yetenek testleri de
kendi içinde, Genel Yetenek Testleri ve Özel Yetenek Testleri olmak üzere iki alt kategoriye
ayrılır.
Genel Yetenek Testleri, genel zihin gücünü belirlemeye yönelik olarak hazırlanan testlerdir.
Genelde 3 temel bölümden oluĢurlar. Bunlar, 1-Sözel ĠliĢkiler, 2-Problem Çözme /Sayısal
ĠliĢkiler ve 3-ġekiller arası ĠliĢkiler testleri Ģeklindedir.
Özel Yetenek Testleri, daha dar ve özel bir alana iliĢkin yetenekleri belirleme amacına yönelik
testlerdir. Spor, müzik, resim, sekreterlik, spikerlik gibi belli bir yeteneğin belirlenmesi için
kullanılırlar.
BaĢarı Testleri ise, bir eğitim/öğretim süreci sonunda (belli çevre koĢulları altında) kiĢinin NE
KADAR ÖĞRENDĠĞĠNĠ ÖLÇMEYE YÖNELĠK testlerdir. Amacı davranıĢ değiĢikliği ya da
yeni davranıĢ kazandırmak olan süreçlerin sonunda, bu amacın ne derece gerçekleĢtiğini ortaya
koyabilmektir. Okullarda yapılan sınavlar bunun en tipik örneğidir.
UYGULANMA SÜRESĠNE GÖRE
Hız Testleri
Sınırlı bir sürede en fazla sayıda soru yanıtlayabilmeye dayalı testlerdir.
Güç Testleri
Gittikçe güçleĢen bir dizi sorudan oluĢan, çoğu kez belli bir cevaplama süresi sınırı konmayan,
cevaplayanın cevaplamaya gücünün yetmediği soruya kadar ilerlediği ve değerlendirmenin
cevaplayanın ilerleyebildiği noktaya göre değerlendirildiği testlerdir.
UYGULANAN KĠġĠ SAYISINA GÖRE
Bireysel Testler
Bir defada yalnız bir kiĢiye uygulanan sınavlardır. Sözlü sınavlar, belli yetenek sınavları bu
kategoriye girer.
Grup Testleri
Aynı anda birden fazla kiĢinin katıldığı sınavlardır. Yazılı sınavlar bu kategoriye girer.
PUANLAMA BĠÇĠMĠNE GÖRE
Objektif /Nesnel Testler
Her kim puanlarsa puanlasın, kiĢilerin puanlama üzerinde etkisinin olmadığı sınavlardır.
Soruların önceden belirlenmiĢ cevapları vardır ve puanlamayı yapan sadece verilen cevaplarla
doğru cevapları kıyaslamanın ötesinde bir iĢlem yapmaz. Bu testlerde önceden belirlenmiĢ kesin
bir cevap anahtarı hazırlanabilir. Çoktan seçmeli, eĢleĢtirme, doğru yanlıĢ tipi sorulardan oluĢmuĢ
testler objektif testler kategorisine girer.
.
Sübjektif /Nesnel Olmayan Testler
Puanlamada, puanlayanın kiĢisel kanaat ve yargısının etkili olabileceği testlerdir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
17
CEVAPLANMA BĠÇĠMĠNE GÖRE
Cevapları Hazır Testler
Çoktan seçmeli, doğru yanlıĢ ve eĢleĢtirmeli soruları içeren, cevaplayanın cevabı hazırlamak
yerine, verilen cevaplar içinden doğru olduğu düĢünülen cevabı seçtiği testlerdir. Puanlama
biçimi açısından sınıflandırıldığında objektif testler olarak adlandırılır.
Cevapları cevaplayana bağlı testler
Cevapları cevaplayan kiĢiye bağlı, testi alanın cevabı kendisinin oluĢturduğu, açık uçlu
sorulardan oluĢmuĢ testler
DAVRANIġ SERGĠLENEN TESTLER
ÖzdeĢ Ögeler Testleri
Spor, müzik, resim, bir araç kullanma becerisi gibi alanlarda, davranıĢın kendisinin gerçek
bağlamında sergilenerek ölçüldüğü testler
Ġlgili DavranıĢ Testleri
DavranıĢın kendisinin doğrudan sergilenmesinin mümkün olmadığı durumlarda, simülatörlerle ya
da benzeri bağlamlar oluĢturularak ilgili davranıĢın yapay ortamlarda sergilendiği testlerdir.
(Pilot adayının uçuĢ simülatöründe hekim adayının kadavra üzerinde davranıĢının ölçülmesi
ilgili davranıĢ testlerine örnek olabilir.
SözelleĢtirilmiĢ DavranıĢ Testleri
DavranıĢın sergileneceği bağlam yoksa ve yapay olarak da oluĢturulamıyorsa, kiĢinin hangi
durumlarda neler yapacağını sözlü olarak ifade ettiği testlerdir.
Bilgi Testleri
DavranıĢa yönelik gerçek, temsili ya da sözel testlerin yapılamadığı durumlarda en son tercih
edilecek test tipidir. Bilginin davranıĢa dönüĢtürüleceği varsayımına dayanır. Örneğin TUS
buna tipik bir örnektir.
HAZIRLANIġ ġEKLĠNE GÖRE
Standart BaĢarı Testleri/Sınavlar
Seçme, yerleĢtirme, eleme gibi amaçlar için, hem konu alanı hem de ölçme değerlendirme
uzmanları grubu tarafından kapsamlı Ģekilde hazırlanan sınavlardır. Bu tip test sonuçları kapsamlı
kıyaslamalara, normatif değerlendirmelere olanak sağlayabilir.
Öğretmen /(Uygulayıcı) Yapımı Testler
Programı yürüten tarafından hazırlanan testlerdir. Bu testlerin geçerliği, güvenirliği verdiği
sonuçların doğruluğu ve sonuçlarının kıyaslanabilirliği gibi konulara ihtiyatla yaklaĢmak gerekir.
18
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
STANDART BAġARI TESTLERĠ ĠLE ÖĞRETMEN YAPIMI TESTLERĠN KARġILAġTIRILMASI
ÖĞRENME AMAÇLARI VE ĠÇERĠK AÇISINDAN
Standart Testler
Öğretmen /(Uygulayıcı) Yapımı Testler
Bütün okullar için belli bir içeriğe dayalı
Öğretmenin kendi sınıfında seçtiği içeriğe
öğrenme amaçlarını ölçer, okul, sınıf
dayalı o grup için belirlenmiĢ amaçlara uygun
düzeyindeki farklılıkları göz önüne almaz
olarak hazırlanır, değiĢikliklere ve
uyarlamalara açıktır ve bazı öğrenme
amaçlarını göz ardı etme eğilimi olabilir.
TEST MADDELERĠNĠN (SORULARIN) KALĠTESĠ AÇISINDAN
Standart Testler
Öğretmen /(Uygulayıcı) Yapımı Testler
Test maddeleri uzmanlar tarafından yazılmıĢ,
Madde kalitesi öğretmenin ölçme
analizi yapılmıĢ ve etkililiği belirlenmiĢ olduğu değerlendirme konusundaki yeterliğine
için, madde kalitesi yüksektir.
bağlıdır. Genelde öğretmenin yeterince çaba
sarf etmemesi nedeniyle madde kalitesi
düĢüktür.
GÜVENĠRLĠK AÇISINDAN
Standart Testler
Güvenirliği yüksek ölçümlere olanak sağlar
Öğretmen /(Uygulayıcı) Yapımı Testler
Ölçümlerin güvenirliği çoğu kez bilinmez.
TESTĠN UYGULANMASI VE PUANLANMASI AÇISINDAN
Standart Testler
Öğretmen /(Uygulayıcı) Yapımı Testler
Uygulanması ayrıntılı bir süreç olarak
Uygulaması öğretmenin belirlediği belli sınıf
tasarlanmıĢ olup, bu süreç yazılı yönergelerle
içi uygulama (rutin) Ģeklindedir ve sınıftan
baĢtan belirlenir. Puanlama ayrıntılı ve
sınıfa değiĢiklikler gösterir. Puanlamada
nesneldir.
nesnellik tartıĢma götürür.
PUANLARIN YORUMLANMASI AÇISINDAN
Standart Testler
Öğretmen /(Uygulayıcı) Yapımı Testler
Puanlar baĢka gruplarla ya da bir norm ile
Puanlar sadece grup içi kıyaslamalara olanak
karĢılaĢtırılabilir.
verir.
Değerlendirme ölçütlerinin belli standartları
Değerlendirme ölçütleri öğretmen tarafından
vardır.
belirlenebilir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
19
ÖĞRETMEN YAPIMI TESTLER/SINAVLAR
a.
b.
c.
d.
e.
f.
g.
Sözlü Sınavlar
Yazılı Sınavlar
Kısa Cevaplı Sınavlar
Doğru-YanlıĢ Tipi Sınavlar
EĢleĢtirme Maddeleri
Çoktan Seçmeli (Objektif) Testler
Performans Değerlendirme / Öğrenci Ürün Dosyası
SÖZLÜ SINAVLAR
Bilinen en eski test türüdür.
Genel bir ölçme Ģekli olarak, öğrenciyi tahtaya kaldırarak bir dizi soru sorup, not takdir edilmesi
Ģeklinde kullanılmaktadır. Çok kalabalık gruplarda, soruların yazılı olarak verilip, cevapların
sözlü Ģekilde alınması Ģeklinde uygulanabilir. Sınıfta öğrencilerin önünde yapılan sözlü
sınavların yanı sıra, bir sınav kurulunun önünde de sözlü sınavlar yapılabilir.
Bazı eğitimciler, sözlü sınavların baĢarıdan çok öğrencinin sözlü ifade becerisini ya da yeteneğini
ölçtüğünü, bu nedenle de baĢarının ölçülmesinde kullanılmaması gerektiğini savunurlar. Ancak,
sözel ifade becerisinin, sözcüklerin sesletiminin, anadilde ya da yabancı dilde konuĢma
becerisinin ölçülmesinde tek seçenektir. Bazı özür durumlarında da (görme özrü ya da yazmaya
engel özür) kaçınılmaz Ģekilde sözlü sınav tercih edilir. Yüksek lisans ve doktora tez savunma ya
da araĢtırma raporu sunumlarında da kullanılır.
Ancak genel kanı, sözlü sınavların baĢarının ölçülmesinde tamamlayıcı olarak kullanılması
yönündedir.
ÖZELLĠKLERĠ
Her bir birey için ayrı ayrı uygulandığı için uygulaması çok zaman alır. (Bazı öğretmenler derste
sordukları sorulara verilen yanıtları, katılımı sözlü sınav puanı olarak değerlendirirler ancak bu
tür sorular bir test maddesinde bulunması gereken özellikleri çoğu kez taĢımazlar)
Her öğrenciye farklı soru sorma zorunluluğu, soruların güçlük derecesinin her öğrenci için aynı
olmasını olanaksız kılar.
Cevaplama esnasında cevabın niteliği dıĢında kalan, (konuĢma ve ifade becerisi, öğrencinin
kiĢiliği [içe dönüklük, dıĢa dönüklük], iletiĢim becerileri, kılık kıyafet gibi) faktörler söz konusu
olabilir. Öğretmenin öğrenci için varsa önyargısına açıktır.
Sözlü sınava alınıĢ sırası, puanlamaya etki edebilir. Bu, iyi bir öğrencinin ardından sınava alınan
vasat öğrencinin değerlendirmesinde ölçüte yansıyacağı gibi, son sıralarda sınava alınan bir
öğrencinin kendinden öncekilerin sınavlarından öğrendikleri onun için avantaj olabilir.
Öğretmenin ve öğrencinin sınav anındaki ruh hali, sözü sınavlar üzerinde oldukça etkilidir.
Kâğıt kalem (yazılı) sınavlara göre, kopya davranıĢı sergilenme olasılığı çok daha azdır.
20
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
UYGULANMASI
Sözlü sınavdan önce bir plan hazırlanmalı ve bu planda
Sınavın amacı
Hangi davranışların hangi içerikle yoklanacağı (belirtke çizelgesi)
Sınavda sorulacak sorular
Soruların kabul edilebilir yanıtları olacak anahtar kavramlar
Sınava ilişkin yönerge (kaç soru sorulacağı, düşünme süresi, puanlama esasları)
yazılı olarak önceden belirlenmeli ve öğrencilere açıklanmalıdır.
Öğrencinin cevaplarına iliĢkin kısa notlar alınmalıdır. Puanlamada ve dönütlerde bu notlardan
yararlanılmalıdır.
Öğrencinin dıĢ görünüĢü, konuĢma akıcılığı ve ölçülmek istenen amaçla ilgili olmayan hususlar
puanlamaya yansıtılmamalıdır.
Sınav öncesinde ve sınav esnasında öğrencinin heyecanını artıracak, onu kaygılandıracak
davranıĢlardan kaçınılmalı, aksine güven telkin edici bir üslup sergilenmelidir.
Uzun cevaplı sorular yerine kısa cevaplı daha çok soru sorma tercih edilmelidir.
Soruları sorduktan sonra yeterince düĢünme süresi verilmeli, tanınan süreler konusunda tüm
öğrencilere adil davranılmalıdır.
Birkaç ders saatini sözlü sınava ayırmak yerine, uzun dönemde her dersin belli bir süresini (ik 15
dakikası gibi) ayırmak daha sağlıklı bir uygulama olur.
Olabilirse, olanaklar ölçüsünde, birden fazla puanlayıcı olması, puanlamada nesnelliği
artıracaktır.
UZUN CEVAPLI (ESSE TĠPĠ) YAZILI YOKLAMALAR (Essay Type)

GeçmiĢten günümüze, özellikle öğretmenlerin yetiĢtirildikleri süreçte en yaygın, geleneksel
ölçme biçimi olması [Genel bir alıĢkanlık olarak, söylem olarak bile sınav/test yerine “yazılı”
ifadesinin kullanılıyor olması]

Sınav öncesi test maddesi hazırlamak için fazla zaman ve çabayı gerektirmemesi

Ölçme ve değerlendirmede öğretmeni aĢırı nesnellikle sınırlamaması

Bu tür ölçme araçları ile baĢarıları ölçülen öğrencilerin daha ayrıntılı ve derinlemesine
çalıĢma eğilimi göstereceklerine olan inanç
gibi nedenlerle öğretmenlerin çok sık kullandıkları bir test tipidir.
ÖZELLĠKLERĠ
DeğiĢik alanlara iliĢkin (nerede, kim, nasıl gibi soruların cevaplarının yanı sıra, betimleme,
benzerlik zıtlık, karĢılaĢtırma, açıklama, tartıĢma, geliĢtirme, özetleme gibi konulara iliĢkin) geniĢ
bir yelpazede biliĢsel davranıĢları ölçer. Özellikle öğrencilerin özgün orijinal görüĢ, düĢünce ve
ürünler ortaya koymalarına olanak sağlar.
Öğrenci aĢırı sayılabilecek bir cevaplama özgürlüğüne sahiptir. Bu özgürlük cevap olamayacak
rastgele ifadelerin yazılmasına da yol açabilir. Bu da asıl ölçülmek istenen davranıĢın dıĢında
kalan baĢka davranıĢların ölçme sonuçlarını etkileme olasılığını doğurur.
Cevaplar “kesin doğru” “kesin yanlıĢ” olarak nitelenemeyebilir. Bu nedenle puanlamada
nesnelliği tartıĢma götürür. Hatta aynı sınav kâğıdı farklı öğretmenlerce puanlandığında aynı
puanı alamayabilir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
21
Sınav süresinin büyük kısmının yazmaya ayrılması, birim zamanda yanıtlanacak soru sayısını
sınırlar ve bu da kapsam geçerliğini düĢürür.
Hazırlanması kolay, az zaman alan ancak puanlanması zor ve çok zaman alan bir sınav tipidir.
Özellikle kalabalık grupların puanlanması zordur ve bu zorluk puanlamanın nesnelliğine
yansıyabilir.
ġans baĢarısı oldukça düĢüktür. Kopya davranıĢı sergilenmesi diğer testlere göre daha zordur.
Her bir maddenin puanlanmasında farklılıklar olabileceği için sınav puanları üzerinde gerçek
anlamda ayrıntılı istatistiksel iĢlemler yapma olanağı yoktur
AĢağıdaki biçimlerde uygulamalara rastlamak mümkündür:
Kompozisyon tipi yazılı sınavlar (Belli bir konuya iliĢkin görüĢ, bilgi, değerlendirme,
öneri gibi) [Free response exams]
Açık kitap yazılı sınavları [Open book exams]
Evde cevaplanan yazılı sınavlar [Take home exams]
Sınıf içi klasik yazılı sınavlar [In class exams]
UYGULANMASI
Mutlaka bir sınav planı hazırlanarak ölçülmesi amaçlanan kritik davranıĢlarla sınav kapsamına
giren konular listelenmelidir. Bu amaçla ayrıntılı bir belirtke çizelgesi (amaç içerik matrisi)
hazırlanmalıdır.
Tercihli soru sistemi kullanılMAmalıdır. Bütün soruların bütün öğrenciler için zorunlu olarak
cevaplandırılacağı sorular olduğu sistem kullanılmalıdır.
Kitaptaki konu baĢlıklarının aynen test maddesi olarak yazılmasından kaçınılmalıdır. Test
maddelerinin dili açık seçik anlaĢılır olmalı, önemli kısımlar, altı çizilerek ya da koyu yazılarak
vurgulanmalıdır.
Sorular önceden
uğraĢılmamalıdır.
yazılı/basılı
olarak
verilmeli,
sınav
ortamında
soru
yazdırma
ile
Sınav için bir yönerge hazırlanarak sınav kâğıdına bu yönerge yazılmalı ve öğrenciler yönergeyi
okumaları için uyarılmalıdır.
Nitelikli soru sorabilmek için, sınavda sorulması planlanan soru sayısının 3 katı soru hazırlanıp,
sınav soruları bunların arasından seçilmelidir.
Puanlamada nesnellik için bir soru kâğıdı cevaplanarak, her sorunun cevabında puanlama için
ölçüt teĢkil edecek kavramlar, anahtar fikirler ve alternatif örnekler ve bunlara kaçar puan
verileceği belirtilmeli, puanlama bu esaslara göre yapılmalıdır.
Soru sayısı ve her sorunun puanlamasında sorunun alt bölümleri, puan değerleri tam sayılarla ya
da kalansız bölünebilen sayılarla ifade edilmelidir.
Ġstenenlerin tam tersinin yazılması ya da belirtildiği halde gereksiz bilgiler yazılan sorularda
negatif puan verilmesi gerekebilir. Bu uygulanacaksa, hangi durumlarda ne kadar negatif puan
verileceği belirlenmelidir.
22
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Kitapların, notların açık olduğu sınavlar ilköğretim ve ortaöğretim kademesinde tercih
edilmemelidir.
Ölçülmesi gereken nitelikler içinde değilse, yazı güzelliği, sayfa düzeni, kâğıdı kullanmadaki
tertip düzen puanlamayı olumlu ya da olumsuz ETKĠLEMEMELĠDĠR…
Öğrencinin diğer niteliklerinin puanlamaya yansımaması için kâğıtlar öğrencinin isimleri
kapatılarak puanlanmalıdır. Puanlama tüm kâğıdın puanlanması yerine, her kâğıdın aynı
maddelerinin puanlanması Ģeklinde yapılmalıdır.
KISA CEVAPLI TESTLER
Cevabı bir sözcük, bir rakam, bir tarih, bir sözcük öbeği ya da en fazla kısa bir cümle olan
sorulardan oluĢan testlerdir.
Bu tip testlerin maddeleri soru kipinde ya da boĢluk doldurma tipinde olabilir.
ÇeĢitli madde (soru tiplerine) örnekler Ģunlar olabilir
İş başında eğitim yönteminde kullanılan materyallere genel olarak ne ad verilir?
[_____________________]
İş başında eğitim yönteminde kullanılan materyaller genel olarak ____________________
olarak adlandırılırlar.
Eğitim açısından davranışı tanımlayınız.
______________________________________________________________________________
Aşağıdaki cümlenin harflerle işaretlenmiş altı çizili ögelerinin hangi cümle ögeleri olduklarını,
ögeler için ayrılmış ve aynı harflerle işaretlenmiş boşluklara yazınız.
Rıza Oya’ya pul koleksiyonunu
A
B
C
gösterdi.
D
A: _______________
B: _______________
C: _______________
D: _______________
Aşağıda Türkiye’de yetiştirilen bazı ürünlerin adları verilmiştir. Bu ürünlerin en çok yetiştiği
coğrafi bölgelerin adlarını ilgili boşluklara yazınız
A. Fındık
B. Tütün
C. Buğday
D. Ġncir
E. Zeytin
____________________
____________________
____________________
____________________
____________________
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
23
ÖZELLĠKLERĠ
Özellikle hatırlama yeteneğini sınar ve her düzeyde ve kademedeki öğrenciler için uygundur ve
bu tip testlerde genel olarak yanımlar, ilkeler, sınıflamalar hakkında sorular sorulabilir.
Cevabın kısa olması sınavda çok soru sorulmasına olanak tanır ve bu sınavın kapsam geçerliğini
artırır
Nesnelliği (objektifliği) yazılı yoklamalardan yüksektir ve puanlaması yazılı yoklamalara göre
daha kolaydır
HAZIRLANMASI VE UYGULANMASI
Maddeler belirli, kesin ve tek cevabı olacak Ģekilde düzenlenmelidir. (Bu tür maddelerin
hazırlanmasına çoğu kez hazırlayan düĢündüğü cevabın tek cevap olduğunu zanneder)
Puanlamadan önce beklenen cevaplar ayrıntılı Ģekilde düĢünülüp yazılmalıdır.
Ankara Türkiye’nin _____________________ [bir ilidir / başkentidir]
Türkiye’nin başkenti ____________________ ilidir.
Hatırlanması istenen bilgi gerçekten hatırlanmaya değecek kadar önemli bir bilgi olmalıdır.
Kitaptan ifadeler alınarak olduğu gibi test maddeleri düzenlenmemelidir. (Ezberciliği teĢvik eder)
Cevap olarak doldurulacak boĢlukların sayısı puanlama hesabı göz önüne alınarak
belirlenmelidir.
Sorulara eĢit puanların verildiği testler, puanlamada, soru analizleri yapmada ve test geliĢtirme
iĢlemlerinde pek çok avantaj sağlar.
EġLEġTĠRME MADDELĠ TESTLER
Ġki grup halinde verilen ve birbiriyle ilgili olan bilgi ögelerinin, açıklaması soruda verilen belli bir
ölçüte göre eĢleĢtirilmesini gerektiren testlerdir.
EĢleĢtirilebilecek bilgi ögeleri için bazı örnekler
Terimler bunların tanımları / tarifleri
Semboller ve nelerin sembolü oldukları
Ġlkeler ve uygulanabileceği yerler
Yazarlar ve eserleri
Önemli olaylar ve tarihleri
Problemler ve çözüm yolları
BuluĢlar ve buluĢu gerçekleĢtiren kiĢiler
Birinci sütundaki şehir adları ikinci sütunda listelenen ülkelerin başkentleridir. Başkentlerin
hangi ülkelere ait olduklarını, ülkenin önündeki harfi, başkentin önündeki boşluklara yazarak
belirtiniz.
___
___
___
___
___
___
Ankara
Atina
BudapeĢte
Canberra
Ottowa
Roma
A. Avusturya
B. Avustralya
C. Belçika
D. Ġtalya
E. Kanada
F. Macaristan
G. Türkiye
H. Yeni Zelanda
I. Yunanistan
24
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Aşağıda, bazı geometrik şekillerin isimleri ve bu geometrik şekillerin çizimleri verilmiştir.
Şekillerin önündeki harfleri, geometrik şekillerin isimlerinin önündeki boşluklara yazarak,
şekillerle isimleri eşleştiriniz.
____ Dik üçgen
A.
____ Dik açı
B.
____ Düzgün altıgen C.
____ Paralelkenar
D.
____ Küp
E.
F.
G.
ÖZELLĠKLERĠ
EĢleĢtirmeli Maddeler, bir bakıma çoktan seçmeli test maddelerine benzerler. Cevaplayıcının
verilenler arasında seçim yapma dıĢında seçeneği olmadığı için bu tip testler objektif testler
kategorisine girer.
Sorular özenle hazırlanırsa, tahmin faktörü ortadan kaldırılabilir.
UYGULANMASI
EĢleĢtirme maddesindeki öncüller ile cevapların her birisi mutlaka benzeĢik ögeler olmalıdır.
(Örneğimizdeki ülkeler sütununun karĢısındaki kentlerin her birisi mutlaka bir baĢkent olmalıdır)
Öncüller ile cevaplar eĢit sayıda OLMAMALIDIR. Aksi takdirde, bilinen eĢleĢtirmeler
çıkarıldıktan sonra kalanları bilindiği için eĢleĢtirilmiĢ olmayacaktır.
Uzun ifadeler öncüllere yazılmalıdır. Böylelikle her bir öncülün eĢleĢeceği doğru cevabı
seçebilmek için bütün cevapları okuma zamanı en aza indirilmiĢ olacaktır. (Örneğin olaylarla
tarihlerden oluĢmuĢ maddede olay öncül olarak yazılmalı, tarihler cevaplar sütununa yazılmalı)
Sütunlar sözcüklerden oluĢuyorsa alfabetik, sayılardan oluĢuyorsa büyüklük küçüklük sırasıyla
verilmelidir.
Maddenin tümü aynı sayfada bulunmalıdır
DOĞRU YANLIġ TESTLERĠ
Doğru ya da yanlıĢ olan önermelerden oluĢmuĢ maddeleri olan testlerdir.
Aslında, tipik bir doğru-yanlıĢ testi maddesi, iki seçeneği olan seçmeli bir maddedir.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
25
ÖZELLĠKLERĠ
ġans faktörü yüksektir (%50) ve üst düzey biliĢsel davranıĢları ölçmede yetersizdir. Bu nedenle
de çok tercih edilmemektedirler.
Soru hazırlamak kolaydır ve cevaplaması kısa süre alır. Bu nedenle bir sınavda sorulacak soru
sayısı oldukça fazla olur ve bu da sınavın kapsam geçerliğini çok yükseltir.
YanlıĢ ifadelerin yanlıĢ bilinenleri pekiĢtireceği görüĢünü savunanlarca eleĢtirilmektedir.
UYGULANMASI
Her madde açıkça tek bir fikri ve yargıyı belirtmelidir ve ifadesi olabildiğince açık ve yalın
olmalıdır.
Her maddedeki yargı ya da fikir, “kesinlikle doğru” ya da “kesinlikle yanlıĢ” olmalıdır.
Doğru ve yanlıĢ maddelerin cümle olarak ifadeleri olabildiğince aynı uzunlukta olmalıdır.
Olumsuzluk ifadeleri dikkatle kullanılmalı, iki olumsuz ifadenin kullanıldığı maddeler
düzenlenmemelidir. (Ebesinin penceresini görmemiĢ değildir = görmüĢtür)
Testteki doğru ve yanlıĢ maddelerin sayısı eĢit ya da birbirine yakın olmalıdır.
Ders kitaplarından ya da derste kullanılan kaynaklardan kalıp halinde cümleler test maddesi
olarak yazılmamalıdır
YanlıĢ olarak düzenlenen maddede yanlıĢlık önemsiz bir noktada olmamalıdır. Ayrıca rakamların
yerlerini değiĢtirerek, yazım yanlıĢı yaparak yanlıĢ madde düzenlemek doğru değildir.
Önermenin ana fikri yanlıĢ olmalıdır.
Uygulamada soruların cevaplanması için asgari zaman verilmelidir.
Düzeltme faktörü uygulanacaksa yönergede belirtilmelidir.
ÇOKTAN SEÇMELĠ (OBJEKTĠF) TESTLER
Bir soru cümlesi ya da eksik bir cümle yapısı Ģeklinde bir madde kökünden ve bunu izleyen bir
dizi önerilen cevaptan oluĢan ve cevaplardan doğru olanının seçilmesi istenen testlerdir.
Nesnelliği ve bilgi, kavrama ve iyi düzenlenirse analiz düzeyinde davranıĢları ölçebilmesi
nedeniyle çok yaygın biçimde kullanılmaktadır.
Üniversite Seçme Sınavları, Seviye Belirleme Sınavları, Tıpta Uzmanlık Sınavları, Lisansüstü
Eğitim Sınavları baĢta olmak üzere pek çok sınavda kullanılması, her kademedeki öğretmeni
öğrencilerini çoktan seçmeli test maddesi yanıtlama konusunda yetiĢtirmeye yöneltmekte, bu
durum bazen öğretim amaçlarının da önüne geçebilmektedir…
ÇOKTAN SEÇMELĠ MADDELERE ÖZGÜ TERĠMLER
TEST MADDESĠ: Testte bağımsız olarak kendi baĢına puanlanabilen en küçük birim. Her soru bir
test maddesidir.
MADDE KÖKÜ: Maddede ne sorulduğunu açıkça belirten ya da sezdiren veya problemi sunan
bölümdür.
SEÇENEKLER: Madde kökünde sorulan soruya verilecek olası cevapların tümüdür. Maddenin
doğru cevabı ile yanlıĢ cevapların tümüne verilen addır.
DOĞRU CEVAP: Madde kökündeki sorunun doğru cevabını içeren seçenektir. (Anahtar cevap
olarak da adlandırılır)
26
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÇELDĠRĠCĠ: Doğru cevabın dıĢında kalan seçeneklerin her birisine verilen addır. Çeldiricilerin
iĢlevi, sorunun cevabını vermek için yeterli bilgisi olmayanları yanıltmak ve doğru cevabın
tesadüfen bulunmasını engellemektir
MADDE TAKIMI: Bir paragraf, bir Ģekil, tablo ya da grafik gibi ortak bir veri üzerinde
Ders yılı boyunca her hafta sonu küçük sınav yapıp,
izleyen hafta, bu sınavlarla saptadığı aksaklıklara çözüm
getirmeye çalıĢan bir öğretmenin yaptığı bu ölçmedeğerlendirme
etkinliklerini,
aĢağıdaki
ölçme
değerlendirme kategorilerinden hangisine sokarsınız?
a)
b)
c)
d)
e)
Biçimlendirme için ölçme-değerlendirme
YerleĢtirme için ölçme değerlendirme
Toptan / nihai (değer biçmek için) değerlendirme
Not vermek için ölçme değerlendirme
YetiĢtirme için ölçme değerlendirme
MADDE
KÖKÜ
Doğru Cevap
Çeldiriciler
SEÇENEKLER
TEST MADDESĠ
temellenmiĢ iki ya da daha fazla maddenin oluĢturduğu grup.
ÖZELLĠKLERĠ
Bu tür sınavlarda okuma yeteneği ve hızı önemli rol oynar
Hazırlanması oldukça güçtür, çok zaman alır, konu hakkında teknik bilgi sahibi olmayı gerektirir
ancak puanlaması nesnel ve çok kolaydır.
Elde edilen puanlar üzerinde birçok istatistiksel iĢlem yapmak mümkündür.
UYGULANMASI
Madde kökünde daha seçenekleri okumadan fark edilen tek ve temel bir fikir bulunmalıdır
Seçeneklerde tekrarlanan ifadeler köke konarak gereksiz tekrarlardan kaçınılmalıdır
Seçenekler olabildiğince aynı uzunlukta olmalıdır
Sayı ile ilgili seçenekler büyüklük küçüklük sırasında olmalıdır
Yukarıdakilerin hepsi ya da hiçbirisi seçeneği dikkatli kullanılmalıdır. (AraĢtırmalar, “hiçbirisi”
seçeneğinin maddenin ayır ediciliğini ve güvenirliğini düĢürdüğünü göstermiĢtir1) Mümkünse
kullanılmamalıdır)
Doğru cevap Ģıkları eĢit olarak dağılmalıdır. Ayrıca Ģıklar belli mantıksal bir dağılım
sergilememelidir.
Olumsuz ifadeler altı çizilerek ya da koyu yazılarak vurgulanmalıdır.
Düzeltme faktörü uygulanacaksa yönergede belirtilmelidir.
1
Haladayna,T.M. and Downing, S.M. (1989) A taxonomy of multiple-choice item writing rules. Applied
measurement in education. 2(1), 37-50.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
27
MADDE TÜRLERĠ
Madde kökü olumlu/olumsuz soru şeklinde olan sorular
Milli Eğitim Bakanlığı Teşkilatı içinde “Öğretim Programları” nerde hazırlanmaktadır?
a)
b)
c)
d)
e)
Projeler Koordinasyon Kurulu Merkezinde
Eğitim Araçları ve Donatım Dairesinde
Eğitim Araştırma ve Geliştirme Dairesinde
Öğretmen Yetiştirme ve Eğitimi Genel Müdürlüğünde
Talim ve Terbiye Kurulu Başkanlığında
Aşağıdakilerden hangisi, alanı ne olursa olsun, bütün öğretmenlerin öğrencilerine kazandırmakla
yükümlü olduğu temel becerilerden birisi değildir?
a) Hızlı ve etkili ezberleme becerisi
b) Yaratıcı Düşünme Becerisi
c) Araştırma-Sorgulama Becerisi
d) Bilgi Teknolojilerini Kullanma Becerisi
e) Türkçeyi Doğru, Etkili ve Güzel Kullanma Becerisi
Madde kökü eksik cümle olan sorular
Öğretim etkinliklerinin düzenlenmesindeki temel ilkeler içinde yer alan BÜTÜNLÜK ilkesi,
a) amaçların belirlenmesinde, bilişsel, duyuşsal ve psikomotor alanların dikkate
alınmasıdır
b) konuların anlamlı bir bütün halinde sunulmasıdır
c) farklı amaçlar yerine bir bütünlük oluşturacak benzer amaçlar belirlenmesidir
d) öğretmenin sınıftaki öğrencileri bütün bir grup olarak görebilmesidir
e) konuların, amaçların ve sınıftaki öğrencilerin birlikte bir bütün olarak görülmesidir
En doğru cevabı gerektiren maddeler
Karadeniz bölgesinde görev yapan bir öğretmen, bölgenin özellikleri ile öğrencilerinin ilgi
ve ihtiyaçlarını göz önüne alarak mevcut programdaki içeriği, hamsi, mısır, fındık çay
gibi konularla ilgili olacak şekilde değiştirmiş ve bu yüzden de okul yönetimi tarafından
eleştirilmiştir. Öğretimi planlama dersi almış bir eğitimci olarak, öğretmenin davranışını
iyi bir programın özelliklerinden öncelikle hangisi ile ilişkilendirerek savunursunuz?
a)
b)
c)
d)
e)
28
Program kullanışlı olmalı
Program esnek olmalı
Program toplumun genel görüş ve beklentileri ile uyumlu olmalı
Program bilimsel olmalı
Program ekonomik olmalı
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Çoktan seçmeli test maddesine dönüştürülmüş maddeler
ÇağdaĢ bir öğretim programında olması gereken dört temel boyut ile bu boyutlara iliĢkin açıklamalar hangi
seçenekte doğru Ģekilde eĢleĢmiĢtir?
AÇIKLAMALAR
Öğretim süreci sonunda kazandırılması ya
da değiĢtirilmesi öngörülen davranıĢlar
Öngörülen davranıĢ değiĢikliğinin ne
derecede gerçekleĢtirilebildiğinin
saptanması
DavranıĢ değiĢikliğinde sadece araç
olarak kullanılacak konular
DavranıĢ değiĢikliğinin ya da yeni
davranıĢ kazandırmanın fiilen nasıl
gerçekleĢtirileceği
A
B
C
D
a)
b)
c)
d)
e)
A-III
A-II
A-I
A-I
A-II
B-IV
B-IV
B-IV
B-IV
B-IV
C-II
C-I
C-II
C-III
C-III
BOYUTLAR
I
AMAÇ
II
ĠÇERĠK
III
SÜREÇ
IV
DEĞERLENDĠRME
D-I
D-III
D-III
D-II
D-I
Aşağıda, sizin doğru ya da yanlış şeklinde değerlendirmeniz istenen 5 yargı mevcuttur.
Bunların sırasıyla doğru ya da yanlış oldukları, hangi seçenekte yer almaktadır?
Radyografi ve fotografide film üzerinde görüntü oluĢumu aynı fiziko-kimyasal prensiplere bağlıdır
Konvansiyonel röntgende görüntü orijinal boyuttadır
Fluorosans olayının radyografide etkisi yoktur
Fluoroskopinin temel iĢlevi radyografiye klavuzluk etmektir
Röntgenogramlar üzerindeki koyu tonlar x-ıĢınının görece az düĢtüğü yerlerdir
a)
b)
c)
d)
e)
YYDYD
DYYYD
DDYYY
DDYDY
YDDDY
ġANS BAġARISI VE ġANS BAġARISI ĠÇĠN ÖNLEM ÖNERĠLERĠ
Objektif testlerin puanlanmasında eleĢtirilen iki nokta vardır.
Birincisi, kısmi bilginin değerlendirilme olanağının
olmaması, ikincisi de, tahmine ya da şansa dayalı davranışın
öğrenme ürünü davranıştan ayırt edilememesidir.
Burada ne mi oluyor?
4 yanlıĢ 1 doğruyu götürüyor
ġans baĢarısını engellemek için, öğrencileri bilmedikleri
sorularda tesadüfi davranıĢ sergilemekten (yani, rastgele
iĢaretlemeler yapmaları ve iĢaretlenen seçeneğin de tesadüfen
doğru yanıt olması durumundan) caydırmak için, seçenek
sayısının bir eksiği kadar yanlıĢ yanıtın, bir doğru yanıtı
geçersiz kıldığı düzeltme faktörü uygulanır. (Düzeltme
faktörü, beĢ seçenekli sınavlarda dört yanlıĢın bir doğruyu
götürmesi Ģeklinde ifade edilen iĢlemin bilimsel adıdır.)
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
29
Dayandığı temel Ģudur: n tane seçenekli bir soruda herhangi bir seçeneğin doğru yanıt olma
olasılığı (100/n)‟dir. Yani beĢ seçenekli bir soruda hiçbir fikri olmayan bir öğrencinin doğru
seçeneği iĢaretleme olasılığı %20‟dir. Öğrenci bu mantıkla, 4 soruyu doğru olarak iĢaretlese
(doğru seçenek dıĢında kalan seçenekleri düĢündüğümüzde) bir soruyu yanıtlamıĢ kadar
bilinçli davranıĢ karĢılığı tesadüfî davranıĢ sergilemiĢ olacaktır. O nedenle seçenek sayısının
bir eksiği (eksik olan doğru seçenek) kadar yanlıĢ, 1 doğru yanıtı geçersiz kılar.
Çoktan seçmeli testlerde, hem kısmi bilgiyi ölçmek hem de Ģans baĢarısını engellemek için bazı
alternatif puanlama seçenekleri önerilmektir
1-NESNEL ÖLÇÜTLERE GÖRE MADDELERĠN AĞIRLIKLANDIRILMASI:
Maddenin psikometrik özellikleri (ölçtüğü davranıĢı doğru biçimde ölçüyorsa, güvenilirse,
ölçülen davranıĢ kritik davranıĢsa, davranıĢ sınırlı bir davranıĢsa vb.) göz önüne alınarak farklı
maddelere farklı ağırlıkta puanlar verilebilir. Önemli davranıĢı doğru ölçen iyi maddelere daha
fazla puan verilirken diğer maddeler daha düĢük puanlı olabilir
2-SEÇENEKLERĠN AĞIRLIKLANDIRILMASI:
Bu tür çoktan seçmeli testlerde tek doğru değil, en fazla doğrudan en az doğruya doğru her
birisinin doğruluk derecesi farklı seçenekler bulunur ve öğrenci iĢaretlediği seçeneğin ağırlığına
göre puan alır.
3-YANITLAMA BĠÇĠMĠNĠN ÇEġĠTLENDĠRĠLMESĠ
Testi alan,
Seçenekleri kendince en doğrudan en az doğruya sıralar ve doğru yanıtın sıralamadaki yerine
göre puan alır. (Ġlk sıradaysa en fazla puan, son sıradaysa en düĢük puan)
ĠĢaretlediği seçeneğin yanına emin olma derecesini (güven ağırlığını) yazar ve seçenek doğru
ise güven ağırlığı kadar puan alır. (Her seçeneğin 2 puan olduğu bir testte, yanıt (c) ise, doğru
yanıt (c) %100 diyen 2 puan alırken, (c) %25 diyen 0,5 puan alır. Soru yanlıĢsa öğrenci o oranda
eksi puan alır.
Doğru olabilecek tüm seçenekleri iĢaretler, bunların arasında doğru yanıt varsa madde
puanının iĢaretlediği seçenek sayısına bölümü kadar puan alır. Tek seçenek iĢaretler ve o da
doğru olursa tam puan, iki seçenek iĢaretler de doğruyu bulursa tam puanın yarısını alır.
30
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÖLÇME DEĞERLENDİRMEDE YENİ YAKLAŞIMLAR
Alternatif Değerlendirme
Özgün Değerlendirme
Performans Değerlendirmesi
Alternatif Değerlendirme:
Geleneksel değerlendirme araçlarının (yazılı, sözlü testler, ödevler) dıĢında kalan geliĢim dosyası
/ ürün dosyası gibi yeni ölçme araçlarıyla yapılan ölçme değerlendirme etkinlikleridir.
Özgün (Authentic) Değerlendirme:
Okulda öğrenilen bilgi ile gerçek yaĢamdaki olaylar arasında iliĢkiler kurulmasına yönelik
çalıĢmaların yine bu bakıĢ açısıyla değerlendirilmesi anlayıĢıdır
Performansın Değerlendirilmesi:
Öğrencinin istenilen bir öğrenme alanındaki bilgi, beceri ve tutumlarını ölçebilmek için, öğrenene
alanla ilgili bir görev verip, o görevdeki etkililiğini geçerliği ve güvenirliği sağlanmıĢ ölçme
araçlarıyla (çoğu kez dereceli puanlama anahtarlarıyla) saptamaktır. Performans
değerlendirmenin temel amacı; öğrencilerin okulda öğrendikleri bilgileri yaĢama aktarmalarını
sağlamak; problem çözme, eleĢtirel düĢünme ve yaratıcılık gibi öğrencilerin yaĢamın her alanında
kullanacakları üst zihinsel süreçlerini geliĢtirmektir.
Performans Değerlendirmenin Ġlkeleri
Değerlendirme uzun süreli olmalı
Değerlendirme olabildiğince çok ve değiĢik becerileri kapsamalı
Hem bireysel hem de grup değerlendirmeleri yapılmalı
Değerlendirme hem süreci hem de ürünü kapsamalı
Değerlendirmede birden çok veri toplama tekniği kullanılmalı
Performans Değerlendirmede Kullanılan Teknikler
YapılandırılmıĢ yarı yapılandırılmıĢ ya da biçimsel olmayan gözlemler yapma
Anekdot kayıtları tutma
Öz değerlendirme formları kullanma
Akran değerlendirme formları kullanma
Yazılı görüĢler alma (Belli konularda düĢüncelerini yazdırma / Tutum ölçekleri kullanma)
Performans ödevleri
Öğrenci ürün (seçki) dosyası (portfolyo) kullanma
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
31
ÖĞRENCĠ GÖZLEM FORMU
Bu form etkinlikler süresince öğrencilerin yapılan çalıĢmalara katılma düzeylerini gözlemlemeniz
amacıyla düzenlenmiĢtir.
Ünitenin Adı:
Sınıfı:
Adı Soyadı:............................................................
Öğrenci No:................
Sıklıkta
Bazen
Nadiren
Hiçbir Zaman
GÖZLENECEK ÖĞRENCĠ K AZANIMLARI
Her Zaman
DERECELER
5
4
3
2
1
I. DERSE HAZIRLIK
1 Bilgi kaynaklarına nasıl ulaĢacağını bilir.
2 UlaĢtığı kaynaklardan etkin bir biçimde yararlanır.
3 Derse değiĢik yardımcı kaynaklarla gelir.
4 Derse hazırlıklı gelir.
Toplam
II. ETKĠNLĠKLERE KATILMA
1 Konu ile ilgili görüĢlerini çekinmeksizin ifade eder.
2 GörüĢü sorulduğunda söyler.
3 Yeni ve özgün sorular sorar.
4 Belirttiği görüĢler ve verdiği örnekler özgündür.
5 Dersi iyi dinlediği izlenimi veren sorular sorar.
Toplam
III. ĠNCELEME – ARAġTIRMA – GÖZLEM
1 Bilgi toplamak için çeĢitli kaynaklara baĢvurur.
2 Kendisine verilen kaynaklarla yetinmeyip baĢka kaynaklar araĢtırır.
3 Ġnceleme ve araĢtırma ödevlerini özenerek yapar.
4 Gözlemlerini dikkatli bir Ģekilde yapar.
5 Gözlemleri sonucunda mantıksal çıkarımlarda bulunur.
6 AraĢtırma ve inceleme sonucunda genellemeler yapar.
Toplam
IV. BĠLĠMSEL YÖNTEM
1 Bilinenlerden bilinmeyeni kestirir.
2 Verileri çizgilere ve grafiklere dönüĢtürür.
3 Yönteme uygun deney yapar.
4 Deneyden tanım ve sonuç çıkararak yorumlar yapar.
5 Deneye uygun rapor yazar.
6 Deneyin sonucunu sunar.
7 AraĢtırma inceleme ve deney sonuçlarından genellemelere ulaĢır.
Toplam
GENEL TOPLAM
32
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ANEKDOT KAYDI
Olayın Tarih ve saati
Yer
Olayı gözleyip kaydeden
Gözlenme süresi
:
:
:
:
Gözlenme amacı
Gözlenen olay/etkinlik
:
:
Olay ile ve olayın ortamı bağlamı nedenleri ile ilgili ayrıntılı bilgiler:
Konuya iliĢkin yorumlar
:
Varsa diğer açıklama ve öneriler:
ÖZDEĞERLENDĠRME FORMU
DEĞERLENDĠRĠLECEK TUTUM VE DAVRANIġLAR
1
2
3
4
5
6
DERECELER
Her
Bazen Ara sıra
zaman
Planlı çalıĢmaya özen gösterdim
ÇalıĢmaların esnasında yaptığım plana uygun hareket ettim
AraĢtırmalarımda çeĢitli kaynaklardan yararlandım
Öğretmenimin önerilerini dikkatte aldım
Zamanımı verimli Ģekilde kullandım
ÇalıĢmalarımda kendi payıma düĢen sorumluluklarımı yerine
getirdim
Bu çalıĢma süresince en iyi yaptığım Ģeyler ve diğer yorumlarım:
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
33
AKRAN DEĞERLENDĠRME FORMU
Fecisi
Kararsızım
Bidasi
Kaya
NeĢe
Oya
Hakkı
Grup Üyeleri
Katılıyorum
1
2
3
4
5
6
7
8
9
DERECELENDĠRME
Her zaman
DEĞERLENDĠRĠLECEK
Genellikle
DAVRANIġLAR
Bazen
Hiçbir zaman
Grup çalıĢmalarına katılmada gönüllüdür
ÇalıĢmalara katkı getirir
DüĢüncelerini paylaĢır, öneriler getirir
Grupla uyum içinde hareket eder
DeğiĢik kaynaklardan araĢtırır
Farklı görüĢlere saygılıdır
TartıĢmalarda kullandığı dil yapıcıdır
Araç gereçleri titiz kullanır
Zamanı ve kaynakları israf etmeden kullanır
1
2
3
4
5
6
7
8
9
10

34
Ölçme değerlendirme dersiyle ilgilenmek benim için eğlencelidir
Ölçme değerlendirme bilmek öğretmenliği kolaylaĢtırır
Ölçme değerlendirme gereksiz bir derstir
Ölçme değerlendirme dersinde zaman geçmek bilmez
Ölçme değerlendirme dersi olmasa bu program daha zevkli hale gelir
Ders dıĢı zamanlarda da ölçme değerlendirme etkinlikleriyle
uğraĢabilirim
Ölçme değerlendirme dersinde öğrendiklerim bana anlamlı gelmiyor
Ölçme değerlendirme derslerine ayrılan zamanın daha çok olmasını
isterdim
Ölçme değerlendirmede kendimi baĢarılı görüyorum
Ölçme değerlendirme ile uğraĢmak bence zaman kaybıdır
Ölçme değerlendirme dersini bu programa koyanı cümle alem …
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Kesinlikle katılmıyorum
Katılmıyorum
ÖLÇME DEĞERLENDĠRME DERSĠNE YÖNELĠK
TUTUM ÖLÇEĞĠ
Tamamen katılıyorum
TUTUM ÖLÇEĞĠ
(Eskiden verilen ve çoğunu velilerin yaptığı) PERFORMANS ÖDEVĠ
Ödev Konuları
Sevgili öğrenciler;
Sizden aĢağıdaki ünite ile ilgili konuları dikkatlice okumanızı, bunlardan birisini seçmenizi ve
seçtiğiniz konu ile ilgili araĢtırma yaparak çalıĢmanızı, bir rapor halinde ve sınıf ortamında poster
biçiminde sunmanızı bekliyorum.
Türkiye’nin herhangi bir bölgesini ele alarak; bu bölgenin tarım ürünlerinin, tarım üretimindeki
dağılımını gösteren bir grafik çizme. Bu ürünlerin ülke ekonomisindeki yerini açıklama.
(Oluşturulan posteri grafiğin yanı sıra, fotoğraf, karikatür, çizim vb. görsel araçlarla
zenginleştirmeli ve dağılımı etkileyen etmenlerle ilgili olarak özet bilgiler ile desteklemelisiniz.)
Türkiye’nin herhangi bir bölgesini ele alarak; bu bölgede bulunan ve çıkarılan madenlerin
dağılımını gösteren bir grafik çizme. Bölgede bulunan ve çıkarılan bu madenlerin ülke
ekonomisindeki yerini açıklama. (Oluşturulan posteri grafiğin yanı sıra, fotoğraf, karikatür,
çizim vb. görsel araçlarla zenginleştirmeli ve konuyla ilgili olarak özet bilgiler ile
desteklemelisiniz.)
Ödev Yönergesi
Bu çalıĢmayı baĢarıyla tamamlayabilmeniz için aĢağıdaki adımları izlemelisiniz.








ÇalıĢmanız için yukarıda verilen konuları dikkatlice okumalı ve düĢünmelisiniz.
Yapabileceğinizi düĢündüğünüz konuyu seçmelisiniz.
Seçtiğiniz konu ile ilgili araĢtırma yapmalısınız.
ÇalıĢmanız için aile bireyleri, kitaplar, gazete haberleri, internet vb. kaynaklardan
yararlanabilirsiniz.
AraĢtırmalarınıza dayanarak konu ile ilgili sunacağınız raporda hangi bilgilere yer
vereceğinize karar vermelisiniz (planlamalısınız).
ÇalıĢmalarınız doğrultusunda teslim edeceğiniz raporu hazırlamalısınız.
ÇalıĢmalarınız doğrultusunda sınıfta sergileyeceğiniz materyalleri (poster ve bu posterde
yer almasını düĢündüğünüz görsel materyaller) hazırlamalısınız.
ÇalıĢmanızı rapor olarak .... / .... / 2014 tarihinde teslim etmeli ve sınıfta görsel
materyallerinizi sunmalısınız.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
35
Puanlama Ölçütleri
Ödev, aĢağıdaki DERECELĠ PUANLAMA ANAHTARINA göre 5 tam puan üzerinden
puanlanacaktır.
5Puan
•
•
•
•
•
•
4 Puan
•
•
•
•
•
•
3 Puan
•
•
•
•
•
•
2 Puan
•
•
•
1 Puan
36
•
Ödev hazırlanırken çeĢitli kaynaklardan faydalanılmıĢtır.
Performans ödevinde çalıĢılmak üzere seçilen konunun raporlaĢtırılmasında
ulaĢılan kaynaklardaki bilgilerden yeterince yararlanılmıĢtır.
Poster çalıĢmasında aktarılan bilgiler grafik dıĢında fotoğraf, karikatür, çizim
vb. ile desteklenmiĢtir.
Poster çalıĢmasında yer alan görsel materyaller, konuya iliĢkin özet bilgiler ile
desteklenmiĢtir.
Ödevde kullanılan kaynaklar uygun biçimde rapora yansıtılmıĢtır.
Rapor anlaĢılır biçimde yazılmıĢtır. OluĢturulan cümleler Türkçe yazım
kurallarına uygundur.
Ödevi hazırlanırken çeĢitli kaynaklardan faydalanılmıĢtır.
Performans ödevinde çalıĢılmak üzere seçilen konunun raporlaĢtırılmasında
ulaĢılan kaynaklardaki bilgilerden yararlanılmıĢtır.
Poster çalıĢmasında aktarılan bilgiler grafik dıĢında fotoğraf, karikatür, çizim
vb. ile desteklenmiĢtir.
Poster çalıĢmasında yer alan görsel materyaller, konuya iliĢkin özet bilgiler ile
desteklenmiĢtir.
Ödevde kullanılan kaynaklar uygun biçimde rapora yansıtılmamıĢtır.
Rapor anlaĢılır biçimde yazılmıĢtır.
Ödev hazırlanırken çeĢitli kaynaklardan faydalanılmıĢtır.
Performans ödevinde çalıĢılmak üzere seçilen konunun raporlaĢtırılmasında
ulaĢılan kaynaklardaki bilgilerden yararlanılmıĢtır.
Poster çalıĢmasında aktarılan bilgiler grafik dıĢında fotoğraf, karikatür, çizim
vb. ile yeterince desteklenmemiĢtir.
Poster çalıĢmasında yer alan görsel materyaller, konuya iliĢkin özet bilgiler ile
yeterince desteklenmemiĢtir.
Ödevde kullanılan kaynaklar uygun biçimde rapora yansıtılmamıĢtır.
Rapor anlaĢılır biçimde yazılmıĢtır.
Rapor anlaĢılır biçimde yazılmıĢtır.
Poster çalıĢmasında aktarılan bilgiler grafik dıĢında fotoğraf, karikatür, çizim
vb. ile yeterince desteklenmemiĢtir.
Poster çalıĢmasında yer alan görsel materyaller, konuya iliĢkin özet bilgiler ile
yeterince desteklenmemiĢtir
Raporda konuya iliĢkin yer alan bilgiler yetersizdir ve rapor anlaĢılır biçimde
yazılmamıĢtır.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Dereceli Puanlama Anahtarları (Rubrikler)
DavranıĢların değerlendirilmesinde, davranıĢların önceden belirlenmiĢ “performans ölçütü”
olarak adlandırılan, “istenen belli davranıĢ kalıplarıyla” kıyaslanmasına ve buna göre
davranıĢların yeterliği konusunda yargıda bulunulması yaklaĢımına dayalı bir puanlama
sistemidir.
Genelde “Bütüncül (Holistik)” ve “Analitik” Dereceli Puanlama Anahtarları olmak üzere iki
çeĢidi vardır.
Bütüncül (Holistik) anahtarlarda, davranıĢ belli alt konulara ayrılmadan bir bütün olarak ele
alınır.
Analitik anahtarlarda, davranıĢ ayrı ayrı bölümlere ayrılır, her bölüm kendi içinde puanlandıktan
sonra alt bölümlerden alınan puanlar toplanarak toplam puan elde edilir.
Analitik Dereceli Puanlama Anahtarları
PUAN SUNULAN ĠÇERĠK
Konuya iliĢkin ileri sürülen düĢünceler mantıksal gerekçelerle desteklendi ve
4
bunlar kendi içinde tutarlıydı ve çeliĢkilerden arındırılmıĢtı
Konuya iliĢkin ileri sürülen düĢünceler mantıksal gerekçelerle desteklendi ancak
3
yeterli değildi ancak olanlar arasında kendi içinde tutarlılık vardı
Konuya iliĢkin ileri sürülen düĢünceler mantıksal gerekçelerle desteklenmeye
2
çalıĢıldı ancak yeterli değildi ve ardıĢık açıklamalar arası bazı çeliĢkiler vardı
Konuya iliĢkin ileri sürülen düĢüncelerde mantıksal gerekçeler oldukça azdı ve
1
ardıĢık olmayan çeliĢkili açıklamalar yapıldı
Konuya iliĢkin ileri sürülen düĢünceler mantıksal gerekçelere dayandırılmamıĢtı ve
0
konular kendi içinde çeliĢkiliydi.
PUAN
4
3
2
1
0
SUNU ġEKLĠ
Sunum dinleyicinin ilgisini çekti ve anlaĢıldı
Konu anlaĢılabilirdi ancak ilgi çekmedi
Konu ilgi çekti ancak zor anlaĢıldı
Konu ilgi çekici değildi ve zor anlaĢıldı
Konu hiç ilgi çekmedi ve dinleyiciler tarafından da anlaĢılmadı
PUAN DĠNLEYĠCĠLERLE ĠLETĠġĠM
1-Akıcı bir dil kullanıldı, 2-dinleyiciyle göz teması kuruldu, 3-ses tonu ve 4-beden
4
dili uygun biçimde kullanıldı
Belirtilen özelliklerden üçü olması gerektiği Ģekliyle gözlendi
3
Belirtilen özelliklerden ikisi olması gerektiği Ģekliyle gözlendi
2
Belirtilen özelliklerden sadece bir olması gerektiği Ģekliyle gözlendi
1
Belirtilen özelliklerden hiçbirisi gözlenemedi
0
PUAN
4
3
2
1
0
ZAMANI KULLANMA
Verilen zaman içinde sunumunu tamamladı
Planlanan süreden 2 dakika sapma gözlendi
Planlanan süreden 3 dakika sapma gözlendi
Planlanan süreden 4 dakika sapma gözlendi
Sunum planlanan süreye hiç uymadı
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
37
ÖĞRENCĠ ÜRÜN DOSYASI
Tümel (portfolio) değerlendirme, öğrencinin öğrenme süreci içerisindeki performansının ve
baĢarısının
Ne öğrendi ve öğrenirken nasıl bir yol izledi?
Nasıl düĢündü?
Nasıl soru sordu?
Nasıl analiz etti?
Bilgiyi nasıl yapılandırdı?
Diğer insanlarla nasıl iletiĢim kurdu?
Öğrenirken karĢılaĢtığı güçlükler nelerdi?
gibi sorulara yanıt getirebilecek Ģekilde değerlendirilebilmesine olanak sağlamak amacıyla,
öğrencinin çeĢitli ürünlerinin dosyalanmasıdır.
Öğrencilerin belirli sürelerle ve konularla sınırlı sınavlar sonucu sergiledikleri performansları
yerine daha geniĢ alanlara iliĢkin olarak harcadıkları çabayı, geliĢim evrelerini izleyebilmek ve
değerlendirmek için geliĢtirilmiĢ bir yaklaĢımdır.
Ürün dosyasının yararları
Öğrencide öz disiplin ve sorumluluk bilincini geliĢtirir
GeliĢimi kanıtlarıyla birlikte daha ayrıntılı ve sağlıklı biçimde sergiler
Gelecekteki öğrenme eğilimleri hakkında bilgi veriri ve yönlendirmeler için veri sağlar
Aile ile iletiĢimi sağlar
Ürün dosyasının Bölümleri
Bir ürün dosyası, genel olarak uç ana bölümden oluĢur:
i) Özgeçmiş:
Öğrencinin ortaya koyduğu çalıĢmaların nasıl bir geliĢim sürecinin ürünü olduğu konusunda fikir
vererek, öğrenciyi daha iyi tanımasına olanak sağlar.
ii) Ürünler:
Ġçindekiler olarak da adlandırabileceğimiz bu bölüm, öğrencinin portfolyo içinde yer alan
çalıĢmalarının neler olduğunu içerir.
iii) Yansıtma:
Bu bolümde öğrenci, yaptığı çalıĢmaların bir öz değerlendirmesini yaparak, amaçları ve geliĢimi
ile ilgili kiĢisel görüĢlerini yansıtır. Bu nedenle, Ģu soruların yanıtları yazılabilir
Neden bu çalışmayı seçtim?
Buradaki amacım neydi?
Neleri iyi yaptım?
Hangi alanlarda zayıfım?
Bunları nasıl daha da geliştirebilirim?
38
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Ürün dosyasında neler bulunur?
Ürün dosyasının ne olduğunu, ne amaçla ve nasıl kullanıldığını, neleri içerdiğini ihtiva eden ve
öğretmen tarafından hazırlanmıĢ bir yönerge.
Otobiyografi /ÖzgeçmiĢ
Geleceğe iliĢkin planlar ve hedefleri içeren yazılar
Tutulan günlükler
Ders notları
Kontrol ve değerlendirme listeleri
Grup çalıĢmalarında yerine getirilen sorumluluklara iliĢkin sunu, belge, araĢtırma kayıtları
Yaptığı görüĢme ve gözlem kayıtları
Öğrencinin ödevleri
Yapılan araĢtırmaların sonuçları, raporları
Yazdığı mektuplar, aldığı notlar
Katıldığı eğitsel etkinliklere iliĢkin izlenim notları
Gezi notları, video ve ses kayıtları, fotoğraflar
Öz değerlendirme
Portfolyoların Değerlendirilmesi
Ürün dosyalarının değerlendirilmesinde de, performans ödevlerinin değerlendirilmesinde
kullanılan dereceli puanlama anahtarları kullanılabilir. Bu amaçla, dereceli puanlama anahtarları
hazırlanırken, aĢağıdaki ölçütler dikkate alınabilir.
A) Bütünlük
Ġstenilen çalıĢmalar dosyada var mı?
Sergilenen ürünler yıl/dönem boyunca edinilen becerileri yansıtıyor mu?
B)Tertip ve Düzen
Bütün çalıĢmalar için uygun baĢlıklar kullanılmıĢ mı?
ÇalıĢmalar, içindekiler bölümüne uygun olarak sıralanmıĢ mı?
ÇalıĢma kâğıtları temiz ve düzenli mi? vb.
C) Yansıtma
Seçilen çalıĢmalar öğrencinin geliĢimini yansıtıyor mu?
Gözlemler ayrıntılı ve mantıklı mı? vb.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
39
40
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
TANILAYICI DALLANMIġ AĞAÇ (TDA)
Geleneksel doğru yanlıĢ tipi sorularla sonuç olarak, sadece bir davranıĢın (yanıtın)
değerlendirilmesi mümkün olurken, bu davranıĢın ne Ģeklide oluĢturulduğu (süreç) hakkında
herhangi bir fikir edinilemez.
Bu nedenle birbirine bağlanmıĢ bir dizi doğru yanlıĢ sorular aracılığı ile öğrencinin ne Ģekilde
düĢünerek yanıt verdiği, yanıt verme sürecine bakılarak, belirlenmeye çalıĢılır. Öğrencinin bir
dizi kararlar vererek ulaĢtığı sonuç, verdiği kararların doğruluğu göz önüne alınarak
değerlendirilir.
Avantajları
YanlıĢ öğrenmeleri, kavram yanılgılarını ortaya çıkarır
Yanıtlanırken farkına varılan yanlıĢ kararlar ile öğrenme sağlar
Sınırlılıkları
Hazırlanması deneyim gerektirir ve zaman alır
Üst düzey davranıĢların ölçülmesi zordur
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
41
YAPILANDIRILMIġ GRĠD
YapılandırılmıĢ gridde yaĢa ve düzeye bağlı olarak 9, 12, 16 kutudan oluĢan bir tablo hazırlanır
ve numaralandırılır. Cevaplar geliĢigüzel kutulara yerleĢtirir. Öğrencinin doğru yanıtları bulması
istenir.
1
4
7
Hava sıcaklığı
Sıranın boyu
Gömleğin rengi
2
5
8
Sınıfın mevcudu
Ali‟nin sınav puanı
Saat 00.00
3
6
9
Çocuğun cinsiyeti
40 santimetre
Karpuzun kütlesi
1-Yukarıdaki kutucukların hangileri DOLAYLI ÖLÇME sonucu elde edilmiĢtir?
2-Yukarıdaki ölçüm sonuçlarının hangilerinde MUTLAK SIFIRDAN söz edilebilir?
Puan= (C1/C2)-(C3/C4)
C1= Doğru seçilen kutucuk sayısı
C2=Doğru kutucukların toplam sayısı
C3= YanlıĢ seçilen kutucuk sayısı
C4= YanlıĢ kutucukların toplam sayısı
Buna göre öğrencinin puanı -1 ile +1 arası değer alır. Bu puanı 10 üzerinden puana dönüĢtürmek
için, (negatif değerleri ortadan kaldırmak amacıyla) +1 eklenir. (Orta nokta sıfırdan +1‟e
ötelenir) Çıkan sayı 5 ile çarpılır.
YapılandırılmıĢ gridin, sorulan soru ile ilgili doğru karelerinin sayısı yanlıĢ karelerden çok fazla
ise bu formül ile değerlendirme isabetli olmayabilir.
42
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
SINAVLARIN / TESTLERĠN PLANLANMASI
Sağlıklı bir ölçme değerlendirme için yapılacak iĢlemleri 3 ana baĢlık altında toplamak olasıdır.
Sınavın /Testin
Planlanması
Uygulanması
Puanlanıp değerlendirilmesi
TEST PLANI
Kapsamlı, yazılı olmasa bile her öğretmen sınavdan önce mutlaka bir planlama yapmalıdır.
Ölçme değerlendirme etkinliğinin, planlı bir Ģekilde yapılması, yapılan iĢin, doğru olarak
yapılmasına, bu da ölçmenin niteliğine, dolayısıyla eğitim öğretimin sürecinin niteliğine katkı
getirecektir.
Bir sınav planı en azından Ģu 3 temel sorunun yanıtının daha iĢin baĢında bilinmesine olanak
sağlamalıdır.
Neyi ölçeceğim
Ne amaçla ölçeceğim
Nasıl ölçeceğim
Neyi, ne amaçla, nasıl ölçeceğim?
Eğer değerlendirme ölçütleri öğretmen
değerlendireceğim?” sorusu da eklenmelidir.
tarafından
belirleniyorsa,
bunlara
“Nasıl
PLANLAMA ĠÇĠN ÖĞRETMENLERE ÖNERĠLER
1-Sınavınızın Amacını Belirleyin
Ölçme değerlendirme etkinliklerinin ne amaçlarla yapıldığını hatırlayarak, sınavınızın amacını
belirleyin.
Öğrenme düzeyini mi belirleyeceğiz?
Programın/ planımızın baĢarısını mı saptayacağız?
Bir seçim mi yapacağız?
YerleĢtirme/düzenleme mi yapacağız?
2-Hangi davranıĢları, hangi içeriği kullanarak ölçeceğinizi belirleyin.
Bir yanda amaçlarınızın, diğer yanda konularınızın olduğu bir belirtke tablosu hazırlayın ve
bununla karar verin. Bu arada amaçların (duyuĢsal, biliĢsel, psikomotor) alanlarını ve her alanın
basamağını (taksonomiyi) göz önüne alın. Buna amaç içerik matrisi de denir.
3-Kullanılacak soru tiplerini / test tipini belirleyin.
Hangi tip maddelerin hangi türde ve düzeyde davranıĢ ölçebildiğini göz önüne alarak karar verin.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
43
4-Soru sayısını belirleyin
Sınavınızın kapsam geçerliğini düĢünün. Soru sayısı azaldıkça kapsam geçerliğinin de düĢeceğini
göz önüne alın
Süreyi göz önüne alın. Soru tipini de dikkate alarak, verdiğiniz süre içinde yanıtlanabilecek kadar
soru sorun
GeçmiĢ sınavlarınızı göz önüne alarak belli davranıĢları ölçtüğünüz soruların güçlük derecelerini
hesaplayın. (Soruya doğru yanıt verenlerin sınava girenlere oranı sorunun güçlük derecesidir.
0 Çok zor
Çok kolay 1
0.29 ve altı………………………ZOR
0.30-0.49 arası………………….ORTA
0.50-0.69 arası………………….KOLAY
0.70 ve üzeri…………………….ÇOK KOLAY
Sorularınızın güçlük derecelerini düĢünün. Soru sayısı ile soruların güçlükleri arası dengeyi
kurun.
Sınava giren öğrenci sayısını düĢünün. Eğer cevabı cevaplayana bağlı sorularla test yapıyorsanız,
cevapları okumak için harcayacağınız zamanı hesaplayın. Dar zamanda çok kağıt okumanın
nesnelliği etkileyeceğini unutmayın…
5-Sınavın ortalama güçlük derecesini belirleyin.
Bu amacınızla ilgilidir.
Eğer seçmek için sınav yapıyorsanız, güçlük derecesi yüksek olan sınav düzenleyin.
Eğer öğrencileri birbirilerine göre derecelendirmek için sınav yapıyorsanız ayırt edici (ne çok zor
ne de çok kolay) sınav düzenleyin.
Bir sınavın ortalama güçlük derecesi, o sınavdan alınan puanların aritmetik ortalamasının,
sınavdan alınabilecek en yüksek puana (tam puana) oranıdır.
6-Puanlamaya iliĢkin esasları belirleyin
Ölçme sürecinin analizinde sözü edilen “ölçme kuralı” kavramını hatırlayın.
Her soruya kaç puan verileceğini, (eğer yazılı yoklama yapıyorsanız) her bir sorunun
puanlanmasına esas ana konuları, anahtar fikirleri, alternatifleriyle birlikte örnekleri nasıl
puanlayacağınızı önceden belirleyin.
Objektif testlerde düzeltme faktörü kullanıp kullanmayacağınıza da karar verin.
Objektif testlerde düzeltme faktörü, seçenek sayısının bir eksiği kadar yanlıĢın, bir doğru cevabı
geçersiz kıldığı bir düzenleme yapmaktır.
7-Sınavın süresini belirleyin
Test tipini, soru sayısını, soruların güçlük derecelerini, öğrencilerinizin düzeyini (özellikle en
yavaĢ/ yetersiz olanları) göz önüne alın.
8-Sınav formuna koyacağınız bir sınav yönergesi hazırlayın.
Sınava bir yönerge koymanız, yaptığınız iĢi gösterdiğiniz özenin göstergesidir.
En azından sürenin ve hangi soruya kaç puan takdir edildiğinin bilinmesi, öğrencinin kendi
stratejisini belirlemesine olanak sağlayacaktır.
44
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
SINAVLARIN UYGULANMASINA YÖNELĠK ÖNERĠLER
Sınav baĢlamadan önce oturma düzenini sağlamıĢ olun
Sınav baĢlangıç ve bitiĢ saatlerini söyleyin hatta tahtaya yazın
Sınav baĢlamadan önce, öğrencilere, hızlıca, sınav evrakında eksik sayfa ya da çıkmayan
bölüm gibi sorunların olup olmadığını kontrol ettirin
Sınav süresince sessiz ve sakin bir sınav ortamı sağlayın, bunun için
sert topuklu ayakkabı giymeyin
öğrencinin dikkatini dağıtacak davranıĢlardan kaçının
KOPYA ÇEKME DAVRANIġI
Öğrenciler
Arkadaşlarının cevaplarına bakarak
Birbirleriyle konuşarak
Sınavda kitap defter açarak
Küçük kopya kâğıtları kullanarak
Vücutlarına yazılar yazarak
Cep telefonu veri tabanlı saat gibi teknolojik gereçleri kullanarak
Sınav kağıtlarını değişerek
Testin bir kopyasını önceden ele geçirerek
Sınava başkasını sokarak
kopya davranıĢı sergileyebilirler.
Kopya davranıĢını önlemek için öneriler
1-Öğrencilerinize “kopya çekme” davranıĢının NE ANLAMA GELDĠĞĠNĠ açıklayın ve
aĢağıdaki hususları onlara anlatın:
Kişinin hak etmeden elde ettiği bir şeyin gerçek bir değeri yoktur. Bir şeyi
bizim için değerli ve anlamlı kılan onu elde etmek için sarf ettiğimiz
emektir, çabadır.
Kopya bir tür yalandır. Kopya davranışı ile bir yerlere gelen kişiler
başkalarını aldatmaktadırlar. Hastalandığınızda gittiğiniz hekimin
bilmeden doktor olduğunu düşününüz.
Toplumsal yaşamda güven duygusunun önemli bir yeri vardır. Kopya
karşılıklı güven duygusunu ortadan kaldırır.
Kopya çekmek, kopya çekmeyenlere karşı ciddi bir haksızlıktır. Hak ve
adalet duygularının zedelenmesi toplumsal yapıya zarar verir
Öğrencilikte kopya çekme davranışı yadırganmadan içselleştirilirse,
kişinin yaşamın ilerleyen aşamalarında da “aldatıcı yollara” başvurma
olasılığı artar.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
45
2-Yüksek not alma baskısı nedeniyle kopyayı önlemek için sınav programını dönem
baĢında açıklayın.
3-Ezberlenerek yanıtlanacak, maddelerin, tarihlerin, formüllerin sorgulandığı sınavlar
yapmayın
4-Kopya çekme davranıĢının karĢılığının ne olduğunu baĢtan açıkça ifade edin ve
yakalarsanız da gereğini tavizsiz biçimde yerine getirin
5-Sınavda oturma düzenini siz belirleyin, soru grupları yapın, sınav esnasında baĢka iĢlerle
meĢgul olmayın
6-Sınav sorularının güvenliğini sağlayın
46
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÖLÇME SONUÇLARININ YORUMLANMASI
İÇİN İŞLEMLER
YÜZDE:
Bir veri yığını içinde ilgilendiğimiz özelliğe sahip verilerin miktarını herkes için aynı anlamı
ifade edecek Ģekle dönüĢtürme iĢlemi.
(Ġlgilendiğimiz özelliğe sahip veri sayısının toplam veri sayısına oranını değiĢtirmeden, toplam
veri sayısını 100‟e dönüĢtürme)
Bir sınıfta baĢarılı sayılan notu alan öğrenci sayıları
Toplam Mevcut: 36 / BaĢarılı olan:18
(18/36)x100 = %50
(12/48)  100 = % 25
(66/264)  100 = % 25
(1 / 4 )  100 = % 25
48 kiĢiden 12 kiĢi baĢarılı
264 kiĢiden 66 kiĢi baĢarılı
4 kiĢiden 1 kiĢi baĢarılı
ARĠTMETĠK ORTALAMA
Ölçümlerin (ölçme sonuçlarının) toplanıp ölçüm sayısına bölümüdür. BaĢka bir ifadeyle veri
değerleri toplamının, veri sayısına bölümüdür. Aritmetik ortalama çoğu kez X sembolü ile
gösterilir.
N
X
X
i 1
240
= 24
10
N
Öğrenci
1nci Öğrenci
2nci Öğrenci
3ncü Öğrenci
4ncü Öğrenci
5nci Öğrenci
6ncı Öğrenci
7nci Öğrenci
8nci Öğrenci
9ncu Öğrenci
10ncu Öğrenci
TOPLAM
10 + 12 + 15 + 18 + 24 + 26 + 30 + 32 + 35 + 38
10
i
Puanı
X1=
X2=
X3=
X4=
X5=
X6=
X7=
X8=
X9=
X10=
10
12
15
18
24
26
30
32
35
38
240
X1 X2 X3 X4 X5 X6
1
5
0
2
5
0
3
5
0
4
5
0
X7
X8
X9
X10
SINIF
ORT
5 5 6 7 8 9
5 5 5 5 5 5
0 10 10 10 10 10
5
5
5
Ortalama TEK BAġINA puanların dağılımları hakkında
BĠLGĠ VERMEZ
Örneğin yukarıdaki 3 ayrı ortalamada, PUAN
ORTALAMALARI
AYNIDIR,
ancak
PUAN
DAĞILIMLARI
BĠRBĠRĠNDEN
OLDUKÇA
FARKLIDIR…
Ortalama, bir testten alınabilecek en yüksek puanın yarısına yaklaştıkça testin ayırt ediciliği artar.
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
47
AĞIRLIKLI ORTALAMA
Eğer ortalamaya katılacak ölçümlerin ortalamaya katkılarının farklı olması isteniyorsa, bu
durumda ağrılıklı ortalama hesaplanır. Bunun için, her ölçüm sonucu katkı getirmesi istenen
ağırlık katsayısıyla (oranıyla) çarpılarak ortalamaya sokulurken, elde edilen toplam, ağırlıkların
toplamına bölünür.
Ağ.Ort 
 X 1  A1    X 2  A2    X 3  A3   .....   X n  An 
A1  A2  A3  ...  An
ORTANCA (MEDYAN)
Veriler (büyükten küçüğe ya da küçükten büyüğe doğru) sıraya konduktan sonra tam
ortaya düĢen ölçme sonucudur. (BaĢtan ve sondan aynı uzaklıktaki ölçme sonucu da denilebilir)
Puanlar sıralandıktan sonra iki %50‟lik kısma ayıran değerdir.
Veri sayısı (N) tek olduğunda, (N+1)/2 „nci terim ORTANCA olur.
Terim sayısı
VERĠLER
1
2
3
4
5
6
7
8
9
20
22
25
27
30
35
36
40
55
Terim sayısı 9 olduğuna göre (9+1)/2 yani 5‟inci terim ortancadır.
Veri sayısının çift olması durumunda, ortanca, tam orta noktanın sağında ve solunda kalan iki
verinin aritmetik ortalamasıdır.
Veri sayısı (N) çift olduğunda da, ORTANCA (N/2)‟nci terim ile [(N+2)/2]‟nci terimlerin
ARĠTMETĠK ORTALAMASI olur.
Terim sayısı 10 olduğuna göre, (10/2) [yani 5‟inci terim] ile [(10+2)/2] (yani 6‟ncı terimin)
ortalaması ortancadır.
Terim sayısı
VERĠLER
1
2
3
4
5
6
7
8
9
10
20
22
25
27
30
35
36
40
55
60
Ortanca = (30+35)/2 = 32,5
48
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ORTANCANIN ANLAMI
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
ORTANCA
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Ort
Ortanca
A
1
2
2
2
3
3
4
4
4
4
4
4
5
5
5
5
5
5
5
6
6
6
6
7
7
7
7
8
9
9
B
1
1
1
1
2
2
2
3
3
3
3
3
3
3
3
3
4
6
6
8
8
8
8
9
9
9
9
9
10
10
C
1
1
1
2
2
3
3
3
4
4
4
5
5
5
6
6
6
6
6
6
6
7
7
7
7
7
7
7
8
8
5,00
5,00
5,00
3,00
5,00
6,00
Dağılım A: Ortanca ve ortalama birbirine yakın: NORMAL DAĞILIM
Dağılım B: Ortanca ortalamadan küçük: Puanların sayıca çoğu ortalamanın altında ancak az
sayıda yüksek puan ortalamayı yükseltiyor.
Dağılım B: Ortanca ortalamadan büyük: Puanların çoğu ortalamanın üstünde ancak az sayıda
düĢük puan ortalamayı aĢağı çekiyor.
(Ortalama ve Tepedeğerle birlikte daha anlamlı sonuçlar verecek çarpıklık yorumları
yapılacaktır.)
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
49
TEPEDEĞER (MOD)
Veri kümesi içinde en çok tekrarlanan, sıklığı (frekansı) en fazla olan veridir.
Tepedeğer, verinin kaç kez tekrarlandığı değil, en fazla tekrarlanan verinin aldığı değerdir.
4
5
6
7
8
8
8
9
9
Yukarıdaki veri dizinde yer alan verilerin değerleri ve bu verilerin tekrar (sıklık) miktarlarına
bakıldığında
Veri
4
5
6
7
8
9
en fazla tekrarlanan (3 kez)
görülmektedir.
Sıklığı
1
1
1
1
3
2
verinin 8 olduğu
Bu durumda söz konusu veri dizisinin tepedeğeri 8 dir.
Her bir verinin bir kez yer aldığı ya da her verinin eĢit sayıda tekrarlandığı dizilerin tepedeğeri
olmaz ve bu durumda dizinin tepedeğeri (modu) YOKTUR denir.
Her bir veri bir kez tekrarlandığı için TEPEDEĞERĠ OLMAYAN puan dizisi
1
3
4
5
7
8
9
11
12
14
11
11
Verileri eĢit sayıda tekrarlandığı için TEPEDEĞERĠ OLMAYAN puan dizisi
1
1
4
4
6
6
8
8
Bazı durumlarda da birden fazla en çok ama eĢit sayıda tekrarlanan veri olabilir. Bu durumda
puan dizinin ĠKĠ TEPEDEĞERĠNDEN söz edilir.
1
1
1
4
6
8
8
8
9
9
Yukarıdaki puan dizinin iki tepe değeri vardır, birisi 1, diğeri de 8 dir.
Eğer buçuklu sayıyla ifade edilmiĢ bir tepedeğere rastlarsanız, bu ARDIŞIK OLAN VE
TEKRAR SAYILARI EġĠT ĠKĠ DEĞERĠN ORTA NOKTASININ tepedeğer alındığını gösterir.
Bu durumu iki tepedeğer olarak ele alanlar çoğunluktadır.
1
3
5
5
5
6
6
6
9
10
Yukarıdaki puan dizinin tepe değeri, ardıĢık olan, yani birbirini izleyen (5 ve 6) ve sıklıkları aynı
olan (3‟er kez yinelenmiĢler) iki sayınının orta noktası olarak 5,5 denildiğine rastlarsanız
ĢaĢırmayın.
50
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GENĠġLĠK (RANJ)
En büyük ve en küçük değerler arası fark.
2
2
3
4
4
5
5
6
7
8
GeniĢlik = En büyük değer - En küçük değer [ 8 – 2 = 6]
GeniĢlik ne kadar BÜYÜKSE puanlar birbirinden o derece farklılaĢmakta, ne derece KÜÇÜKSE
puanlar birbirine yaklaĢmakta, yani benzer puanlar olmaktadır.
Puanlarının iyi (normal) dağıldığı bir testte, geniĢlik o testten alınacak en yüksek puanın yarısına
yakın olmalıdır. GeniĢlik ile en yüksek puanın yarısı arasındaki fark büyüdükçe, testin ayırd
ediciliği artar.
ÇEYREK SAPMA
Büyükten küçüğe doğru sıralanmıĢ puanların, birinci çeyreği ile (sıralamanın %25‟inci puanı)
üçüncü çeyreği (sıralamanın %75‟inci puanı) arası farkın yarısıdır. Ortanca etrafındaki iki
çeyrek nokta arasındaki açıklığı gösterir. Dağılımın belirgin biçimde sağa ya da sola eğimli
olması durumunda daha anlamlıdır. Böylelikle, uçlardaki aĢırı değerlerin neden olduğu fazla
sapmanın etkisi ortadan kaldırılmıĢ olur. Ancak tüm puanlar hesaba katılmadığı için güvenilir
bir değiĢim ölçüsü olarak kabul edilmez.
N tane puan küçükten büyüğe doğru sıralanır.
N(25/100) birinci çeyrek [Q1] puanı, N(75/100) ise üçüncü çeyrek [Q3]puanı gösterir.
Q
Birinci Çeyrek
1
2
3
4
Q3  Q1
2
Ġkinci Çeyrek
5
6
7
8
9
Üçüncü Çeyrek
10
11
12
13
14
Dördüncü Çeyrek
15
16
17
18
19
20
10 12 13 14 15 19 21 23 23 24 25 27 29 33 35 37 38 41 44 49
ORTANCA
Ortanca etrafındaki iki çeyrek nokta arasındaki açıklığı
Toplam (N) 20 puan olduğuna göre, birinci çeyrek Q1= 20 (25/100)= 5 (BeĢinci sıradaki puan )
Üçüncü çeyrek ise Q3 = 20 (75/100)= 15 (OnbeĢinci sıradaki puan)
Q
35  15 20

 10
2
2
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
51
STANDART SAPMA
Bir dizi ölçümde, ölçümlerin ortalamadan olan farklarının bir ortalamasıdır.
Puan dizisinde puanların ortalaması bulunduktan sonra, her puanın ortalamadan farkı bulunur.
X
Puanların Ortalaması
100  90  90  80  70  70  60  50  50  40
10
Öğrenci
A1
A2
A3
A4
A5
A6
A7
A8
A9
A 10
Not
Not-Ortalama
100
100 - 70 =
90
90 - 70 =
90
90 - 70 =
80
80 - 70 =
70
70 - 70 =
70
70 - 70 =
60
60 - 70 =
50
50 - 70 =
50
50 - 70 =
40
40 - 70 =
Farkların Toplamı=
X  70
Fark
30
20
20
10
0
0
-10
-20
-20
-30
0
Ancak, her durumda, ortalamanın altında ve üstünde kalan bu farkların genel toplamının her
zaman 0 (sıfır) olduğu görülecektir. Bu durum, farkların aritmetik ortalamasının alınması için bir
engel teĢkil etmektedir. Bu nedenle farkların karesi alınarak iĢlem yapılır.
Öğrenci
A1
A2
A3
A4
A5
A6
A7
A8
A9
A 10
 X
N
S
52
i 1
i  X
N 1
Not
100
90
90
80
70
70
60
50
50
40
Not-Ortalama
100 - 70 =
90 - 70 =
90 - 70 =
80 - 70 =
70 - 70 =
70 - 70 =
60 - 70 =
50 - 70 =
50 - 70 =
40 - 70 =
TOPLAM
Fark (Fark) 2
30
900
20
400
20
400
10
100
0
0
0
0
-10
100
-20
400
-20
400
-30
900
0
3600
2
S
3600
10  1
S  400
S=20
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
HĠSTOGRAM / Frekans Poligonu
Bir puan dizisindeki dağılımı görselleĢtirebilmek için, hangi puandan kaç tane alınmıĢ olduğunu
gösteren bir grafik çizilir. Bu grafikte y ekseni puan sayısını, x ekseni de puanları gösterir.
Eğer bu bir çubuk grafiği çeklinde olursa Frekans Poligonu
Çubukların tepe noktalarından geçen bir eğri olursa Dağılım Eğrisi olarak adlandırılır.
ESKĠDEN PUAN DAĞILIMINI GÖRMEK ĠÇĠN NELER YAPILIRDI?
Puan listesi ele alınırdı
Bir sınıfta 50 öğrenciye ait puanlar:
91
77
71
65
61
57
52
45
40
30
86
76
71
64
59
56
51
45
39
30
84
73
68
63
59
56
49
44
39
27
81
71
67
63
58
53
48
40
38
25
80
71
66
62
58
52
47
40
30
20
Bu puanları sıralamak için ÇETELE
tutulurdu.
Her bir puanın onlar hanesinin satırı ile birler hanesinin kesiĢtiği yere bir çizgi (iĢaret)
yerleĢtirilirdi.
9 1
7 3
0
90
80
70
60
50
40
30
20
1
/
/
/
///
/
/
2
3
4
5
6
/
/
//
/
//
/
///
///
/
/
/
/
/
/
//
7
8
//
/
/
/
/
/
/
/
/
//
/
/
9
//
/
//
3 8
Bu çeteleye bakarak puanlar sıralanırdı
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
53
91
86
84
81
80
77
76
73
71
71
71
71
68
67
66
65
64
63
63
62
61
59
59
58
58
57
56
56
53
52
52
51
49
48
47
45
45
44
40
40
40
39
39
38
30
30
30
27
25
20
Grafik özellikleri ve veri gruplama esasları belirlenirdi
Veri sayısının fazla ve değerlerin çok çeĢitli olması durumunda, genel eğilimlerin görülmesi
kolay olmayacağı için, veriler belli aralıklara göre gruplandırılarak incelenir. (Bunun yapılmadığı
bir durumda, 100 üzerinden yapılan bir sınav için, histogramın, x ekseninde 100 değer içeren bir
grafik olacağını görünüz)
Sıklık tablosunda 10–25 grup olması istenir. Grup sayısı 10‟un altına inince bazı bilgiler
kaybolurken, 25‟in üzerine çıkması yorumlamayı ve iĢlemleri zorlaĢtırır.
Grupların her birinin üst ve alt sınırları arasında kalan değerleri içerecek aralıkların geniĢliğinin
(katsayısının) belirlenmesi için en yüksek ve en düĢük değer arası fark, kararlaĢtırılan (10–25
uygun olmaktadır) grup sayısına bölünür.
Aralık geniĢliğinin (3, 5, 7, 9 gibi) TEK sayı olması, aralığın orta noktasının belirlenmesini
kolaylaĢtırır.
Bu örnek için, grup sayısı ve aralık geniĢliği:
En fazla = 91
En az =20
GeniĢlik: 91-20=71
Grup Sayısı 15 olsun
71/15 = 4,7 (En yakın tek sayıya taĢınmıĢ aralık geniĢliği ya da katsayısı= 5)
GRUPLAR
Grup Sayısı 15
En düĢük puanı içerecek Ģekilde aralık geniĢliğinin tam katı /böleni olan bir sayıdan grup sınırları
baĢlatılır ve aralık geniĢliği adımlarıyla en yüksek puanı içerecek Ģekilde tamamlanır.
54
GRUP
SINIRLARI
90-94
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
ORTA
NOKTA
90 91 92 93 94
87
82
77
72
67
62
57
52
47
42
37
32
25 26 27 28 29
20 21 22 23 24
ARALIK
GENĠġLĠĞĠ
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Grupların gerçek sınırlarının saptanması
Herhangi bir puanın kesin olarak hangi gruba dâhil olduğunun belirlenmesi için grupların
gerçek sınırlarının belirlenmesi gerekir. Örneğin 24,4 24,5 ve 24,6 puanları
20-24 aralığında mı yer alacaktır yoksa 25-29 puan aralığında mı?
30-34
25-29
20-24
29,5024,50-29,49
19,50 -24,49
30 31 32 33 34
25 26 27 28 29
20 21 22 23 24
Orta Nokta = Aralık Alt Sınırı + [ ( Aralık Üst Sınırı – Aralığın Alt Sınırı ) / 2 ]
20-24 aralığının orta noktası = 19,50 + [(24,50-19,50) / 2]= 22,00
Puanların dahil oldukları grupları ve grupların aralık geniĢliklerinin gerçek sınırlarını gösteren
tablo aĢağıdaki Ģekilde ifade edilebilir.
GRUP
SINIRLARI
90-94
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
GERÇEK
SINIRLAR
89,50-94,49
84,50-89,49
79,50-84,49
74,50-79,49
69,50-74,49
64,50-69,49
59,50-64,49
54,50-59,49
49,50-54,49
44,50-49,49
39,50-44,49
34,50-39,49
29,50-34,49
24,50-29,49
19,50-24,49
ORTA
NOKTA
92
87
82
77
72
67
62
57
52
47
42
37
32
27
20 21 22 23 24
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
55
Örneğimizdeki 50 puanın SIKLIK (FREKANS) TABLOSU aĢağıdaki Ģekilde yapılabilir.
Grup
Aralığı
90–94
85–89
80–84
75–79
70–74
65–69
60–64
55–59
50–54
45–49
40–44
35–39
30–34
25–29
20–24
SIKLIK
O grup
aralığına
düĢen
puandan kaç
tane var.
25–29
aralığında 2
adet (25 ve
27) puan var
Sıklık
1
1
3
2
5
4
5
7
4
5
4
3
3
2
1
Yüzde
Sıklık
2
2
6
4
10
8
10
14
8
10
8
6
6
4
2
Yığılmalı Toplamlı
Sıklık
Yüzde Sıkl.
50
100
49
98
48
96
45
90
43
86
38
76
34
68
29
58
22
44
18
36
13
26
9
18
6
12
3
6
1
2
YÜZDE SIKLIK:
O grup aralığına düĢen puan
sayısının, toplam puan
sayısının yüzde kaçı olduğu
25–29 aralığındaki 2 puan,
toplam 50 puanın %2‟si
TOPLAMLI YÜZDE
SIKLIK
O grup aralığı dahil
altta kalan puan
yüzdelerinin toplamı
35-39 aralığında %6
30-34 aralığında %6
25-29 aralığında %4
20-24 aralığında %2
olmak üzere puanların
toplam %18‟i.
YIĞILMALI SIKLIK
O grup aralığı dahil, altta kalan
gruplardaki puanların sayısı
35-39 aralığında 3
30-34 aralığında 3
25-29 aralığında 2
20-24 aralığında 1 olmak
üzere toplam 9 puan
FREKANS POLĠGONU
7
5
4
5
4
5
4
3 3
3
2
2
90-94
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
1 1
25-29
1
20-24
8
7
6
5
4
3
2
1
0
Artık bu iĢlemler için yazılım kullanılıyoruz
56
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GRUPLANDIRILMIŞ VERİLERLE İŞLEMLER
ORTALAMA:
GruplandırılmıĢ verilerle ortalama hesabında, her grup aralığının ORTA NOKTASI bulunarak,
bu orta nokta değeri frekansla (sıklıkla) çarpılır ve bu çarpımların toplamı toplam frekansa
bölünür.
Grup
Aralığı
90–94
85–89
80–84
75–79
70–74
65–69
60–64
55–59
50–54
45–49
40–44
35–39
30–34
25–29
20–24
Frekans
(Sıklık)
(f)
1
1
3
2
5
4
5
7
4
5
4
3
3
2
1
n f
Yığılmalı
Sıklık
50
49
48
45
43
38
34
29
22
18
13
9
6
3
1
Orta
Nokta
(X0)
92
87
82
77
72
67
62
57
52
47
42
37
32
27
22
50
X 
f .X 0
n
(f) (X0)
92
87
246
154
360
268
310
399
208
235
168
111
96
54
22
 f .X
0
2810
X
2810
50
X  56,2
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
57
ORTANCA: GruplandırılmıĢ verilerde ortancayı hesaplayabilmek için yığılmalı sıklık sütunu
olmalıdır.
Grup
Aralığı
90–94
85–89
80–84
75–79
70–74
65–69
60–64
55–59
50–54
45–49
40–44
35–39
30–34
25–29
20–24
Frekans
(Sıklık)
(f)
1
1
3
2
5
4
5
7
4
5
4
3
3
2
1
Yığılmalı
Sıklık
50
49
48
45
43
38
34
29
22
18
13
9
6
3
1
Ort  L AS
n


t
fa 
2

a
f
b




LAS =
n/2 nci sıklığı içeren yığılmalı sıklık değerinin karĢılık geldiği puan aralığının
gerçek alt sınırını gösterir. n/2 burada 25‟dir ve yığılmalı sıklık değerinde bunu içeren puan
aralığı 55-59 aralığıdır. Bu aralığın gerçek alt sınırı da 54,51 yani 54.5 dur. Gerçekten de
ortanca, bu aralığın alt ve üst sınırları arasındadır.
t fa = Ortancanın bulunduğu aralığın altında kalan sıklıkların toplamı. (Burada 22)
fb
= Ortancanın bulunduğu puan aralığının sıklığı (Burada 7)
a = Aralık geniĢliği (katsayısı) (Burada 5)
 50


22


Ort  54,5   2
5
 7 


58
Ort  56,64
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
TEPEDEĞER: GruplandırılmıĢ verilerde sıklığı (frekansı) en yüksek olan aralığın orta noktası
tepedeğer sayılabilir.
Grup
Aralığı
90–94
85–89
80–84
75–79
70–74
65–69
60–64
55–59
50–54
45–49
40–44
35–39
30–34
25–29
20–24
Frekans
(Sıklık)
(f)
1
1
3
2
5
4
5
7
4
5
4
3
3
2
1
T  L
Orta
Nokta
(X0)
92
87
82
77
72
67
62
57
52
47
42
37
32
27
22
Tepedeğ.  55 
fS
a
f S  fÖ
L =Sıklığı en fazla olan grubun alt değeri.
Burada 55
f S =Sıklığı en fazla olan gruptan bir sonraki
grubun sıklığı Burada 5
f Ö = Sıklığı en fazla olan gruptan bir önceki
grubun sıklığı Burada 4
a = Sıklığı en fazla olan grubun geniĢliği
(aralık katsayısı) Burada 5
[55–59 arasının 4 olmadığını görünüz]
5
5
5 4
Tepedeğ.  57,7
YÜZDELĠK: Bir puan dizisinin dağılımı göz önüne alındığında, puanların belli bir yüzdesinin
altında kaldığı puan değeri.
Örneğin, 70‟nci yüzdelik puanların %70‟nin altında kaldığı (puanların %30‟unun da kendisinden
büyük olduğu) bir puandır.
QN =N’inci yüzdelik
Grup
Aralığı
90–94
85–89
80–84
75–79
70–74
65–69
60–64
55–59
50–54
45–49
40–44
35–39
30–34
25–29
20–24
Frekans
(Sıklık)
(f)
1
1
3
2
5
4
5
7
4
5
4
3
3
2
1
Yığılmalı
Sıklık
50
49
48
45
43
38
34
29
22
18
13
9
6
3
1
Q N  L AS
Q N
 100  t fa

fb




a


LAS =
n/2 nci sıklığı içeren yığılmalı sıklık değerinin
karĢılık geldiği puan aralığının gerçek alt sınırını gösterir.
n/2 burada 25‟dir ve yığılmalı sıklık değerinde bunu içeren puan
aralığı 55-59 aralığıdır. Bu aralığın gerçek alt sınırı da 54,51
yani 54.5 dur. Gerçekten de ortanca, bu aralığın alt ve üst
sınırları arasındadır.
t fa = Ortancanın bulunduğu aralığın altında kalan sıklıkların
toplamı. (Burada 22)
f b = Ortancanın bulunduğu puan aralığının sıklığı (Burada 7)
a = Aralık geniĢliği (katsayısı) (Burada 5)
Abdullah Can Yoğunlaştırılmış Hafta Sonu Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
59
 50  50

 100  22 
Q50  54,5  
5
7




Q50  56,64
50‟nci yüzdeliğin ORTANCA olduğunu görünüz.
DAĞILIMIN YÖNÜ – ÇARPIKLIK
Bir puan dizisinin dağılım eğrisi ne kadar simetrikse (çan eğrisine benziyorsa) o derece
NORMAL DAĞILIM özellikleri taĢıyor demektir.
Normal Dağılım sergileyen bir dizinin ORTALAMASI, ORTANCASI ve TEPEDEĞERĠ
aynıdır. Bu değerler ne kadar birbirine yakınsa dağılım o derece normal dağılıma yakındır.
Ortalama
Ortanca
Tepedeğer
Normal Olmayan Dağılımlar ÇARPIK DAĞILIMLAR olarak da adlandırılabilir.
Bir puan dağılımının çarpıklığı
ÇARPIKLIK 
3(Ortalama  Ortanca)
Standart Sapma
Ortalama ortancadan büyükse Çarpıklık Katsayısı POZĠTĠF olur.
Bu da SAĞA ÇARPIK dağılım olarak adlandırılır.
Dağılım SAĞA ÇARPIK olan, yani Ortalaması Ortancasından büyük olan testler ZOR
TESTLERDĠR.
60
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Ortanca
Ortalama
Ortalama ortancadan küçükse Çarpıklık Katsayısı NEGATĠF olur.
Bu da SOLA ÇARPIK dağılım olarak adlandırılır.
Dağılım SOLA ÇARPIK olan, yani Ortalaması Ortancasından küçük olan testler KOLAY
TESTLERDĠR.
Ortanca
Ortalama
Orta güçlükte (normal) bir testin çarpıklık katsayısının 0 ile 0.25 arasında olması istenir.
BĠR SINAVIN GÜÇLÜĞÜNE ĠLĠġKĠN YORUM ÖNERĠLERĠ
Puan ortalamasının sınavdan alınabilecek olası en yüksek puana oranına, yani testin ortalama
güçlük katsayısına bakılabilir. Bu sayının 1‟e yakınlığı testin kolaylığının, 0‟a yakınlığı da testin
zorluğunu gösterir. Geleneksel yaklaĢımla %50 yi orta nokta olarak aldığımızda
Zorluk %50‟den küçükse
Test hazırlanıĢ itibarıyla zordur
Süreç yetersiz kalmıĢ olabilir
Bireysel performansı düĢük (zayıf) öğrenciler çoğunluktadır
Zorluk %50‟den büyükse
Test hazırlanıĢ itibarıyla basittir
Süreç kazanımlar için yeterli olmuĢtur
Ġyi puan alan öğrenciler çoğunluktadır
Dağılım eğrisinin Çarpıklık Katsayısına bakılır. Çarpıklık katsayısı NEGATĠF ise, test kolaydır.
Eğer çarpıklık katsayısı
0.00 ile +0.10 arasındaysa test BĠRAZ ZOR
+0.10 ile +0.25 arasındaysa test ORTA ZORLUKTA
+0.25 den büyükse test OLDUKÇA ZOR denebilir.
Elde sadece puan ortalamaları ve soru sayıları varsa, soru sayısı ile olası puan arasındaki
doğrusal iliĢkiden yola çıkarak, Ortalamanın soru sayısına oranlarına bakarak testlerin
güçlüklerini kıyaslayabiliriz.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
61
KORELÂSYON ve UYUM
Korelâsyon (ilgileĢim) iki veri dizisi arasındaki iliĢkinin MĠKTARINI ve YÖNÜNÜ gösteren
eden bir istatistiksel iĢlemdir ve bu iĢlemin sonucu KORELÂSYON KATSAYISI olarak
adlandırılır.
Korelâsyon katsayısının anlamlı bir sonucu ifade etmesi için, aralarındaki iliĢkinin sorgulandığı
veri dizileri, aynı kaynağa ait eĢleĢtirilmiĢ veri dizileri olmalıdır. Örneğin, öğrencilerin
Matematik ve Fen Bilgisi baĢarıları arası iliĢki sorgulanacaksa, her bir öğrenciye ait eĢleĢtirilmiĢ
matematik ve fen bilgisi puanları dizileri ile iĢlem yapılmalıdır.
Korelâsyon katsayısı (r ile gösterilir) -1 ile +1 arası değer alabilen bir sayıdır.
Korelâsyon katsayısı ne kadar 1‟e yakınsa, aradaki iliĢki o kadar ÇOK demektir.
Korelâsyon katsayısının iĢareti, iliĢkinin yönünü gösterir.
Pozitif (+) iliĢki, değiĢimin yönünün aynı olduğunu gösterir. Aralarında iliĢki sorgulanan
değiĢkenlerden birisi artıyorsa, diğeri de artıyor demektir.
Negatif (-) iliĢki ise değiĢkenlerden birisi artarken diğerindeki azalmayı ifade eder.
Korelâsyon katsayısının 1 olması mükemmel iliĢki demektir.
Korelâsyon katsayısının sıfır (0) olması değiĢkenler arasında hiç iliĢki olmadığını gösterir.
Korelâsyon katsayısının karesi, bir değiĢkendeki değiĢimin ne kadarının diğer değiĢkenden
kaynaklandığını gösterir.
Türkçe ve Matematik puanları arası korelasyonun (r=0.7) olduğu bir durumda, [r2=0.49] Türkçe
puanlarındaki değiĢimin %49‟unu Matematik puanlarının açıkladığını ya da Matematik
puanlarındaki değiĢimin %49‟unu Türkçe puanlarının açıkladığını ileri sürebiliriz. Ancak
korelasyon değiĢkenler arası NEDEN SONUÇ iliĢkisini gösteremez.
Korelâsyonun çeĢitleri vardır. Burada sıklıkla kullanılan basit doğrusal korelasyondan (Pearson
momentler çarpımı korelasyon katsayısının bulunmasından) söz edilmiĢtir.
62
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
BASĠT DOĞRUSAL KORELÂSYON
10 öğrencinin Matematik Puanları X i ile Fen Bilgisi puanları da Yi ile gösterilmiĢ olsun.
Bu öğrencilerin Matematik Puanları ile Fen Bilgisi puanları arası iliĢki var mıdır?
Öğrenci
1
2
3
4
5
6
7
8
9
10

Y
XY
X2
Y2
95
80
100
60
88
65
90
75
80
60
90
85
90
65
89
70
90
80
82
70
8550
6800
9000
3900
7832
4550
8100
6000
6560
4200
9025
6400
10000
3600
7744
4225
8100
5625
6400
3600
8100
7225
8100
4225
7921
4900
8100
6400
6724
4900
793
811 65492 64719 66595
793
65492
rxy 
X
811
 N
 N

  X i   Yi 
N
 i 1 
X iYi   i 1

N
i 1
10
2
2

 N
 
 N
 
  X i   N
  Yi  
 N
2
2
i

1




Xi 
Yi   i 1  


 i 1
  i 1

N
N










64719
rxy 
793
66595
 793  811 
65492  

 10

2
2



793  
811 
64719 
 66595 

10
10 


811
rxy  0,96
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
63
BaĢka bir formül ile aynı örnek durum için Basit Doğrusal Korelâsyon Katsayısının
hesaplanması:
Öğrenci
1
2
3
4
5
6
7
8
9
10

X
Y
XY
X2
Y2
95
80
100
60
88
65
90
75
80
60
90
85
90
65
89
70
90
80
82
70
8550
6800
9000
3900
7832
4550
8100
6000
6560
4200
9025
6400
10000
3600
7744
4225
8100
5625
6400
3600
8100
7225
8100
4225
7921
4900
8100
6400
6724
4900
793
811 65492 64719 66595
65492
20
 N
 N 
N  X iYi    X i   Yi 
i 1
 i 1  i 1 
2
2
N
N
 N 2  N




 
2
 N  X i    X i    N  Yi    Yi  
 i 1    i 1
 i 1  
 i 1
64719
rxy 
(793)2
20
66595
(811)2
(20  65492)  (793  811)
[(20  64719)  7932 ][(20  66595)  8112 ]
rxy 
64
811
N
20
rxy 
793
(666726)
= 0.96
[(1294380)  628849][(1331900)  657721]
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
DĠĞER KORELÂSYON TEKNĠKLERĠ
Ġki değiĢken arasındaki basit doğrusal korelasyon katsayısının hesaplanabilmesi için
değiĢkenlerin her ikisinin de en az aralık ölçeğinde sürekli değiĢkenler olması gerekmektedir.
NOKTA ÇĠFT SERĠLĠ KORELÂSYON KATSAYISI
Bazı durumlarda, en az aralık ölçeğinde sürekli bir değiĢken ile iki kategorili nitel bir değiĢken
arası iliĢki sorgulanabilir.
10 kişilik yüksek lisans grubunda İleri Eğitim İstatistiği dersi veren bir öğretim elemanı SPSS
yazılımını kullanarak hesaplamalar yaptırmaktadır. Öğrencilerden bazılarının kendi kişisel
bilgisayarları varken bazılarının da yoktur. Dönem sonunda yaptığı genel değerlendirme
sonuçlarına bakarak, dersteki başarı ile bilgisayara sahip olma arasında bir ilişki olup
olmadığını sorgulamak istemektedir.
Bu durumda, baĢarı (sınav puanı) aralık ölçeğinde sürekli bir değiĢken, bilgisayara sahip olma ya
da olmama da iki kategorili nitel bir değiĢkendir. [Bilgisayarı olanlar ve olmayanlar]
Genellikle kategorik değiĢkende, ilgilenilen kategori (burada bilgisayara sahip olma ile baĢarı
sorgulanacağı için, ilgilenilen kategori bilgisayara sahip olanlardır) (1) ile, diğer kategori de (0)
ile kodlanır.
Bilgisayarı var mı?
Başarı Puanı
Öğrenci No_01
Yok
(0)
75
Öğrenci No_02
Var
(1)
80
Öğrenci No_03
Yok
(0)
60
Öğrenci No_04
Yok
(0)
70
Öğrenci No_05
Var
(1)
Öğrenci No_06
Var
(1)
90
85
Öğrenci No_07
Yok
(0)
65
Öğrenci No_08
Yok
(0)
80
Öğrenci No_09
Yok
(0)
85
Öğrenci No_10
Var
(1)
90
X jD  X  p j
rpb 

SX
 q j



X jD = Ġlgilenilen kategorideki bireylerin (1 ile kodlanmıĢ olanların) sürekli değiĢkene ait
puanlarının ortalaması. Yani, bilgisayarı olan öğrencilerin baĢarı puanlarının aritmetik ortalaması
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
65
X 02  X 05  X 06  X 10
80  90  85  90
345
=
X jD 
 86,25
4
4
4
X = Sürekli değiĢkene ait puanların (her iki kategorideki bireylerin puanlarının) ortalaması
X jD 
X 01  X 02  X 03  X 04  X 05  X 06  X 07  X 08  X 09  X 10
10
75  80  60  70  90  85  65  80  85  90
780
= 78
X 
X 
10
10
X
S X = Sürekli değiĢkene ait puanların (her iki kategorideki bireylerin puanlarının) standart
sapması
 X
N
SX 
i 1
 X
2
i
N 1
(75  78) 2  (80  78) 2  ...  (85  78) 2  (90  78) 2
SX 
10  1
S X  10.32
p j  Kategorik değiĢkende, ilgilendiğimiz kategoriye düĢen birey sayısının her iki kategorideki
toplam birey sayısına oranı. Toplam öğrenci sayısı= 10. Bilgisayarı olan öğrenci sayısı= 4
p j  (Bilgisayarı olan öğrenci sayısı) / Toplam Öğrenci sayısı
q j  1 p j
rpb 
q j  1 0,4
X jD  X  p j 


SX
q
 j 
rpb 
q j  0,6
p j  4/10
p j  0,4
(= Diğer kategoridekilerin toplama oranı)
86,25  78  0,4 


10,32  0,6 
rpb  0,64
SIRA FARKLARI KORELÂSYON KATSAYISI
Aralarında iliĢki sorgulanan değiĢkenlerin sıralama ölçeği ile ifade edildiği durumlarda
(Spearman Brown) sıra farkları korelasyon katsayısı hesaplanabilir. Bu korelasyon katsayısı,
değiĢkenlerden herhangi birisinin aralık ölçeğinde olması durumunda da, bu değiĢkenin yapay
olarak sıralama ölçeğine çevrilmesi sonunda kullanılabilir.
Bir öğretmen, yaptığı bir sınavda, öğrencilerin sınavdan aldıkları puan ile sınav kâğıdını verme
sırası arasında bir ilişki olup olmadığını sorgulamak istiyor.
Bu durumda sınav kâğıtlarını veriĢ sırası zaten sıralama ölçeğinde bir değiĢkendir ancak aralık
ölçeğinde olan sınav puanlarının da “sıralama ölçeğine” dönüĢtürülmesi gerekir.
66
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Kağıdı veriş sırası
6
8
7
2
5
9
1
4
3
10
Öğrenci_01
Öğrenci_02
Öğrenci_03
Öğrenci_04
Öğrenci_05
Öğrenci_06
Öğrenci_07
Öğrenci_08
Öğrenci_09
Öğrenci_10
Sınav Puanı
70
60
70
78
60
55
80
90
70
50
Bu durumda, aralık ölçeğinde olan sınav puanlarının sıralama ölçeğine dönüĢtürülmesi gerekir.
1
Öğrenci
Puan
ÖLÇEK SR
2
3
4
5
6
7
8
9
Öğrenci_08 Öğrenci_07 Öğrenci_04 Öğrenci_01 Öğrenci_03 Öğrenci_09 Öğrenci_02 Öğrenci_05 Öğrenci_06
10
Öğrenci_10
90
80
78
70
70
70
60
60
55
50
1
2
3
5
5
5
7,5
7,5
9
10
Öğrenci_01
Öğrenci_02
Öğrenci_03
Öğrenci_04
Öğrenci_05
Öğrenci_06
Öğrenci_07
Öğrenci_08
Öğrenci_09
Öğrenci_10
Öğrenci_01
Öğrenci_02
Öğrenci_03
Öğrenci_04
Öğrenci_05
Öğrenci_06
Öğrenci_07
Öğrenci_08
Öğrenci_09
Öğrenci_10
n= 10
Kağıdı
veriş sırası
6
8
7
2
5
9
1
4
3
10
Kağıdı veriş
sırası (X)
6
8
7
2
5
9
1
4
3
10
Puan
70
60
70
78
60
55
80
90
70
55
Puan
Sırası
5
7,5
5
3
7,5
9
2
1
5
10
Puan
Sırası
Fark
(Y)
(X-Y)=d
d2
5
7,5
5
3
7,5
9
2
1
5
10
1
0,5
2
-1
-2,5
0
-1
3
-2
0
1
0,25
4
1
6,25
0
1
9
4
0
Farkın Karesi
d = 0 d
2
= 26,5
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
67
N
rs  1 
6 d 2
i 1
2
rs  1 
n(n  1)
6  26,5
10(102  1)
= 0,84
Farkların toplamı [  d ] daima sıfır olacaktır ancak yapılan iĢlemin doğruluğunun sınanması için
genelde bu toplama iĢlemi yapılır.
UYUM
DeğiĢkenler arası iliĢki kadar uyum da ölçme değerlendirme açısından önemli olabilir. Özellikle
ölçümlerin tutarlılığı söz konusu olduğunda, iliĢkiden çok uyum ön plana çıkar.
Bir sınavda puanların nesnelliğinin sağlanması açısından her bir sınav kâğıdı birbirinden
bağımsız olarak iki ayrı kiĢi tarafından puanlanmıĢ olsun. Eğer puanlayıcılardan birisi her kağıda
diğer puanlayıcının verdiğinden 5 puan fazla veriyorsa, bu durumda puanlar arasında kuvvetli bir
iliĢkiden söz edilebilir ancak bu puanların uyumlu olduğu anlamına gelmez.
ĠliĢkili olan veriler uyumlu olmayabilir, ancak uyumlu veriler iliĢkilidir.
10 öğrenciden oluĢan bir grupta, bağımsız iki puanlayıcının (A ve B) öğrencilere verdikleri
puanlar aĢağıdaki gibi olsun.
PUANLAYICILAR
A
B
Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci Öğrenci
01
02
03
04
05
06
07
08
09
10
8
5
5
4
7
7
5
6
4
3
7
7
5
4
8
8
5
4
8
9
Her iki puanlayıcıdan aynı puanı alan öğrenci sayısının toplam öğrenci sayısına oranı TAM
UYUM YÜZDESĠ olarak adlandırılır.
68
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Burada 3‟üncü, 6‟ncı ve 8‟inci öğrencilerin puanları olmak üzere 10 öğrenciden 3‟ü aynı puanı
almıĢlardır. Bu durumda tam uyum yüzdesi 100  (3/10) = %30 dur. Bu puan dizilerinin
arasındaki korelâsyonun 0.80 olduğu düĢünüldüğünde uyum ve iliĢki arası fark daha açık
görülebilir.
B’nin Verdiği Puanlar
A’nın Verdiği Puanlar
1 2 3 4 5 6 7 8 9 10 TOPLAM
1
2
3
4
5
6
7
8
9
10
TOPLAM
1
4
1
3
1
2
1
1
1
1 3 1 1 2 1 1
2
3
10
A‟nın 5 puan verdiği toplam 4 öğrenci var. (Bunu en sağdaki TOPLAM)
sütununa yazınız.
ġimdi bu 4 sınav kâğıdını B‟nin verdiği puanlara göre sütunlara dağıtınız.
( B bu 4 kâğıdın 3 tanesine 4 puan 1 tanesine de 6 puan vermiĢ) Sütunların
toplamı satır toplamına eĢit olmalı.
Bu iĢlem bütün puanlar için yapıldıktan sonra, köĢegendeki sayıların
toplamının, tüm öğrencilere oranı, uyum yüzdesini gösterecektir.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
69
STANDART PUANLAR ve NORMAL DAĞILIM
Standart puanların eğitimde öncelikli kullanılma amacını ortaya koyabilmek için, standart
puanların iĢlevini bir durum çerçevesinde ele almak yerinde olacaktır.
A şubesinden Neşe ile B şubesinden Oya, aynı programın farklı şubelerinden ders alan iki
öğretmen adayıdır. Ölçme değerlendirme dersini aynı öğretmenden almaktadırlar.
Her şubeye ayrı ayrı uygulanan 10 tam puan üzerinden bir sınavdan, Neşe de 6 puan, Oya da 6
puan almıştır. Bu durumda Neşe mi daha başarılıdır, Oya mı?
Salt değerlendirme (bir ölçütle kıyaslama ve yorum getirme) açısından bakılınca aynı başarıyı
sergilemiş görünmektedirler. Ancak soru şu şekilde sorulduğunda yanıt ne olur?
Neşe mi daha fazla performans sergilemiştir, Oya mı?
a) Her ikisi de aynı derecede performans sergilemişlerdir
b) Sınıfların ortalamalarına bakmak gerekir
ġubelerin puan dağılımı ve öğrencilerin sıralı puanlardaki yerleri aĢağıda verilmiĢtir.
Ayrıca her iki Ģubenin puan ortalamaları AYNIDIR.
ORTALAMA 5
NeĢe
70
A ġubesi
10
B ġubesi
7
10
7
10
6
8
6
8
6
8
6
6
6
6
5
5
5
5
5
4
5
4
4
4
4
4
4
3
4
1
4
1
4
1
4
1
4
1
4
Oya
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
A Ģubesinin puanlarının standart sapması. (Ortalamadan farkların ortalaması)
ORTALAMA: 5
STANDART SAPMA:3.18
-5
NOT
10
10
10
8
8
8
6
6
5
5
4
4
4
4
3
1
1
1
1
1
Ort.Fark
5
5
5
3
3
3
1
1
0
0
-1
-1
-1
-1
-2
-4
-4
-4
-4
-4
-4
-3
-2
-1
0 +1
+2
+3
+4
+5
10
10
10
8
8
8
6
6
5
5
4
4
4
4
3
1
1
1
1
1
B Ģubesinin puanlarının standart sapması. (Ortalamadan farkların ortalaması)
ORTALAMA: 5
STANDART SAPMA:1.08
-5
NOT
7
7
6
6
6
6
6
5
5
5
5
4
4
4
4
4
4
4
4
4
Ort Fark
2
2
1
1
1
1
1
0
0
0
0
-1
-1
-1
-1
-1
-1
-1
-1
-1
-4
-3
-2
-1
0 +1
+2
+3
+4
+5
7
7
6
6
6
6
6
5
5
5
5
4
4
4
4
4
4
4
4
4
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
71
A ŞUBESİ
-5
-4
-3
-2
-1
0
B ŞUBESİ
+1 +2 +3 +4 +5
-5
-4
-3
-2
-1
0
10
10
10
8
8
8
6
Neşe
+1 +2 +3 +4 +5
7
7
6
6
6
6
Oya
6
6
5
5
5
5
5
5
4
4
4
4
4
4
4
4
4
4
4
4
4
3
1
1
1
1
1
X  5 SSP=3.18
NeĢe ve Oya ortalamadan 1’er puan fazla almıĢlardır.
X5
SSP=1,08
Ancak A Ģubesindeki öğrenciler (bütün performanslarını ortaya koydukları varsayımı ile)
genel olarak ortalamanın 3 puan üzerine kadar çıkabilmiĢlerdir.
Eğer sınavı öğrencilerin uzatmak istedikleri bir yay, sınavın güçlüğünü de yayın sertliği olarak
düĢünecek olursak, bu yay (sınav) belli bir noktadan itibaren (ortalama puan olsun) genel olarak 3
birim uzatılabilmiĢtir. Sınıf geneli açısından bakıldığında 3 birim uzatılabilen bu yayı NeĢe
ancak 1 birim uzatabilmiĢtir.
B Ģubesindeki öğrenciler ise, (bütün performanslarını ortaya koydukları varsayımı ile) genel
olarak ortalamanın 1 puan üzerine çıkabilmiĢlerdir. Oya ise sınıfın genel olarak 1 birim
uzatabildiği yayı, son noktasına kadar esnetmiĢtir.
Sınıfın gösterdiği en yüksek performansı referans aldığımızda, A Ģubesindeki NeĢe sınıfın genel
performansının 1/3‟ü kadar performans sergilerken, B Ģubesindeki Oya en yüksek performans
düzeyinde bir performans sergilemiĢtir.
Performansı ortalamadan (daha yüksek olan) farklı puanlar almak olarak düĢünürsek,
Ancak bunun da grup için ölçütünün (kaç) standart sapma olduğunu göz önüne alırsak,
performansı, standart sapma cinsinden ortalamadan fark olarak ifade edebiliriz.
72
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
NeĢe ve Oya‟nın performanslarını nicelleĢtirmek (sayı ile ifade etmek) için
(Öğrenci puanı)-(Puan Ortalaması) / Puanların Standart Sapması
A Ģubesinden NeĢe ile B Ģubesinden Oya‟nın puanlarının 6‟Ģar, Ģubelerin puan ortalamalarının 5
ve A Ģubesinin puanlarının standart sapmasının 3,18; B Ģubesinin puanlarının standart sapmasının
da 1,08 olduğunu göz önüne alarak, öğrencilerin performanslarını belirleyelim:
Neşe 
65
1

 0,31
3,18 3,18
Oya 
65
1

 0,92
1,08 1,08
Bu durumda Oya, NeĢe‟den (0,92/0,31=2,9) yaklaĢık 3 kat daha fazla performans göstermiĢtir.
Gruba göre performansın göstergesi olan (ortalamadan farkın standart sapma cinsinden ifadesi)
bu puanlara standart
z puanları denir.
Farklı Ģubelerde olup aynı puanı alan iki öğrencinin performanslarını kıyaslarken, öğrencilerin
puanları ve grupların puan ortalamaları aynı olduğu halde, (gruplardaki puanların standart
sapmaları farklı olduğu için) öğrenci performanslarının aynı olmadığını gördük.
Farklı gruplardaki öğrencileri, aldıkları puanlara bakarak, performans açısından
birbirleriyle kıyaslayabilmek için, puanların içinde bulundukları puan dizilerinin
ORTALAMALARININ ve STANDART SAPMALARININ aynı olması gerekir.
BaĢka bir ifadeyle NeĢe ile Oya‟nın aldıkları puana (6) bakarak, performansları aynıdır
diyebilmek için, her iki Ģubenin puanlarının ortalamalarının yanı sıra standart sapmalarının da
aynı olması gerekir.
Farklı gruplardaki öğrencileri aldıkları puanlara bakarak performansları açısından
kıyaslayabilmek için, öğrenci puanları arası sıralamayı bozmadan, grupların puan dizilerini,
ortalamaları ve standart sapmaları aynı olan puan dizilerine dönüĢtürmek gerekir.
STANDART PUAN HESABI
ÖĞRENCĠLER
Ali
Veli
Bidasi
Fenasi
Fecisi
Hakkı
Oya
NeĢe
Kaya
Tayyar
ORTALAMA
S.SAPMA
PUANLARI
100
90
90
80
70
70
60
50
50
40
Ortalamadan Fark
(ORT-PUAN)
100-70= 30
90-70= 20
90-70= 20
80-70= 10
70-70= 0
70-70= 0
60-70= -10
50-70= -20
50-70= -20
40-70= -30
STANDART PUANLAR
Fark / S Sapma
30/20= 1,5
20/20= 1
20/20= 1
10/20= 0,5
0/20= 0
0/20= 0
-10/20= -0,5
-20/20= -1
-20/20= -1
-30/20= -1,5
70
20
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
73
Ġki sınıfın STANDART puanları.
Neşe
10
10
10
8
8
8
(10-5)/3,18=
(10-5)/3,18=
(10-5)/3,18=
(8-5)/3,18=
(8-5)/3,18=
(8-5)/3,18=
1,57
1,57
1,57
0,94
0,94
0,94
6
(6-5)/3,18=
(6-5)/3,18=
(5-5)/3,18=
(5-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(3-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
0,31
6
5
5
4
4
4
4
3
1
1
1
1
1
ORT
5
SSP 3,18
Oya
0,31
0,00
0,00
-0,31
-0,31
-0,31
-0,31
-0,63
-1,26
-1,26
-1,26
-1,26
-1,26
0,00
1,00
7
7
6
6
6
6
(7-5)/1,08=
(7-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
1,86
1,86
0,93
0,93
0,93
0,93
6
(6-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
0,93
5
5
5
5
4
4
4
4
4
4
4
4
4
ORT
5
SSP 1,08
0,00
0,00
0,00
0,00
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
0,00
1,00
Her iki grubun standart puanlarının ortalamasının ve standart sapmasının AYNI olduğunu
görünüz.
Standart z puanları, her zaman, ortalaması 0 (sıfır) standart sapması 1 (bir) olan puan dizileridir.
Farklı puan dizileri standart z puanlarına dönüĢtürüldüklerinde, ortalaması 0 standart sapması 1
olan puan dizilerine dönüĢtürülmektedir. Böylelikle, ortalamaları ve standart sapmaları aynı puan
dizleri elde edildiğinde, farklı gruplardaki öğrencilerin performansları, standart puanlarına
bakılarak, birbirleriyle kıyaslanabilir hale gelmektedir.
Ancak standart z puanları 1‟den küçük,
puanlardır.
ortalamanın altındakileri de negatif değerde olan
Hesaplamalarımızda daha anlaĢılabilir puanlarla iĢlem yapabilmek için, standart z puanlarının
sıfır olan ortalamasını 50‟ye, 1 olan standart sapmasını da 10‟a öteleyerek standart T puanlarını
elde ederiz.
Standart z puanları
z
X X
S
Standart T puanları
T  10.z  50
NeĢe ve Oya‟nın sınıflarının standart z ve T puanları.
74
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Neşe
10
10
10
8
8
8
(10-5)/3,18=
(10-5)/3,18=
(10-5)/3,18=
(8-5)/3,18=
(8-5)/3,18=
(8-5)/3,18=
6
(6-5)/3,18=
(6-5)/3,18=
(5-5)/3,18=
(5-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(4-5)/3,18=
(3-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
(1-5)/3,18=
6
5
5
4
4
4
4
3
1
1
1
1
1
ORT
5
z
T=10.z+50
1,57
1,57
1,57
0,94
0,94
0,94
0,31
0,31
0,00
0,00
-0,31
-0,31
-0,31
-0,31
-0,63
-1,26
-1,26
-1,26
-1,26
-1,26
10x(1,57)+50=
10x(1,57)+50=
10x(1,57)+50=
10x(0,94)+50=
10x(0,94)+50=
10x(0,94)+50=
10x(0,31)+50=
10x(0,31)+50=
10x(0,00)+50=
10x(0,00)+50=
10x(-0,31)+50=
10x(-0,31)+50=
10x(-0,31)+50=
10x(-0,31)+50=
10x(-0,63)+50=
10x(-1,26)+50=
10x(-1,26)+50=
10x(-1,26)+50=
10x(-1,26)+50=
10x(-1,26)+50=
0,00
1,00
SSP 3,18
T
65,73
65,73
65,73
59,44
59,44
59,44
53,15
53,15
50,00
50,00
46,85
46,85
46,85
46,85
43,71
37,42
37,42
37,42
37,42
37,42
50,00
10,00
Oya
7
7
6
6
6
6
(7-5)/1,08=
(7-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
(6-5)/1,08=
6
(6-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(5-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
(4-5)/1,08=
5
5
5
5
4
4
4
4
4
4
4
4
4
ORT
5
z
T=10.z+50
1,86
1,86
0,93
0,93
0,93
0,93
0,93
0,00
0,00
0,00
0,00
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
-0,93
10x(1,86)+50=
10x(1,86)+50=
10x(0,93)+50=
10x(0,93)+50=
10x(0,93)+50=
10x(0,93)+50=
10x(0,93)+50=
10x (0,00)+50=
10x(0,00)+50=
10x(0,00)+50=
10x(0,00)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
10x(-0,93)+50=
0,00
1,00
SSP 1,08
T
68,59
68,59
59,29
59,29
59,29
59,29
59,29
50,00
50,00
50,00
50,00
40,71
40,71
40,71
40,71
40,71
40,71
40,71
40,71
40,71
50,00
10,00
Standart T puanlarının ortalamalarının 50, standart sapmalarının 10 olduğuna dikkat ediniz.
Bu standart z puanlarının, ortalama ve standart sapmalarının ötelenmesinin doğal bir sonucuydu.
1nci Grup Standart 2nci Grup Standart 3ncü Grup Standart 4ncü Grup Standart 5nci Grup Standart
Puanları T Puanı Puanları T Puanı Puanları T Puanı Puanları T Puanı Puanları T Puanı
55
50
45
40
35
30
25
20
15
10
ORTALAMA 32,5
15,14
S.SAPMA
64,86
65
61,56
60
58,26
55
54,95
50
51,65
45
48,35
40
45,05
35
41,74
30
38,44
25
35,14
20
42,5
50
15,14
10
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
75
70
65
60
55
50
45
40
35
30
52,5
15,14
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
85
80
75
70
65
60
55
50
45
40
62,5
15,14
64,86
95
61,56
90
58,26
85
54,95
80
51,65
75
48,35
70
45,05
65
41,74
60
38,44
55
35,14
50
72,5
50
15,14
10
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
Farklı puan dizilerinin standart T puanları hesaplandığında, bu iĢlemin puan dizilerini ortalaması
50, standart sapması 10 olan puanlara dönüĢtürdüğünü görürüz.
Üniversitemizin
verilmektedir.
Bağıl
değerlendirme
sisteminde
harf
notları
T
notlarına
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
göre
75
Hangi T notunun hangi harf notuna karĢılık geldiğini gösteren bir tablo aracılığı ile T notları
harf notlarına dönüĢtürülmektedir.
Ancak aĢağıdaki 5 farklı grupta 50 puanın karĢılığı olan T notunun, grubun (ham / iĢlenmemiĢ)
puan ortalamasına göre değiĢtiği görülmektedir.
1nci Grup
2nci Grup
3ncü Grup
4ncü Grup
5nci Grup
Ham Standart Ham Standart
Ham
Standart
Ham
Standart Ham Standart
Puanları T Puanı Puanları T Puanı Puanları T Puanı Puanları T Puanı Puanları T Puanı
55
50
45
40
35
30
25
20
15
10
ORTALAMA 32,5
15,14
S.SAPMA
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
65
60
55
50
45
40
35
30
25
20
42,5
15,14
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
75
70
65
60
55
50
45
40
35
30
52,5
15,14
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
85
80
75
70
65
60
55
50
45
40
62,5
15,14
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
95
90
85
80
75
70
65
60
55
50
72,5
15,14
64,86
61,56
58,26
54,95
51,65
48,35
45,05
41,74
38,44
35,14
50
10
Grubun ham puan ortalaması yükseldikçe, aynı ham puanın karĢılığı olan T notu düĢmektedir.
Bu durum ham puan ortalaması yüksek gruplarda DEZAVANTAJ, ham puan ortalaması düĢük
gruplarda AVANTAJ olarak iĢlev görmektedir.
Bu durumu normalize etmek için T notuna karĢılık gelen harf notu çizelgeleri, farklı ham puan
ortalamaları için ayrı ayrı düzenlenmiĢtir. Bu amaçla, ham puan ortalamasına göre sekiz ayrı
baĢarı grubu tanımlanmıĢ, her grup için ayrı çizelge oluĢturulmuĢtur.
Sınıf Düzeyi
Üstün BaĢarı
Mükemmel
Çok Ġyi
Ġyi
Ortanın Üstü
Orta
Zayıf
Kötü
Ham BaĢarı
Notu
Ortalaması
Aralıkları
80.0<n≤100
70.0<n≤80.0
62.5<n≤70.0
57.5<n≤62.5
52.5<n≤57.5
47.5<n≤52.5
42.5<n≤47.5
42.5≤n
FF
(0)
< 22
< 24
< 26
< 28
< 30
< 32
< 34
< 36
FD
(0,5)
22-26.99
24-28.99
26-30.99
28-32.99
30-34.99
32-36.99
34-38.99
36-40.99
DD
(1.0)
27-31.99
29-33.99
31-35.99
33-37.99
35-39.99
37-41.99
39-43.99
41-45.99
DC
(1.5)
32-36.99
34-38.99
36-40.99
38-42.99
40-44.99
42-46.99
44-48.99
46-50.99
CC
(2.0)
37-41.99
39-43.99
41-45.99
43-47.99
45-49.99
47-51.99
49-53.99
51-55.99
CB
(2.5)
42-46.99
44-48.99
46-50.99
48-52.99
50-54.99
52-56.99
54-58.99
56-60.99
BB
(3.0)
47-51.99
49-53.99
51-55.99
53-57.99
55-59.99
57-61.99
59-63.99
61-65.99
BA
AA
(3.5)
(4.0)
52-56.99 ≥57
54-58.99 ≥59
56-60.99 ≥61
58-62.99 ≥63
60-64.99 ≥65
62-66.99 ≥67
64-68.99 ≥69
66-70.99 ≥71
Bu durumda, ham puanlara bakarak T notunun ne olacağı konusunda öğrencilerin kestirimde
bulunabilecekleri bir durum söz konusudur.
Sadece tam sınıfın ortalamasında puan alan öğrencinin harf notu tablodan bulunabilir. Çünkü
sınıfın ortalamasında puan alan bir öğrencinin ortalamadan farkı sıfır olduğu için, standart sapma
ne olursa olsun z notu 0 (sıfır), T notu da 50 olacaktır.
Örneğin sınıfın tam ortalamasında olarak 65 puan alan bir öğrencinin T notu 50 olacaktır.
Ham puan ortalaması 50 olan bir sınıf ORTA kategorisinde olacağı için bu düzey sınıfta 47-51.99
T notu aralığının karĢılığı harf notu CC dir. Ancak sınıf ortalamasının 85 olduğu durumda 85
puan, BB harf notuna karĢılık gelmektedir.
76
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
NORMAL DAĞILIM
Normal dağılım bir olasılık dağılımıdır.
Ġlk kez 1733‟de Fransız matematikçi Abraham de Moivre
tarafından p baĢarı olasılığı değiĢmemek kaydıyla, binom
dağılımının2 limit Ģekli olarak elde edilmiĢtir.
9‟uncu yüzyılda Gauss‟un katkısıyla istatistikteki yerini almıĢtır.
Normal dağılım doğada gerçekleĢen olaylarla büyük uyum içindedir. Pek çok rastlantısal
süreçlerin dağılımı olarak karĢımıza çıkar
Olasılık ile Normal Dağılım ĠliĢkisi
Olasılık, genel olarak, ilgilenilen bir olayın, benzer tüm olaylar içinde ortaya çıkma ya da
gözlenme oranı olarak tanımlanabilir. Herhangi bir olayın ya da denemenin, mümkün olan tüm
sonuçlarının oluĢturduğu gruba örneklem uzayı adı verilir. Bir zar atıldığı zaman, ortaya çıkacak
(mümkün olan) tüm durumlar, yani, gelecek sayıların 1‟den 6‟ya kadar olan sayılardan oluĢması,
zar atma olayının ya da denemesinin sonuçlarına iliĢkin örneklem uzayını oluĢturur.
(S= 1,2,3,4,5,6 ) Bir zar atma deneyinde, bir kez atılan zarın 6 gelmesinin ortaya çıkma oranı
ise olayın gerçekleĢme olasılığı olarak adlandırılır ve bu örnekte 1/6‟dır. (0.16 ya da %16) 3
Benzer biçimde, 52 kartlık karıĢık bir deste oyun kâğıdından rastgele çekilen bir kartın kupa
(destede 13 kupa vardır) çıkma olasılığı 13/52=0.25 (ya da %25‟dir). Bir deneyde birbirini dıĢta
tutan4 olaylar “bağımsız olaylar” olarak adlandırılır ve bağımsız olaylara iliĢkin olasılık
hesaplamada iki temel kural vardır. Birbirini dıĢta tutan olaylardan, birisinin veya diğerinin
ortaya çıkma olasılığı, olayların tek tek ortaya çıkma olasılıklarının toplamına eĢittir. Ancak
olayların birlikte ortaya çıkma olasılığı ise, tek tek ortaya çıkma olasılıklarının çarpımına
eĢittir5.
Bir rastlantısal olayın gerçekleĢme olasılığının ne Ģekilde bir değiĢim ya da eğilim sergilediği
ortaya konabilirse, bu eğilime bakılarak, değiĢik durumlar için bazı olayların gerçekleĢme
2
Binom dağılımı n sayıda iki kategori (yani baĢarı/baĢarısızlık, evet/hayır, 1/0 vb) sonucu veren denemelere uygulanır.
AraĢtırıcının ilgi gösterdiği kategori baĢarı olarak adlandırılır. Bu türlü her bir deneyde, bağımsız olarak, baĢarı(=evet=1)
olasılığının p olduğu (ve yalnızca iki kategori sonuç mümkün olduğu için baĢarısızlık olasılığının 1 − p olduğu) bilinir. Bu türlü
bağımsız n sayıda denemeler serisi içinde elde edilen baĢarı sayısının ayrık olasılık dağılımı binom dağılım olarak tanımlanır.
3
Bir olayda hesaplanan olasılık 0 (sıfır) ile (1) arası değer alabilir. Sıfır, olayın asla gerçekleĢmeyeceğini, 1 ise her zaman
gerçekleĢeceğini ifade eder. Bir olayda, ortaya çıkması olası olayların her birisinin olasılık toplamları her zaman 1‟e eĢittir. Zar
örneğinde,
1‟den
6‟ya
kadar
herhangi
bir
sayının
gelme
olasılığı
%16‟dır.
Bunların
toplamı
(0.166667+0.166667+0.166667+0.166667+0.166667+0.166667=1) 1‟e eĢittir.
4
Olayların birbirini dıĢta tutması demek, sadece ve sadece bir durumun gözlenebilmesi demektir. Örneğin, kırmızı ve mavi
boncukların olduğu bir torbada, çekilen bir boncuğun hem mavi hem kırmızı olamaması birbirini dıĢta tutan olay demektir. Yani,
boncuk maviyse, kırmızı olamaz, kırmızıysa mavi olamaz. Ancak, boncukların değiĢik maddelerden yapılmıĢ olması durumunda,
mavi boncuğun cam ya da plastik olabilmesi, birbirini dıĢta tutmayan olaylardır. Boncuk maviyken kırmızı olamaz (dıĢta tutan)
ancak cam ya da plastik olabilir (birbirini dıĢta tutmayan olay).
5
Ġçinde, 4 mavi, 6 kırmızı boncuk bulunan bir torbadan, (çekilen boncuğun yerine konması kaydıyla) ard arda yapılacak iki
boncuk çekiminde, mavi çıkma olasılığı (4/10=0.40) %40, kırmızı çıkma olasılığı ise, (6/10=0.60) %60‟dır. Çekilen boncukların
(zaten ya mavi olacaktır ya da kırmızı) mavi ya da kırmızı olma olasılığı (0.40+0.60=1)‟dir. Ya da, kırmızı ve mavi dıĢında renk
olmadığı için, %100‟dür. Ancak ard arda yapılan iki çekiliĢte mavi ve kırmızı çıkma olasılığı ise, (0.40x0.60=0.24) yani
%24‟tür. Ġki kırmızı çıkma olasılığı ise, (0.60x0.60=0.36) yani %36‟dır.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
77
olasılıklarına iliĢkin öngörülerde6 bulunabiliriz. Bunun için de, rastlantı değiĢkeninin olasılık
dağılımının oluĢturulması gerekir.
Bir rastlantı değiĢkeninin olasılık dağılımını, Ģu Ģekilde açıklayabiliriz:
Rastlantısal olay, bir paranın iki kez atılması, olasılık dağılımının araĢtırılacağımız durum ise
paranın tura gelmesi olsun. Böyle bir durumda, (yani para ard arda iki kez atıldığında), örneklem
uzayı (mümkün olan bütün durumların kümesi) Ģu Ģekilde oluĢacaktır. (Tura-Tura, Tura-Yazı,
Yazı-Tura, Yazı-Yazı)
Tura gelme olasılığı ile ilgilendiğimize göre, Ģu durumlar söz konusu olabilir.
1-Hiç tura gelmeyebilir
2-Bir adet tura gelebilir
3-Ġki adet tura gelebilir.
(TT TY YT YY)
(TT TY YT YY)
(TT TY YT YY)
[Dört durumdan birisi]
[Dört durumdan ikisi]
[Dört durumdan birisi]
Sıfır tura gelmesi (hiç tura gelmemesi) olasılığı: 1/4
Bir tura gelmesi olasılığı (1/4 +1/4 = 2/4 ) : 1/2
Ġki tura gelmesi olasılığı: 1/4
Ġlgilendiğimiz olay (Tura Gelme)
GerçekleĢme olasılığı
0
1/4
1
1/2
2
1/4
Bu dağılımın grafiği aĢağıdaki gibi olacaktır;
1/2
1/4
1/4
x
0
1
2
Para iki kez değil de 50 kez atılırsa, olasılık dağılımını göstermek güçleĢir. Bu nedenle olasılık
dağılımı binom adlı bir formül yardımı ile gösterilir
n
f  x, n, p     p x (1  p) n x
 x
Burada, n deneme sayısını, x istenilen baĢarı sayısını, p ise bir denemedeki baĢarı olasılığını
gösterir. Örneğin, bir para 20 kez atılırsa, 12 tura gelme olasılığı aĢağıdaki Ģekilde hesaplanabilir.
( n =20, x =12 ve p =1/2 )
6
Doğadaki pek çok olay belli olasılık dağılımlarına göre gerçekleĢir. Örneğin, yağıĢlar gamma dağılımına, okyanus
dalgaları Rayleigh dağılımına, gaz molekülleri ki-kare dağılımına, somon balıklarının boyları da normal dağılıma
uyar (Sınıksaran, 2008).
78
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME

f 12,20, 1
n

  1 
2
2
x
12
 
(1  12) 2012  0,12
Francis Galton tarafından öne sürülen ve Galton Kutusu (veya Galton Makinesi) olarak
adlandırılan bir düzenek aracılığı ile yukarıdaki duruma benzer olasılıkların dağılımını
görselleĢtirmek mümkündür. Galton, aĢağıdaki biçimde eĢit aralıklarla çiviler çakılmıĢ bir
platformun üzerinden, tam ortadaki çivinin üzerine bir boncuk bırakıldığını düĢünmüĢ ve bu
boncuğun çivinin sağına ya da soluna düĢme olasılığının eĢit olduğunu (1/2) varsaymıĢtır. Benzer
biçimde sağa ya da sola düĢen boncuğun, üzerine düĢeceği izleyen sıradaki çivinin de sağına ya
da soluna düĢme olasılığı aynıdır. Bu düzeneğin üzerine 500 tane boncuk bırakılırsa, boncukların
en alttaki kutucuklara dağılımı nasıl olur?

       
      
       
      
       
      
       





















Bir boncuğun iki sıra çivide, en alttaki kutularda olma olasılığı ve bunun olasılık dağılımı
aĢağıdaki gibi olacaktır. (Burada L sol yanı, R sağ yanı göstermektedir)
Çivi sırası arttığında durum aĢağıdaki gibi olacaktır:
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
79
Grafiği çizildiğine çana benzeyen ve (bu nedenle çan eğrisi olarak da adlandırılan) bu dağılıma
normal dağılım7 denmektedir.
7
Normal dağılım eğrisinin matematiksel fonksiyonu
Burada,
S
standart sapmayı, X , ortalamayı,
göstermektedir. Euler sayısı ise e 
80
e
f ( x) 
1
e
S . 2
1  x X
 
2 S
Euler sayısını (2.71828),



 de
2
Ģeklinde ifade edilir.
pi sayısını (3,14159)

n
1 1 1 1 1 1
1
1

veya






....

e  lim 1  

n 
0! 1! 2! 3! 4!
n!
n

n 0 n!
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Normal dağılım doğada gerçekleĢen pek çok olayla uyum içindedir ve pek çok rastlantısal sürecin
dağılımı olarak karĢımıza çıkar. Örneğin, rastgele seçilen belli sayıda yetiĢkin erkeğin ayakkabı
numaralarının dağılımına bakılacak olursa, 35, 36 gibi küçük numaraların oldukça az sayıda, 41,
42 gibi numaraların oldukça fazla sayıda, 45, 46 gibi büyük numaraların da yine az sayıda olduğu
görülecektir. Benzer biçimde, bir çınar ağacındaki binlerce yaprağın, bir balıkçı teknesinin ağına
takılan hamsilerin boylarına bakıldığında da ortalama boyutlardaki yaprak ve hamsilerin büyük
bir çoğunluğu oluĢturdukları, küçük ve büyüklerin de daha az sayıda oldukları görülecektir.
Ġnsanların, boylarında, kilolarında gözlendiği gibi, zeka düzeylerinde ve belli konulardaki
yeteneklerinde de normal dağılımı gözleriz.
Normal dağılımın belli özellikleri vardır. Ġdeal normal dağılımın ortalaması, ortancası ve tepe
değeri aynıdır. Ayrıca, normal dağılım eğrisi, yatay ekseni (x eksenini) hiçbir zaman kesmez.
Yani normal dağılımın tümüne ulaĢamayız. Ancak, iki önemli parametresini, ortalamayı () ve
standart sapmayı () bildiğimiz takdirde belli oranlarına ulaĢabiliriz ancak bu oran %100
olamaz.8
% 68.26
(-1)

(+1)
8
Bu ifadede sözü edilen ortalama evrendeğer olarak düĢünüldüğü için () sembolü ile standart sapma da aynı
nedenle () sembolü ile gösterilmiĢtir. Belli bir örneklemin ölçüm sonuçları söz konusu olduğunda X ve S
sembolleri kullanılmıĢtır.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
81
Ortalama ve standart sapmanın normal dağılım üzerindeki etkilerini aĢağıdaki Ģekilde
görselleĢtirmek mümkündür.
Ortalamanın değişimi:
A ve B‟deki dağılımların ortalamaları eĢittir
ancak C‟nin ortalaması B‟nin ortalamasından
büyüktür. ( X A  X B  X)C
Standart Sapmanın değişimi:
B ve C‟deki dağılımların, satandart sapmaları
eĢittir ancak A‟nın standart sapması B ve C‟nin
standart sapmasından küçüktür.
( S A  S B  S)C
Ġdeal normal dağılım eğrisinin, ortalama, ortanca ve tepe değerinin aynı olmasının dıĢındaki
diğer özellikleri aĢağıdaki Ģekilde özetlenmiĢtir.
Ortalamanın bir standart sapma () üzerindeki değerin altında kalan alan, eğrinin altında kalan
toplam alanın %34‟üne, bir standart sapma altında kalan alan da, toplam alanın %34‟üne karĢılık
gelir. Buradan hareketle, sonuçları normal dağılım gösteren bir dizi ölçümde, ölçüm sonucu elde
edilen değerlerin % 68.26‟sının ortalamanın bir standart sapma altında ve üstünde yer aldığı
söylenebilir. Ortalamanın 2 standart sapma üzerindeki ve altındaki değerler ise, toplam değerlerin
%95.44‟ünü oluĢturur. Normal dağılım bir olasılık dağılımı olduğuna göre, ortalamanın ve
standart sapmanın bilindiği durumlarda, herhangi bir ölçüm sonucunun yüzde kaç olasılıkla
ölçüm sonuçları dizisinin neresinde yer alacağını kestirmek mümkündür.
Ortalamanın, belli bir standart
sapma üzerinde ya da altında kalan
değerler için, eğrinin altında kalan
alanın toplam alana yüzdesi
Standart Sapma
Normal dağılım eğrisinin
altında kalan alana iliĢkin
birikimli (kümülatif) yüzdeler
Standart z puanları
82
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
BaĢka bir ifadeyle, ölçülebilen belli bir özellikleri açısından normal dağılım sergileyen bir
topluluktan rastgele çekilen bir bireyin, ortalamadan 1 standart sapma civarına (üstüne ya da
altına) düĢme olasılığı 0.6826 iken, 2 standart sapmada bu olasılık 0.9544‟e, 3 standart sapmada
ise 0.9974‟e çıkar.
Normal dağılım olgusu değiĢik iĢ alanlarda kullanılır. Örneğin hazır giyim sektöründe değiĢik
ölçülerde üretilen malların miktarları buna göre saptanır. Bir araĢtırmaya göre, 20-40 yaĢ
aralığındaki Türk kadınlarının kalça ortalaması 96.5cm., standart sapması da 5.7cm. olarak
bulunmuĢtur. Buna göre, bu yaĢ grubundaki kadınların %68‟inin kalça ölçüsü (96.5 ±5,7)= [90.8102.2], %95‟inin kalça ölçüsü de (96.5±(2×5.7)=[85.1-107.9] aralığında yer alır. Dolayısıyla
mağazalardaki etek pantolon gibi giysilerin yaklaĢık %70‟i (90.8-102.2) ölçüleri arasındadır
(Sınıksaran, 2008)
Bir puan dağılımının ortalaması ve standart sapması biliniyorsa, bu grupta herhangi bir puan alan
öğrencinin sınıf içindeki durumu, yani sınıftaki öğrencilerden kaçından daha yüksek ya da düĢük
puan aldığı gibi sonuçlar ortaya konabilir. Örneğin, puanlarının ortalamasının
(X =60),
standart sapmasının (S=8) olduğu bir sınavdan, 70 puan alan bir öğrencinin durumunu Ģu Ģekilde
yorumlamak olasıdır;
Bu sınıfın puanlarının normal dağılım sergilediği varsaydığımızda, standart sapmaya göre, puan
aralıkları Ģu Ģekilde gerçekleĢecektir:
X-3S
X-2S
X-S
[60-(3×8)]=
[60-(2×8)]=
[60-(1×8)]=
X(Ort)
36
44
52
60
%0.1
%2.3
%15.9
%50
X+S
X+2S
X+3S
[60+(1×8)]=
[60+(2×8)]=
[60+(3×8)]=
68
76
84
%84.1
%97.7
%99.9
Öğrencinin
Dilimi
(Puanların %84.1‟i bu aralıkta)
Sınavdan 70 puan alan bir öğrenci, ortalamanın 2 standart sapma üzerindeki dilimin içinde yer
almaktadır. Buna göre, öğrencinin grubunun %84‟ünden daha yüksek puan aldığı söylenebilir9.
Normal dağılımda, herhangi bir değerin, ortalamanın bir, iki, üç standart sapma üzerinde ve
altında bulunma olasılığı Ģekilde görüldüğü gibidir.
-3S
-2S
-1S
X
+1S
+2S
+3s
% 0.1
% 2.3
% 15.9
% 50
% 84
% 97.7
% 99.9
9
Daha kesin sonuçlar için, öğrencinin puanı standart z puanına dönüĢtürülmelidir. (Zaten, standart z puanları,
ortalamadan farkın standart sapma cinsinden ifadesinden baĢka bir Ģey değildir). Belli bir z değeri için, normal
dağılım eğrisinin altında kalan alan, birikimli yüzdeyi vereceği için, (fonksiyonun belli aralık için integralini
hesaplamayla uğraĢmadan) z dağılım tablosundan bu değer bulunabilir. Örneğin, Ortalamanın 60, standart sapmanın
8 olduğu bir dağılımda 70 puan alan bir öğrencinin standart z puanı [(70-60)/8=1.25]‟dir. Tablodan bakıldığında, bu
z notunun karĢılığında 0.8944 değeri görülecektir. Yani öğrenci sıralamadaki tam yeri, en düĢükten en yükseğe doğru
sıralanmıĢ tüm puanların %89.44 „üncüsüdür.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
83
DEĞERLENDĠRME
(PUANLARIN NOTA DÖNÜŞTÜRÜLMESİ)
Bu bölümde, puan sözcüğü ile varlığın ölçmeye esas özelliğinin dönüĢtürüldüğü sayılar (sınav
kâğıdının okunmasının ardından verilen puan ya da ölçme sonucu) not sözcüğü ile de ölçme
sonucunun ölçütle kıyaslanması sonucu varılan yargı sonucu kastedilmektedir.
Puanların notlara dönüĢtürülmesinde iki genel yaklaĢım söz konusudur.
Mutlak (ölçüte dayalı) değerlendirme sonucu not verme
Bağıl (norma dayalı) değerlendirme sonucu not verme
Ancak değerlendirmenin ne amaçla kullanılacağı, yani hangi amaçlı ölçmenin sonuçlarının
değerlendirildiği değerlendirmeyi etkiler.
AMAÇLAR
MUTLAK (ÖLÇÜT DAYANAKLI)
BAĞIL (NORM TEMELLĠ)
Planlı, programlı bir süreçte öğrencinin Öğrencileri, baĢarıları ya da kazanımları
kazanması gereken davranıĢ değiĢikliklerinin, ölçüsünde, kendi içinde, sergiledikleri
programdan beklenen katkının sağlanabilmesi göreceli performansa göre sıralama, sınıflama
için gerekli miktarının öğrenciye kazandırılıp ve buna göre baĢarılı baĢarısız öğrenci ayrımı
kazandırılmadığının saptanması.
yapma.
ĠÇERĠK
MUTLAK (ÖLÇÜT DAYANAKLI)
BAĞIL (NORM TEMELLĠ)
ÖngörülmüĢ bir programın iskeletini içeren, Programlarda yer alan içerikle ilgili olmak
tanımlanmıĢ ve ölçülebilir biçimde ifade kaydıyla, daha genel bilgi ve beceriler.
edilmiĢ içerik
Ġçeriğin sınırları net değildir esneyebilir.
MADDE ÖZELLĠKLERĠ
MUTLAK (ÖLÇÜT DAYANAKLI)
BAĞIL (NORM TEMELLĠ)
Her bir davranıĢ, öğrencinin performansını Amaç grubu göreceli olarak sıralama olduğu
yeterince yansıtabilmek ve Ģans faktörünü için, madde güçlükleri dikkate alınır. Ayırıcı
dıĢlamak için en az dört madde ile sınanır
maddelerin yer alması istenir. Her kazanımın
Maddeler belirlenirken, güçlük dereceleri belli
sayıda
madde
ile
yoklanması
yerine, kazandırılacak davranıĢ evrenini önemsenmez.
yansıtıp yansıtmadıklarına bakılır. (Amaç
sıralama değildir)
SONUÇLAR
MUTLAK (ÖLÇÜT DAYANAKLI)
BAĞIL (NORM TEMELLĠ)
Her öğrencinin puanını öngörülen standarda Her öğrencinin puanı, bir grup içindeki
ulaĢma derecesinin göstergesidir.
sıralamada yer aldığı dilimi konumu gösterir,
Puan analizleri, her öğrencinin hangi kazanım ancak bu dilim sadece daha büyük evrenlerde
alanında ne kadar performans gösterdiğini daha önceki çalıĢmalarla belirlenmiĢ, norm
ortaya koyar.
haline getirilmiĢ bir yeri yansıtabilir.
Her öğrencinin performansı bireysel olarak bir
anlam ifade eder.
84
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
MUTLAK DEĞERLENDĠRME SONUCU NOT VERME
Mutlak BaĢarı Yüzdesine göre:
Çoğu zaman mutlak baĢarı yüzdesi göz önüne alınarak uygulanır. (Ancak çoğu kez öğretmenler
testleri 10, 100 gibi puanlar üzerinden yaptıkları için, bu iĢlemi farkında olmadan yaparlar.)
Mutlak baĢarı yüzdesi, öğrencinin puanının sınavdan alınacak olası en yüksek puana yüzde
olarak oranı Ģeklinde hesaplanır.
[Mutlak BaĢarı Yüzdesi= (Öğrenci Puanı/ Olası en yüksek puan). 100
Burada asıl karar verilmesi gereken nokta Ģudur. Sınavın süreçte kazanılan davranıĢların tümünü
yansıttığı varsayımıyla, sınavda sergilenen istenen davranıĢların yüzde kaçı baĢarılı sayılmak için
yeterli olacaktır?
Eğitim sisteminde genel olarak %45 ölçütü yaygındır.
Mutlak
BaĢarı
Yüzdesi
85–100
70–84
55–69
45–54
00–44
NOT
ANLAMI
5
4
3
2
1
Pekiyi
Ġyi
Orta
Geçer
BaĢarısız
Ölçek Puanlamasına göre
Değerlendirilecek davranıĢlar bir gözlem formuna dönüĢtürülebilir ve gözlem formunda her
davranıĢın puanlanması için sayısal ölçek adımları olabilir.
Alan
1.1
1.2
1.3
1.4
DAVRANIġ
Alana iliĢkin temel ilke ve kavramları söyleyebiliyor /
yazabiliyor
Alandaki temel kavram ve ilkeleri mantıksal bir bütünlük
ve tutarlılıkla iliĢkilendirebiliyor
Konunun gerektirdiği sözel ve görsel dili uygun biçimde
kullanabiliyor
Konu alanını diğer alanlarla iliĢkilendirebiliyor
Eksik (1)
Yeterli (2)
X
Ġyi (3)
X
X
X
Her bölümdeki puanlar toplanır ve Mutlak BaĢarı Yüzdesi hesaplanır (Bölüm puanının,
bölümden alınabilecek olası en fazla puana yüzde olarak oranı bulunur.)
Alınan puanların toplamı: 1.1‟den 2 puan, 1.2‟den 3 puan, 1.3‟den 1 puan ve 1.4‟den 2 puan
olmak üzere toplam 8 puan.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
85
Bölümden alınacak olası en yüksek puan 12 olduğuna göre, Mutlak BaĢarı Yüzdesi (8/12).100
dür. Yani 60.6 puan. Yukarıdaki ölçeğe göre Notu 3 ORTA dır.
81–100 76–80
AA
BA
70–75
BB
60–69
CB
50–59
CC
45–49
DC
40–44
DD
30–39
FD
00–29
FF
Bu ölçeğe göre de NOTU CB dir.
Dereceli puanlama anahtarına göre:
Değerlendirmeye esas performans alanları belirlenir
Her alana ilişkin, davranışın açıkça ölçülebilir, gözlenebilir biçimde ifadesi olan performans
göstergeleri belirlenir
Her performans göstergesi, mükemmelden yetersize doğru değerlendirmeye esas ölçütleri
içerecek şekilde derecelendirilmiş davranış örüntüleri biçiminde ifade edilir.
Gözlenen davranış, performans ölçütüyle kıyaslanarak değerlendirilir.
1.2 Alan Eğitimi Bilgisi10
EKSĠĞĠ VAR
Konuyu öğrencinin bilgi
düzeyine indirmekte
zorlanmaktadır.
KABUL EDĠLEBĠLĠR
Genellikle konuyu öğrencinin
bilgi düzeyine uygun
öğretebilmekte, ancak kimi
konularda zorlanmaktadır.
Öğrencilerde yanlıĢ öğrenilmiĢ
kavramları tanımada güçlük
Öğrencilerde yanlıĢ öğrenilmiĢ
çekmektedir.
kavramları tanımakta, ancak
bunların doğrusunu
Öğrenci sorularına yanıt
öğrenmekte güçlük
vermekte daha yeterli olması
çekmektedir.
gerekir.
Konu alanı öğretim
Konu alanı öğretim
programına iliĢkin yeterli
programına iliĢkin bilgisi
bilgiye sahiptir.
yüzeyseldir.
Konu alanının özel öğretim
Genel öğretim yaklaĢım,
yaklaĢım, yöntem ve
yöntem ve tekniklerine iliĢkin
tekniklerine iliĢkin bilgisi
bilgi sahibidir, ancak alanın
olmasına karĢın, bilgisini
özel öğretim yaklaĢım, yöntem geliĢtirmeye gereksinimi
ve tekniklerine iliĢkin bilgileri
bulunmaktadır.
yüzeyseldir.
ĠYĠ YETĠġMĠġ
Öğrencilerin yanlıĢ öğrendiği
kavramları saptayarak
doğrularını öğrenmelerini
sağlayabilmektedir.
Öğrencilerin sorularına uygun ve
yeterli yanıtlar verebilmektedir.
Öğreteceği bilgiyi öğrencilerin
zihinsel, duygusal ve sosyal
geliĢimlerini göz önüne alarak
düzenleyebilmektedir.
Okullardaki alanına iliĢkin
öğretim programlarını
derinlemesine tanımaktadır.
Bilgi teknolojisinden
yararlanabilmektedir.
Konu alanına özgü özel öğretim
yaklaĢım, yöntem ve tekniklerine
iliĢkin derinlemesine bilgi
sahibidir.
10
Yükseköğretim Kurulunun WEB sayfasından aynen alınmıĢtır.
http://www.yok.gov.tr/egitim/ogretmen/akr2/ek3/ek31.html
86
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
BAĞIL DEĞERLENDĠRME SONUCU NOT VERME
Doğal Performans Gruplarına göre not verme
Bir sınav sonunda, öğrencilerin aldıkları ham notlar büyükten küçüğe doğru sıralandığında,
notların akıĢında belirgin kesintiler olabilir. Doğal Performans Gruplarına göre not verme
iĢleminde, bu kesintilerin, doğal performans gruplarının ayrım noktalarını gösterdiği varsayılır ve
notlar bu aralıklara göre verilir.
Örneğin, bir sınıfta alınan ham notların, 100, 98, 97, 97, 80, 78, ... Ģeklinde sıralandığı bir
durumda, 97 ile 80 arasındaki boĢluk, en büyük baĢarı harfi (örneğin AA) ve onu izleyen ikinci
baĢarı harfi (örneğin, BA) arası ayrımı gösterebilir.
Ancak, doğal performans gruplarını ifade ettiği varsayılan bu not aralıkları, çok belirgin olarak
ortaya çıkmayabilir, çok sayıda gözlenebilir, ya da çok az sayıda olabilir. Bu tip sorunlar,
performans gruplarındaki dengesizlikten kaynaklandığı gibi, ölçme hatalarından da
kaynaklanıyor olabilir.
Dağılım Yüzdelerine (Yüzdelik Dilimlere) Göre not verme
Bu değerlendirmede puanların normal dağılım sergilediği ve her puandan belli sayıda öğrencinin
alacağı varsayılır. Bunun için de öğrencilerin aldıkları ham notlar büyükten küçüğe doğru
sıralanır. Öngörülen yüzdelere giren öğrencilere o yüzdenin gerektirdiği puan verilir.
Örneğin, A dan F‟ ye kadar A,B,C,D, ve F harf notlarının verildiği bir not sisteminde, sınıfın
%40‟ının ortalamada (C notu) yığılacağı, B ve D notlarına kaymanın %20‟Ģer olacağı, kalan uç
noktalarda (A ve F) ise %10‟ar öğrenci olacağı düĢünülerek, harf notları bu oranlarda dağıtılır.
Standart Puanlara Göre Not verme
Bu tür değerlendirmede ham puanlar z puanlarına ya da T puanlarına dönüĢtürülür.
Notlara karĢılık gelecek z ya da T puan aralıkları belirlenir ve buna göre notlar verilir.
Genel kabul gören bir yaklaĢım örneği aĢağıda verilmiĢtir:
z puan aralığı
-1.49 ve altı
-1.50 ile -0.49 arası
-0.50 ile +0.49 arası
+0.50 ile +1.49 arası
+1.50 ve üzeri
BaĢarı NOTU
1
2
3
4
5
AĢağıda da T puanlarına göre düzenlenmiĢ benzer bir yaklaĢım örneği görülmektedir:
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
87
T puan aralığı
35 ve altı
36 ile 45 arası
46 ile 55 arası
56 ile 65 arası
66 ve üzeri
88
BaĢarı NOTU
1
2
3
4
5
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GEÇERLİK
Sınav sonrası öğrenci diyalogları:
Bu sınavda soruları cevaplamak için dersi izlemek ve derste öğretilenleri anlamıĢ olmak Ģarttı.
Konuları bilmeyenin bu sınavdan geçer puan alması çok zor
Sınavda derste öğretilenlerden soruldu
Süreçte belli davranıĢlar kazandırılmıĢsa ve söz konusu davranıĢların ne derecede kazanıldığı
sorgulanıyorsa, yanıtlanması gereken iki soru vardır.


Ölçmede yoklanan davranışlar, süreçte kazandırılan davranışlar mı?
Ölçmede süreçte kazandırılan davranışların tümü yoklanamayacağına göre, yoklanan
davranışlar, kazandırılan davranışları ne derece temsil edebiliyor?
Geçerlik, bir ölçme aracının, ölçmeyi amaçladığı özelliği, baĢka bir özellikle karıĢtırmadan
doğru bir Ģekilde ölçebilme derecesidir. Ölçmek istediği özelliği, baĢka özelliklerle
karıĢtırmadan ölçebilen ölçme aracı geçerlidir. Geçerli ölçmelerin sonuçlarının UYGUNLUK,
ANLAMLILIK FAYDALILIK gibi nitelikleri yüksek olur. Geçerliğin, Kapsam geçerliği,
Ölçüt geçerliği, (EĢzaman/uyum geçerliği ve Yordama geçerliği Ģeklinde) Yapı geçerliği,
GörünüĢ geçerliği
KAPSAM GEÇERLĠĞĠ
Ölçme aracındaki maddelerin, kazandırılmıĢ davranıĢla ilgili olma ve kazandırılmıĢ davranıĢlar
evrenini temsil edebilme düzeyidir.
Kapsam geçerliğinin sağlanması için atılması gereken adımlar;
1-Ölçülecek davranışlar evreninin belirlenmesi (süreçte kazandırılmış tüm davranışlar)
2-Testin ölçeceği davranışların (örneklemin) belirlenmesi
3-Testin ölçeceği davranışlar örnekleminin süreçte kazandırılmış davranışlar evrenini temsil
edebilme derecesinin belirlenmesi
4-Her bir test maddesinin, ölçülmek istenen davranışı ölçmeye uygun olup olmadığının kontrol
edilmesi.
Kapsam geçerliğinin sağlanması iĢlemlerinde öğretmenlere önerilen en yaygın iĢlem bir belirtke
tablosu (amaç içerik matrisi) hazırlamaktır. Bu çizelge önce tüm davranıĢ evrenini içerecek
Ģekilde yapıldıktan sonra, bu evreni temsil eden bir örnekleme dönüĢtürülür.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
89
AMAÇ ĠÇERĠK MATRĠSĠ
Yaratma
Değerlendirme
Analiz
Uygulama
Anlama
ÜNĠTELER
Hatırlama
DAVRANIġ DÜZEYLERĠ
TOPLAM
1. Amaçların ifadesinde önemli noktalar
2. DavranıĢların aĢamalı
sınıflandırılması
3. Yeterliğe dayalı amaç ifadesi
4. AĢamalı amaç ifadesi
5. Ölçme ve değerlendirme farkı
6. Doğrudan ve dolaylı ölçme
7. Mutlak ve bağıl değerlendirme
8. DeğiĢken kavramı ve özellikleri
9. Sınıflama Ölçeği
10. Sıralama Ölçeği
11. Aralık Ölçeği
12. Oran Ölçeği
13. Ölçmede birim ve ölçmede sıfır
kavramları
14. Ölçme değerlendirme sürecinin basit
analizi
15. Testlerin değiĢik ölçütlere göre
sınıflandırılması
16. Sözlü sınavlar
17. Yazılı sınavlar
18. Kısa cevaplı sorulardan oluĢan
sınavlar
19. Doğru yanlıĢ tipi sınavlar
20. Çoktan seçmeli sınavlar
21. Performansa dayalı ölçme
Bir ölçmenin kapsam geçerliğinin sağlanmıĢ olması, süreci temsil edebiliyor olmasıyla ve her
maddenin ilgili davranıĢı ölçmeye uygun olmasıyla sağlanır.
Kapsam geçerliği uzman görüĢü ile de sağlanabilir. Bunun için her bir maddenin, o madde ile
ölçülmek istenen davranıĢı ölçüp ölçmediği (tercihen birden fazla) uzman kanısı ile güvence
altına alınmaya çalıĢılır.
90
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÖLÇÜT GEÇERLĠĞĠ
Ölçüt geçerliği, geçerlilik derecesi saptanmaya çalıĢılan bir ölçme aracıyla ve geçerliliği
belirlenmiĢ (ve bu nedenle ölçüt olarak adlandırılan) bir ölçme aracıyla aynı varlığın belli bir
özelliğine iliĢkin yapılan ya da yapılacak ölçümler arası korelâsyondur.
Bu korelasyon ne kadar yüksekse, geçerliği belirlenmeye çalıĢılan ölçme aracı, geçerli olan (ve
ölçüt olarak nitelenen) ölçme aracıyla yapılan ölçümlere benzer ölçümler yapıyor demektir.
Genel olarak iki ölçüt geçerliği tanımlanır. Bu konuda iki farklı tanımın yapılıĢ gerekçesi,
geçerliğin sınanması amacıyla yapılan ölçüm ile ölçüt olarak ele alınacak geçerli ölçümün
yapılıĢ zamanlarının yakın ya da farklı zamanlarda olmasıdır.
Uyum geçerliği: Eğer geçerliği sınanacak ölçümle ölçüt olarak ele alınan ölçüm aynı ya
da yakın zamanlarda yapılıyorsa, buna uyum geçerliği denir.
Öğretmen kendi hazırladığı bir test ile kapsam geçerliği sağlanmıĢ standart bir testi eĢzamanlı ya
da yakın zamanlarda verip, iki ölçüm sonucu arası korelasyona bakarak, kendi testinin
geçerliğine bakıyorsa, buna uyum geçerliği denir.
Yordama geçerliği: Geçerliği sınanan ölçmenin ölçütü olacak geçerli ölçme sonucunun
daha sonraki zamanlarda ortaya çıktığı durumdaki geçerliğe denir.
Bir programa öğrenci seçimi için verilen test sonucuna göre kabul edilen öğrenciler, o programda
baĢarılı oluyorlarsa, bu testin yordama geçerliğinin yüksek olduğu söylenebilir. Test baĢarısı ile o
programın ilerleyen aĢamalarında sergilenecek baĢarı arasında korelasyon varsa, söz konusu
testin yordama geçerliğinden söz edilebilir.
YAPI GEÇERLĠĞĠ
Bir ölçme aracının yapısı, birbiriyle ilgili olduğu düĢünülen ögelerin kendi aralarında ya da diğer
ögelerle iliĢkisinin oluĢturduğu örüntüdür. Ölçme aracının belli maddelerinin ölçtüğü
davranıĢların kümelenmesi, istenen davranıĢı [aynı anda birden fazla davranıĢı ölçüyor
göründüğü için] ölçmeyen, gereksiz, ilgisiz maddelerin olmaması (ya da az olması) (ki faktör
analizi adlı bir iĢlemle ortaya konabilir) testin yapı geçerliğini gösterir. Benzer biçimde, bir
ölçme aracının ölçmek istediğimiz özelliğin teorik (kuramsal) bir yapıyı ölçebilme derecesi de
yapı geçerliğini gösterir. (Teori, doğrudan gözleyemediğimiz, tam olarak nasıl gerçekleĢtiğini
bilemediğimiz olay ve olguları açıklayan birbiriyle çeliĢmeyen tutarlı önermeler bütünüdür)
Örneğin Piaget‟nin biliĢsel geliĢim kuramına göre, somut iĢlemler dönemine gelmiĢ 7-11 yaĢ
aralığında bir çocuğun nesneleri birkaç özelliğine göre sıralaması, iĢlemleri tersine çevirebilmesi,
maddenin korunumu yasasını içselleĢtirmiĢ olması öngörülür. Bu davranıĢları ölçmek amacıyla
hazırlanmıĢ bir ölçme aracı, somut iĢlem öncesindeki bir grup ile somut iĢlemler aĢamasındaki bir
gruba verildiğinde grupları ayırabiliyorsa, yapı geçerliği var demektir.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
91
GÖRÜNÜġ GEÇERLĠĞĠ
GörünüĢ geçerliği ölçme aracının ölçmek istenen özelliği ölçecekmiĢ gibi görünmesidir.
Üzerinde grafikler formüller bulunan bir test görünüm itibarıyla tarih bilgisini ölçecekmiĢ gibi
düĢünülmez.
Nesnelliği dolayısıyla bilimselliği en az olan geçerlik türüdür.
Bazı ölçmeciler, görünüĢ geçerliğini, konu alanı uzmanı olmayan kiĢilerin genel kanısı olarak
adlandırırlar. Örneğin, çarpma iĢlemini yapabilme davranıĢını ölçmek için hazırlanmıĢ bir testi, sadece
öğrenci velilerine gösterdiğinizde ne kadar çok veli bu test çarpma iĢlemini yapabilmeyi ölçer derse, testin
görünüĢ geçerliği o denli yüksektir.
GörünüĢ geçerliğine, testin okunabilir büyüklükte yazı karakteriyle yazılmıĢ olmasını, maddelerin
birbirine girmemiĢ olmasını, sayfa kenarlarında yeterli boĢluklar olmasını, soruların sayfa sonunda
bölünmemiĢ olmasını dahil edenler de vardır.
GörünüĢ geçerliği nesnelliği tartıĢma götüren bir yargı olarak nitelenebilir.
SONUÇSAL GEÇERLĠK
Son yıllarda, alternatif ölçme değerlendirme yaklaĢımının ölçme araçlarına bir yansıması olarak, (henüz
çok yaygın olmamakla birlikte) sonuçsal geçerlik [consequential validity] adıyla yeni bir geçerlik türü
tanımlanmıĢtır. Süreç odaklı ve performansa dayalı ölçme bakıĢ açısıyla ele alındığında, öğrencilerin
süreçte, öğrenmeyi öğrenme, öz-düzenleme yapma, biliĢ-üstü stratejiler kullanma gibi beceriler
kullanması gerekir. Ölçme de, seçki dosyalarıyla, projelerle, akran değerlendirmeleriyle bunları ortaya
çıkaracak ve teĢvik edecek Ģekilde yapılacağına göre, ölçme araçlarıyla bu tür beceriler arası bir iliĢki
vardır. Bu tür ölçme araçları, kullanılmaları sonucunda, ne kadar, öğrenenlerin öğrenmeyi öğrenme, özdüzenleme yapma, biliĢ-üstü stratejiler kullanma gibi becerilerini geliĢtiriyorsa, o oranda sonuçsal
geçerliği var demektir. Uygulamada, alternatif ölçme değerlendirme yöntem ve araçlarıyla yapılan
uygulama sonuçları, geleneksel ölçme değerlendirme sonuçlarıyla kıyaslanarak, öğrenciler üzerinde ne tür
etkiler yaptığına bakılarak belirlenmeye çalıĢılmaktadır.
GEÇERLĠK ÜZERĠNDE ETKĠSĠ OLAN FAKTÖRLER
Ölçmede kullanılan madde tipi (açık uçlu soru, doğru yanlıĢ tipi soru, eĢleĢtirmeli soru vb) ve soru
sayısı
Her madde tipinin ölçülmek istenen davranıĢı tam olarak ölçme yeterliği farklıdır.
Madde sayısı arttıkça kapsam geçerliği artar
Güvenirlik:
Güvenirlik ard arda yapılan ölçüm sonuçları arası tutarlılıktır. Güvenirliği olmayan bir ölçüm hatalı
ölçümdür ve hatalı biçimde ölçülen davranıĢın süreçte kazandırılan, baĢka davranıĢla karıĢmamıĢ bir
davranıĢ olup olmadığı açıkça belli değildir.
Puanlayıcının nesnellik derecesi
Nesnel olmayan bir puanlamada, ölçülen davranıĢa süreçte kazandırılmamıĢ pek çok davranıĢın (yazı
güzelliği, sayfa düzeni, belli ifade tarzları) karıĢmıĢ olma olasılığı vardır.
Uygulama koĢulları:
Isı, ıĢık, ses, sallanan sıra, dikkati dağıtan gözetmen, ölçme sonucu gözlenen davranıĢın, gerçekte (daha iyi
koĢullarda) sergilenebilecek davranıĢtan daha kötü olmasına neden olabilir. Ölçülecek performansa
karıĢan kızgınlık, dikkat verememe gibi davranıĢlar söz konusu olur.
92
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÖLÇMEDE HATA
Ölçme sonuçları, özellikle de dolaylı ölçmede,
her zaman ilgilenilen özelliğin miktarının
gerçekte ne olduğunu vermez.
Ölçme sonucu elde edilen değer ile özelliğin
gerçek değeri arasında (yönünü kesin olarak
bilemediğimiz) bir fark olur.
ĠĢte bu, ölçme sonucu elde edilen değer
ile özelliğin gerçek değeri arasındaki
fark hata olarak adlandırılır.
ÖLÇMEDE HATA KAYNAKLARI
Özellikle davranıĢ ölçmede karĢılaĢılan hataların değiĢik nedenleri olabilir.
ÖLÇMEYĠ YAPAN KĠġĠDEN KAYNAKLANAN hatalar olabilir.
Ölçmeyi yapan kiĢinin yanlı davranması, dikkatsiz olması, davranıĢ ölçme konusunda yeterli
bilgisinin olmaması hataya neden olabilir.
ÖLÇME ARACINDAN KAYNAKLANAN hatalar olabilir.
Ölçme aracı tutarlı ölçüm yapamayabilir. Ölçme aracı, ölçülmek istenen davranıĢı baĢka
davranıĢlarla karıĢtırmadan ölçemeyebilir. Ölçme aracı iyi düzenlenmemiĢ olabilir (soruların
okunmasında güçlükler, karıĢık sayfa düzeni, sayfa sonunun böldüğü sorular)
ÖLÇMENĠN YAPILDIĞI ORTAMDAN KAYNAKLANAN hatalar olabilir.
Sınav yerinin ısı, ıĢık ve havalandırma koĢulları kötü olabilir, sıra ya da masaların rahatça
yazmaya uygun olmayabilir, gözetmen ya da sınav sorumlusu sert topuklu ayakkabı giymiĢ
olabilir.
(DAVRANIġLARI) ÖLÇÜLEN (KĠġĠDEN) /ÖZELLĠKTEN KAYNAKLANAN hatalar
olabilir.
Öğrencinin derse ve sınava karĢı olumsuz tutumları ya da önyargıları olabilir.
Öğrencinin kiĢiliği ölçülen davranıĢa uygun olmayabilir, sorumluluk duygusunun derecesi düĢük
olabilir, sınav anında yorgun, isteksiz, canı sıkkın olabilir.
ÖLÇMEDE TERCĠH EDĠLEN YÖNTEMDEN KAYNAKLANAN hatalar olabilir
Üst düzey biliĢsel davranıĢları çoktan seçmeli testle, uygulamaya, performansa dayalı bir yeterliği
yazılı sınavla ölçmeye çalıĢmak gibi bir yol tercih edilmiĢ olabilir.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
93
ÖLÇMEDE HATA ÇEġĠTLERĠ (TÜRLERĠ)
Ölçmede yapılan hatalar, sabit, sistematik, tesadüfî (rastgele) hatalar olmak üzere üç grupta
incelenir.
SABĠT HATALAR
Ölçümler esnasında değeri sabit kalan, değiĢmeyen hatadır. Kefesinin altına bir cisim yapıĢan eĢit
kollu bir teraziyle yapılan her tartımda, terazinin o cisim kadar eksik tartması, ya da öğretmenin
bütün öğrencilerin sınav puanına belli miktarda puan eklemesi bu tür hataya örnektir.
SĠSTEMATĠK HATALAR
Ölçümü yapılan belli bir özelliğe ya da ölçüm yapılan belli koĢullara bağlı olarak ortaya çıkan
hata türüdür. Öğretmenin, kızlara 5 puan fazla vermesi, yazısı güzel olanlara daha fazla puan
vermesi, öğrenci numarasını yazmayanlardan 2 puan kırması gibi hatalar sistematik hatalardır.
Sistematik hatalar güvenirlikten çok geçerliği etkilerler.
Bir ölçüm esnasında hatalı ölçme aracı tekrarlı biçimde kullanılıyorsa, sabit hatanın sistematik
hataya dönüĢtüğü durumlar ortaya çıkabilir. (Gerçekte 25 cm olan ama üzerinde 30 cm. lik aralık
iĢaretlenmiĢ olan bir cetvelle 20 cm.lik ağaç çubuklar kesilecekse, çubuk boylarının ölçümündeki
hata sabittir ve bütün çubukların boylarındaki ölçüm hatası değiĢmez. Ama bu cetvelle değiĢik
boyutlardaki oda halılarının en ve boyları ölçülecekse, boyu 60 cm olarak ölçülen bir halıdaki
ölçme hatası (10 cm eksik) olurken, boyu 120 cm. olarak ölçülen halıdaki ölçme hatası ( 20 cm.
eksik) olacaktır. Ölçülecek özellik miktarıyla hata sistematik olarak artmaktadır. )
TESADÜFÎ /RASTGELE HATALAR
Kaynağı ve miktarı ve ortaya çıkıĢ nedeni tam olarak bilinmeyen değiĢik (pozitif ya da negatif
yönlerde olabilen) hatalardır. Ölçme aracından, ölçüm yapan kiĢiden, ölçümü yapılan özellikten,
ölçme ortamından ve öngörülemeyen değiĢik nedenlerden kaynaklanabilir. (Sınav esnasında
okulun önünden geçen caddede gürültülü bir iĢ makinesiyle çalıĢma baĢlatılması ölçme
sonuçlarını negatif yönde etkileyebilir)
94
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
ÖLÇÜMLERİN GÜVENİRLİĞİ
Eğer ölçmede hata yoksa ya da azsa, art arda yapılan ölçüm sonuçları birbirinin aynı ya da
benzeri olacaktır. Art arda yapılan ölçümler arasındaki tutarlılık ya da kararlılık güvenirlik olarak
adlandırılır. (Ölçüm sonuçları arası benzerliği kararlılık, herhangi bir madde puanı ile testin
bütününün puanı arası korelâsyonu tutarlılık olarak adlandıranlar da vardır)
Ancak ölçmede sabit hata varsa, art arda yapılan ölçüm sonuçları yine benzer çıkacaktır. Bu
nedenle, güvenirliğin en genel tanımını, “ölçmenin hatalardan arınmıĢ olmasıdır” Ģeklinde
yapmak daha doğru olacaktır.
Ölçümlerin güvenirliği, güvenirlik katsayısı adı verilen bir sayı ile ifade edilir. Bu sayı
korelâsyona (ilgileĢim) dayalı olarak hesaplanır. Korelâsyon katsayısı -1 ile +1 arası değer
alabilen bir sayıdır. Ancak güvenirlik katsayısı çoğunlukla 0 ile +1 arası bir değer alır ve
1’e ne kadar yaklaĢırsa, güvenirliğin o oranda arttığı anlamına gelir.
Güvenirlik kavramının, özellikle yeni bir ölçme aracı geliĢtiriliyorsa, “duyarlılık” ile de ilgisi
vardır. Duyarlılık, ölçme aracının birimiyle ilgili bir kavramdır. Bir testte her bir madde ile
ölçülen davranıĢı bir birim olarak kabul edersek, bu konudaki hassasiyet, ölçülmek isten
davranıĢın ölçülmesine katkı sağlayacaktır. Benzer biçimde soru sayının da artmasına neden
olacaktır.
GÜVENĠRLĠĞĠN KESTĠRĠLMESĠ
Ölçümlerin güvenirliğinin kestirilmesinde, güvenirliğin derecesinin sayısal olarak ifade
edilmesinde kullanılan kavram GÜVENĠRLĠK KATSAYISIDIR. Zaman zaman bu anlamda
(yanlıĢ biçimde) kullanılan GÜVENĠRLĠK ĠNDEKSĠ aslında doğrudan sayısal olarak
belirlenemeyen ve güvenirliği tanımlamaya yarayan kuramsal bir kavramdır. (Gözlenen puanlar
belirlenebilirken, gerçek (hatası olmayan) puanlar ölçme yoluyla doğrudan elde edilemezler)
GÜVENĠRLĠĞĠN KESTĠRĠLMESĠNDE UYGULAMALAR GENELDE ĠKĠYE AYRILIR.
1-Ġki uygulamaya dayalı yaklaĢım
a) Test tekrar test yöntemi
b) EĢdeğer (paralel) testler yöntemi
2-Tek uygulamaya dayalı yaklaĢım
a) Testi yarılama yöntemi
a) Kuder Richardson (KR-20) ve (KR-21) güvenirlik katsayılarını hesaplama
b) Cronbach Alpha ( ) güvenirlik katsayısını hesaplama
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
95
TEST TEKRAR TEST YÖNTEMĠ
Aynı test formu (ölçme aracı) belli bir zaman aralığı ile aynı gruba iki kez uygulanarak, arda arda
yapılan ölçüm sonuçları arası korelasyona bakılır. Bu korelasyon katsayısı ölçümlerin
güvenirliğinin göstergesi sayılır.
Ancak ölçüm sonuçları arası korelasyon katsayısının güvenirlik katsayısı olarak
anlamlandırılması için iki sayıltı söz konusudur
Ġki uygulama arasındaki sürede öğrencilerin ölçülen davranıĢlarında değiĢiklik olmamıĢtır
(Yeni öğrenmeler, unutmalar)
Birinci uygulamanın ikinci uygulama üzerinde anlamlı bir etkisi yoktur (Ġlk ölçme sırasında
edinilen deneyimin ikinci ölçmede kullanılması, soruların hatırlanması)
Ġki uygulama arasındaki önerilen süre konusunda bir genelleme yapılacak olursa:
Testin ölçtüğü özellikler/davranıĢlar açısından, testi alanlarda önemli değiĢikliklerin olmasına
yetmeyecek, ikinci uygulamada, birinci uygulamada sergilenen davranıĢların hatırlanmasına izin
vermeyecek bir uzunlukta olması önerilmektedir.
Ġki hafta gibi bir süre sonunda elde edilen değer tutarlılık, daha uzun bir ara ile uygulama sonuç
elde edilen değer ise kararlılık olarak adandırılabilir.
EġDEĞER (PARALEL) TESTLER YÖNTEMĠ
Test tekrar test yönteminde sözü edilen ikinci sayıltının (birinci uygulamanın ikinci uygulama
üzerinde soruların hatırlanmasından kaynaklanan etkisinin olmaması) sağlanma güçlüğüne
çözüm olarak tercih edilebilecek bir yöntemdir.
Aynı davranıĢları farklı maddelerle ölçen, bu farklı maddelerinin güçlükleri denk olan iki test
eĢdeğer formlar olarak adlandırılır. (Genelde bunun için, belli bir konuda çok sayıda güçlük
dereceleri denk soru hazırlanarak, bunların içinden rastgele seçimle eĢit sayıda soru içeren iki
soru grubu oluĢturulur, ya da her bir amaç için iki denk soru hazırlandıktan sonra bu soru
çiftlerinden rastgele seçilen birileriyle bir soru formu kalanlarla da diğer soru formu oluĢturulur)
Uygulamada, eĢdeğer formlar, ard arda aynı gruba verilerek, elde edilen ölçme sonuçları arası
korelasyona bakılır. EĢdeğer formlarla elde edilen güvenirlik katsayısı daha çok tutarlılık ve
eĢdeğerlik anlamı taĢır.
TESTĠ YARILAMA YÖNTEMĠ
Homojen bir test ya da birleĢtirilerek tek bir form haline getirilmiĢ birden fazla eĢdeğer test bir
seferde uygulanır. Bir test formu gibi görünen ancak, iki denk parçaya ayrılmıĢ ya da birden fazla
denk alt testleri içeren bu test formunun hazırlanması Ģu Ģekillerde olabilir:
Soruların birinci yarısı alt testlerden birisini, ikinci yarısı da diğerini oluĢturabilir.
96
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Formda tek numaralı maddeler bir alt testi, çift numaralı maddeler diğer alt testi oluĢturabilir.
Birden fazla alt test uygulandığında da alt testler birbirilerini izleyebilir ya da maddeleri benzer
biçimde numaralandırılabilir.
Bir test formu haline getirilmiĢ ölçme aracı uygulandıktan sonra, alt testler ayrı ayrı puanlanarak,
alt test puanları arası korelâsyona bakılır. Ġkiden fazla alt testin olması durumunda (A, C, D alt
testleri gibi), alt testler arası tüm olası ikili korelâsyon katsayıları
(A-C, A-D, C-D)
hesaplanarak bunların aritmetik ortalaması alınabilir.
Ġster iki alt test olsun ister ikiden fazla, hesaplanan güvenirlik katsayısı sadece alt testlerden
herhangi birine iliĢkin güvenirlik katsayısını verir. Bu nedenle söz konusu güvenirlik, tüm
testin güvenirlik katsayısının alt sınırı anlamına gelir.
En az iki alt test (k=2) içeren bir testin bütününün güvenirlik katsayısı Ģu Ģekilde hesaplanır:
(Spearman Brown Formülü)
rTümü 
k (r11)
1  (k  1).r11
Burada k alt test sayısını, r11 ise alt testlere ait güvenirlik katsayısını göstermektedir.
KUDER RICHARDSON (KR–20) GÜVENĠRLĠK KATSAYISI
Tek uygulama sonucunda ölçme aracının iç tutarlığını bulmak için kullanılan güvenirlik
katsayısıdır. KR–20, sadece, test maddelerinin yanıtlarının doğru ya da yanlıĢ olarak
nitelenebildiği durumlarda (objektif testlerde) sadece doğru yanıtlar puanlanarak kullanılabilir.
Madde puanları farklı ağırlıklardaysa veya testte (Ģans baĢarısı için) düzeltme faktörü
kullanıldıysa KR–20 hesaplanmaz.
K


p j .q j 


K 
j 1

KR20 
1
K 1 
S2 




Burada;
K= Testteki soru sayısı
pj =
qj =
j‟nci maddenin madde güçlüğü (o maddeyi doğru yanıtlayanların testi alanlara oranı)
1- pj (j‟inci maddeyi doğru yanıtlayanların dıĢında kalanların testi alanlara oranı)
S = Test puanlarının standart sapması (Standart sapmanın Karesi= VARYANS)
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
97
Ij,
bir maddeyi (j‟inci madde) doğru olarak yanıtlayan öğrencilerin sayısı, N sınavı alan
pj 
toplam öğrenci sayısı olmak üzere,
Ij
N
q j ise maddeyi yanlıĢ
o maddenin güçlüğüdür.
yanıtlayan ya da doğru yanıtlayamayanların oranıdır. Bir maddeyi doğru yanıtlayanların oranı ile
yanlıĢ yanıtlayan ya da yanıtlamayanların oranının toplamı daima 1 olacağına göre,
q j =(1- p j )
dir.
VARYANSINI verir.
Bir maddenin,
S 
2
j
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Testi Alanlar
Öğrenci_A
Öğrenci_B
Öğrenci_A
Öğrenci_C
Öğrenci_D
Öğrenci_E
Öğrenci_F
Öğrenci_G
Öğrenci_H
Öğrenci_I
Öğrenci_J
Öğrenci_K
Öğrenci_L
Öğrenci_M
Öğrenci_N
Öğrenci_O
Öğrenci_P
Öğrenci_R
Öğrenci_S
Öğrenci_T
Doğru Yanıtlar
p
q (p-1)
p.q
K
 p j .q j
j 1
1
1
0
0
1
0
1
1
0
0
0
0
1
1
0
1
0
1
0
0
0
 p .q
j
3
1
0
0
0
1
0
1
0
1
0
0
1
1
0
1
1
0
0
0
1
4
1
1
1
1
1
0
1
0
1
1
1
0
1
1
1
1
0
0
1
1
j
qj
değerlerinin çarpımı, o maddenin
(VARYANS= standart sapmanın karesi)
SORULAR
5
6
7
1
1
1
1
0
1
1
0
1
1
0
1
1
1
1
1
0
1
1
0
0
0
0
0
0
0
1
0
1
1
1
1
1
1
0
1
1
1
0
1
0
1
1
0
1
1
0
1
0
1
1
0
0
1
1
1
1
1
0
1
8
1
1
1
0
1
0
1
0
1
1
1
1
1
0
1
1
1
0
1
0
9
1
0
1
1
1
1
1
0
1
0
1
1
1
1
1
1
1
0
1
1
10
1
1
1
1
1
1
0
0
0
1
0
0
1
0
0
1
0
0
0
0
8
12
9
15
15
7
17
14
16
9
0,40 0,60 0,45 0,75 0,75 0,35 0,85 0,70 0,80 0,45
0,60 0,40 0,55 0,25 0,25 0,65 0,15 0,30 0,20 0,55
0,24 0,24 0,25 0,19 0,19 0,23 0,13 0,21 0,16 0,25
ORT
Std.Sapma
10
TOPL
PUAN
10
6
7
6
9
5
7
0
6
6
7
7
8
4
8
7
6
1
7
5
6,10
2,36
 0.24  0.24  0.25  0.19  0.19  0.23  0.13  0.21  0.16  0.25  2.08
j 1
K


p j .q j 


K 
j 1

KR20 
1
K 1 
S2 




98
ve
K
j 1
2
1
1
1
0
1
0
1
0
1
1
1
1
0
0
1
0
1
0
1
0
pj
KR20 
10 
2.08 
1 

10  1  2.362 
KR20  0.64
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
KUDER RICHARDSON (KR–21) GÜVENĠRLĠK KATSAYISI
Tek uygulama sonucunda ölçme aracının iç tutarlığını bulmak için kullanılan güvenirlik
katsayısıdır. KR–20’nin hesaplanabilmesi için, her bir maddenin (doğru yanıtlayanların testi
alan tüm bireylere oranı Ģeklinde) güçlük derecesinin bilinmesi gerekmektedir.
Bu nedenle, her bir maddesi doğru ya da yanlıĢ olarak nitelenemeyen testler için KR-20
kullanılamaz.
Madde güçlük derecelerinin hesaplanamadığı durumlarda da KR-21 güvenirlik katsayısı
hesaplanır. Bu güvenirlik katsayısı, madde güçlüklerinin denk olduğu varsayımına dayanır ve
madde güçlükleri farklılaĢtıkça düĢer. Bu nedenle KR-20 güvenirliğin alt sınırı olarak
anlamlandırılmalıdır.
KR21 
K  K .X  ( X ) 2 
1 

K 1 
K .S 2

Burada
K= Testteki soru sayısı
X = Test puanlarının aritmetik ortalaması
S = Test puanlarının standart sapması
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Testi
Alanlar
Öğrenci_A
Öğrenci_B
Öğrenci_A
Öğrenci_C
Öğrenci_D
Öğrenci_E
Öğrenci_F
Öğrenci_G
Öğrenci_H
Öğrenci_I
Öğrenci_J
Öğrenci_K
Öğrenci_L
Öğrenci_M
Öğrenci_N
Öğrenci_O
Öğrenci_P
Öğrenci_R
Öğrenci_S
Öğrenci_T
1
0
2
2
0
0
2
1
0
0
0
2
0
0
2
0
0
1
2
2
1
K  K .X  ( X ) 2 
KR21 
1 

K 1 
K .S 2

2
1
0
0
1
0
1
2
1
1
2
1
2
1
1
1
1
0
2
1
1
3
2
1
0
1
0
0
1
0
1
1
0
1
2
0
0
0
1
0
1
0
4
2
1
0
0
1
0
1
1
1
1
2
2
0
1
0
0
0
0
0
0
5
0
1
0
0
1
1
0
1
2
1
2
1
0
1
2
0
0
1
2
1
6
0
1
0
2
0
1
2
1
2
1
1
2
0
1
2
1
2
1
2
1
7
2
0
0
0
1
0
1
0
0
1
2
1
0
1
0
1
1
1
1
1
8
9
10 TOPLAM
11
2
0
2
8
1
0
1
5
1
1
1
6
1
1
0
3
0
0
0
7
0
0
2
10
0
1
1
9
2
2
1
11
1
2
1
12
1
2
2
12
1
1
0
13
0
2
2
6
1
1
1
13
2
2
2
8
1
1
1
6
0
2
1
9
1
1
2
9
0
2
0
10
0
1
0
8
0
2
1
8,8
ORTALAMA
2,76
S.SAPMA
10  (10  8,8)  (8,8) 2 
KR21 
1 

10  1 
10  (2,76) 2 
KR21  0,96
KR-21 sayıltılara dayalı bir güvenirlik hesabı olduğu için, sonuçları çok güvenilir olmaz.
Özellikle hız testlerinde yanıltıcı sonuçlar verir.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
99
CRONBACH ALPHA ( ) GÜVENĠRLĠK KATSAYISI
Tek uygulama sonucunda ölçme aracının iç tutarlığını bulmak için kullanılan güvenirlik
katsayılarından birisidir. Maddelerin ağırlıklı olarak puanlandığı ya da dereceleme yöntemiyle
puanlandığı durumlarda kullanılır. Alpha güvenirlik katsayısı bir tür iç tutarlılık katsayısıdır ve 0
ile 1 arası değiĢir.
K


S 2j 


K 
j 1


1
K 1 
ST2 




K =Testteki soru sayısı
Sj = j‟inci madde puanlarının standart sapması (Karesi=Varyansı)
ST= Test puanlarının standart sapması (Karesi= Varyansı)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Testi Alanlar
Öğrenci_A
Öğrenci_B
Öğrenci_A
Öğrenci_C
Öğrenci_D
Öğrenci_E
Öğrenci_F
Öğrenci_G
Öğrenci_H
Öğrenci_I
Öğrenci_J
Öğrenci_K
Öğrenci_L
Öğrenci_M
Öğrenci_N
Öğrenci_O
Öğrenci_P
Öğrenci_R
Öğrenci_S
Öğrenci_T
S.Sapma
(S.Sapma)2
10
S
j 1
2
j
j 1

100
2
4
3
4
5
4
5
6
5
4
5
6
5
5
5
5
4
4
5
6
3
3
3
4
5
6
5
6
7
8
7
6
7
8
7
6
7
8
7
6
7
6
4
4
3
5
6
7
8
7
6
7
6
7
6
5
6
5
5
4
4
5
4
5
2
3
4
3
4
5
6
5
6
7
7
7
6
5
6
7
7
6
5
6
6
2
3
4
5
6
7
8
7
8
9
8
7
6
7
8
7
6
7
8
6
7
4
5
4
5
6
7
6
5
6
5
4
5
6
5
4
5
4
3
4
5
8
5
6
5
6
7
8
7
6
7
6
7
6
5
6
5
4
7
6
5
4
9
3
4
3
4
5
6
5
6
7
6
5
6
7
6
5
6
7
5
6
6
10
7
6
6
6
7
8
7
6
7
6
7
6
5
6
7
6
7
6
6
6
TOPLAM
39
43
45
52
58
66
66
60
66
64
65
62
59
60
59
58
60
54
59
52
0,83 0,88 1,30 1,32 1,50 1,79 0,97 1,07 1,19 0,68
0,68 0,77 1,69 1,74 2,24 3,21 0,94 1,15 1,41 0,46
K


S 2j 


K  j 1 

1 2
K 1 
ST 




7,75
 (0,83) 2  (0,88) 2  (1,30) 2  (1,32) 2  (1,50) 2  (1,79) 2  (0,97) 2  (1,07) 2  (1,19) 2  (0,68) 2
10
10
S
1
5
6
5
6
7
6
7
6
7
8
7
6
7
8
7
6
7
6
7
6
2
j
 0,68  0,77  1,69  1,74  2,24  3,21  0,94  1,15  1,41  0,46
S
j 1
10 
14,29 
1

10  1  (7,75) 2 
  1,11 1  0,238
2
j
 14,29
  0,847
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GÜVENĠRLĠĞĠ ETKĠLEYEN FAKTÖRLER
1-Ölçme hataları (ölçmeyi yapan kiĢiden kaynaklananlar, ölçme koĢullarından kaynaklananlar,
ölçülen bireylerden kaynaklananlar)
Puanlamada nesnel olamama bireylerin gerçek performanslarını yansıtmaz
Ölçme koĢullarından (ısı, ıĢık, gürültü vb) farklı derecede etkilenenler olabilir
Tekrara dayalı uygulamalarda, uygulamalar arası süre uzadıkça değiĢik davranıĢların
ölçmeye dahil olma olasılığı artacaktır, ancak sürenin kısalması da ilk uygulamanın etkilerini
artıracaktır.
Grup homojen olmayabilir (bariz bireysel yeterlik, yetenek farklılıkları olabilir). Grubun
homojen olmaması güvenirliği düĢürecektir.
2-Ölçme aracının nitelikleri
Ölçme aracının ölçtüğü davranıĢların benzeĢik ya da farklı farklı olması güvenirliği etkiler.
Homojen testler, heterojen testlere göre daha yüksek güvenilirlik gösteririler.
Testin çok zor olması veya çok kolay olması puanların belli bir aralıkta yığılmasına neden olur
ve bu da güvenirliği düĢürür. Uygulamada kolay testlerin güvenirliği zor testlere göre daha
yüksek olma eğilimindedir.
Testin hazırlanıĢ itibarıyla Ģans baĢarısına açık olması, dolayısıyla gerçek davranıĢ değiĢikliği
yerine rastgele davranıĢları yansıtması, güvenirliği düĢürür. (Kopya davranıĢı da gerçek
öğrenmeleri yansıtmayacağı için güvenirliği düĢürür)
Maddelerin ifadelerinin açık ve anlaĢılır olmaması, yanlıĢ anlaĢılmalar nedeniyle istenenler
yanıtlar olmayabilir ve bu durum da değiĢik davranıĢların sergilenmesine neden olarak
güvenirliği düĢürür
Ölçme aracındaki madde (soru) sayısı güvenirliği etkiler. Testin güvenirliğini etkileyen diğer
faktörler sabit tutulmak kaydıyla, soru sayısı artırıldıkça (gözlenen puan gerçek puana
yaklaĢacağı için) güvenirlik artacaktır. (Yarılama yöntemiyle güvenirliğin kestirilmesinde
kullanılan Spearman Brown Formülü, ikiden fazla alt testten oluĢmuĢ bir testin bütününün
güvenirliğinin benzeĢik herhangi iki alt testin sağladığı güvenirlikten fazla olduğunu
göstermektedir.)
En az 2 alt test
arası (r11)
0,8
0,8
0,8
0,8
0,8
0,8
Alt Test Sayısı
k
2
3
4
5
6
7
rTümü 
k (r11)
1  (k  1).r11
0,89
0,92
0,94
0,95
0,96
0,97
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
101
Bu noktadan hareketle, aynı özelliklere sahip maddeler eklemekle (testin alt test sayısını
artırmakla) güvenirlik artırılabilir. Spearman Brown Formülü yardımıyla, testin var olan
güvenirliğini istenilen düzeye yükseltmek için alt test sayısını ya da (alt testteki madde sayısının
bilindiği durumda) eklenecek soru sayısını hesaplamak mümkündür.
Örneğin, güvenirlik katsayısı 0,5 olan bir testin güvenirliğini 0,9‟a çıkarmak için testin
uzunluğunu kaç kat artırmak gerekir?
rTümü 
k (r11)
1  (k  1).r11
0,9 
k  0,5
1  (k  1).0,5
k  0,5  0,91  (k  1)  0,5
0,5.k  0,9[1  0,5.k  0,5]
0,5.k  0,9  0,45.k  0,45
0,5.k  0,45k  0,9  0,45
0,05.k  0,45
0,45
k 9
k
0,05
Güvenirlik katsayısı 0,5 olan bir testin güvenirliğini 0,9‟a çıkarmak için testin uzunluğunun 9 kat
artırılması gerekir.
Güvenilir bir sınav yapmak isteyen öğretmenlere öneriler
Az soru yerine cevabı kısa tutup çok soru sormaya çalıĢın
Soruları herhangi bir farklı anlaĢılmaya meydan vermeyecek biçimde açık seçik ne net olarak
ifade edin
Sınavınızı öğrenci için bir kaygı nedeni haline getirmeyin.
Sınav süresini iyi ayarlayın. Her sınavınızda öğrencilerin ne kadarının cevaplamayı ne kadar
sürede bitirdiklerini gözlemleyin ve bu sonucu süre ayarlamada kullanın
Sınavlarınızı soru ayrıntısında puanlayın, her sorunun doğru yanıtlanma oranından yola çıkarak
sorularınızın güçlüğü hakkında fikir edinin ve sorularınızı güçlük düzeyini ayarlayın. Zor soruları
baĢa ya da bir grup olarak yerleĢtirmeyin. (Soruların güçlük derecesini bilmenin, sınavınızın
ayırt ediciliği ile ilgisi olduğunu gözden kaçırmayın.)
ġans baĢarısı baĢta olmak üzere öğrenme ürünü olmayan davranıĢlar (kopya gibi) için önlem alın.
Oturma düzeni ile, gözetim ile önlem alınabilirse de, kopyayı engellemenin en geçerli yolu,
kopya ile yanıtlanamayacak soru sormaktır.
Sınavın puanlamasını olabildiğince nesnel (objektif) olarak yapın
102
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
GEÇERLĠK VE GÜVENĠRLĠK ARASI ĠLĠġKĠ
En genel tanımlarıyla
GEÇERLĠK: Ölçülmek istenen davranıĢın ölçülmesi
GÜVENĠRLĠK: Art arda yapılan ölçümlerin (hatadan arınık bir Ģekilde) tutarlı olması
GÜVENĠLĠR /GEÇERLĠ DEĞĠL
GEÇERLĠ / GÜVENĠLĠR DEĞĠL
GEÇERLĠ VE GÜVENĠLĠR
Ölçme, ilgilenilen özelliğin varoluĢ miktarının sayı ya da sembolle ifadesiyse, sayı ya da
sembolle ifade edilen özellik ĠLGLENĠLEN ÖZELLĠK DEĞĠLSE, ölçmenin çok da anlamı
yoktur. Bu nedenle, GEÇERLĠK GÜVENĠRLĠK tartıĢmasında, GEÇERLĠK önde gelen bir
özelliktir. Bir test geçerli değilse, güvenirliğini tartıĢmanın bir anlamı yoktur.
Bir testin güvenirliğinin düĢük olması geçerliği sınırlandırabilir, ama yüksek güvenirlik
geçerliği garanti etmez.
Bir testin güvenirliği düĢükse, geçerliği ne kadar uğraĢılsa da belli bir değerin üzerine
çıkamaz.
Test puanları ile ölçüt olarak geçerliği kanıtlanmıĢ test puanları arası korelâsyonun geçerlik
katsayısı olarak düĢünüldüğü bir bağlamda, geçerlik katsayısı güvenirlik katsayısının karekök
değerini geçemez.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
103
ÖLÇMENİN STANDART HATASI
ve MADDE ANALİZLERİ
Uygulamada, elde edilen ölçme sonucu, gözlenen puanlardır. Yapılan ölçüme bakılarak, ne
bireylerin gerçek puanları ne de gözlenen puanları ile gerçek puanları arası fark (HATA) tam
olarak bilinebilir.
Gözlenen ve gerçek puanların arasındaki fark olan hatanın büyüklüğünün araĢtırılabilmesi için
kiĢiye iliĢkin birden fazla ölçüm yapılması gerekir.
Kuramsal olarak, bir kiĢiye iliĢkin aynı araçla sonsuz sayıda ölçüm yaparsak, ölçüm sonucu olan
puanlar bir dağılım sergileyecektir. Bu puan dağılımının ortalaması kiĢiye iliĢkin ideal puanın en
iyi tahminidir. Böylesine bir dağılımın standart sapması da (ortalamadan farkların ortalaması)
ölçmenin standart hatası olacaktır.
Ancak, gerçekte bir kiĢiye iliĢkin çok sayıda tekrarlı ölçüm yapmak zordur ve çoğu kez de bu
süreçte, ölçülen kiĢide ve ölçülen özellikte ortaya çıkan değiĢimler ölçüm sonuçlarını etkiler. Bu
nedenle, ölçmenin standart hatası, baĢka bir biçimde, (ölçülen puanların standart sapması ve
ölçümün güvenirliği bilindiğinde) dolaylı olarak tahmin edilebilir.
S Hata  S  1  rx S
= Ölçülen puanların standart sapması
rx = Güvenirlik katsayısı
Standart sapmanın 0 (sıfır) ya da güvenirliğin 1.00 olduğu durumlarda standart hatanın 0 (sıfır)
olduğunu görünüz. Bu art arda yapılan ölçüm sonuçlarının hep aynı / hatasız olduğu anlamına
gelmektedir.
S Hata  S  1  rx denkliği yardımıyla ölçüm sonucunda elde edilen puanlardaki hata oranı,
yine test puanları cinsinden hesaplanabilir. Ancak hatanın yönü bilinmediğinden, bireyin gerçek
puanı, gerçek puanın belli bir oran altında ve üstünde belirlenen sınır puanların arasında kalan bir
aralık değeri olarak hesaplanır. Buna puanın GÜVEN ARALIĞI denir ve belli bir olasılıkla
gerçek puanın nerede olduğunu gösterir.
GA  X Gözlenen  ( z puanı  S Hata )
Bir testin standart sapması 10, güvenirliği de 0,84 olarak bulunmuĢtur. Bu testte alınan 60 puanın
güven aralığı nedir?
S Hata  10  1  0,84
S Hata  10  0,16
S Hata  4
Güven aralığı 1 z puanı için, 2 z puanı için ve 3 z puanı için ayrı ayrı olasılık değerlerini
gösterecek biçimde hesaplanır.
GA (1z puanı için %68 olasılıkla) 60±1.4
GA (2z puanı için %95 olasılıkla) 60±2.4
GA (3z puanı için %99 olasılıkla) 60±3.4
104
[60-4=56 60+4=64] 56 ile 64 puan arasında
[60-8=52 60+8=68] 52 ile 68 puan arasında
[60-12=52 60+12=72] 48 ile 72 puan arasında
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Gerçek puanın güven aralığında bulunma olasılığının yüzdesi,
normal dağılım eğrisinde
ortalamadan, bir, iki ve üç standart sapma büyük ve küçük puanlar arasında kalan alanlarda
bulunabilecek puanların toplam puanlara oranıdır.
z standart puanları ortalaması 0
(sıfır), standart sapması 1 (bir)
olan puanlardı.
ĠKĠ TEST PUANI
ARASINDAKĠ FARKIN
GÜVENĠRLĠĞĠ
Sonunda nota dönüĢtürülecek test
puanları da aslında gerçek puanlar
değildir. Test sonucu elde
edilebilecek gerçek puanlar, ancak
belli olasılıkla bir güven aralığında
ifade edilebilmektedir.
Diğer yandan, puanlar nota dönüĢtürülürken, her bir nota karĢılık gelecek puan aralıkları
tanımlanmaktadır.
Puanların nota dönüĢtürülmesinde, notları birbirinden ayıran puan aralığının, gerçek puanı içeren
(en azından %68 olasılıkla) güven aralığından büyük olması durumunda, notların gerçekten
öğrencileri ayırabildiğini söyleyebiliriz.
Yani, bireysel puanların standart hatasının fark puanların standart hatasından daha küçük (ya da
fark puanların standart hatasının bireysel puanların standart hatasından büyük) olması gerekir.
Bu da bireysel puanların, fark puanlardan daha güvenilir olmasını gerektirir.
Bireysel puanların standart hatası bilindiğinde fark puanların standart hatası, (her birisi bir puanın
hatasını temsil etmek kaydıyla)
 ( S Hata ) 2  ( S Hata ) 2
Puanlarının standart hatası 4 olan bir testte fark puanlarının standart hatası 42  42  5,66 dır.
Bu testte iki puanın %68 olasılıkla (1 S Sapma) FARKLI sayılabilmesi için aralarında 5,66‟lık
bir fark olması gerekir.
Eğer %95 olasılıkla (0.05 hata payıyla) bir ayrım olması isteniyorsa iki puan arası
(25,66=11,32)‟lik bir fark olmalıdır.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
105
KULLANIġLILIK
Ölçme araçlarının niteliği ile ilgili bir baĢka kavram da kullanıĢlılıktır. Ancak, kullanıĢlılık
ölçme aracının geçerliğini, yapacağı ölçümlerin güvenirliğini etkilemeyecekse ya da bunlara
katkı sağlayacaksa ölçme açısından anlamlıdır.
KullanıĢlılığa katkı getiren faktörler Ģunlar olabilir
Ekonomiklik (Maliyet anlamında)
Hazırlanma süresi
Puanlanma süresi
Uygulama kolaylığı
Puanlama ve puanları yorumlama kolaylığı
TESTLERDE MADDE ANALĠZLERĠ
Testlerde madde analizi, bir testin geliĢtirilmesi sürecinde, nitelikli bir test oluĢturmak için
yapılan iĢlemlerdir. DavranıĢ bilimlerinde, değiĢkenlerin tümünü kontrol ederek, her ayrıntıyı
önceden ortaya koymak olanaksız olduğu için, çoğu kez denemeler yapılır ve bu denemelerin
sonuçlarına göre daha sonraki uygulamalara iliĢkin kestirimlerde bulunulur.
Halil Tekin‟in ifadesiyle, test geliĢtirmede madde analizleri terzinin elbise provası yapmasına
benzer.
Bu denemenin katkıları
1. Zorluk açısından, aĢırı uçlarda yer alan, çok kolay ve çok zor soruları belirlemek
2. Bir sorunun iĢe yaramayan ya da anlaĢılamayan çeldiricilerini belirlemek
3. Amaca uygun test geliĢtirmede kullanabilmek için güçlük derecesi değiĢik sorular
belirlemek
4. Her sorunun ayırt etme gücünü belirlemek
5. Amaca uygun bir test formu hazırlarken, en uygun soru sayısını ve test süresini
belirlemek için veri sağlamak
6. Yönergelerin etkililiğini belirlemek
Öğretmenlerin uyguladıkları her testin analizini bir sonraki dönemin testlerini hazırlamak için
yapmaları, bir soru bankası / arĢivi hazırlamaları, doğru ölçme değerlendirme yapabilmelerine
olanak sağlayacaktır. Ölçme değerlendirmenin öğretim süreçlerindeki önemi düĢünüldüğünde,
bunun eğitim sisteminin niteliğini artırıcı çok önemli bir adım olacağı görülecektir.
MADDE ANALĠZĠNDE ÖĞRETMENLERE ÖNERĠLERĠ
Normal dağılıma yakınlık, süreçte kazandırılmıĢ yeni davranıĢların, öğrencilerin gerçek
performanslarının göstergesi sayılabilir. Ancak, her testin sonucundaki dağılımın normal
dağılım sergilemesi iyidir gibi bir genelleme doğru değildir. Dağılımın “iyi” olması testin
amacına bağlıdır. Bazen sağa çarpık dağılım sergileyen test (seçme için zor test) istenebilir.
106
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Öğrencileri birbirinden ayıran, onları sıralayan testlerin geniĢliği ve standart sapması küçük
olmamalıdır. Bağlayıcı olmamakla birlikte, böylesi bir geniĢliğin, testten alınabilecek tam puanın
yarısı olması uygun görülebilir. (Bir tane çok yüksek ya da çok düĢük puanın geniĢliğe etkisi göz
ardı edilmemelidir)
Dağılım için, standart sapmanın geniĢliğe oranı da bir fikir verebilir. Bu oranın 4-6 arası olması
iyi olarak yorumlanır.
Çarpıklık testin gruba zor ya da kolay geldiğinin bir göstergesidir. Bir testin güçlük derecesi
testin amacına bağlı olarak değiĢir. Seçmek için test yapılıyorsa, testin puan ortalamasının,
alınabilecek olası en yüksek puana oranının (ortalama güçlüğünün) gruptan seçilecek birey
sayısının grup mevcuduna oranı ile paralel olması istenir. [100 kiĢiden 20 kiĢi seçecekse p=0,2 ]
Sıralamaya, sınıflamaya yönelik testlerde ortalama güçlüğün p=0,5 civarında olması istenir.
MADDE GÜÇLÜĞÜ
Bir maddenin güçlüğü, o maddeye doğru yanıt verenlerin testi alan tüm öğrencilere oranıdır.
pj 
Ij
N
Burada,
pj
j‟inci maddenin güçlüğü, Ij, j‟nci maddeyi doğru yanıtlayan sayısı, N ise
testi alan sayıdır.
Madde güçlüğü, 0 ile 1 arasında bir değer alabilir ve 1‟e yaklaĢtıkça madde kolay, 0‟a yaklaĢtıkça
zor olarak nitelenir.
Madde güçlüğü ile ilgili diğer veriler:
Bir testte madde güçlüklerinin toplamı o testin aritmetik ortalamasını verir.
Bir maddeye doğru yanıt verenlerin oranı (pj) ile doğru yanıt veremeyenlerin oranının
pj) çarpımı madde varyansını verir. Madde Varyansı= pj . qj
(qj=1-
Madde varyansının karekökü maddenin standart sapmasına eĢittir.
MADDE AYIRICILIK GÜCÜ
Testlerde, ölçülmek istenen niteliğe sahip olan bireylerle sahip olmayanları birbirinden ayırt
edilmesi istenir. Bu, istenilen özelliğe sahip olanların, özelliği ölçen maddeyi doğru
yanıtlamaları, olmayanların ise boĢ bırakmaları ya da yanlıĢ yanıtlamaları anlamına gelir.
Testin tamamından alınan puan ölçüt olarak kabul edildiğinde, yüksek puan alan bir birey,
ilgilendiğimiz maddeyi yanıtlarken, testin tamamından düĢük puan alan birey, ilgilendiğimiz
maddeyi yanıtlamayacak ya da boĢ bırakacaktır. Madde yeteri kadar ayırd edici ise, yüksek puan
alanlar o maddeyi doğru olarak yanıtlamalı, düĢük puan alanlar ise yanıtlamamalı ya da boĢ
bırakmalıdır. Görüldüğü gibi bu bir iç tutarlık sorunudur.
Herhangi bir maddenin ayırd edicilik gücü, o madde puanı ile testten alınan toplam puan arası
korelasyon katsayısıdır.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
107
Maddeler doğru yanlıĢ olarak nitelendiği için, madde puanı iki kategorili nitel değiĢken (1-0)
olarak ele alınırken, testin bütününden alınan puan da aralık ölçeğinde sürekli değiĢken olarak ele
alınır. Bu durumda da nokta çift serili korelasyon katsayısı hesaplanabilir.
X X
rpb  jD
SX
 pj 


q
 j 
X jD , testin j‟inci maddesini doğru
Burada,
yanıtlayanların testin bütününden aldıkları puanların
ortalaması, X test puanlarının aritmetik ortalaması,
S X test puanlarının standart sapması, p j j‟inci maddenin
güçlüğü (o maddeyi doğru yanıtlayanların, testi alanlara
oranı), q j = (1- p j ) (o maddeyi yapamayan ya da boĢ
bırakanların, testi alanlara oranı)
Madde ayırıcılık gücü 0,40 ve üzerinde olan maddeler çok iyi madde olarak düĢünülürken,
0,20-0,29 arası maddeler düzeltilmeye muhtaç maddeler olarak düĢünülür. Madde
ayırıcılık gücü 0,20’nin altındaki maddelerin testten çıkarılması önerilir.
MADDE GÜVENĠRLĠĞĠ
Bir maddenin güvenirlik katsayısı, o maddenin ayırıcılık gücü ile standart sapmasının çarpımına
eĢittir.
rj  rjx  S j
Burada, r jx madde ayırıcılık gücü, S j ise o maddenin standart sapmasıdır.
K
Bir testte madde güvenirlik katsayılarının toplamı testin standart sapmasını verir. S X   rj
j 1
Bazı kaynaklarda, madde ayırıcılık gücü için, daha kolay hesaplanabildiği düĢüncesiyle pratik bir
yol önerilir. SıralanmıĢ puanlara göre, toplam puan sayısının %27‟sini oluĢturacak Ģekilde, üst ve
alt gruplar belirlenir ve bu gruplar içinde kalan doğru cevap yüzdeleri arası farka bakılır.
rjx 
Düst  Dalt
N
Düst = Üst grupta o maddeyi doğru yanıtlayanların sayısı
Dalt = Alt grupta o maddeyi doğru yanıtlayanların sayısı
N = %27 lik grup içine düĢen puan sayısı (Birbirine eĢit
olduğu için alt ya da üst grup mevcudu)
Benzer biçimde madde güçlüğünü hesaplarken aynı yaklaĢımı öneren kaynaklar da vardır. Bu
durumda iĢlem sadece üst ve alt grupların içinde kalan bireylerin verdikleri yanıtlarla sınırlı
biçimde aynı yolla hesaplanır.
Düst  Dalt
pj 
N üst  N alt
108
Düst = Üst grupta o maddeyi doğru yanıtlayanların sayısı
Dalt = Alt grupta o maddeyi doğru yanıtlayanların sayısı
Nüst  N alt = Üst ve alt grupta yer alan bireylerin toplamı
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
MADDE ANALĠZĠ ĠÇĠN ÖRNEK
Madde güçlüklerinin hesaplanması
Soru_1
1 Öğrenci_A
1
2 Öğrenci_B
0
3 Öğrenci_B
1
4 Öğrenci_C
1
5 Öğrenci_D
0
6 Öğrenci_E
1
7 Öğrenci_F
1
8 Öğrenci_G
0
9 Öğrenci_H
1
10 Öğrenci_I
1
Ij
pj
Soru_2 Soru_3 Soru_4 Soru_5 Soru_6 Soru_7 Soru_8 Soru_9 Soru_10
1
1
1
1
1
1
1
1
1
1
0
0
1
0
0
1
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
1
0
0
0
1
1
0
1
0
0
1
1
1
1
0
1
0
1
1
1
0
1
1
1
1
0
0
1
0
1
1
0
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
1
0
0
1
0
1
1
1
1
1
1
7
7
6
4
5
5
5
7
9
8
0,7
0,7
0,6
0,4
0,5
0,5
0,5
0,7
0,9
0,8
TOPLAM
PUAN
10
5
7
4
6
7
6
6
4
8
Bir maddenin güçlüğü o maddeyi doğru yanıtlayanların, testi alanlara oranıdır.
pj 
Ij
p1 
N
I1
N
p1 
7
 0,7
10
p6 
5
 0,5
10
p10 
8
 0,8
10
Bu testin en kolay sorusu 9‟uncu soru, en zor sorusu da 4‟üncü sorudur.
Madde güçlüklerinin toplamı testin aritmetik ortalamasını verir
N
X   pj
j 1
X  0,7  0,7  0,6  0,4  0,5  0,5  0,5  0,7  0,9  0,8
X  6,3
Testin madde güçlüklerinin aritmetik ortalaması, testin ORTALAMA GÜÇLÜĞÜNÜ verir.
p
0,7  0,7  0,6  0,4  0,5  0,5  0,5  0,7  0,9  0,8 6,3

10
10
p  0,63
Bu da (ortalama güçlük) ARĠTMETĠK ORTALAMANIN MADDE SAYISINA BÖLÜMÜDÜR
p
X 6,3

K 10
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
109
MADDE AYIRICLIK GÜCÜNÜN HESAPLANMASI
1
2
3
4
5
6
7
8
9
10
Öğrenci_A
Öğrenci_B
Öğrenci_B
Öğrenci_C
Öğrenci_D
Öğrenci_E
Öğrenci_F
Öğrenci_G
Öğrenci_H
Öğrenci_I
Ij
pj
qj
pjxqj
Soru_1 Soru_2 Soru_3 Soru_4 Soru_5 Soru_6 Soru_7 Soru_8 Soru_9 Soru_10
1
1
1
1
1
1
1
1
1
1
0
1
0
0
1
0
0
1
1
1
1
0
1
1
0
0
1
1
1
1
1
1
0
0
0
1
0
0
0
1
0
1
0
1
0
0
1
1
1
1
1
0
1
0
1
1
1
0
1
1
1
1
1
0
0
1
0
1
1
0
0
1
0
1
1
0
0
1
1
1
1
1
1
0
0
0
0
0
1
0
1
0
1
0
1
1
1
1
1
1
ORT
7
0,7
0,3
0,21
7
0,7
0,3
0,21
6
0,6
0,4
0,24
4
0,4
0,6
0,24
5
0,5
0,5
0,25
5
0,5
0,5
0,25
5
0,5
0,5
0,25
7
0,7
0,3
0,21
9
0,9
0,1
0,09
TOPLAM
PUAN
10
5
7
4
6
7
6
6
4
8
6,3
8
0,8
0,2
0,16
1‟inci Maddenin AYIRICILIK GÜCÜ
rpb 
X jD  X
SX
1
3
4
6
7
9
10
Öğrenci_A
Öğrenci_B
Öğrenci_C
Öğrenci_E
Öğrenci_F
Öğrenci_H
Öğrenci_I
 pj 


q
 j 
10
7
4
7
6
4
8
1‟inci maddeyi doğru yanıtlayanların puan ortalaması
X 1nciMdD 
S X  1,83
r1X 
110
10  7  4  7  6  4  8 46

 6,57
7
7
6,57  6,3  0,7 


1,83  0,3 

r1 X  0,147 2,33
X  6,3

p1  0,7
q1  (1  0,7)  0,3
r1 X  0,22
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
MADDE GÜVENĠRLĠĞĠ
Bir maddenin güvenirlik katsayısı, o maddenin ayırıcılık gücü ile standart sapmasının çarpımına
eĢittir.
rj  rjx  S j
1‟inci maddenin ayırıcılık gücü = r1X 

6,57  6,3  0,7 

 r1 X  0,147 2,33
1,83  0,3 

r1 X  0,22
Bir maddeye doğru yanıt verenlerin oranı (pj) ile doğru yanıt veremeyenlerin oranının
pj) çarpımı madde varyansını verir. Madde Varyansı= pj . qj
(qj=1-
Madde varyansının karekökü de maddenin standart sapmasına eĢittir.
1‟inci maddenin varyansı = p1.q1
r1  0,22  0,46
(0,7)(0,3)= 0.21 S1  0,21
S1  0,46
r1  0,10
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
111
BĠLGĠ NOTU
PROGRAM DEĞERLENDİRME
PROGRAM GELĠġTĠRME SÜRECĠ
TASARLAMA
Program geliĢtirme modellerine ve
konuya iliĢkin ilkelere göre bir
programın yazılı olarak ortaya
konması
GELİŞTİRME
Değerlendirmeden elde edilen bilgiler
doğrultusunda, programın daha etkili,
daha verimli olması için iyileĢtirmeler
yapma
UYGULAMA
Seçilen pilot okullarda programın
denenmesi
Deneme sonuçlarına göre gerekli
düzenlemelerin yapılmasının
ardından, programın yaygın olarak
uygulanması
DEĞERLENDİRME
Yaygın olarak uygulanan programın
etkililiğini görme
Programın Denenmesinde (Pilot Uygulamada) Ġzlenen Adımlar
Uygulamanın planlanması
Deneme uygulamasının yapılacağı okul ve sınıfların seçimi
Okul yöneticilerinin ve uygulama yapacak öğretmenlerin belirlenmesi
Yönetici ve öğretmenlerin program ve uygulamalar konusunda bilgilendirilmesi
Programın ve öğretim materyallerinin iĢe koĢulması
Uygulamanın değerlendirilmesi
Program Değerlendirmede Temel ĠĢlemler
Değerlendirmeden kastedilen “anlamın” kesinleĢtirilmesi. (Program Değerlendirmenin ve
kullanılacak modelin ne anlama geldiğinin tanımlaması, bu konuda verilecek temel kararın
gerekçelerine iliĢkin soruların yanıtlanması)
Değerlendirme amacının belirlenmesi
Kilit kiĢilerin (değerlendirme sürecinde görev alacak kiĢiler ve görev tanımları) belirlenmesi
Olanakların ve engellerin belirlenmesi
Değerlendirmeyle yanıtları aranacak soruların belirlenerek öncelik sırasına konması
Değerlendirme sürecinin tasarımının netleĢtirilmesi
Verilerin toplanması
Verilerin çözümlenmesi (analizi)
Bulguların yorumlanması ve ilgillerle paylaĢılması
112
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
PROGRAM DEĞERLENDĠRME
Bir programın etkililiğini (program ne tür ürünler ortaya koymayı amaçlamıĢsa, o ürünlerin,
içinde yer aldıkları toplumun gereksinimlerini ve beklentilerini karĢılama derecesini) ortaya
koymak için veri elde etmek amacıyla yapılan değerlendirme etkinliğidir. Bu süreçte elde edilen
veriler, “mevcut programın daha etkili olabilmesi için neler yapılması gerektiğinin”
belirlenmesinde de kullanılmalıdır.
Öğretmenler, çocukların içlerindeki potansiyeli doğru olarak saptayıp, ülkenin
gereksinim duyduğu alanlara yönlendirip, toplumun beklentilerini karşılayacak gençleri
yetiştiriyorlarsa
Hekimler, toplumda sıklıkla karşılaşılan hastalıkları doğru teşhis edip tedavi
edebiliyorlarsa, hastalarıyla iletişim kurabiliyorlarsa,
Polisler, o toplumda sıklıkla görülen suçları önleyebiliyorlarsa, toplumla işbirliği içinde
çalışabiliyorlarsa
O toplumdaki öğretmen, hekim ve polis yetiĢtirme programları etkili demektir.
Sanal mağazalardan alıĢveriĢ kültürü olmayan, kredi kartı kullanma alıĢkanlığı olmayan kapalı
bir toplumdaki polis yetiĢtirme programlarında “biliĢim suçlarını önleme” amacı ağırlıklı olarak
yer alıyorsa ve bu programdan yüksek akademik ortalamalarla polisler mezun oluyorsa, burada
da bir baĢarıdan söz edilebilir. Ancak buradaki baĢarı programın baĢarısını değil öğrenci
baĢarısını göstermektedir. Öğrenci baĢarısının yüksek olması, her zaman programın etkili
olduğunu göstermez. Bir Avrupa ülkesinde, “Domuz Çiftliklerindeki üretimin artırılması
üzerinde” lisansüstü eğitimini üstün baĢarıyla tamamlamıĢ bir veteriner hekimin, bu baĢarısının
müslüman bir ülke bağlamında etkililiği yok denecek kadar azdır.
Programın değerlendirilmesi, öğretimin değerlendirilmesi demek değildir. Program
değerlendirme bakıĢ açısıyla ele alındığında, öğretimin değerlendirilmesi, programın
değerlendirilmesinin içinde yer alan bir alt süreç olarak düĢünülebilir. Olması gereken, etkili bir
program içinde baĢarılı bir öğretim sürecinin gerçekleĢtirilebilmesidir.
Öğretimin değerlendirilmesinde çoklukla Ģu konular incelenir
Öğrenci baĢarısı (programın baĢından itibaren kaydedilen ilerleme, eriĢi)
Öğretmenin performansı
Kullanılan strateji, yöntem ya da tekniklerin etkililiği
ÖĞRETĠMĠN DEĞERLENDĠRĠLMESĠNDE GENEL YOLLAR
Tanılayıcı Değerlendirme: Programa baĢlamadan önce, öğrencilerin baĢlangıç durumlarını
ortaya koyma amaçlı değerlendirme. Ön koĢul öğrenmelerin olup olmadığını belirlemeye
yönelik.
Biçimlendirici Değerlendirme: Sürecin planlandığı biçimde devam edip etmediğini ortaya
koymaya, planlamadan sapmalar varsa bunları düzeltmek için veri sağlamaya yönelik
değerlendirme
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
113
Düzey Belirleyici: Program sonunda, baĢta belirlenen amaçların hangi düzeyde gerçekleĢtiğini
ortaya koymaya yönelik değerlendirme. Genellikle, (davranıĢın ne ölçüde kazanılmıĢ olduğunu
ortaya koymaya yönelik) baĢarı ve (belli bir iĢi yapabilmek için gerekli asgari davranıĢ düzeyine
sahip olup olunmadığını ortaya koyan) yeterlik testleriyle belirlenir.
PROGRAM
GELİŞTİRME
SÜRECİNDEKİ
DEĞERLENDĠRME BĠÇĠMLERĠ
YERİNE
GÖRE
PROGRAM
Programın hazırlanma sürecinde, uygulanmadan önce, Program GeliĢtirme (PG) uzmanlarının,
konu alanı uzmanlarının, öğretmenlerin ve diğer ilgililerin aĢağıdakine benzer sorulara yanıt
bulmak amacıyla (masa baĢında) yaptıkları değerlendirmeye YANSITICI DEĞERLENDĠRME
denir.
Programın genel amaçları, beklenti ve gereksinimlerle ve kendi içinde tutarlı mı?
Bireylere kazandırılacak (davranışsal)
amaçlar /kazanımlar, programın genel
hedefleriyle uyumlu mu?
İçeriğin ve sürecin programın amaçlarını gerçekleştirme olasılığı nedir?
Süreçte seçilen yöntem, strateji ve araçlar uygun mu?
Değerlendirme araçları ve biçimleri, amaçları ölçmeye ve değerlendirmeye uygun mu?
Programın (özellikle deneme / pilot) uygulanması esnasında, sistematik gözlemlerle,
öğretmenlerle yapılan görüĢmelerle ve çeĢitli veri kaynaklarıyla programa iliĢkin veri toplanması,
bu verilerden elde edilecek dönütlerle programa uygulamada şekil verilmesi ve gerekli
düzeltmeler yapılması amacıyla gerçekleĢtirilen değerlendirmeye BĠÇĠMLENDĠRĠCĠ
DEĞERLENDĠRME denir. Bu değerlendirme öncesi, programdan beklentiler açıkça
tanımlanmalı ve bunlardan ölçüt olarak yararlanılmalıdır.
Uygulama sonunda,
Öğrenenlerin, değişen davranışlarının
Öğretmenlerin öğretime ilişkin görüşlerinin
Sürecin izlenmesine ilişkin çeşitli kayıtların
Öğrenenlerin başarısının ölçüm sonuçlarının
Program paydaşlarının beklentilerinin karşılanma derecesinin göz önüne alınarak
yapılan nihai değerlendirmeye TOPLAM DEĞERLENDĠRME denir.
Yeniliklerin programa yansıtılmasına, içeriğin yenileĢtirilmesi ya da yeniden düzenlenmesine,
öğretim planlarının (amaç, süreç, öğretimin değerlendirilmesi) gözden geçirilmesine, amaçların
iĢlevselliğinin sağlanmasına katkı getirmesi beklenir.
PROGRAM DEĞERLENDĠRMEDE FELSEFĠ YAKLAġIMLAR
Program Değerlendirmede, değerlendirme yapanların, benimsedikleri kuramlara, sahip oldukları
felsefi görüĢlerine göre tercih edebilecekleri yaklaĢımlar bulunabilir.
Çıktılara (ürünlere) yoğunlaĢmıĢ biçimde, çeĢitli deneysel desenler ve bu desenlerde yapılacak
ölçümler sonucu elde edilecek nicel verilerle Program değerlendirmesi yapılabilir. Bu
BĠLĠMSEL/DENEYSEL YAKLAġIM olarak adlandırılır.
114
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Bazı değerlendirmeciler, deneysel yaklaĢımlarla belli deneysel desenlerle değil de, programın
doğal ortamında, var olan özelliklerinin betimlenmesi Ģeklinde değerlendirme yaklaĢımını
benimseyebilirler. Bu ĠNSANCIL (HUMANĠSTĠK) YAKLAġIM olarak bilinir.
Bazı değerlendirmeciler de, nicelikten çok niteliğe önem vererek, katılanlarla yapılan
görüĢmelerin, ilgililerle tartıĢılan konularda onların görüĢ ve düĢüncelerinin sonuçlarına göre
değerlendirme yapmayı tercih edebilirler. Bu yaklaĢım da DOĞACI YAKLAġIM olarak
adlandırılır.
PROGRAM DEĞERLENDĠRME MODELLERĠ /YAKLAġIMLARI
Bir program değerlendirme öncesinde,
Programın hangi ögelerinin hangi öncelikle değerlendirileceğine,
Değerlendirmeyle yanıtları aranacak sorulara verilecek yanıtların niteliğine,
Programın kimler tarafından değerlendireceğine,
Değerlendirmede izlenecek yöntem ve tekniklere,
Program değerlendirmeden beklentilere (sonuçlarla ne yapılmak istendiğine)
Zaman, mekan, araç gereç gibi elde mevcut olanaklara
göre ne tür bir değerlendirme yolu izleneceğine karar verilir. Bu konuda, daha önceden denenmiĢ,
farklı öncelikleri, farklı yöntem ve teknikleri, farklı aĢamaları içeren değerlendirme yolları (karar
Ģablonları) vardır. Bunlara PROGRAM DEĞERLENDĠRME MODELLERĠ /YAKLAġIMLARI
denir.
PROGRAMIN ÖGELERĠNE DÖNÜK DEĞERLENDĠRME MODELĠ
Daha çok, yansıtıcı değerlendirmede kullanılabilecek bir model ya da yaklaĢımdır. Bir Program
GeliĢtirme çalıĢmasında, programın kapsamlı biçimde değerlendirilmesine olanak sağlayabilir.
Programın her bir ögesinin ele alınarak, önce kendi içinde tutarlılığı, ardından da diğer ögelerle
iliĢkileri incelenir. Programın 4 temel ögesi olan Amaç [Hedef], Ġçerik [Kapsam], Süreç [Öğretim
Durumları] ve Değerlendirme [Sınama Durumları] için belli sorulara yanıt aranır. Ögeler ve
öğelere iliĢkin yanıt aranacak soru örnekleri aĢağıdadır.
Ayrıca, programın uygulanacağı öğretim kurumları belliyse, uygulama bağlamının özellikleri de
değerlendirmeye katılabilir.
AMAÇLAR (HEDEFLER)
Toplumun ihtiyaç ve beklentileri ile örtüĢüyor mu?
Bireysel beklentileri ve ihtiyaçları karĢılıyor mu?
Konu alanının özelliklerine uygun mu?
Kendi içinde tutarlı ve hiyerarĢik bir yapısı var mı?
Ġfadeleri yeterince açık ve anlaĢılabilir mi?
GerçekleĢtirilebilecek nitelikte mi?
ĠÇERĠK(KAPSAM)
Amaçlarla iliĢkili mi?
Kendi içinde tutarlı mı?
Ġlginç, önemli, anlamlı, güncel, geçerli ve düzeye uygun mu?
Düzenlenme (sıralanma) biçimi (öğretim ilkelerine) uygun mu?
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
115
SÜREÇ (ÖĞRETĠM DURUMLARI)
Kullanılacak içerikle ve amaçlarla uyumlu mu?
Ġçerdiği strateji yöntem ve teknikleri ilgili öğrenme kuramlarıyla iliĢkili mi?
Öğretmenin, öğrencilerin, kullanılan araç gereç ve materyalin rolleri belli mi?
Katılımı sağlayacak etkinlikleri içeriyor mu?
Öğrencilerin bulundukları geliĢim aĢamalarıyla uyumlu mu?
DEĞERLENDĠRME (SINAMA DURUMLARI)
Kullanılan ölçme yöntemi ve araçları amaçlara uygun mu?
Seçilen değerlendirme yöntemi (mutlak/bağıl) uygun mu?
Ölçme araçlarının ölçümleri geçerli mi?
Ölçme sonuçları güvenilir mi?
ÖĞRENME ORTAMINA ĠLĠġKĠN
Kurumun örgütsel yapısı, programın uygulanmasını sağlayabilecek biçimde mi?
Fiziksel kaynaklar yeterli mi?
(TYLER’IN) AMACA (HEDEFE) DAYALI PROGRAM DEĞERLENDRME MODELĠ
Ürünün (program aracılığı ile yetiĢtirilen bireylerin, kazandırılmak istenen özellikleri) merkeze
alınarak, geçerli ve güvenilir ölçme araçları kullanılarak,
GerçekleĢtirilen ve gerçekleĢtirilemeyen hedeflerin /amaçların neler olduğunun,
GerçekleĢtirilemeyen hedeflerin/amaçların neden gerçekleĢtirilemediğinin
belirlenmesidir.
Beklenti, ürünlere kazandırılamayan özelliklerin, farklı öğrenme yaĢantılarıyla, farklı yöntem
teknik ya da araçlarla kazandırılması veya bu özelliklerin yeniden düzenlenmesi ya da
programdan çıkarılmasıdır.
Deneysel bir yaklaĢımdır. BiliĢsel amaçlar için DavranıĢ Testleri, Psikomotor Amaçlar için
Performans Testleri /Gözlem Formları, DuyuĢsal Amaçlar için Ġlgi Tutum ve benzeri ölçekler
kullanılır.
Hedefe dayalı değerlendirme sürecinde aĢağıdaki aĢamalar yer alır:
1.
2.
3.
4.
5.
6.
7.
Programın hedeflerini belirleme
Hedefleri kazandırılmak istenilen özelliğe göre sınıflama
Hedefleri davranıĢ cinsinden ifade etme
Hedefe ulaĢılıp ulaĢılmadığını gösterecek durumu saptama
Ölçme tekniklerini geliĢtirme ya da seçme
Öğrencilerin davranıĢ yeterlilikleri ile ilgili veriyi toplama
Elde edilen verilerle belirlenen hedefleri karĢılaĢtırma
Tyler baĢta ve sonda olmak üzere en az iki kere hedeflere ulaĢma derecelerini saptamak için
ölçüm, ardından da kalıcılığı sınamak için bir de izleme ölçümü önermiĢtir.
116
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
STUFFLEBEAM’ĠN BAĞLAM, GĠRDĠ – SÜREÇ VE ÜRÜN MODELĠ
(KARAR VERME MODELĠ)
Stufflebeam‟a göre değerlendirmenin amacı, program hakkında karar verme konumundaki
kiĢilere, program geliĢtirme sürecinde programın
Planlaması
Yapılanması
Uygulaması
Yeniden düzenlemesi
ile ilgili kararlarına dayanak teĢkil edecek bilgilerin toplanması için
Programın yer aldığı (çevrenin) bağlamın
Girdinin
Sürecin
Ürünün
değerlendirilmesidir.
Bu model CIPP (Context, Input, Process, Product) modeli olarak bilinmektedir
Bağlamın Değerlendirilmesi: Bu aĢamada programla ilgili tüm faktörler ve mevcut durum
analiz edilir. Bu aĢamanın amacı, program hedeflerinin (amaçlarının) belirlenmesine temel olacak
bilgilerin toplanması ve hedeflerin (amaçların) belirlenmesidir.
Amaçlar,
Öğrenenlerin, toplumun, iş dünyasının ihtiyaç ve beklentilerini karşılıyor mu?
İş hayatıyla işbirliği ve eşgüdüm var mı?
Gelecek öğrenmelere hazırlık sağlıyor mu?
Güncel mi?
Girdinin Değerlendirilmesi: Programın amaçlarına ulaĢılabilmesi için gerekli olan kaynaklar ve
bu kaynakların ne Ģekilde kullanılacağı hakkında bilgi sağlar. Girdilerin analizi sırasında,
Amaçlar mevcut duruma uygun olarak belirlenmiş mi?
Öğretim stratejileri, yöntemleri, amaçlara / hedeflere uygun mu?
Kapsam (içerik), genel amaçlar ve özel hedeflerle tutarlı mı?
Okulun kapasitesi yeterli mi?
Öğrencilerin hazır bulunuşluk düzeyleri yeterli mi?
gibi programa, okula ve öğrenenlere iliĢkin sorulara yanıt aranır
Sürecin Değerlendirilmesi: Gözlem formlarıyla, anketlerle, baĢarı testleriyle, performans
testleriyle, ilgi ve tutum ölçekleriyle,
Öğretmenler program dokümanlarını kullanıyorlar mı?
Öğrenme öğretme yöntem ve stratejileri uygun biçimde kullanılıyor mu?
İçerik tam olarak veriliyor mu?
Ölçmede kullanılan araçlar uygun, geçerli mi? Ölçümler güvenilir mi?
Programın maliyeti ne kadar?
Öğrencilerin memnuniyet düzeyi nedir?
gibi soruların yanıtları bulunmaya çalıĢılır.
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
117
Ürünün Değerlendirilmesi: programın ürünleri hakkında veri toplanarak beklenen ürünle gerçek
ürünün karĢılaĢtırılması söz konusudur. Performans testleri, anketler, iĢ doyum ölçekleriyle
Amaçlara ne derecede ulaşıldı?
Kazandırılan nitelikler beklentileri karşılıyor mu?
Mezunların iş bulma oranı nedir?
İş dünyasının /paydaşların ürünlere ilişkin görüşleri nelerdir?
Program ürünlerinin hareketliliği / işsizlilik oranı/ ücretleri nedir?
gibi soruların yanıtları bulunmaya çalıĢılır.
Bağlamın, girdinin, sürecin ve ürünün değerlendirilmesi sonucunda programın uygulanmasına,
üzerinde değişiklikler yapılmasına (düzeltilmesine) ya da uygulamadan kaldırılmasına KARAR
VERĠLEBĠLĠR:
METFESSEL – MICHAEL DEĞERLENDĠRME MODELĠ
Metfessel, Newton S. and Michael, William B. 1967 N.S. Metfessel and W.B. Michael, A paradigm involving multiple criterion
measures for the evaluation of the effectiveness of school programs, Educational and Psychological Measurement 27 (1967), pp.
391–943.
1960‟ların sonlarında Metfessel ve Michael sekiz adımlı bir değerlendirme sürecini
önermiĢlerdir. Program Değerlendirme uzmanları,
1. Eğitim dünyasındaki öğretmenler, yöneticiler, öğrenciler ve sıradan vatandaĢların dolaylı
ya da doğrudan değerlendirmede yer almasını sağlamalı,
2. Genelden özele doğru aĢamalı olarak sıralanan hedeflerin (tutarlılığını görebilmek için)
yoğun paradigmasını geliĢtirmeli,
3. Ġkinci maddede oluĢturulan özel hedefleri programda uygulanabilir bir biçime
dönüĢtürmeli,
4. Belirlenen hedeflerin ıĢığında programın etkililiğini bireyler üzerinde ölçebilecek ölçme
araçları geliĢtirmeli,
5. Programın uygulandığı sürece, test ve diğer uygun araçları kullanarak düzenli gözlemler
yapmalı,
6. Toplanan bilgileri analiz etmeli,
7. Programı felsefi anlamda değerlendirebilmede kullanılabilecek standartları ve değerleri
açıklamalıdır (Buradan elde edilecek sonuçlar belli bir alanda eğitim gören öğrencideki
geliĢim ve değiĢimleri değerlendirmeye yarayacaktır. Ayrıca programın tümünün
etkililiğini değerlendirmek de söz konusu olacaktır)
8. Toplanan bilgilere dayanarak programın ileriye yönelik uygulanabilirliği konusunda
öneriler geliĢtirmelidir.
PROVUS’UN FARKLAR YAKLAġIMI ĠLE DEĞERLENDĠRME MODELĠ
Malcolm Provus tarafından geliĢtirilen bu model sistem yönetimi kuramına dayalı
değerlendirmeyi beĢ evreye (aĢamaya) ve her evrede yapılacak dört iĢleme ayırır. Bu dört iĢlem;
1.
2.
3.
4.
118
Program standartlarını (hedeflenen performansı) belirleme,
Program performansını (edimini) belirleme,
Program performansı ile standartları karĢılaĢtırma,
Program performansı ile standartlar arasında bir farklılığın olup olmadığını belirleme
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Farklarla elde edilecek bilgiler her evrede karar vermek zorunda olanlara açıklanır. Bu durumda
karar verecekler için karar seçenekleri Ģunlardır:
1.
2.
3.
4.
5.
Bir sonraki evreye gitmek,
Önceki evreyi yeniden kullanılacak hale getirmek,
Programı yeniden baĢlatmak,
Edim ve standartları yeniden düzenlemek
Programı sonlandırmak.
Her birinde (programın yeterliliğini saptamak için, performansın belirlenen program
standartlarıyla karĢılaĢtırıldığı) dört iĢlemin yapılarak, çıkan sonuca göre karar seçeneklerinin
değerlendirileceği beĢ evre Ģunlardır:
1. Tasarım: Program tasarımının öngörülen standartlarda olup olmadığı incelenir. Arada
fark varsa, programın kabulü ya da uygulamadan kaldırılması kararını verecekler
bildirilir.
2. Düzenleme (OluĢturma): Olanaklar, yöntemler, öğrenci davranıĢları olarak adlandırılan
program ögeleri değerlendirilir. Bu ögelere iliĢkin öngörülen standartlarla mevcut durum
kıyaslanır.
3. Süreçler: Öğrenci ve personel etkinlikleri, iĢlevleri, iliĢkileri bakımından değerlendirme
yapılır. Yetersizlikler varsa rapor edilir.
4. Ürün – Süreç: Öngörülen (olması gereken) hedefler göz önünde bulundurularak
programın genel değerlendirilmesi yapılır. Ürün değerlendirmeye okul- toplum iliĢkisi
açısından bakılır.
5. Maliyet-yarar analizleri: Program çıktıları benzer program çıktılarıyla karĢılaĢtırılır.
GeliĢtirilen ve uygulanan yeni eğitim programının sonuçlarının, programın maliyetini
karĢılayıp karĢılamadığı araĢtırılır. (Bu maliyet hesabında sadece parasal konular değil,
politik ve toplumsal değerler de değerlendirmeye katılır.
STAKE’ĠN UYGUNLUK – OLASILIK MODELĠ
Değerlendirme tartıĢmasında Robert Stake, düzenli ve düzensiz değerlendirme ayrımı yapar ve
eğitimcileri nesnel sonuçlara götüreceği için, (sezgisel normları ve göreli yargıyı dıĢta tutan)
düzenli değerlendirmeyi önerir. Stake, nesnel bir yargıya varmanın çok zor olduğunu, ancak
profesyonel bir değerlendirme uzmanının görevinin nesnel yargıya varmak olduğunu ileri sürer.
Stake, değerlendirmeye dayalı bilgilerin, üç boyutta elde edilebileceğini ileri sürmektedir.
1. Girdi: Girdiler (öğrenme – öğretme süreci öncesi var olanlar) çıktıyı etkiler.
2. Süreç: Etkileşim söz konusudur (öğretmen- öğrenci, öğrenci- öğrenci, öğrenci – kaynak
kişi). Sınıf ortamı, zaman ayarlamaları, boş zaman düzenlemeleri iletişim ve süreçteki
kişilerin karşılıklı etkileşim içinde olmaları değerlendirmede dikkate alınır. Bu boyut
öğrenme – öğretme süreci olarak adlandırılabilir.
3. Çıktı (Ürün): Akademik başarı, tutum ve beceri düzeyinde değerlendirme söz konusudur.
Yeni programı, bu programı uygulayan öğretmen ve yöneticilerin de değerlendirmesi gerekir.
Stake‟in modelinde tasarlanan ve gerçekleĢen çıktının uygunluğuna bakılır. Tasarlananla
gözlenenin uyumu, tasarlanan gerçekleĢti mi? gibi sorulara yanıt aranır
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
119
EISNER’ĠN EĞĠTSEL ELEġTĠRĠ DEĞERLENDĠRME MODELĠ
Eğitsel eleĢtiri modeli diğerlerinden farklı olarak niteliksel incelemeye ağırlık vermektedir. Yeni
bir program uygulandıktan sonra, programın niteliksel sonuçları hakkında bilgi toplanır. Eisner,
program değerlendirmeyi güzel sanatlardaki değerlendirmeye benzetmektedir. Nasıl bir opera,
film, resim bu konuların uzmanı olan kiĢiler tarafından eleĢtiriliyorsa, eğitim programı da bu
konuda bilgisi olan, eleĢtiri yapabilecek kiĢiler tarafından değerlendirilmelidir.
Eisner, eğitsel eleĢtiriyi kullanacak değerlendirmecilerin
Belli bir programın uygulanması sonucunda öğretim yılı boyunca neler oldu?
Anahtar olaylar nelerdir? Bu olaylar nasıl ortaya çıktı?
Öğretmen ve öğrenciler bu olaylara nasıl katıldı?
Bu olaylara katılanların tepkileri nasıldı?
Bu olaylar daha nasıl etkin yapılabilirdi?
Öğrenciler yeni bir programı denerken ne öğrendiler?
gibi soruları sormaları gerektiğini belirtir.
Bu sorular süreç, okul yaĢantısı ve eğitimin niteliği üzerine odaklanır. Eisner, uzman
değerlendiricilerin okulda neler olduğuna iliĢkin elde ettikleri bilgilerin veli, toplum ve kamu
kuruluĢlarına iletilmesine izin verilmesi gerektiğini söyler
Modelin
BETĠMLEME,
YORUMLAMA ve
DEĞERLENDĠRME
olmak üzere üç temel boyutu vardır. Betimsel boyutta, eğitimin niteliği ile ilgili özellikler
tanımlanır. Betimleme sırasında, yeni programın sonucunda okulda ne gibi değiĢiklikler olduğu,
bu değiĢikliklerin öğrenci ve öğretmenleri nasıl etkilediği, tepkilerin neler olduğu gibi sorulara
yanıt aranır. Yorumlamada, program sonucu meydana gelen olaylar göz önünde bulundurularak,
bu olayların olası bazı sonuçları tahmin edilir ve yorumlanır. Değerlendirme boyutunda ise
betimleme ve yorumlama sonuçlarına dayalı olarak programın değeri hakkında yargıda
bulunulur.
120
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
BĠLGĠ NOTU
TESTLERĠN KULLANIMINA ĠLĠġKĠN ETĠK ĠLKELER
Testlerin kullanımına iliĢkin etik ilkeler
Yeterlik
Gizlilik
Test güvenliği
Test yorumlama
Test yayımlama
Ģeklinde sıralanabilir.
YETERLĠK ĠLKESĠ
Özellikle psikolojik testleri alıp kullanılacak kiĢiler, psikoloji, davranıĢ, davranıĢ ölçümü, bireyi
tanıma, test sonuçlarını doğru yorumlama konularında yeterliğe sahip olmalıdırlar.
Testler konusunda eğitimi olmayan, testlerin teknik özelliklerini bilmeyen, sosyal etkilerini
değerlendiremeyen kimselerin psikolojik testleri kullanmaları doğru değildir.
Özellikle Psikolojik testlerin, Psikoloji ve Eğitim Bilimlerinde en az yüksek lisans eğitimi almıĢ,
psikolojik testlerin niteliklerini bilen ve gerekli uygulama standartlarını yerine getirecek kiĢiler
tarafından satın alınabilmeleri gerekir. Testlerin bu özelliklerinin kullanma kılavuzlarında
belirtilmiĢ olmaları gerekir.
Kullanım kılavuzlarında (el kitaplarında) belirtilen, verilmesi özel eğitim gerektirmeyen eğitsel
testler, ilgi testleri, problem tarama listeleri ve değiĢik ölçekler, araĢtırmacılar tarafından satın
alınıp kullanılabilirler.
UzmanlaĢmayı gerektiren bireysel zekâ testleri, projektif teknikler ile puanlanması ve
yorumlanması karıĢık ve zor olan kiĢilik testlerinde de kullanıcı uzmanlığı koĢulu aranmalıdır.
Psikolojik testler konusunda özel eğitim görmemiĢ olan sosyal bilimciler, araĢtırmalarında bu tür
testleri kullanmak isterlerse, bunu bir uzmanın yardım ve denetiminde yapmalıdırlar.
Yeterlik ilkesi kapsamında bir baĢka sorun da, geliĢtirilmiĢ olan testlerin kimi uygulamacılar
tarafından sistemli bir çalıĢmaya ve araĢtırmaya dayandırılmaksızın (yeni maddelerin eklenmesi,
var olan kimi maddelerin çıkartılması, vb Ģeklinde uygulamalarla) değiĢtirilmesidir. Çok
karĢılaĢılan bir durum olarak, araĢtırma izni için baĢvurulan Milli Eğitim Müdürlüklerinde çalıĢan
kimi görevliler, araĢtırmada kullanılacak ölçeklerin kapsamı hakkında önerilerde bulunabilmekte
ve “uygun görülmeyen”" maddelerin çıkarılmasını isteyebilmektedirler. Bu önerilerin herhangi
bir çalıĢma yapılmadan yerine getirilmesi demek, testlerin bozulması anlamını taĢır.
GĠZLĠLĠK ĠLKESĠ
Uygulayıcının çok önemli bir görevi de bireyle ilgili test verilerinin gizliliğine saygı
göstermektir. Testlerden elde edilen sonuçlar öncelikle bireyin kendisine açıklanır. Test
sonuçları, bireyin bilgisi veya onayı dıĢında, sadece ve sadece, gerekli hallerde, bireyin
problemlerini çözmede yardımcı olacak diğer meslek sahiplerine (tıbbi, hukuki, vb otoritelere)
açıklanabilir. Test sonuçları, bu sonuçları bilme yetkisine sahip meslek mensupları arasında
sohbet, dedikodu konusu olamaz.
Test verileri psikolojik hizmetlerde, teĢhis, tedavi, bireysel danıĢma ya da araĢtırma amaçları
doğrultusunda ve mesleki gereklilikler bağlamında kullanılabilir.
Test uygulamaları öğretim ya da araĢtırma gibi akademik ve bilimsel amaçlar için yapılıyorsa,
teste katılan birey(ler)in izinlerinin alınması gerekir. Sonuçlar rapor edilirken katılımcıların
kimlikleri saklı tutularak, veriler genel anlamda betimlenir. Bu veriler hiç bir koĢulda,
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
121
katılımcıların kimlikleriyle iliĢkilendirilmiĢ bir biçimde, konferanslarda, radyo ve televizyon
programlarında, gazete ve dergi yazılarında kullanılamaz.
TEST GÜVENĠRLĠĞĠ ĠLKESĠ
Yeterlik ilkesinde sözü edildiği üzere, kullanılabilmeleri belli bir yeterliği gerekiren psikolojik
testler herkesin ulaĢabileceği bir biçimde bulundurulmamalıdır. Bunu sağlamak amacıyla
1.Popüler makalelerde veya diğer yayınlarda, testte geçen maddeler ve maddelerle
iliĢkilendirilmiĢ puanlar, bunlardan yola çıkarak, baĢkalarınca testlerin kullanımına olanak
verecek biçimde yayınlanmamalıdır.
2. Testleri kullanma yeterliğine sahip kiĢilerle, testlere görevleri gereği nüfuz edebilecek ilgili
kiĢiler, psikolojik testlerin ve diğer değerlendirme araçlarının kullanılmasının öğretimiyle
uğraĢan kiĢiler, testlerin özel içeriklerinin ve belirleyici ilkelerinin yayılması tehlikesini bilerek
davranmalıdırlar.
TEST YORUMLAMA ĠLKESĠ
Tıpkı testlerin kendisi gibi, test puanları (sonuçları) da, bunları uygun bir biçimde kullanmaya ve
yorumlamaya yetkili ve yeterli kiĢilerle paylaĢılmalıdır. Bu ilke çerçevesinde,
1. Okullarda, toplumsal kuruluĢlarda veya sanayide, öz değerlendirme veya ilerlemeyi, üretimi
ölçme amaçlı testler kullanılabilir. Bunların sonuçları, yetkili kiĢilerce değerlendirilip
yorumlandıktan sonra paylaĢılıp kullanılmalıdır.
2. Test sonuçları, değerlendirme veya sınıflama amacıyla, velilere, paydaĢlara, iĢverenlere veya
diğer ilgililere aktarılırken, yanlıĢ yorumlanmaya ve bunun sonucu olarak yanlıĢ kullanmaya
karĢı korunmalıdır. Genelde, test puanları yerine genel test sonuçlarının paylaĢılması daha doğru
olur.
3. Test sonuçları öğrenci veya velilere, doğrudan ulaĢtırılırken, uygun ve yeterli yorum ve
önerilerle desteklenmelidir.
TEST YAYIMLAMA ĠLKESĠ
Psikolojik testlerin ticari amaçla yayımlanması, ancak ve yalnızca bu testleri profesyonel bir
biçimde sunacak ve yalnız yetkili ve yeterli kullanıcılara dağıtacak yayımcılarca yapılmalıdır.
Bu ilke çerçevesinde,
1.Testin standardize edilme yöntemini ve geçerlik çalıĢmalarının özetini içeren, testin tanıtıcı
kitapçığı, teknik el kitabi veya uygunluk raporu bulunmalıdır.
2. Testin tanıtıcı kitapçığında, testin geliĢtirildiği evren ve kullanılma amaçlan belirtilmelidir.
Testin kullanılabilirlik, güvenilebilirlik sınırları ile onun geçerlilik özellikleri, varsa da özellikle
tamamlanmamıĢ veya yeterli araĢtırma yapılmamıĢ yönleri, açıkça belirtilmiĢ olmalıdır.
AraĢtırma ile desteklenmemiĢ yorumlara iliĢkin uyarılar içermelidir..
3.Testin el kitabında ya da kullanım kılavuzunda, test sonuçlarının uygun Ģekilde
yorumlanabilmesinin gerektirdiği eğitim, yetiĢme veya profesyonel yeterlilikler belirtilmelidir.
4. Test tanıtım açıklamaları reklam amaçlı olmamalı, doğru ve bilimsel açıklamalara dayalı
olmalı, duygusal ve yanıltıcı olmamalı ve el kitapları eğitsel ve psikolojik testler için konmuĢ
standartları içermelidir.
122
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
SON DERS
Gireceğiniz sınavlarda sorumlu olmadığınız ama yaşam denen gerçek sınavda işinize yarayacağını
düşündüğüm ve kapsam geçerliği tartışmasına girmemek için sınıfta vermeyeceğim son dersim.
Bu programda, sizlerle paylaşılan konular içinde yeni bir şey yoktur ve bütün bu bilgiler konuyla
ilgili herhangi bir ders kitabında ya da Internette mevcuttur. Bu nedenle, BUNLARI SADECE
BİLİYOR OLMAK sizleri farklı kılmaz, sizlere bir katkı getirmez.
Bizim asıl sorunumuz, bildiklerimizi karşılaştığımız durumlarda uygulayamayışımız ve bu nedenle
de yüz yüze geldiğimiz sorunları çözmede yetersiz kalmamızdır. Yaşı nerdeyse bir asır olan
Cumhuriyetimin eğitiminin ne durumda olduğunu şöyle bir düşünün ve mesajımın anlamını
kavramaya çalışın.
Bu programın sizlerin öğretim becerilerinize gerçek katkısı, mesleği icra etmeye başladığınızda
görülecektir. Verdiğim ders için konuşuyorum, o zaman ne ben sizin yanınızda olacağım ne de
uğruna çalıştığınız sınavlarınız karşınızda olacak. İşte bu noktada sizinle paylaşılan klasik eğitim
tarifini bir yana bırakıp eğitimi şu şekilde tanımlayarak işinizi yapmaya çalışın;
“EĞİTİM SADECE DAVRANIŞA DEĞİL, DAVRANIŞLARIN ALTINDAKİ DEĞERLERE MÜDAHALE
EDEBİLMEKTİR.”
Eğer bu süreç gerçekten eğitim olduysa, o zaman, sınav yaptırımı, not korkusu olmadan da bu
programda paylaşılanlarla iş yapmaya çalışırsınız.
Yıllardır insanla uğraşıyorum ve kimsenin kimseye bir şey öğretemeyeceğini öğrendim. Çünkü
öğrenme “bireysel” olarak gerçekleşebilen bir süreçtir. “O zaman, sınıfların, öğretmenin işi ne?”
diye soracaksınız…
Bu sorunun yanıtı çok net, “Öğrenmek isteyenlere öğrenme olanağı sunmak ve işlerini
kolaylaştırmak…” Burada anlaşılmayan, size ütopik gelen bir nokta var ama bu “öğrenme”
sözcüğüne yüklediğiniz anlamdan kaynaklanıyor. Çünkü bu güne kadar nadiren öğrendiniz, çoğu
kez de “terbiye edildiniz”
Bir insana istenen bir davranışı sergiletmenin (geleneksel bakış açısıyla, bir şey öğretmenin) iki
yolu var. Hatta birincisi, sınıf içindeki görevini “öğrenmek isteyenlere öğrenme olanağı sunmak”
şeklinde ifade ettiğim öğretmenin, bu işi sınıfta “nasıl yapacağı?” sorusunun da yanıtı.
Bir, öğretmek istediğiniz her ne ise, bunu öğrenen için önemli, onun bir ihtiyacı, ona ilginç gelen
bir şey haline getireceksiniz. O zaman göreceksiniz ki öğrenen, öğrenilecekleri sizden talep
etmeye, sizden istemeye başlıyor…
İki, öğreneni öylesine zor bir duruma sokacaksınız ki, o durumdan kurtulabilmek için,
kendisinden istenen her şeyi yapmaya razı olacak. Tanıdık geldi değil mi? Şu sınavı verip bir
kurtulsam, şu hocanın dersinden bir geçsem, hatta, şu formasyon bitse de kurtulsak… Ama ben
buna eğitim değil “terbiye” diyorum ve asıl kullanım yerinin sirk ve benzeri yerler olduğunu iddia
ediyorum…
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
123
Ben ulaşabildiğim denizyıldızlarını denize atmaya çalıştım. Bu işi yıllardır yaptığım için, bu dönem
bende büyük değişiklere yol açmadı. Ama denize ulaşan denizyıldızları içinde, kendileri için çok
şey değişenlerin olabileceği umudu, önümüzdeki yıllarda da bu işi sürdürebilmem için bana güç
verdi.
Öğretmenlik “bilim mi, sanat mı?” tartışması, derin bir tartışmadır ve en azından sanat
boyutunun var olduğunun bir göstergesidir. Ama kesin olan şu ki, öğretmenlik bir değerler ve
tutumlar mesleğidir. Çünkü, Bandura’nın da (Sosyal Bilişsel Öğrenme adıyla) kuramlaştırarak
dediği gibi, insan kendisine söylenenden çok, gördüğünü yaşadığını öğrenir. Bu noktada,
öğretmen olmak için “bilmek” yetmez… Bilindik söylemdir, “ne kadar konuşursan konuş,
anlatabildiğin karşındakinin anladığı kadardır” denir ya, öğretmen için de şunu söylüyorum. Bir
öğretmen olarak, ne kadar çok şey bilirseniz bilin, sizin öğretmenliğiniz, bildiklerinizi
öğrencilerinizle paylaşabildiğiniz kadardır. O nedenle kişi olarak kendinizi sık sık hesaba çekin…
Sınavlardaki başarınız sizi sevindirmesin, olur da umduğunuzu bulamazsanız bu da sizi üzmesin.
Okul başarısı çok anlamlı değil. Dileğim yaşamda ve meslekte başarılı olabilmeniz.
Pişmanlık çok kötü bir duygudur ve bir şeyler yapabilecekken yapılmadığında hissedilir.
Bu nedenle, asla ERTELEMEYİN, ÜŞENMEYİN ve VAZGEÇMEYİN. Ne yapacaksanız ona başlamak
için en uygun zaman şu andır. Ve yapmak isteyip de yap(a)madıklarınızı gözünüzde büyütmeyin.
Herkesin bildiği gibi, binlerce kilometrelik yollar da o ilk bir adımla başlar. O ilk adımı atmaktan
çekinmeyin.
“Keşke” sözcüğünü kullanmayın. Alternatifi, “bir dahaki sefere” dir.
İnsan ilişkilerinde en iyi politika dürüstlüktür. Empati de anlamayı ve anlaşılmayı kolaylaştırıyor.
Ne konuda olursa olsun, zenginliğin miktar olarak üst sınırı yok. Mutlu olmak için yetinmek
gerekiyor.
Sakın ola kökleşmiş yanlış sistemleri düzeltmek gibi bir misyonla yola çıkmayın. Pek çok
büyüğünüz gibi “öğrenilmiş çaresizlik” hastalığına yakalanırsınız. Bireysel ilkeleriniz olsun ve
amacınız, ilkeleriniz gerektirdiği için, “bireysel olarak doğrudan yana tavır koymak” için
davranmak olsun. O zaman kendinizi saf ya da kullanılmış hissetmez, motivasyonunuzu
yitirmezsiniz.
Okulunuz, sınıfınız, arkadaş çevreniz gibi, içinde yer aldığınız küçük sistemleri değiştirmek
istiyorsanız, değişime önce kendinizden başlayın. Ardından çevrenizin değiştiğini göreceksiniz.
Unutmayın, eylemler her zaman sözlerden daha etkilidir.
Yaşamda başarılı olanlarla olamayanlar arasındaki tek fark, başarılı olanların, “her şeyin bir
bedeli olduğunu” biliyor olmaları ve o bedeli ödemeyi göze alıp, bir şekilde o bedeli
ödemeleridir. Ama insan, kendisine katkı getirmeyecek, kendisini mutlu etmeyecek hiçbir şey
için gerçek bir bedel ödemez. O nedenle, ne istediğinizi, onu niçin istediğinizi çok iyi bilin.
Sevgi ve bilgi paylaşıldıkça çoğalan iki şeydir. Bunları çevrenizden esirgemeyin.
Yolunuz ve bahtınız açık olsun…
Görükle’deki konfeksiyon atölyesinden sevgiyle…
124
Abdullah Can 2013-2014 Pedagojik Formasyon Sertifikası Programı ÖLÇME VE DEĞERLENDĠRME
Download

X - ercantuncel.net - Uludağ Üniversitesi