EĞİTİMDE
ÖLÇME VE DEĞERLENDİRME
I- TEMEL KAVRAMLAR
1.1
Ölçmenin Temelleri
Ölçme ve
değerlendirme konusuna nereden başlanacağına, “neden ölçme yaparız?” sorusuna cevap vererek ulaşabiliriz. Çünkü
amacımızın ya da ölçme işlemimizin gerekçesi ölçmeyi nasıl yaptığımızdan da
önemlidir. En azından ilk önce yanıtlanması gereken soru budur.
Yukarıdaki
soruya birçok yanıt vermek mümkün olmakla birlikte temel yanıtlardan birisi
çevremizdeki çoğu şeyin değişmesi olacaktır. Yani değişme olmasaydı ya da her
şey sabit olsaydı ölçme yapmaya ihtiyacımız olmazdı. En azından sürekli olarak
ölçme yapmazdık. Bir kez ölçme yaptıktan sonra bu işlemi başka zaman veya yerde
tekrarlamamıza gerek kalmazdı. Çünkü değişme olmadığı için ölçme sonucu aynı
kalacaktır. Değişme olmaması ölçme işlemini gereksiz kılacaktı.
Açıklamalar
ışığına ölçme değişmeleri ortaya koyma veya değişkenlerin değişen değerlerini
belirlemek amacıyla yapılır diyebiliriz. Yani “niye ölçeriz?” sorusuna değişme
olduğu için; “neyi ölçeriz?” sorusuna da değişkenleri cevabını vermek
mümkündür. Bu durumda değişkenler üzerinde durulması, değişken kavramının
tanımlanması gerekmektedir.
Değişken: Birkaç tanım vermek
mümkündür. En az iki değer alan veya bir durumdan diğerine farklılık gösteren, çeşitli
değerler alabilen -insana, olaylara, eşyaya ait niteliklere- özelliklere denir. Yani, durumdan duruma,
yerden yere, zamandan zamana farklılaşan özelliklerin tümüne değişken adı
verilebilir. Ör: Boy uzunluğu, ağırlık, hava sıcaklığı, matematik yeteneği vb.
Çevremizdeki çoğu
şeyin değişmesine rağmen sabit olan özelliklere de rastlamaktayız. Bir durumdan
diğerine değişmeyen veya ikiden az değer alan özelliklere sabit denir. Ör. Maddenin özgül ağırlığı, pi sayısı vb.
Bir özellik ya
değişkendir ya da sabittir. Değişkenlik ya da sabitlik nesnelerin özellikleri
ile ilgilidir. Örneğin soğuk ve nem oranı hava nesnesinin iki özelliğini;
çalışkanlık ve boy uzunluğu insanın iki özelliğini göstermektedir. Değişkenler
belli ölçütlere göre sınıflanabilirler. Bu sınıflamalardan bazıları tablo 1’de
görünmektedir.
Tablo 1’de
görülen değişkenlerden nicel değişkenler sayılarla ifade edilebilirken nitel
değişkenler, sıfatlarla veya sembollerle ifade edilir. Nitel değişkenler
sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere,
simgelere dönüşür. Özelliklere sayıların karşı getirilmesi, matematiğin kural
ve işlemlerinin uygulanması sayesinde, özelliklerin büyüklükleri ve
aralarındaki ilişkileri görmeye imkân sağlar. Değişkenlerin nitel veya nicel
olması onlara uygulanacak işlemlerle ilişkilidir ve bu işlemlerin sınırını
belirler.
Sürekli
değişkenlerin ele alınacak iki değeri arasında her zaman yeni bir değer
bulunabilir. Yani iki değeri arasında sonsuz sayıda değerler alabilir. Uzunluk,
ağırlık bu tür değişkenlere örnek olarak verilebilir. Örneğin uzunluk
santimetre, milimetre, mikron vb. daha küçük birimlere bölünerek ölçülebilir.
Kesikli değişkenler ise iki değeri arasında birkaç değer alabilir ama sonsuz
sayıda değer alamaz. Bu nedenle süreksizdir. Bu tür değişkenlere sıfatlar,
semboller veya doğal sayılar karşılık getirilebilir. Sürekli değişkenin
değerleri listelenemezken kesikli değişkenin değerleri listelenebilir. Liste
sonlu sayıdadır.
Tablo 1. Değişkenler bazı ölçütlere göre sınıflanması
Ölçütler |
Değişken türü |
Tanım |
Örnekler |
Değişkenin alacağı değer |
1.Nicel Değişken |
Sayılarla
ifade edilebilen özelliklerdir. |
Boy
uzunluğu, ağırlık |
2.Nitel Değişken |
Sıfatlarla
veya sembollerle ifade edilebilen özelliklerdir. Bu tür değişkenler sayılarla
gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere simgelere
dönüşür. |
Medeni
durum, Mezun olunan okul türü |
|
3. Sürekli Değişken |
Matematiksel
olarak herhangi iki değeri arasında bir başka değeri bulunabilen değişkenlere
sürekli değişken denir. Başka bir deyişle sürekli değişkenin iki değeri arası
sürekli bölünebilir. |
Uzunluk,
ağırlık, reel sayılar sistemi |
|
4. Süreksiz Değişken (Kesikli
Değişken) |
Değişken,
farklı iki değeri arasında başka bir veya birkaç değer dışında değer
alamıyorsa, süreksizdir. Bu tür değişkenlere sıfatlar, semboller veya doğal
sayılar karşılık getirilebilir. |
Cinsiyet
(Kadın-Erkek), diploma derecesi (pekiyi, iyi, orta, zayıf) vb. Tavla zarında
gelebilecek sayılar kesiklidir. |
|
Araştırmanın amacı |
5. Bağımsız Değişken (Etkileyen
değişken) |
Aldığı
veya alacağı değerler başka değişken(ler)e bağlı olmadan değerler alabilen
değişkenlerdir. |
Örnekler:
1-Derse
karşı Tutum 2-Şişmanlık |
6.Bağımlı Değişken (Etkilenen
Değişken) |
Başka
bir değişkene bağlı olarak değerler alabilen değişkenlerdir. |
1-Başarı 2-Elbise
beden numarası |
|
7.Ara Değişken (Katalizör) |
Bağımsız
değişkenlerin bağımlı değişkenler üzerindeki etkilerini artıran veya azaltan
değişkenlerdir. |
Tutum-Başarı
değişkenleri arasındaki ilişkide öğretmen davranışlarının niteliği ara
değişken olabilir. |
Değişkenler araştırmanın
amacına göre bağımlı ya da bağımsız değişkenler olarak sınıflanabilir. Doğası
gereği kendi başına bağımlı ya da bağımsız bir değişken yoktur. Yani
araştırmacının amacına bağlı olarak bir araştırmada bağımlı değişken olan bir
özellik başka bir araştırmada bağımsız değişken ya da ara değişken olabilir.
Örneğin, bir araştırmacı tarih dersine karşı tutumun tarih başarısını etkileyip
etkilemediğini araştırdığında bağımlı değişkenimiz tarih başarısı iken, bağımsız
değişkenimiz tarih dersine karşı tutumdur. Ancak aynı araştırmacı tarih dersine
çalışmak için ayrılan sürenin tarih başarısını etkileyip etkilemediğini
araştırırken, tarih dersine karşı tutumu derse çalışılan süreyi artıran ve
azaltan bir ara değişken olarak düşünebilir. Veya yine aynı araştırmacı bir
başa çalışmasında tarih öğretmeninin öğrencileri ile sürdürdüğü iletişim
biçiminin, öğrencilerin tarih dersine karşı tutumu nasıl etkilediğini
araştırabilir. Görüldüğü gibi tutum, birinci araştırmada tutum bağımsız; ikinci
araştırmada ara ve üçüncü araştırmada bağımlı değişken olarak işleme
alınmaktadır. Bu nedenle değişkenleri bağımlı, bağımsız ve ara değişken olarak
sınıflamak istediğimizde araştırmacının amacını dikkate almak zorunluluğumuz
vardır.
1.2
Eğitim ve Ölçme-Değerlendirmeye İlişkin Temel Tanımlar
Aslında her
eğitim felsefesine göre farklı eğitim tanımları vermek mümkündür. Eğitimin “Bireyin davranışında kendi yaşantıları
yoluyla ve kasıtlı olarak istendik değişim meydana getirme süreci” tanımı
yaygın kabul gören bir tanımdır.
Buradaki
kavramları biraz açacak olursak, kendi yaşantısı kavramı yaparak yaşayarak
öğrenmeye; kasıtlı kavramı öğrenme ortamını öğretilecek davranışa göre ayarlamaya
(öğretim durumlarına); istendik değişim kavramı önceden belirlenmiş hedef ve
davranışlara işaret etmektedir.
Ölçmenin Önemi
Ölçme ve
değerlendirmenin eğitimdeki önemi günlük yaşamda ve genel olarak bilimlerdeki
öneminin bir yansımasıdır. Örneğin hava durumunu belirlemek için bilgi toplamaz
isek günlük yaşamda nasıl giyineceğimize karar veremez, sık sık hava durumu
konusunda yanılarak hasta olurduk. Bilimler içinde en duyarlı, en hatasız ölçme
yapan bilimlere daha fazla güven vardır. Bilimler gelişmişliğini ölçme ve
değerlendirme yöntemlerindeki gelişmişlik derecesine borçludurlar. Bu açıklamalar
ışığında sosyal bilimlerdeki ölçme ile fizik bilimlerindeki ölçmeler arasında,
ölçtükleri niteliklerden ve ölçme ve değerlendirmede kullandıkları araç ve
yöntemlerden kaynaklanan farklılıklar bulunmaktadır.
DEĞERLENDİRME
(DÖNÜT-DÜZELTME)
Şekil 1. Sistem Yaklaşımında Ölçme ve
Değerlendirmenin Yeri
Şekil
1’den de anlaşılacağı üzere değerlendirme sistemin her basamağında
kullanılmaktadır. Ayrıca değerlendirmenin değerlendirmesinden de söz etmek
gerekir. Tabii ki değerlendirme yapabilme için ölçme yapmak gereklidir.
Değerlendirmede kullanılan ölçütler ve değerlendirme yöntemleri ile
değerlendirmeye konu olan bilgiyi toplama amacıyla kullanılan ölçme araçları ve
yöntemlerinin de değerlendirilmesi gerekmektedir.
Şemalardan
anlaşılacağı üzere eğitim sistemini nasıl bir şema ile gösterirsek gösterelim o
şemada ölçme ve değerlendirmeye mutlaka yer verme zorunluluğu vardır. Çünkü
ölçme ve değerlendirme eğitim sisteminin temel ve vazgeçilmez öğelerinden
biridir.
Ölçmenin Tanımı: “Nitelikleri nicelemek;
gözlem sonuçlarını sayısallaştırmak; bir niceliğin gözlenip, gözlem sonuçlarını
sayı veya semboller ile gösterilmesi” tanımlarından herhangi birisi
kullanılabilir. Ölçme bir gözlemdir. Bir betimleme işidir. Bu tanımlar dışında
tanımlar da yapmak mümkündür. “Özellikler kümesiyle sayı veya semboller
kümesini eşleme işidir” veya “ampirik küme ile formal küme arasında bir
bağıntıdır” gibi tanımlar örnek verilebilir.
f
Şekil 2. Ölçmenin kuramsal tanımı
Ampirik küme
ölçülecek niteliklerin kümesini, formal küme ölçülen nitelikleri göstermek
amacıyla kullanılan sayı veya sembol kümesini gösterir.
Özellikler
Kümesi İşlemler Kümesi
(Tanım
Kümesi) (Değer Kümesi)
Örnek Ulaşılacak davranışlar Ulaşılan
Davranışlar
(Sınav
Başarısı) (Sınav Notu)
Ölçüm: Özelliklerle ilgili değerlerin her birine, tek tek gözlem
sonuçlarına ölçüm denir.
Ölçmenin Özel Anlamı: Bireyler hakkında bilgi toplamaktır.
Ölçme Türleri
1)Doğrudan (Temel/Dolaysız) Ölçme:
Herhangi bir niteliği başka nitelikle ilişkilendirmeden gözlemek doğrudan ölçme
olarak adlandırılır. (Boy sırasına koyma, Terazi ile tartma, metre ile ölçme)
2)Dolaylı (Göstergeyle) Ölçme: Herhangi
bir değişkene ait niteliği başka değişkenler veya araçların niteliğinden
faydalanarak ölçmektir.(termometre ile ısı ölçme veya yaylı kantarla ağırlık
ölçme: birinci durumda civanın genleşmesi yardımıyla ısı hakkında fikir sahibi
olurken, ikinci durumda yayın uzamasına bağlı olarak ağırlık hakkında bir
şeyler söyleyebiliriz.)
3)Türetilmiş Ölçme: İki ayrı ölçülen
nitelik üzerinde yapılan işlemler yardımıyla yeni bir ölçme sonucuna ulaşmadır.
(Örneğin Hız=km/saat (yol / zaman) veya Yoğunluk = Kütle/hacim gibi)
Ölçmede birimler
Ölçme
işleminde doğal ve yapay (tanımlanmış) birimlerin olduğundan söz edilebilir.
Örneğin, bir işyerinde çalışan işçilerin sayısını bulmak için birim olarak
işyerinde çalışan tek bir işçiyi almak doğru olacaktır ve bu ölçmenin doğal
birimi olduğu söylenebilir. Ancak, uzunluk, ağırlık, zaman gibi bazı
değişkenlerle ilgili birimler tanımlanmış (yapay) birimlerdir. Örneğin, metre
ve kilogram üzerinde anlaşılmış veya tanımlanmış birimlerdendir. Birimlerin
tanımlanmış olmasının bir sakıncası yoktur ve birçok doğal birimden daha
güvenilir ölçme sonuçları elde edilebilir. Zaten birçok birimi tanımlama gereği
de üzerinde anlaşmaya varılamayan veya tartışmalara neden olan doğal birimler
nedeniyle ortaya çıkmıştır.
Birimlerde
aranan üç özellik vardır. Bunlar; eşitlik
(ölçeğin her bölmesinin –metredeki her santimetrelerin- birbirine eşit
olmasıdır), genellik (birimlerin
herkes tarafından aynı anlamda kullanılması veya birimlerin çoğunluk tarafından
kabul edilmesidir) ve amaca uygunluk
(ölçülecek özelliği ölçmeye uygunluk veya bu özelliği en iyi şekilde
yansıtabilmektir) olarak ifade edilebilir.
Ölçmede Araçların Rolü
1-Ölçme sonuçlarının duyarlığını ve güvenirliğini dolayısıyla kesinliğini
artırır. Ölçme sonuçlarına karışan hata miktarının azalmasını sağlar.,
2-Duyu organlarımızla ölçme yapamadığımız durumları gözlememizi
kolaylaştırır. Böylece duyu organlarını kullanamadığımız durumlarda da ölçme
yapma imkanı buluruz.
3-Herkesin kabul ettiği, üzerinde anlaştığı standart ölçme sonuçları elde
etmemize olanak sağlar.
Ölçek: Ölçme aracı, ölçme birimi veya
ölçme sonuçlarının formal nitelikleri olarak tanımlanmaktadır.
Ölçekleme: Eğitim ve psikolojide ölçek
veya ölçme aracı geliştirme olarak tanımlanabilir.
Ölçmede Kullanılan Ölçek Türleri
1)Adlandırma (Sınıflama) Ölçeği: Farklı
ve benzer tarafların gözlendiğinde kullanılan ölçek türüdür. Adlandırma =
kodlama; öğrencilere numara verme, illere plaka numarası verme, futbolculara
sırt numarası verme vb. gibi yapılan işlemlere verilen addır. Sınıflama = bir
özelliği dikkate alma; bir özelliğe sahip olanlar, sahip olmayanlar veya bir
dereceye kadar sahip olanları belirlerken kullanılabilir. Bu ölçeklere sözde
ölçek de denir. Bazı ölçmecilerce birimleri ve başlangıç noktaları değişir
dense de birimleri ve başlangıç noktaları yoktur. Çünkü birimdeki değişme birim
de aranan niteliklere uymamaktadır. Farklılıkları birim cinsinden
belirleyemeyiz. Ölçmenin basit, ilkel bir türüdür. Ölçme sonuçları sembol, sayı
veya sıfatlara dönüştürülür. Matematiksel işlem yapılmaz. İstatistiksel olarak
frekans tablosu yapılabilir ve mod (tepe değer =en çok tekrar eden ölçüm)
bulunabilir. İlk olarak bu ölçeklerin yansıma özelliği vardır: yani farklı iki
objeye “a” kodu verilmişse a=a’dır. İkinci olarak bu ölçeklerin simetri
özelliği vardır: yani aynı kümede bir objeye “a” diğerine “b” kodu verilmişse
ve a=b ise b=a’dır. Üçüncü olarak bu ölçeklerin geçişme özelliği vardır: yani
a=b ve b=c ise a=c’dir.
2)Sıralama Ölçeği: Belirli bir nitelik
bakımından büyükten küçüğe ya da küçükten büyüğe sıraya koyma işidir. Bu sıraya
uygun sayı veya sembol kullanılırsa sıralama ölçümleri yapılabilir. Kullanılan
sayılar sıra sayılarıdır. Bu ölçekler büyüklük küçüklük bağıntısı ve bu
bağıntının özelliklerini sağlar. Sıralama ölçeklerinin de birim ve başlangıç
noktası olmadığı söylenebilir. Yani büyüklükler hakkında farklılığın ne kadar
olduğu yönünde bilgi sahibi olamayız. Öğrencilerin elde ettiği test ham puanları
sıralama ölçeğindedir. Bu ölçeklerin birinci özelliği ters simetridir: yani
a<b ise b>a’dır ya da b<a değildir. İkinci özellik geçişmedir: yani
a<b ve b<c ise a<c’dir. Bu ölçeklerle adlandırma, sınıflama ve
büyüklük küçüklük karşılaştırması yapılabilir. Ancak büyüklükteki farklara
ilişkin işlemler yapılamaz. İstatistiksel olarak frekans tablosu, mod, medyan
(ortanca) ve yüzdelikler hesaplanabilir. İlişki ölçülerinden sıra farkları
korelasyonu bulunabilir.
3)Eşit Aralık Ölçeği: Birimi ve izafi
(tanımlı, yapay, göreceli, göreli) bir sıfır noktası vardır. Gerçekte “
4)Oran Ölçeği: Başlangıç noktası gerçek
(mutlak) sıfırdır. Eşit bir birimi vardır. Bu ölçeklerle elde edilen verilerde
her türlü matematiksel ve istatistiksel işlemler yapılabilir.
Gerçek (mutlak) ve yapay (bağıl-görece)
sıfır için örnek
1. Durum
X Y
Yukarıdaki şekillerde birinci
(küçük) doğruya X, ikinci (büyük) doğruya Y dersek Y=2X olur.
2. Durum
X Y
1. Durumdaki
uzunlukların başlangıç noktalarını 50 cm’ye çekersek Y=2X işlemi geçerliğini
yitirir. Yani ikinci şekilde, tanımlı sıfır noktasının gerçek sıfırı
göstermemesi nedeniyle Y=2X işlemi artık kullanılmaz olur. Bu nedenle ikinci
durumda Y≠2X’tir. Buna benzer olarak üst (nitelikli) ölçeklerden alt (niteliği
düşük) ölçeklere geçiş yapıldığı her seferinde üst ölçekteki bilgi ve işlem
zenginliği kaybedilerek, alt ölçekteki işlem ve bilgilerle yetinmek zorunda
kalınır.
Tablo 2
kullanılan ölçek türüne göre elde edilen gözlem sonuçlarının anlamlarını,
gözlem sonuçları üzerinde yapılabilecek işlemleri ve dolaylı olarak da nasıl
yorumlanacaklarını görmemize yardımcı olabilir.
Tablo 3’te
ölçme işleminde kullanılan ölçeklerle ilgili özet bilgiler yer almaktadır.
Tablo 3 ile ilgili açıklanması gereken iki önemli nokta vardır. Bunlar;
Tablo 2. Ölçeklerle elde edilen bilgilerin
anlamlılıkları
|
Ölçeğin yapısal özellikleri |
Elde edilecek Olan
ölçülerin anlamlılık dereceleri |
||||
Ölçek tipi |
Başlangıç noktası |
Birimi
(Aralığı) |
Nitelik gösterme
gücü |
Nicelik gösterme gücü |
||
|
|
|
|
Sıra |
Fark |
Oran |
Sınıflama |
Yok |
Yok |
Var |
- |
- |
- |
Sıralama |
Değişken |
Değişken |
Var |
Var |
- |
- |
E. Aralıklı |
Keyfi |
Keyfi |
Var |
Var |
Var |
- |
Oranlı |
Mutlak |
Mutlak |
Var |
Var |
Var |
Var |
1.Ölçekler
yukarıdan aşağıya en basitinden en karmaşığına bir sıra göstermektedir
(Basitlik ve karmaşıklık, elde edilen ölçümlerin bize verdiği bilgi, bu
bilgilerin güvenirliği ve ölçümler üzerinde yapılabilecek işlemlerin çokluğuna
dayalı olarak belirlenmektedir).
2.Karmaşık
ölçekler basit ölçeklere dönüştürülebilirler. ( Aksi çoğu zaman -test standart
puanlarını elde etme dışında- mümkün değildir.)
Davranışların ölçülmesi,
ya o davranışların ya da o davranışlar sonunda ortaya çıkan ürünün veya
ikisinin birden gözlenmesi şeklinde gerçekleşir.
Tablo 3. Ölçek türleri özet tablosu
ÖLÇEKLER |
TEMEL İŞLEMLER |
ÖRNEKLER |
İST. TEKNİKLER |
SINIFLAMA (ADLANDIRMA) |
Farklılık ya da Benzerliği belirlemek |
-kişileri saç ve ten rengine
göre sarışın esmer diye gruplama -evlere kapı numarası,
sokaklara sokak adı verme |
-frekans -tepe değer (mod) -yüzde |
SIRALAMA |
Azı – çoğu veya küçüğü-büyüğü
belirlemek |
-kitapları kalınlık sırasına
göre dizme -öğrencileri boy veya başarı
sırasına koyma |
-ortanca (medyan) -yüzdelik -sıra farkları korelasyon
katsayısı |
(EŞİT) ARALIK |
Farkları belirlemek |
-termometreyle sıcaklık ölçme -kullanılan takvimler -standartlaştırılmış test
puanları |
-ortalama -standart sapma -Pearson Moment Çarpımları
korelasyon katsayısı |
ORAN ÖLÇEĞİ |
Oranları belirlemek |
-hacim, uzunluk, ağırlık vb.
ölçüleri |
-matematiksel ve istatistiksel
her türlü işlem. |
Amaç istendik davranışların
ölçülmesi ise en geçerli ölçme o davranışların gerçek hayat şartlarında
gözlenmesiyle olur. Ürüne bakılarak ölçme de ise gerçek koşullar altında ortaya
çıkan ürünlere bakılarak yapılmalıdır. Ancak davranışların gerçek hayatta
gözlenmesi çoğunlukla güçtür. Bu nedenle gerçek hayat durumuna mümkün olduğunca
benzetilmiş ortamlar altında ölçme yapılmaktadır. Ölçme sonuçlarının ölçme
yapılan ortamın gerçek hayat şartlarına benzerliği ölçüsünde geçerli olduğu
söylenebilir.
Diğer bir yol,
gerçek hayat durumunu anlatarak böyle bir durumda kişiye ne yapacağını
sormaktır. Bu sayıltıya göre okulda geliştirilecek ve ölçülecek davranışların
çoğu bilgi, tutum ve duygulara dönüşür. O halde bazı davranışlar yerine onların
dayandığı bilgi, beceri ve tutumları gözleyip ölçeriz. Bu işlemler sırasında
gözlenen bilgi, beceri ve tutumların gerçek durumda davranışa dönüşeceği
varsayılır.
Hangi
yaklaşımla veya varsayımlarla yapılırsa yapılsın ölçme şu üç aşamadan geçer; 1)
Ölçülecek özelliğin kararlaştırılması ve tanımlanması 2) Ölçülecek özelliğin
ortaya çıkarılmasını ve gözlenmesini sağlayacak işlemlerin belirtilmesi
3)Gözlem sonuçlarının derece veya miktar olarak ifade edilmesi.
Değerlendirme: Ölçme sonuçlarını bir
ölçüt veya ölçütlerle karşılaştırarak karara varma, ölçme sonuçlarını yargılama
ya da karar verme olarak tanımlanabilir.
Değerlendirmenin Özel Anlamı: Bireyler
hakkında toplanan bilgiyi ölçütlerle karşılaştırarak bireyler hakkında karar
verme, yargıda bulunma sürecidir.
Test: Sınav, seçmeli testler, sınama,
deneme, kontrol, yoklama anlamlarına gelir. Bu kelime kullanılırken hangi
anlamda kullanıldığı açıklanmalıdır.
Sınav: Birden çok testin
kullanılabildiği (yetenek, tutum, başarı vb.) çeşitli özellikleri ölçme
sürecini vurgular. Test ise belli özellikleri ölçmek için kullanılan ve onu
alan herkes için aynı olan sorulardan ya da işlerden oluşan ölçme aracıdır.
Sınavın kapsamı geniş, testin kapsamı dardır.
Bölüm Testi
1.
Aşağıdakilerden hangisi ölçmenin eğitimde kullanılma amacıdır?
A) Değerlendirmeye temel
oluşturması*
B) Kolay ve nesnel puanlamayı
sağlamsı
C) Maliyeti azaltarak
kullanışlığı artırması
D) Bireyleri başarıya göre
sıralaması
E) Davranışa sahip olanla
olmayanı ayırması
2. Ölçmede araç kullanmanın faydasını aşağıdakilerden
hangisi en iyi açıklar?
A) Puanlamayı kolaylaştırır.
B) Kapsam geçerliğini artırır.
C) Tesadüfî hataları kontrol eder.
D) Yorumlamaya olanak verir.
E) Gözlemi duyarlı hale getirir.*
3.
Aşağıdakilerden hangisi temel (doğrudan) ölçmedir?
A) Bir daktilo yazısındaki hataları
saymak*
B) Başarı testi ile öğrenci başarısını
ölçmek
C) Yaylı kantar ile ağırlık ölçmek
D) Bir zekâ testi ile zekâ yaşını
hesaplamak
E) Termometreyle havanın ısısını ölçmek
4. Aşağıdakilerden
hangisinde birimlerde bulunması gereken özellikler tam ve doğru olarak verilmiştir?
A) Geçerlik, doğruluk, duyarlık
B) Geçerlik, güvenirlik, tutarlık
C) Hatasızlık, iç-tutarlık, yeterlik
D) Eşitlik, genellik ve uygunluk*
E) Genellik, kullanışlılık, niteliklilik
****
“Daktilo
kursuna giden Özge’nin yeterlik belgesi almaya hak kazanmak için 100 üzerinden
en az 50 puan alması gerekiyordu. Özge 70 puan aldı ve yeterlik belgesini
kazandı.”
Aşağıdaki 3 soruyu yukarıdaki ifadeye göre cevaplandırınız.
5. “50 puan” neyi gösterir?
A) Güvenirlik B) Ölçme C)
Değerlendirme D) Ölçüt* E) Geçerlik
6. “70 puan”
neyi gösterir?
A) Güvenirlik B) Ölçme* C)
Değerlendirme D) Ölçüt E) Geçerlik
7. “Yeterlik
belgesini kazanması” neyi gösterir?
A) Güvenirlik B) Ölçme C)
Değerlendirme* D) Ölçüt E) Geçerlik
****
8. Bir sınavda çıkan soruların tamamını doğru
cevaplandıran bir öğrencinin tam puan alması ile ilgili olarak aşağıdakilerden
hangisi kesinlikle söylenebilir?
A) Öğrenci sınıfında üst sıralarda yer
alabilir.*
B) Öğrenci dersteki konuların hepsini bilmektedir.
C) Sınavın güvenirliği çok düşük
çıkacaktır.
D) Sınıfın çoğunluğu bu sınavda başarılı
olmuştır.
E) Sınavın kapsam geçerliği düşüktür.
9. Aşağıdaki ölçme sonuçlarının hangisinde doğal birim yoktur?
A) Veli 5 çift ayakkabı
aldı.
B) Ceren’in boyu 1,68 metredir.*
C) Fatma sorulardan 28’ini doğru cevapladı.
D) Bu lokantada 7 garson var.
E) Galeride satılmayan 3 araba kaldı.
10.
Aşağıdakilerden hangisi bir dolaylı ölçmedir?
A) Giyimine bakarak kişinin sevdiği rengi
belirlemek
B) Öğrencilerin kitaplarından ciltlenmiş
olanlarını seçmek.
C) Ders kitabını sınıfa getirmeyen
öğrencileri saymak
D) Öğrencilerin akademik benlik
tasarımlarını ölçmek *
E) Sınıftaki esmer ve sarışın öğrencileri
belirlemek.
11. Bir üniversitenin Spor Bilimleri bölümüne öğrenci seçme
sınavında öğrencilerin 10 saniyede kaç metre koştukları belirlenerek puan
verilmektedir. Öğrencilere puan vermek için yapılan ölçme işlemi hangi
ölçektedir?
A) Adlandırma
B) Sınıflama C) Sıralama D) Eşit Aralıklı E) Oranlı*
12. Değişken
kavramını aşağıdakilerden hangisi daha iyi açıklar?
A)Gözlenen özellikler B)Etkisi araştırılan
nitelikler
C)Bir sonucu ulaştıran
nitelik D)Etkilenme düzeyi
araştırılan nitelikler
A)Aldığı değerler farklılaşan
nitelikler*
13. Eğitimde hangi ölçek türünde ölçme yapılamaz?
A) Sıralama
B) Aralık
C) Oran*
D) Sınıflama
E) Adlandırma
|
II- ÖLÇME
ARACINDA
ARANAN
NİTELİKLER
Ölçme aracında
üç özelliğin yeterli düzeyde bulunması istenir. Bunlar kısaca aşağıda
tanımlanmıştır.
1-Güvenirlik: Ölçme aracının hatalardan
arınık olma derecesi, ölçtüğü şeyi tutarlı ölçebilme derecesi.
2-Geçerlik: Ölçme aracının kullanış
amacına hizmet etme derecesi, Ölçtüğü şeyi, diğer değişkenleri karıştırmadan
ölçebilme derecesi.
3-Kullanışlılık: Ölçme aracının
hazırlama, uygulama, puanlama ve tüm bu süreçlerde ekonomiklik derecesi olarak
adlandırılabilir.
Gerçek Puan
Kuramı Temel Denklemi: X= T + E (Denklem 1)
X: Gözlenen
puan T: Gerçek Puan E: Ölçemeye Karışan Hata Puanı
Örnek bir
öğrenci 20 soruluk bir testten 17 puan almış olsun. Bu 17 puanı gözlenen
puandır. Ancak öğrencinin sahip olduğu bilgi düzeyi ile 14 puan alabileceğini
varsayalım. Bu 14 puan gerçek puandır. Öğrencinin gerçek performansını ya da
başarısını yansıtan puandır. Öğrenci geriye kalan 3 puanı da kopya çekerek ve
şansla kazanmıştır. İşte bu 3 puana, ya da gözlenen puanla gerçek puan
arasındaki farka hata puanı diyebiliriz. X bilinir, çünkü gözlenen puandır. T
hipotetiktir (teoriktir), bilinemez. E eğer yönü ve miktarı belli ise
bilinebilir. Ancak tesadüfî ise yönü ve miktarı bilinemez. Dolaylı yollardan hesaplanır.
Hiçbir ölçme
hatasız değildir. Hemen her ölçmeye milyarda bir oranında da olsa hata karışır.
Hataların çeşitli kaynakları vardır. Hatalar: Ölçmeci, ölçme aracı, ölçme
yöntemi, ölçme ortamı veya ölçülen kişiden gelebilir.
2.1 Hata Türleri
1-Sabit Hatalar: Her ölçme sonucuna
aynı miktarda ve aynı yönde karışan; her ölçme sonucu için aynı yönde etkili
olan ve her bir ölçmede miktarı değişmeyen hatalardır. (Ör: Her öğrenciye 10
puan fazla verilmesi veya bir soruyu bütün sınıfın doğru cevaplandırması sabit
hatalardandır.)
2-Sistematik Hatalar: Ölçme sonuçlarına
belirli bir kurala göre karışan ve yönü ile miktarı tespit edilebilen hatalara
sistematik hatalar denir. Çoğunlukla her bir ölçme için sabit olmayan,
puanlayıcı yanlılığını yansıtan hatalardır. (Ör: Matematik ya da Fen dersinde
öğrencilerin güzel yazı yazma, düzen vb.ne puan verme veya sadece erkek / kız
öğrencilere fazladan puan verme sistematik hatalardandır.)
3-Random (tesadüfî, gelişigüzel, rasgele)
Hatalar: Kaynağı, yönü ve miktarı bilinmeyen, ölçme sonuçlarına tesadüfen
karışan hatalardır. Bu tür hatalar ölçme sonuçlarına nerede, ne zaman, nasıl,
ne kadar karıştı tespit edilemezler. (Ör: Sınav koşullarının öğrencilere
etkisi, öğretmenin puanlama dikkatsizliği gibi etkenlerden ölçmelere karışan
hatalar bu türdendir.) Ancak bu tür hataların ortalamasının sıfıra yaklaştığı
ve normal dağıldığı kabul edilir.
Ölçmede asıl
ilgilenilen hata türü tesadüfî hatalardır. Sabit hatalar standart sapma ve
varyansa etki etmezler. Sistematik ve sabit hatalar kontrol edilebilirler. Ölçme
sonuçlarına hangi yönde ve hangi miktarda karıştığı tespit edilerek ölçme
sonuçlarından çıkarılabilirler. Böylece de ölçme sonuçları hatalardan
arındırılmış olur. Dolayısıyla sabit ve sistematik hataların ölçme sonuçlarının
güvenirliğine etkileri azaltılabilir veya tamamen ortadan kaldırılabilir. Bu
nedenle güvenirlik söz konusu olduğunda ölçmecileri asıl ilgilendiren hata türü
olarak tesadüfî hatalara vurgu yapılır. Ancak random hataları kontrol etme imkânı
yok gibidir. Bu nedenle yapılabilecek en doğru işlem random hataları azaltmak
için gerekli önlemeleri alabilmektir.
Ölçme aracının
duyarlığı hataları azaltır. Ölçmecinin yeterli oluşu, ölçme aracının iyi
kullanılması, puanlamanın objektifliği, ölçme yapılan ortamın amaca uygunluğu
ve ölçülen kişinin performansını yansıtacak durumda olması hataları azaltır.
2.2 Güvenirlik
Genel anlamda
tutarlık ve duyarlık demektir. İki veya daha fazla ölçümün birbirini tutması
veya yapılan ölçümlerin duyarlı olmasıdır.
Pozitif bilimlerde aynı şartları sağlamak mümkün olabildiği için bu
yöntem iyi sonuçlar verir. Eğitim ve psikolojide aynı şartları sağlamanın
zorluğu farklı yöntemler geliştirilmesini zorunlu kılmıştır. Geçerlik ve
güvenirliği belirleme tekniklerinde en çok kullanılan istatistik tekniklerden
biri korelasyon katsayısıdır. Aşağıda, korelâsyonun alabileceği tipik
değerlerle ilgili grafiklerden üçü verilemeye çalışılmıştır.
Korelâsyon
katsayısı –1 ile 1 arasında değerler alır. Değer 1’e yakınsa pozitif korelasyon
vardır. Değişkenler aynı yönde değişiyor anlamına gelir. Yani değişken
değerlerinden biri artarken diğeri de artıyorsa pozitif korelasyon olur. Bu
durumda, değişkenlere ait değerler eksenlerin birleştiği köşeden karşı köşeye
yönelen bir elips içinde gösterilebilir (1. gösterim örneğindeki gibi). Eğer
değişkenlerin değerleri, eksenlerin birleştiği köşeden karşı köşeye yönelen düz
bir doğru üzerinde gösterilirse bu durumda mükemmel olumlu ilişkiden söz
edilir. Değer –1’e yaklaşıyorsa negatif korelasyon vardır. Değişken değerlerinden
biri azalırken diğeri artıyorsa negatif ilişki vardır. Bu tür ilişkiye ters
yönde ilişki de denir. Bu durumda değişkenlere ait değerler dikey eksenden
yatay eksene doğru yönelen bir elips içinde gösterilebilir (2. gösterim
örneğindeki gibi). Değişkenlere ait değerler dikey eksenden yatay eksene
yönelen bir doğru üzerinde gösterilebilirse bu durumda mükemmel olumsuz
ilişkiden söz edilir. Korelasyon değeri 0’a yakınsa iki değişken arasında
ilişki olmadığı söylenir. Değişkenlerin değerleri bir daire, bir kare bazı
zamanlar ise dikdörtgen içerisinde gösterilebilir. (3. gösterim örneğindeki
gibi).
Korelasyon
grafiksel olarak gösterildiği gibi istenirse değer olarak da hesaplanabilir.
Grafik teknik sayesinde korelasyonun yönü ve gücü hakkında fikir sahibi olsak
da yorum yapmakta zorlanılacak durumlar da mümkündür. Denklem 2 korelasyon
değerinin nasıl elde edildiğini göstermektedir. Bu formüle korelasyon için ham
puan formülü adı da verilir. Eğer istenirse bu formül kullanarak korelasyon
değeri elde edilir ve yorumlanır. Elde edilen korelasyonun gücü sorulduğunda
mutlak değer 1’e yakınlığına bakılır. Özel olarak yön belirtilirse hesaplanan
korelasyonun işaretine bakılır. Korelasyon
Formülü
|
Korelasyon
güvenirlik ve geçerlik katsayısı olarak kullanılırken pozitif ve bire yakın
olmasına dikkat edilir. Yani pozitif ve bire yakın korelasyon varsa geçerlik ve
güvenirlik olduğu söylenebilir. Güvenirlikte 0,70 üstü; geçerlikte ise 0,30
üstü korelasyon var ise kısmen de olsa geçerlikten ve güvenirlikten söz
edilebilir.
1. Test |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
X |
|
|
x |
x |
|
|
|
|
|
|
|
|
x |
|
X |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Test |
|
||
1. Gösterim |
|
(Pozitif Yüksek Korelasyon) |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Test |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Test |
||
2. Gösterim |
|
(Negatif Yüksek Korelasyon) |
|
|
1. Test |
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
x |
|
|
|
|
|
|
|
|
|
x |
|
|
x |
|
x |
x |
|
|
|
|
|
|
x |
x |
|
|
x |
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
x |
x |
x |
x |
|
|
|
|
|
|
x |
|
x |
|
x |
|
|
|
|
x |
x |
|
|
|
|
x |
|
x |
|
|
x |
x |
x |
x |
x |
|
|
|
|
|
|
x |
|
x |
|
|
|
|
x |
x |
|
|
|
|
|
|
x |
|
|
x |
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
x |
|
x |
|
|
|
|
|
|
|
X |
|
|
x |
|
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
x |
x |
|
x |
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. Gösterim |
|
|
|
|
|
|
|
|
|
|
|
2. Test |
||
|
|
(Sıfıra Yakı Düşük Korelasyon) |
|
|
Güvenirlik bir korelasyon olmasına
rağmen 0 ile 1 arasında değişir. Varyanslardan hareket ettiğinden – (negatif)
değer almaz. Çok ender olarak 1’in üstünde veya negatif çıkar. Aynı şekilde
herhangi bir ölçme sonuçlarının tam güvenilir ya da sıfır güvenirlikte olması
beklenmez. Eğer ölçmelerimiz tam güvenilir olsaydı güvenirliğin tanımından ölçmelerimizde
hata olmazdı, bu durumda güvenirliğin (korelasyonun) değeri 1 olurdu; eğer
ölçmelerimiz sıfır güvenirlikte olsaydı, ölçümlerin hepsi hata ölçüsü anlamına
gelirdi; bu durumda da güvenirliğin (korelasyonun) değeri 0 olurdu.
Geçerlikte ise
ölçülmek istenen değişkenle zıt yönlü bir değişken ölçülebilir. Örneğin bir
dersten hoşlanmamak (olumsuz tutum) ile o dersteki başarı negatif yönlü
korelasyon verebilir. Bu nedenle güvenirlik 0 ile 1 arasında değer almasına
rağmen geçerlik -1 ile +1 arasında değerler alır. Geçerlik ve güvenirliğin
alabileceği değerlerin sınırlarını aşağıdaki gibi göstermek kalıcılığı
açısından yararlı olabilir.
0 ≤ rxx ≤
+1 (Güvenirliğin sınırları)
-1 ≤ rxy ≤
+1 (Geçerliğin sınırları)
Güvenirliği
Belirleme Yollarından Bazıları:
1-Test Tekrar Test Güvenirliği: Aynı testi aynı gruba iki kez
uygulama yoluyla elde edilen güvenirlik katsayısıdır. İki uygulamadan elde
edilen puanlar arasındaki korelasyon katsayısıdır. İki uygulama arasından
belirli bir zaman geçmelidir. Aradan geçen zaman cevaplayıcıların ölçülen
özellik bakımından değişmeyecekleri, aynı zamanda ilk uygulamada verdikleri
cevabı hatırlamayacakları bir süre olmalıdır. Bu güvenirlik katsayısına
Kararlılık Katsayısı da denir.
2-Paralel Test Güvenirliği: Test-tekrar test yönteminin
dezavantajını gidermek amacındadır. En az iki eşdeğer form geliştirilir. İki
test madde sayısı, niteliği ve ölçtükleri davranışlar bakımından denk
olmalıdır. İki test aynı öğrenci grubuna uygulanır. İki testten elde edilen
cevaplayıcı puanları arasında korelasyon katsayısı hesaplanır. Uygulama aynı
öğrenci grubuna aynı zamanda yapılırsa hem karalılık anlamında güvenirlik hem de
formların eşdeğerliği hakkında bilgi verir.
3-İki Yarı Güvenirliği: Tek uygulama gerektirdiğinden çok
kullanılır. Test iki eşdeğer yarıya bölünür (Yarısından veya tek-çift sorular).
Öğrencilerin bu iki yarılardan elde ettikleri puanlar arasında korelasyon elde
edilerek testin bir yarısı için güvenirlik bulunur. Bu korelasyon kullanılarak
testin tümü için güvenirlik hesap edilir. Testin tümü için güvenirlik
katsayısının formülü şöyledir.
(Denklem 3)
Bu
yöntemin kullanılmasında tek boyutlu; aynı niteliği ölçen maddelerden oluşan
bir test olmasına özen gösterilir. Aksi durumda yorumlamada sıkıntı
yaratacağından kullanılmaz.
4-KR-20 Güvenirliği: Bu formül için madde güçlük indeksi (p)
bilinmelidir. İkinci olarak testteki her bir maddenin aynı değişkeni ölçtüğü
yani testin ölçmek istediği niteliği ölçtüğü sayıltısı vardır. Formül madde
güçlüklerini ve madde sayısını dikkate alarak hesaplanan bir güvenirlik
katsayısıdır.
(Denklem 4)
K: Madde sayısı
p: Maddeyi doğru
cevaplandıranların tüm cevaplayıcılara oranı
q: Maddeyi yanlış
cevaplandıranların tüm cevaplayıcılara oranı
: Tüm testin varyansı
5-KR-21 Güvenirliği: Testteki maddelerin eşit ya da yakın güçlükte
olduğu varsayılıyorsa ve madde istatistikleri (güçlükleri veya varyansları = pq)
bulunmamışsa test puanları ortalaması ve varyansı kullanılarak KR-21 güvenirlik
katsayısı hesaplanabilir. Maddelerin eşit güçlükte varsayılmasından dolayı
KR-21 genellikler KR-20’den küçük çıkar.
(Denklem 5)
Eğer maddeler güçlük bakımından
oldukça farklı ise yani birbirine yakın veya eşit değilse bu formül
güvenirliğin en alt sınırını verir. Bu durumda elde edilen güvenirlik katsayısı
yeterli görülüyorsa (.75’in üstünde ise) testin güvenilir olduğunu söylemek
mümkündür.
KR-20 ve KR-21 formülleri sadece 1-0 puanlamasında kullanılır. Eğer
puanlama farklı ise bu formül kullanılmaz. Cronbach alfa güvenirlik katsayısı
kullanılır.
6- Cronbach alfa: Maddeler (sorular) 1-0’dan farklı puanlandığı
zaman veya bir testin alt testleri varsa bu tür testlerin güvenirliğini
KR-20’nin özel bir hali olan Cronbach Alfa tekniği ile hesaplarız. KR-20’den
farkı eğer testin alt testleri var ise madde varyansları toplamı yerine alt
test varyansları toplamı alınır. 1-0’dan farklı puanlandığında KR-20’de olduğu
gibi madde varyansları kullanılır.
(Denklem 6)
å: Madde varyansları toplamı veya alt test varyansları toplamı
7-Puanlayıcı Güvenirliği: Cevap kâğıtlarına birden fazla
puanlayıcının verdiği puanlar arsındaki korelasyondur. Puanlayıcıların
yansızlığı ve uyumu hakkında bilgi verir. Daha çok yazılı sınavlar, sözlü
sınavlar, performans testleri gibi durumlarda kullanılır.
8-Puanlama Güvenirliği: Bir puanlayıcının bir sınav kağıdına farklı
zamanlarda (en az iki kez) verdiği puanlar arasındaki korelasyondur.
Puanlayıcının kararlılığı ve yansızlığı hakkında fikir verebilir. Daha çok
yazılı sınavlarda, ödev-projelerde ve kısmen de kısa cevaplı testlerde
kullanılabilir.
Tablo 4. Güvenirlik Belirleme Tekniklerine İlişkin Özet Bilgiler
Güvenirlik Katsayısı
Tipi |
Anlamı |
Gereken form sayısı |
Uygulama sayısı |
Hata varyansı kaynağı |
KUDER-RICHARSON KR - 20 ve KR - 21 |
İç
tutarlık |
Bir |
Bir |
Kapsam
örneklemi ve
heterojenliği |
CRONBACH ALFA |
İç tutarlık |
Bir |
Bir |
Kapsam
örneklemi ve
heterojenliği |
İKİ YARI |
İç
tutarlık |
Bir |
Bir |
Kapsam
örneklemi |
TEST-TEKRAR TEST |
Kararlılık |
Bir |
İki |
Zaman
örneklemi |
PARALEL FORMLAR Birlikte uygulama |
Tutarlık |
İki |
Bir |
Kapsam
örneklemi |
PARALEL FORMLAR Aralıklı uygulama |
Tutarlık |
İki |
İki |
Zaman ve
kapsam |
PUANLAYICI |
Tutarlık |
Bir |
Bir |
Puanlayıcılar |
PUANLAMA |
Kararlık |
Bir |
Bir |
Puanlama |
Açıklanan
güvenirlik belirleme tekniklerine ilişkin özet bilgiler tablo 4’te
verilmektedir. Tablo 4 güvenirliklerin hangi anlama geldiği, kullanılması
gereken form sayısı, uygulama sayısı ve hesaplanan güvenirlik değerlerine
karışan hata kaynaklarını göstermektedir.
Güvenirliği Artırma Yolları
1-Soru sayısını
artırmak güvenirliği artırır. Güvenirlikle soru sayısı arasında matematiksel
bir ilişki vardır. Soru sayısı arttıkça duyarlı ölçme yapılacağı için
güvenirlik de artar. Ancak soru sayısını bir noktadan sonra artırmanın getirişi çok fazla değildir. Bu
ilişki aşağıdaki şekilde görülebilir. Güvenirliği tam (1) yapabilmek için
eklenecek soru sayısı sonsuzdur. Monoton artan bir fonksiyondur. Bir noktadan sonra eklenecek
soru sayısı ile artacak güvenirlik miktarı önemsiz bir düzeye gelir. Bunu bir örnekle açıklayacak
olursak madde sayısı 4 güvenirliği 10 olan
bir teste sürekli soru ekleme durumunda güvenirlik artış miktarı şöyle olacaktır.
Aşağıdaki şekilde
örüldüğü gibi bir noktadan sonra meydana gelen güvenirlik artışı eklenen soru sayısı karşısında değmeyecek bir
miktardır. Soru sayısı ile güvenirlik ilişkisi kapsamında ne kadar soru
eklenince istenilen güvenirliği elde edeceğimizi gösteren formül vardır. Bu formül aşağıdaki gibidir.
rn
= (Denklem
7)
formülde geçen
terimlerin açıklamaları şöyledir.
rs=Soru eklenecek testin
(eldeki testin) güvenirliği
rn=Testin soru eklendikten
sonra beklenen güvenirliği (istenen güvenirlik)
n=Testin kaç kat uzatılacağı
Örnek:
Güvenirliği 0.75 olan 10 soruluk bir testin güvenirliğini .90'a çıkarmak için
ne kadar soru ekleyeceğimizi bulmak için formülü uygularsak (bkz. Örnek
çalışmalar) n @
3 çıkar. Buradan n*k yoluyla; 3*10 = 30
bulunur. Bu durumda test 30 soru olduğunda güvenirliğin 0.90 olacağı
anlaşılmaktadır. Yani güvenirliği 0.90’a çıkarmak için teste 20 soru daha
eklemek gerekmektedir.
Tablo 5. Madde sayısı ve Güvenirlik
İlişkisi
Soru Sayısı |
K |
Güvenirlik |
Artan Güvenirlik Artışı |
4 |
0.10 |
- |
8 |
0.18- |
0.08 |
16 |
0.30 |
0.12 |
32 |
0.46 |
0.16 |
64 |
0.63 |
0.17 |
128 |
0.77 |
0.14 |
256 |
0.89 |
0.12 |
512 |
0.94 |
0.05 |
1024 |
0.97 |
0.03 |
∞ |
1.00 |
0.03 |
Şekil 5. Madde sayısına göre güvenirlik
2-Soruların açık,
anlaşılır ve cevaplanabilir olması güvenirliği artırır. 3-Öğrencilerin
güdülenmesi güvenirliği artırır.
4-Sınav süresinin yeterli olması güvenirliği
artırır.
5 -Testin orta güçlükte
olması (çok kolay veya çok zor olmaması) güvenirliği artırır.
6-Testin objektif
puanlanması güvenirliği artırır.
7-Ölçme işleminin tüm
basamaklarında gerekli titizlik ve dikkati göstermek güvenirliği artırır.
9-Duyarlığı yüksek araç ve yöntem kullanmak güvenirliği artırır.
10-Ölçme sonuçlarının elde edilen
duyarlıkta kaydedilmesi güvenirliği artırır.
2.3 Ölçmenin Standart Hatası
Ölçmelerin
tutarlığı ile güvenirlikten sonraki ikinci yaklaşım hataların büyüklüğünü
belirlemektir. Tek bir gözleme bakılarak hata konusunda bir şey söylenemez.
Aynı kişiye ait birden fazla ölçme yapılmalıdır. Bu ölçmeler bir dağılım
gösterir. Bu dağılımın ortalaması kişinin gerçek puanının tahminidir. Yani
gerçek puana en yakın puandır. Bu dağılımın standart kayması ölçmenin standart
hatası olarak adlandırılır.
Ancak
bireylerle ilgili tekrarlı ölçmeler yapmak zaman alıcıdır. Bu nedenle çok
sayıda kişiye test uygulamak, bu testten elde edilen puanların standart
kaymasını ve güvenirliğini kullanmak yoluyla bireylerin puanlarına karışan hata
(ölçmenin standart hatası) hesaplanabilir. Bu yolla hesaplanan ölçmenin standart
hatası formülü aşağıdaki gibidir:
(Denklem 8)
Sx=Testin
standart sapması
rxx’=
Testin güvenirliği
Standart
hata grubun değişirliğinden az etkilenir. Güvenirlik ise grubun değişirliğine
bağlıdır. Bu nedenle bazen güvenirlik yerine kullanılması önerilmiştir.
Özellikle testteki puanların ve puanlar arasındaki farkların güvenirliği ile
ilgili yargılar için çok kullanışlıdır. (Ör: Güvenirliği .64 olan ve standart
kayması 5.03 olan testten bir öğrencinin 48 puan aldığını varsayalım. Geçme
notu 50 olsun. Bu durumda öğrenci sınıfını geçmeli midir? Nasıl karar
vereceğiz? Kararı, standart hatayı hesaplayıp öğrencinin puanına ekleme ve
çıkarma yapma yoluyla öğrencinin puan aralığını bulduktan sonra vermek
yararlıdır. Bu test için ölçmenin standart hatasını hesaplayacak olursak ilgili
formülden 3,02 olarak elde edilir. Bu puanı öğrencinin puanına ekleyip
çıkarınca öğrencinin puanı 44,98 – 51,02 arasında olacaktır. Öğrencinin puanı
50 geçme notunu kapsadığından geçer not vermek doğru olur.
Güvenirlik İçin Örnek
Çalışmalar:
Tablo
6. Test-Tekrar Test Veya Paralel Test Güvenirliği İçin Veriler
|
||||||
|
1.Uyg.(X) |
2.Uyg.(Y) |
X2 |
Y2 |
XY |
|
1 |
30 |
33 |
900 |
1089 |
990 |
|
2 |
32 |
32 |
1024 |
1024 |
1024 |
|
3 |
33 |
34 |
1089 |
1156 |
1122 |
|
4 |
35 |
36 |
1225 |
1296 |
1260 |
|
5 |
37 |
37 |
1369 |
1369 |
1369 |
|
6 |
38 |
42 |
1444 |
1764 |
1596 |
|
7 |
40 |
39 |
1600 |
1521 |
1560 |
|
8 |
39 |
44 |
1521 |
1936 |
1716 |
|
9 |
44 |
41 |
1936 |
1681 |
1804 |
|
10 |
34 |
36 |
1156 |
1296 |
1224 |
|
Toplam |
362 |
374 |
13264 |
14132 |
13665 |
|
T2 |
131044 |
139876 |
|
|
|
|
TX*TY |
135388 |
|
|
|
|
|
r= |
0,83 |
Testim
güvenirliği |
||||
kkök
r |
0,91 |
Maksimum
geçerlik değeri |
Bu sonuçlara
göre 10 soruluk testimizin orta güvenirlikte olduğu söylenebilir.
Diğer güvenirlik hesapları da
ilgili tekniğin gerekli işlemleri yerine getirilerek korelasyon formülünden
faydalanılarak yapılmıştır.
Aşağıda 10 soruya 10 kişinin verdiği cevaplara
dayanarak elde edilen madde puanları matrisi görülmektedir. Bu matrisi
kullanarak güvenirlik tekniklerinden uygun olanlar için güvenirlik değerleri ve
bir ölçüte göre maksimum geçerlikleri hesaplanmıştır. Benzer örnekler üzerinde
çalışılabilir.
Tablo
7 Yarıya bölme, KR-20 ve KR-21 Güvenirlik Analizleri için 10 Maddeye İlişkin
Veriler
|
|
|
|||||||||
Kişiler |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Puan |
A |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
1 |
5 |
B |
1 |
1 |
1 |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
7 |
C |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
8 |
D |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
4 |
E |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
9 |
F |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
3 |
G |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
4 |
H |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
10 |
I |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
3 |
J |
0 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
1 |
0 |
6 |
DS |
5 |
9 |
9 |
4 |
7 |
6 |
3 |
6 |
5 |
5 |
59 |
p |
0,50 |
0,90 |
0,90 |
0,40 |
0,70 |
0,60 |
0,30 |
0,60 |
0,50 |
0,50 |
|
q |
0,50 |
0,10 |
0,10 |
0,60 |
0,30 |
0,40 |
0,70 |
0,40 |
0,50 |
0,50 |
|
p*q |
0,25 |
0,09 |
0,09 |
0,24 |
0,21 |
0,24 |
0,21 |
0,24 |
0,25 |
0,25 |
2,07 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Testin
tümü için |
Ort |
S2
|
S |
||
|
|
|
|
|
5,90 |
6,32 |
2,51 |
||||
TEK
SORULAR |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
3 |
5 |
7 |
9 |
Puan |
|
|
|
|
|
A |
0 |
1 |
1 |
0 |
0 |
2 |
|
|
|
|
|
B |
1 |
1 |
1 |
0 |
1 |
4 |
|
|
|
|
|
C |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
D |
1 |
1 |
0 |
0 |
0 |
2 |
|
|
|
|
|
E |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
F |
0 |
1 |
0 |
0 |
1 |
2 |
|
|
|
|
|
G |
0 |
1 |
0 |
0 |
0 |
1 |
|
|
|
|
|
H |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
I |
0 |
0 |
1 |
0 |
1 |
2 |
|
|
|
|
|
J |
0 |
1 |
1 |
0 |
1 |
3 |
T2 |
|
S2 |
|
|
Toplam |
5 |
9 |
7 |
3 |
5 |
29 |
841 |
|
1,66 |
|
|
ÇİFT
SORULAR |
|
|
|
|
|
|
|
|
|
||
|
2 |
4 |
6 |
8 |
10 |
Puan |
|
|
|
|
|
A |
1 |
0 |
1 |
0 |
1 |
3 |
|
|
|
|
|
B |
1 |
0 |
1 |
1 |
0 |
3 |
|
|
|
|
|
C |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
D |
1 |
0 |
0 |
0 |
1 |
2 |
|
|
|
|
|
E |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
F |
1 |
0 |
0 |
0 |
0 |
1 |
|
|
|
|
|
G |
1 |
0 |
1 |
1 |
0 |
3 |
|
|
|
|
|
H |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
I |
0 |
0 |
0 |
0 |
1 |
1 |
|
|
|
|
|
J |
1 |
1 |
0 |
1 |
0 |
3 |
T2 |
TX*TY |
S2 |
|
|
Toplam |
9 |
4 |
6 |
6 |
5 |
30 |
900 |
900 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
KORELASYON |
|
|
|
|
|
|
|
|
|
|
|
|
X
2 |
Y2 |
X*Y |
|
|
|
|
|
|
|
|
1 |
4 |
9 |
6 |
|
|
|
|
|
|
|
|
2 |
16 |
9 |
12 |
|
|
|
|
|
|
|
|
3 |
16 |
16 |
16 |
|
|
|
|
|
|
|
|
4 |
4 |
4 |
4 |
|
|
|
|
|
|
|
|
5 |
16 |
25 |
20 |
|
|
|
|
|
|
|
|
6 |
4 |
1 |
2 |
|
|
|
|
|
|
|
|
7 |
1 |
9 |
3 |
|
|
|
|
|
|
|
|
8 |
25 |
25 |
25 |
|
|
|
|
|
|
|
|
9 |
4 |
1 |
2 |
|
|
|
|
|
|||
10 |
9 |
9 |
9 |
|
|
|
|
|
|||
Toplam |
99 |
108 |
99 |
|
|
|
|
|
r= |
0,79 |
SBr= |
0,88 |
Kkök r |
0,94 |
|
|
KR-20 |
0,75 |
kkök r |
0,86 |
|
|
KR-21 |
0,69 |
kkök r |
0,83 |
Sadece yarılardan birinin
güvenirliği, iki yarı arasındaki korelasyon
Testin tümü için güvenirlik,
Spearman-Brown düzeltme formülü sonucu.
Testin alabileceği Maksimum ölçüt
geçerlik değeridir.
Madde güçlükleri ve sayısı
dikkate alınarak hesaplanan iç tutarlık değeridir.
Testin alabileceği Maksimum ölçüt
geçerlik değeridir.
Madde güçlükleri eşit
varsayılarak hesaplanan iç tutarlık değeridir.
Testin alabileceği Maksimum ölçüt
geçerlik değeridir.
Yukarıda 0,75 bulunan KR-20
güvenirliğini 0,90’a çıkarmak için teste kaç madde eklememiz gerektiğini aşağıdaki
gibi bir işlem süreciyle bulabiliriz.
rn = ve 3x10=30 olacaktır. 10 maddelik testimize 30
soru daha ekleyip 40 soruya çıkarırsak güvenirliğini de 0,90 değerine
çıkarabiliriz.
1-0 puanlamadan farklı durumlarda
kullanılan iç tutarlık katsayısı Cronbach Alfa güvenirliği için aşağıdaki örnek
verilmiştir. Görüldüğü gibi 8 soruluk testin güvenirliği yetersiz bulunmuştur.
Tablo 8. Cronbach Alfa Güvenirlik Analizi için 8 Maddeye ait Veriler
|
|
|
|
|
|
|
|
|
|
|
M1 |
M2 |
M3 |
M4 |
M5 |
M6 |
M7 |
M8 |
Puan |
K8 |
4 |
4 |
5 |
5 |
5 |
4 |
5 |
4 |
36 |
K1 |
4 |
3 |
5 |
2 |
4 |
5 |
3 |
5 |
31 |
K4 |
2 |
4 |
4 |
3 |
5 |
3 |
5 |
5 |
31 |
K6 |
5 |
3 |
2 |
2 |
4 |
3 |
5 |
5 |
29 |
K7 |
3 |
3 |
4 |
2 |
5 |
4 |
3 |
3 |
27 |
K2 |
5 |
3 |
4 |
2 |
1 |
3 |
4 |
4 |
26 |
K3 |
3 |
1 |
2 |
3 |
4 |
3 |
2 |
5 |
23 |
K5 |
1 |
3 |
3 |
4 |
3 |
2 |
2 |
2 |
20 |
S2 |
1,98 |
0,86 |
1,41 |
1,27 |
1,84 |
0,84 |
1,70 |
1,27 |
223 |
|
|
|
|
Madde
varyansları toplamı |
11,16 |
|
|||
Alfg |
0,64 |
Cronbach
alfa güvenirliği |
Tüm
test için |
|
|
||||
kkök |
0,80 |
Maksimum
ölçüt geçerliği |
Ort |
S2 |
s |
|
|||
|
|
|
|
|
|
27,88 |
25,27 |
5,03 |
|
2.4
Geçerlik
Bir ölçme aracının sadece o araçla ölçülmek istenen
değişkeni ölçme, başka değişkenlerle
karıştırmama veya amaca hizmet etme derecesidir. Testin sahip olması gereken en
önemli niteliktir. Buna göre geçerlik, genel anlamda, bir ölçme aracının ya
da ölçme yönteminin ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle
karıştırmadan, doğru olarak ölçebilme derecesi olarak tanımlanabilir. Başka bir tanım ise geçerliği,
maddenin/testin bilenle bilmeyeni veya bir davranışa sahip olanla olmayanı
ayırma derecesi olarak ifade eder. Bu tanım eğitimde kullanılan araçların
geçerliğini belirlemede, madde analizlerinde çok kullanılır. Bu terim,
testlerin sağladığı sonuçların kullanılma
amaçlan için geçerli olup olmadığını, geçerli oluş derecesini ve gerçekliğini belirtmektedir.
Bir
ölçme aracının geçerliği yüksek ise güvenirliği de yüksektir. Bunun tersi doğru
değildir. Güvenirliği yüksek olan testin
geçerliği düşük olabilir.
Geçerlikte iki önemli soru vardır. l)Ölçme aracı hangi
amaç ya da amaçlar için kullanılabilir.
2)Ölçme aracı bu amaç veya amaçlara ne derece de hizmet edebilir, uygundur?
Bir testin geçerliği bir derece sorunudur. Ya hep ya hiç
sorunu değil. Hatalardan tamamen
kurtulmak mümkün değil ancak minimum yapmaya çalışmak gerekir.
Geçerliği
birden fazla yolla tanımlamak mümkündür. Tek bir tanım vermek yerine kullanış
amacına uygun olduğuna ilişkin kanıtlar bulmak daha doğrudur. Çok bilinen
geçerlik türleri kısaca şöyle özetlenebilir.
1-Kapsam Geçerliği:
Ölçülmek istenen kapsamla geçerliği araştırılan testin ölçtüğü kapsamın örtüşme
derecesidir. Bir ölçme aracının ölçülmek istenen davranışları (özellikleri) ne
derece kapsadığının belirlenmesidir. Kapsam
geçerliğinin belirlenmesi için ölçme konusu olan özelliklerin ya da davranışların önceden belirlenmesi gerekir.
Eğitimde
hedefler geneldir, gözlenemezler. Oysa ölçülecek nitelik ya da davranış doğrudan ya da dolayı olarak
gözlenebilmelidir. Bu nedenle hedefler verine davranışlar ölçme konusu yapılır.
Ör: Hedef 1; "Ölçmeyle ilgili belli
başlı kavramların bilgisi." Geneldir. Gözlenemez.
Davranış
1; Güvenirlik kavramının tanımını yazma, söyleme veya verilen seçenekler arasından işaretleme. Özeldir.
Gözlenebilir.
Kapsam Geçerliğini Belirleme Yolları
İki temel yol olduğu söylenebilir. Birincisi
akli (rasyonel), ikincisi istatistikî yoldur.
1-a- Belirtke Tablosu Hazırlamak. Belirtke tablosu, sütun başlarında hedefler, satır başlarında konular ve hücrelerde
hedefler ve konularla ilgili davranışların numara ya da sayılarla gösterildiği tablodur.
Yani davranışların konu ve hedeflere göre dağılımını gösteren çizelgelerdir.
Tablo 9. Örnek Belirtke Tablou Tablosu. |
|||||||
Konular |
Bilgi |
Kavrama |
Uygulama |
Analiz |
Sentez |
Değerlendirme |
Toplam (%) |
1.Ölçmenin
Temel Kavramları |
4 |
3 |
2 |
2 |
1 |
4 |
16 (%33) |
2.
Ölçme Aracının Nitelikleri |
3 |
5 |
8 |
3 |
2 |
3 |
24 (%50) |
3.Yazılı
Yoklamalar |
- |
3 |
1 |
2 |
1 |
1 |
8 (%17) |
Toplam (%) |
7 (%15) |
11 (%23) |
11 (%23) |
7 (%15) |
4 (%7) |
8 (% 17) |
48 (% 100) |
Örnek belirtke tablosunda (Tablo
9)görüldüğü gibi davranışların konu ve hedeflere göre dağılımı belirlenir. Sınav sorularının bu dağılımı ne derece yansıttığı
incelenir. Bu inceleme sonucunda kapsam geçerliği olup olmadığına karar verilir. Eğer sorular bu dağılıma uygun olarak ölçme yapıyorsa, yani davranışları konu ve hedef ağırlıklarını da göz önünde bulundurmak koşuluyla
yeterince kapsıyorsa kapsam geçerliğinden söz edilir.
1-b-Uzman kanısına başvurma: Sorular uzmanlara gösterilerek
ilgili davranışları ne derecede ölçtüğünü belirlemeleri istenir. Bu amaçla "evet, hayır"lı,
davranışlarla "ilgili, ilgisiz" veya davranışları "ölçüyor, ölçmüyor" gibi
cevapların verilebileceği ölçekler kullanıldığı gibi soruların davranışları ölçme
düzeyini gösteren 3 ya da 5'li likert tipi ölçekler de kullanılabilir. Elde edilen sonuçlar yüzde-frekans veya
korelasyon katsayısı hesap edilerek değerlendirilebilir. Bu tekniğe Bir uzmanın soruları belirtke tablosuyla karşılaştırma tekniği de
denebilir. Bu
teknik belirtke tablosu hazırlamanın devamı olan bir tekniktir. Bu tekniğin
yukarıdaki teknikten tek farkı hazırlanan belirtke tablosunu hazırlayan kişinin
değil bağımsız bir uzmanın incelemesidir.
2-Tekrarlı Teşt Geliştirme: İki farklı uzman grubunun aynı kapsamı
ölçen iki test geliştirmesi ve bunları öğrencilere uygulama sonucu elde edilen puanlar arasındaki
korelâsyonun hesaplanmasıdır.
Özet olarak kapsam geçerliğini,
sağlamak için uzman kişiye danışma,
belirtke
tablosunu dikkate alma ve konu hedef ağırlığına bakmak gerekir. Kapsam
geçerliği için kullanacağımız
testin nitelikleri kullanma amaç ve durumlarıyla mümkün olduğunca eşlenmelidir. Kapsam geçerliği alan
uzmanlarının testle ilgili görüşleri olarak kabul edilebilir.
Örnek: Dört işlemle ilgili bir test hazırlayalım. Testin amacı
öğrencilerin dört işlemle ilgili becerilerini ölçmektir. Ancak testi hazırlarken çıkarma işlemiyle ilgili
sorular yazmazsak kapsam geçerliği
düşecektir. Çıkarma işleminin yanı sıra bölme işlemi ile ilgili soruları da yazmayı ihmal edersek kapsam geçerliği daha da
düşecektir. Aynı örneği şu şekilde de inceleyebiliriz. Dört işlem becerisi ile
ilgili davranışların ağırlıkları (çarpma, bölme, çıkarma ve toplama
işlemlerinin ağırlıkları) farklı olsun. Bu konuların ağırlığını belirlemede,
çözülen örnek sayısı, harcanan ders
saati kitapta ayrılan sayfa sayısı ve esas olarak belirtke tablosundaki davranışların sayısı olacaktır. Kullanılacak
testte bu ağırlıkla dengeli olacak şekilde soru yoksa kapsam geçerliği düşük olur.
Durum1 Durum 2 Durum
3
|
|
|
Örnek: Aşağıdaki şekillerin hangisinde
testin kapsamıyla kullanıcının kapsamı en iyi şekilde eşleşmiştir? (A: Ölçülecek
davranışları; B: test kapsamı)
Şekil 6. Kapsam geçerliğiyle ilgili bazı muhtemel
görünümler
Durum 1’de testin
kapsamıyla kullanıcı kapsamı az bir alanda çakışmaktadır. Dairelerin kesiştiği alan çok dar olduğundan testi kullanmak
çok anlamlı olmaz. Bu test ölçülecek nitelik yada davranışlara ilişkin çok
az-bilgi sağlar.
Durum 3'de terstin,
kapsamı kullanıcı kapsamı içinde yer almaktaysa da iyi bir ölçüm olmayacağı
bellidir. Test kullanıcının ölçmeyi amaçladığı özellik ya da davranışları
ölçmede sınırlı kalmaktadır. Boşluk ancak
başka testler kullanılarak doldurulur. Çoğunlukla birden fazla test kullanılmasının önerilmesi, tek bir
testin istenen kapsamı ölçmede sınırlı olmasındandır.
Durum 2'de kullanıcının
kapsamı ile testin kapsamı tam olarak eşleşmiyorsa da testin kapsamı
uygulayıcının kapsamım diğerlerine göre daha çok karşılamaktadır.
Burada tekrar
vurgulanabilir ki, kapsam geçerliği, bir bütün olarak testin ve testteki her bir maddenin maksada ne derece hizmet
ettiğidir. Birincisi, testteki tüm maddelerin ölçülecek konuyu (içeriği) ve davranışları ne derece temsil ettiği;
ikincisi, testteki her bir maddenin
ölçülecek davranışı ne derece ölçtüğüne bağlıdır. İstenmeyen değişkenlerin
ölçülmesi de kapsam geçerliğini düşürür. Örneğin, "beşle altının
çarpımının ikiye bölünmesinden iki
çıkarılmasıyla elde edilen sayı kaçtır?" ifadesine sözel yetenek karşır. Matematik
becerisi ölçeme amaçlanırken başka bir niteliği ölçtüğümüz için kapsam
geçerliği düşmüş olur. Yani kapsamda sözel
yetenek becerisi ve bizim böyle bir değişkeni ölçme amacımız olmadığı halde bu değişken ölçmeye
karışarak hem amacımızdan uzaklaşmamızı hem de kapsam geçerliğinin düşmesine neden olur.
2-Ölçüte
Dayalı Geçerlik (Ölçüt Geçerliği): Test puanlarıyla ölçüt yada ölçütler
arasındaki korelasyon katsayısıdır. Ölçütler
genelde "dış ölçüt”tür. Elde
ettiğimiz geçerlik ise bir ölçüte göre
geçerliktir. Geçerlik katsayısı ölçüt alınan puanlara göre değişecektir. Bu
nedenle öncelikle doğru ölçüt bulmak gerekir. Yani geçerliği araştırılan
konuyla ilgili bir ölçüt olmalıdır. Aynı zamanda ölçütün geçerliği ve
güvenirliği yüksek olmalıdır. Ölçüt geçerliği ölçütün
elde edildiği zamana göre ikiye ayrılarak incelenir.
a-Yordama Geçerliği: Ölçüt puanların yordayıcı (geçerliği
araştırılan) puanlardan sonra
elde edilmesi durumundaki geçerliktir, Bu geçerlik türünde yordayıcı puanları
daha sonraki bir
performansı yordamak (kestirmek-tahmin etmek) amacıyla kullanılır. Eğer iyi yorduyorsa (yani yordayıcı ve ölçüt
puanlar arasındaki ilişki yüksekse) yordama geçerliğinden söz edilir. Yordama bir tahmindir. Ancak
her tahmin bir yordama değildir. Bir tahminin yordama olabilmesi için geleceğe dönük olması
belli bilgiler temelinde bazı teknikler kullanılarak yapılması gerekir. Yordama işinde (geçerliğinde)
kullanılan istatistiksel teknik regresyondur.
Yordama
geçerliğinde en önemli sorun uygun bir ölçüt, bulmaktır. İyi bir ölçüt şu özelliklere sahip olmalıdır. 1-Ölçüt
öncelikle yordanmaya çalışılan değişkenle ilişkili olmalıdır. (Örneğin müzik yeteneğini
ölçen bir araçla kişinin okuduğunu anlama yeteneğini yordayamazsınız.) 2-Ölçüt güvenilir
olmalıdır. Ölçüte ilişkin puanlar ne kadar çok hata içerirse yordama geçerliği o
derecede düşük olacaktır. 3-Ölçüt geçerli olmalıdır. Zaten geçerlik çalışması bir aracın amaca uygunluk
derecesini ortaya koyma çalışmasıdır. Bu nedenle amaca uygunluğu kanıtlanmamış ya
da amaca uygun olmadığı bilinen bir ölçütle bu çalışma başarısız olur. 4-Kolay ve pratik olmalıdır. Elde edilmesi ve
uygulanması kolay ve pratik olmalıdır.
b)Uyum
(Uygunluk) Geçerliği:
Ölçüt puanların yordayıcı puanlarla aynı zamanda veya daha önce elde edilmesi durumunda, ölçüt ile
yordayıcı arasındaki korelasyon katsayısına
uyum geçerliği adı verilir. Uyum geçerliğine hâlihazır geçerlik, mevcut durum
geçerliği, eş-zaman geçerliği ve uygunluk geçerliği de denilmektedir. Yordama
geçerliğinden farkı; testin ölçülmek istenen
davranış veya özellikleri hangi düzeyde ölçebileceğini belirlemektir.
Yordamada ise kestirme vardır. Özellikle testin amacı tanı koymak ise uyum
(eş-zaman) geçerliğine başvurmak yararlıdır. Örneğin üniversite sınavı ile
üniversite başarısı; işe giriş sınavı ile
iş performansı arasındaki korelasyon katsayıları yordama geçerliği olurken;
üniversite giriş sınavı ile ortaöğretim başarı puanı (ölçüt olarak) veya
matematik dersi başarısı ile aynı
zamanda elde edilen matematik yeteneği testi puanları arasındaki korelasyon katsayıları
uyum geçerliği olur.
Bir testin bir ölçüte göre
geçerliği bu testin güvenirliğinin karekökünden
büyük olamaz.
Ölçüt
geçerliğini yordayıcı ve ölçütün güvenirlikleri, yordayıcı ve ölçütün birbirine
etkisi (bağımlı-bağımsız olması), grubun
homojenliği ve puanların ranjı (genişliği) etkiler.
3-Yapı
Geçerliği: Bireylerde var olduğu kabul edilen özelliklere
psikolojide yapı denir. "Zeka, tutum,
ilgi, kaygı, depresyon, atılganlık, içedönüklük, dışa dönüklük, güvensizlik
vb." gibi kişilik özellikleri psikolojik
yapıya örnek olarak verilebilir. Yapı, birbiriyle ilişkili
olan öğeler ya da öğelerin oluşturduğu
örüntü olarak tanımlanır. Bu yapılar
hipotetiktir (teoriktir, kuramsaldır). Yani var oldukları kabul edilir. Doğrudan ispatlanamaz.
Ancak gözlemlerle varlıkları hissedilir. Örneğin günlük dilde "zeki adam" dediğimizde
bunu ispatlayanlayız. Yani zekânın varlığını ispatlamaya kalkmayız. O kişinin bizim kabul ettiğimiz bir
yapıyla ilgili davranışları gösterdiğini düşünürüz.
Yapı
geçerliği bir araçla ölçülmek istenen yapının o araçla ortaya konulma derecesi olarak tanımlanabilir.
Yapı
geçerliği, yapının tanımlanmasındaki doğruluğa, yapıdan çıkarsanan gözlenebilir
davranışların yapıyla
ilgili olmasına, davranışların yapının tamamını (kapsamını) temsil etmesine, gözlenebilir davranışları ölçmek
için yazılan maddelerin (soruların) onları ölçebilme derecesine bağlıdır.
4-Görünüş Geçerliği:
Bir testin ne
ölçtüğü ile ilgili değil ne ölçüyor göründüğü ile ilgilidir. Testin ölçülmek istenen değişkeni
ölçüyor görünmesidir. Bu çalışma testin tamamı için "olduğu kadar maddeler için de yapılır. Yani
maddelerde ölçülmek istenen davranışı ölçüyor görünmelidir.
Örneğin "14/4 işlemi sonucunda kalan kaç olur." ile "On dört'ü
dörde böldüğümüzde kalan kaç
çıkar." Soruları matematik davranışını aynı geçerlik düzeyinde ölçüyor görünmemektedir.
Birincisi daha iyi bir matematik sorusu gibi görünmektedir.
Geçerliği Artırmanın Yollan
1-Her ölçme aracının
geçerliği o araçtaki maddelerin teker teker geçerliğine bağlıdır. Her soru araçla ölçülmek istenen davranışların en az birini ölçmek
zorundadır.
3-Test güvenirliğini artıran tüm etmenler geçerliği
artırır.
4-Cevaplamaya verilen süre (cevaplanamayan soruların kapsamı
daraltmasından dolayı) geçerliği
etkiler.
5-Puanlama
yanlılıkları geçerliğin etkiler.
6-Ölçüt puanların
geçerlik ve güvenilirlikleri geçerliği etkiler.
7-Ölçme aracının güçlüğü ve grubun
yetenek düzeyi geçerliği etkiler. Örneğin okul birincisi, ikincisi seçilecekse zor bir sınav
yapılabilir. Kolay bir sınav yapılırsa araç amaca hizmet etmeyeceğinden geçerlik düşük
olacaktır.
8-Soruların yıllarca
değiştirilmeden kullanılması geçerliği düşürür.
9-Soruların sınavdan
önce açıklanması geçerliği düşürür.
10-Kopya çekilmesi
geçerliği düşürür.
11-Testin kullanım sayısı geçerliği etkiler.
Her kullanımın geçerliği bir miktar düşürdüğü söylenebilir.
12-Testin kullanış
amacı ve uygulama gurubu geçerliği etkiler.
Güvenirlik
Ve Geçerlik Arasındaki Temel İlişkiler
1-Test
aracının en önemli özelliği geçerli olmasıdır.
2-Bir
ölçme aracının geçerliği yüksek ise güvenirliği de yüksektir. Tersi doğru
değildir.
3-Güvenirliği
yüksek bir testin geçerliği düşük olabilir.
4-Güvenirlik
geçerlik için önkoşuldur ancak yeterli koşul değildir.
5-Bir
arcın ölçüt geçerliği o aracın güvenirliğinin karekökünden büyük olamaz.
; (Denklem 10)
Formülde max. rxy
geçerliği, rxx, güvenirliği göstermektedir..
2.5 Kullanışlılık
Araçların hazırlanış,
uygulanış ve puanlanış bakımından ekonomik ve kolay olması aynı zamanda sınırlılıklarının az olması
anlamına gelmektedir. Şu alt başlıklar altında incelenebilir:
1-Ekonomiklik: Araç, öğretmen,
yönetim, öğrenci vb. için ekonomik olmalıdır.
2-Hazırlama süresinin azlığı: Aracı
geliştirmenin ne kadar zaman aldığı ile ilgilidir. Diğer koşullar eşit olduğunda en kısa
zamanda hazırlanan testler tercih edilmelidir.
3-Uygulama süresinin azlığı: Aracın
kullanışlılığı, verdiği puanın önemine oranla uygulama gerektirdiği zaman azaldıkça artar.
4-Hazırlayıcı ve uygulayıcının
niteliklerine bağlı olarak sınırlı olması: Araçların hazırlanması ve
uygulanması özel beceriler gerektiriyorsa kullanışlılığı azalır.
5-Cevaplayıcının niteliklerine
bağlılık: Cevaplayıcıların niteliklerine
uygun araçlar kullanışlıdır.
6-Uygulama kolaylıklarına bağlılık:
Sayfa düzeni, baskı kalitesi vb. özellikler uygulamayı kolaylaştırır. Araçları kullanışlı yapar.
7-Puanlama kolaylığına bağlılık: Objektif olarak ve çabuk
puanlanan araçlar kullanışlıdır.
8-Yorumlama kolaylığına bağlılık:
Elde edilen puanlar anlamlı biçimde yorumlanamaz ise değerlendirme ve karar verme de
kullanılamaz. Araç yorumlamaya yardımcı, yorumlamayı kolaylaştırıcı ve yorumda hatayı azaltıcı ise
kullanışlıdır.
Bölüm Testi
1. Aşağıdakilerden hangisi bir testin geçerliğinin artmasını
sağlayamaz?
A) Soruların öğrenci düzeyinin altında
olması*
B) Öğrencilerin sınavdan önce
güdülenmesi
C) Soruların açık ve anlaşılır
olarak yazılması
D) Sınav ortamının rahatsız edici
uyarıcılardan arıtılması
E) Soruları puanlarken dikkatli
davranılması
2. Aşağıdakilerin hangisi bir testin kullanışlılığını kesinlikle
düşürür?
A) Soruların yazılmasının fazla zaman
almaması
B) Sınavı uygulama maliyetinin az olması
C) Soruları puanlamanın uzun zaman alması*
D) Fazla soru yazma gereğinin olmaması
E) Sınav kâğıdını çoğaltmanın kısa zaman
alması
3. Derste
görülen üç konunun ikisinden soru yazılmadığı durumda hangi geçerlik türü düşer?
A) Yordama B)
Uygunluk C) Yapı D) Kapsam* E)
Görünüş
4. Bir testten elde edilen puanlara tesadüfi hataların karışmaması veya
az karışması testin hangi özelliği ile ilgilidir?
A) Güvenirlik*
B) Geçerlik
C) uyumluluk
D) kullanışlılık
E) nesnellik
5.
Aşağıdakilerden hangisi güvenirlik kavramını açıklamada kullanılamaz?
A) Ölçme sonuçlarına karışan hataların azlığı
B) Farklı uygulama puanlarının birbirini
tutması
C) Maddeler arası ilişkilerin yüksek
olması
D) Aracın her uygulamada kararlı sonuçlar
vermesi
E) Aracın ölçülmek istenen değişkeni ölçebilmesi*
6.
Aşağıdakilerden hangisi bir testin güvenirliğini artırmaz?
A) Sorularda bilimsel ve dilsel hata
olmaması
B) Puanlamanın yansız olarak yapılması
C) Soru sayısının belli bir oranda
artırılması
D) Verilen puanların dikkatli kaydedilmesi
E) Oldukça fazla sınav süresi vermek*
7. Bir testin
ölçtüğü kapsamdan yeni sorular yazarak soru sayısını artırmak öncelikle
testin hangi özelliğini etkiler?
A) Güvenirlik* B) Geçerlik C)
Objektiflik D) Kullanışlılık E) Genellenebilirlik
8. I- Hazırlama süresinin kısalığı
II- Maliyetinin düşük olması
III- Kolaylıkla uygulanabilir olması
IV-Puanlamanın az zaman alması
Yukarıda verilen açıklamalar bir
ölçme aracının hangi özelliğiyle ilişkilidir?
A) Kullanışlılık* B) Geçerlik C) Kolaylık D) Güvenirlik E) Kapsamlılık
9. Aşağıdakilerden hangisi kapsam geçerliğinin en
iyi açıklar?
A)
Testin yordama gücünün yüksekliği
B)
Testin kolay uygulanabilirliği
C)
Maddelerin açık anlaşılır yazılması
D)
Soruların konulara dengeli dağılması*
E)
Testin yansız puanlanabilmesi
10.
I-Sabit II-Sistematik III-Tesadüfî
Yukarıdaki hata
türlerinden hangileri kontrol altında tutulamaz?
A)
I –
B)
II
C)
III*
D)
I – III
E)
II – III
11.
Aşağıdakilerden hangisi ölçme araçlarının güvenirliği ile doğrudan ilgili değildir?
A) Aracın duyarlığının yüksekliği
B) Her konudan sorular sorulması*
C) Soruların dikkatli puanlanması
D) Puanların dikkatli kaydedilmesi
E) Yansız puanlama yapılması
12.
Aşağıdakilerden hangisinin olması durumunda ölçme araçlarının geçerliği düşer?
A) Soruların konuları yeterince
örneklemesi.
B) Ölçme sonuçlarına karışan hataların
azalması
C) Öğrencilerin doğru cevapları birbiriden
alması*
D) Sınav kağıtlarının iki kez puanlanması
E) Cevaplamayla ilgili bir yönergenin
verilmesi
13. Bir okuldaki matematik öğretmenleri iki gruba
ayrılarak aynı davranışları ölçen iki test geliştirmişler ve bu iki testi bir
hafta arayla aynı öğrencilere uygulamışlardır. Uygulama sonucunda iki
uygulamadan elde edilen puanlar arasındaki korelasyon 0,91 bulunmuştur. Bu
korelasyon katsayısı aşağıdakilerden hangisinin yorumlamada kullanılabilir?
A) Testlerin objektif puanlanabildiğini
B) İki testinde geçerliğini
C) Test puanlarına karışan hata miktarını
D) Testlerden hangisinin daha zor olduğunu
E) Testlerin ne kadar güvenilir olduğunu*
14.
Aşağıdakilerden hangisi öncelikle bir testin güvenirliğini artırır?
A) Soruların öğrencileri
birbirinden ayırması
B) Aracın gelecekteki başarıyı
yordayabilmesi
C) Amaçlanan değişkenin ölçülmesi
D) Konularla dengeli sayıda soru yazılması
E) Puanlamanın bir anahtarla yapılması*
15. Geçerliği
en çok etkileyen hata türü hangisidir?
A) Tesadüfî B) Sabit C)
Sistematik* D) Standart E) Yanlı
|
IIII – EĞİTİM ÖĞRETİM SÜRECİNDE KULLANILAN ÖLÇME ARAÇLARI
3.1 Test Planı (Test Geliştirme)
Bir sınavın amacını
belirleme adımından not verme adımına kadar olan süreci kapsayan işlemleri içerir. Aşamalar
şunlardır.
1-Testin amacını belirlemek: Testle hangi
değişkenlerin/özelliklerin ölçüleceği (örneğin matematik yeteneği, matematik
başarısı, matematiğe karşı tutum gibi) sonuçların hangi değerlendirme türü için
kullanılacağı (öğrenme eksikleri, hazırbulunuşluk düzeyi vb.) ve sonuçlar
üzerinde hangi işlemlerin yapılacağını belirleme işlemlerini kapsar.
2-Ölçülecek
nitelikleri saptamak: Bu adımda ölçme
işleminin hangi düzeyde ve hangi konulardaki özelliklerin ölçüleceğini
belirlemek söz konusudur. Bu adıma ölçülecek kapsamı ve bu kapsamdaki
davranışları belirlemek söz konusudur diyebiliriz. Örneğin matematik başarısını
ölçeceksek kaçıncı sınıf ve hangi konular olduğuna karar vermek ve hatta bu
konularda hangi kazanımların yoklanacağı belirlenmelidir. Bu kararda testin
amacı etkili olacaktır.
3-Soruları Yazmak: Belirlenen davranışlara uygun, belirtke tablosunda bulunan
davranışlar için sorular yazılır ve soruların sayısı konu ağırlığına bağlı
olarak ayarlanır. Bu aşamada bir anlamda kullanılacak test türüne (yazılı,
sözlü, seçmeli gibi) ve soru tipine de karar verilmiş olur.
4-Soruları
gözden geçirmek / düzeltmek: Sorular
yazıldıktan sonra, bilimsel bilgilere uygunluk, dil hataları, anlaşılırlık ve
ölçülmek istenen davranışı yoklama yönlerinden incelenerek deneme uygulaması
yapılmadan önce gerekli düzeltmeler yapılır.
5-Deneme formunu hazırlamak: Sorular düzenlendikten sonra test
uygulama formu haline getirilir. Bu forma deneme formu adı verilir. Deneme
formu test hazırlama kurallarına uygun olarak oluşturulmalıdır. Deneme formu
uygulaması için genellikle esas ölçme yapılacak gruba benzeyen veya heterojen bir
grup seçilir.
6-Deneme uygulamasını yapmak: Testin ve test maddelerinin
sayısal özelliklerini belirlemek amacıyla yapılır. İşleyen ve işlemeyen
maddeleri belirlemeye çalışılır.
7-Puanlama
yapmak: Deneme uygulaması yapıldıktan
sonra cevaplayıcıların cevapları için puanlama yapılır. Puanlama 1-0 veya
sorular için uygun görülen bir şekilde yapılabilir.
8-Test
ve madde istatistiklerini hesaplamak: Puanlama
yapıldıktan sonra cevaplayıcı sayısı ve testin amacına uygun tekniklerle test
ve madde istatistikleri hesaplanır.
9-Madde
seçmek: Elde edilen test ve madde istatistiklerine
bağlı olarak hangi maddelerin seçileceğine, hangi maddelerde ne tür düzeltmeler
yapılacağına, nihai testin hangi maddelerden oluşturulacağına karar verilir.
10-Nihai (esas) testi oluşturmak: Deneme uygulaması sonucunda
seçilen maddelerin istatistiksel özellikleri nihai testin sayısal özellikleri
hakkında bilgi verici olabilir. Bu bilgilere göre nihai test amaca hizmet
edecek nitelikte ise seçilen maddelerle nihai test formunu test formu oluşturma
özelliklerine uygun olarak oluşturmak mümkündür.
11-Uygulama: Nihai test oluşturulduktan sonra asıl gruba bu testi
uygulama aşamasına geçilebilir. Bu aşamada da madde ve test istatistiklerini
belirleme, önceden kestirilen özelliklere ne ölçüde uyduğunu belirlemek söz
konusu olabilir.
Eğitimde yapılan süreçlerin birçoğunda öğrenciler hakkında bilgi
toplama amacı vardır. Bu amaçla çeşitli yollardan ve araçlardan
faydalanılabilir. Ölçme araçları yardımıyla öğrenciler üzerinde yapılan ölçme
işlemleri aşağıdaki amaçları kapsayabilir.
1) Başarı ya
da performansın yordanması
2) Öğrenme
eksik veya yanlışlarının ortaya çıkarılması,
3) Öğrenci
ihtiyaçlarını belirlemek
4)
Öğrencilerin performans ya da başarısını değerlendirmek
5)
Öğrencileri yönlendirmek veya onlara rehberlik yapmak
3.2 Birey Hakkında Bilgi Toplama Yolları
Bireyler
hakkında bilgi toplamanın çeşitli yolları vardır. Bunlar genel olarak ikiye
ayrılır.
1-Test dışı teknikler: Gözlem, vak’a
kayıtları, kontrol listeleri, dereceleme ölçekleri, biyografi, otobiyografi vb.
yöntemler.
2-Test teknikleri: Öğrencileri yeri ve
zamanı önceden belirlenmiş sınama durumları içine sokarak tepkilerini almak
amacıyla geliştirilen araçlar kullanarak bilgi toplamaktır. Örnek olarak zekâ,
başarı, yetenek vb. testleri verilebilir.
Testlerle
yapılacak değerlendirmelerde, yer ve zaman herkes için aynı olduğundan
bireyleri birbiriyle kıyaslamak daha objektif görülebilir. Çünkü test koşulları
herkes için aynıdır, eşittir. Farklı değişkenlerin etkisinin minimuma indiği
kabul edilir.
Test
uygulaması birey hakkında bilgi toplama yollarından birisidir. Test kelimesi
sınama, yoklama anlamındadır. Türkiye’de ise sınav anlamında, özellikle çoktan
seçmeli sınav anlamında kullanılır..
Psikolojik
testler sınıflandırılırken bazı ölçütler kullanılır. Bu ölçütler çerçevesinde
birçok testin hangi kategoriye alınacağı şüphelidir. Birçok testin sınıflanması
binişiklik gösterir. Yani testlerin çoğu aynı zamanda birden çok sınıflamanın
içine girebilmektedir. Sınıflamaları tek başına doğru ya da yanlış diye
belirlemek mümkün değildir. İşe yarayıp yaramadıklarına bakılır. Sınıflama
belirli ölçütlere göre yapıldığından çeşitli sınıflamalara rastlanmaktadır.
Aşağıda bazı ölçütlere göre testlerin nasıl sınıflanabileceğine ilişkin kısa
bilgiler bulunmaktadır.
A – Davranışların Doğası Bakımından
1 – Maksimum Yerlik Testleri
Bireyin
belli bir işi, belli bir durumda, ne derece iyi ya da doğru yapabildiğini
belirlemede kullanılır. Bireyin zihinsel, duyuşsal, devinişsel ya da akademik
yetenekleri hakkında bilgi toplamak amacı ile hazırlanan araçlardır.
a)
Zeka
Testleri: Kişinin takvim yaşı ile zihinsel gelişimi arasındaki uyumu ölçen
testlerdir. Çocukları için öğrenme gücünü, yetenekler içinse karşılaşılan
zihinsel sorunlarla başa çıkabilme yeteneğini ölçer. Bazı ölçmecilerce 3 grupta
incelenir.
1. Genel Yetenek Testleri; Belirli
düzeylerde genel zihin yeteneklerini ölçer. Doğuştan getirildiğine, çevre
etkisiyle çok az değiştiğine inanılan zihin gücünü ölçer. Genellikle kişinin
ileride, kendisine olanak verildiğinde, belirli bir şeyi ne kadar
öğrenebileceğini veya yapabileceğini yordamada, öğrenme gücünü (neyi ne kadar
öğrenebileceğini) ölçmede kullanılır.
2. Özel Yetenek Testleri; Sınırlı ve dar
bir alandaki zihin gücünü ölçer. Örneğin, müzik, resim ve sanat dalarlında
bireyin sahip olduğu özel zihin yeteneklerini ölçen testler bunlar arasındadır.
3. Farklı yetenek testleri: Dil yeteneği,
soyut kavrama yeteneği, mekanik kavrama yeteneği gibi farklı zihin
yeteneklerini ölçen testlerdir.
b) Başarı Testleri: Kişinin eğitim
süreci içinde veya belirli çevre koşulları altında ne kadar öğrendiğini ölçen
testlerdir. Bu testler, bireylerin geçmişte ne kadar öğrendiğini ortaya
çıkarmak için kullanılabilir. Esas olarak bireyin ileride ne kadar
öğrenebileceğinin değil geçmişte ne kadar öğrendiğinin belirlenmesinde
kullanılır. Üç tür başarı testi yaygın kullanılır.
1.Erişi testleri; amaçlanan davranışlardan
hangilerinin ne ölçüde öğrenildiğini/kazanıldığını ölçmeyi amaçlar.
2. İzleme testleri; amaçlanan davranıştan
her birinin ne ölçüde kazanıldığını ve hangi düzeyde öğrenme eksik ve
güçlükleriyle karşılaşıldığını belirlemeyi amaçlar.
3. Hazırbulunuşluk (düzey belirleme) testleri:
Bir ders ya da kursa başlamadan önce öğrenenlerin sahip olması gereken kazanım
veya davranışlardan ne kadarına sahip olduklarını belirlemek amacıyla
kullanılan testlerdir.
2 – Kişilik Testleri
Yansıtıcı
türden ve kişisel yoruma açık olan bu test grubunda amaç; danışanın psikolojik
danışma yardımı almasını gerektirecek bir kişilik bozukluğunun olup olmadığını
anlamaktır. Bireyin psikolojik ihtiyaç ve değerlerini, normal ve normal olmayan
kişilik özelliklerini görmemize yardımcı olur.
a) Projektif kişilik testleri: Açık olmayan uyarıcılara karşı bireyin gösterdiği
kişisel ve sübjektif tepkilere dayanır. Projektif (yansıtma) testlerde
resimler, mürekkep lekeleri, tamamlanmamış cümleler kullanılır.
b) Kişilik
envanterleri: Bireylerin psikolojik ihtiyaç ve değerlerini ölçer. Bunun
yanında bireylerin normal ve normal olmayan kişilik yönlerini belirlemeye de
yardımcı olur.
c. Uyum envanterleri: Bireyin çevresine
veya çevresindeki insanlara uyum düzeyin belirlemek üzere geliştirilmiştir.
d. İlgi envanterleri: Bireylerin
hoşlandıklarını ve hoşlanmadıklarını tanıyarak ileride doyum sağlayacağı alanları
meslek olarak seçmelerine yardımcı olmak amacı ile kullanılan ölçme
araçlarıdır.
B – Puanlama Biçim Bakımından
1 – Objektif Testler
Herkesin
puanlayabileceği, anahtarı daha önceden belirlenmiş testlerdir. Çoktan seçmeli,
doğru-yanlış ve eşleştirmeli testler objektif testler için örnek oluşturabilir.
2 – Subjektif Testler
Puanın,
puanlayıcının öznel kanı ve yargısından etkilendiği testlerdir. Sözlü ve yazılı
testler bu türden testlere örnek verilebilir.
C – Testi Hazıryalan Kişiler Açısından
1 – Öğretmen Yapımı Testler
Öğrencilerin
veya öğrenenlerin öğrenme düzeyini belirlemek için, sınıf atmosferi gibi
faktörleri göz önüne alarak öğretmenlerin kendi sınıf veya okulları için
hazırladıkları testlerdir. Sınıf öğretmeninin sınıftaki öğretimin etkililiğini
ölçmek ya da artırmak için geliştirdiği testlerdir.
2 – Standart Testler
Belli bir
alanda öğretilenlerin tümünü diğer değişkenlerden arınık olarak ölçmeyi
amaçlayan testlerdir. Daha
kapsamlı bir kullanış için uzmanlarca hazırlanır. İçerik, puanlama, yönergeler
ve yorumlama özgülleşmiştir.
Unutulmamalıdır
ki, başka ölçütler kullanarak testleri farklı şekilde gruplamak da mümkündür.
3.3 Değerlendirmede Kullanılan Ölçme
Araçları
|
Yazılı Yoklamalar
Tanım: Cevaplayıcının sorulan soruların cevaplarını düşünüp hatırlayarak ve hatırladığı cevabı organize edip yazılı
olarak sunduğu sınav türüdür. Kâğıt kalem veya essay tipi sınavlar da denir. Yazılı sınavlar kişinin özgün ve yaratıcı düşünce
gücünü, yazılı anlatım becerisini, belli
konulardaki görüşünü, ilgisini ve
tutumunu ölçmede kullanışlıdır. Yazılı
sınavı uygulamaları farklı şekillerde yapılabilir.
Bunlar;
1-Klasik yazılılar: Tanıma uygun olarak, günümüzde birçok öğretmenin
uyguladığı sınav tarzıdır.
2-Tercihli sınavlar: Sınav soruları arasında tercihli
sorular varsa bu tür sınavlara tercihli sınavlar denmektedir. Tercihli sınavlar birkaç biçimde
uygulanabilir. Örneğin, sorular konulara göre gruplandırılarak her gruptan belirli sayıda soru seçilip
cevaplandırılması istenebilir; belirli
soruları zorunlu tutarak yanında seçimlik sorular verilerek belirli sayıda da
seçimlik sorunun cevaplandırılması istenebilir ya da tüm sorular verilerek
bunlardan seçilecek belirli sayıda sorunun
cevaplandırılması istenebilir.
Yazılı yoklamalarda kullanılan çeşitli soru
tipleri vardır. Bunlar;
a-Sınırlı cevap soruları (Kısa cevap gerektiren sorular): Cevapları çoğunlukla sınırlı veya
kısa olan sorulardır. Verilecek cevabın niteliğine, uzunluğuna ve
örgütlenmesine ilişkin bazı sınırlamalar getirilir
(Listeleyin, tanımlayın, nedenlerini sıralayın gibi).
b-Serbest cevap soruları (Uzun cevap
gerektiren sorular veya açık uçlu sorular): Cevapları sınırlı olmayan, kompozisyon tipi sorulardır. Cevabın içerik, nitelik ve uzunluğunu
belirlemede cevaplayıcıya
belli ölçülerde özgürlük verilir (Yaratıcı düşünme gücü, bilgiyi örgütleme yeteneği, düşüncelerin iç tutarlığını ve dış tutarlığını
değerlendirme gücü gibi özelliklerin ölçülmesinde
kullanılabilirler). Bu tip sorulardan az sayıda sorulabildiğinden
kapsam geçerliğini düşürücü etkileri vardır. Ancak, kompozisyon
becerileri, sentez ve değerlendirme basamağındaki davranışlar, yaratıcılık ve
özgünlük gibi değişkenler ölçüleceği zaman zorunlu olarak kullanılması gereken
sorulardır.
c-Zorunlu cevaplı sorular: Bütün cevaplayıcılar tarafından
cevap verilmesi zorunlu olan
sorulardır.
d-Seçimlik sorular:
Cevaplandırılması cevaplayıcıların seçimine bırakılan sorulardır. Bazı durumlarda verilen bütün sorular arasından
belirlenen kadarının cevaplandırılması istenir. Bazı durumlarda da zorunlu
cevaplandırılacak soruların yanında seçimlik sorularda verilerek, zorunlu sorular yanında seçimlik sorulardan belirlenen
kadarının seçilip cevaplandırılması
istenir.
Yazılı sınavların özellikleri
1-Öğrenciler cevaplarını belirli bir
sürede yazmak zorunda olduklarından çok sayıda soru sorulamaz. Bu nedenle kapsam geçerliği düşüktür. Kapsam geçerliği önemli olduğu durumlarda yazılı sınav uygulamak
doğru olmaz.
2-Yazma hızı öğrenciler arasında
farklı olduğundan "yazı yazma hızı" gibi bir değişken ölçülecek değişkene karışarak geçerliği düşürebilir.
3- Soru sayısı az ve soruları yazma
zamanı kısa olduğundan hazırlanması kolaydır.
4-Puanlama süresi zaman aldığından
özellikle çok sayıda cevaplayıcının olduğu durumlarda, puanlayıcının kâğıtları
okumaya zamanı azsa veya sonuçların çabuk bildirilmesi gerekiyorsa yazılı sınavların kullanışlılığı
düşer.
5-Özellikle serbest cevaplı sorularda kesin doğru, kesin
yanlış ayrımı zor olduğundan kâğıdın okunması
ve puanlanması zaman alır. Bu durum yansız puanlama yapmayı da zorlaştırır.
Aynı zamanda öğrencileri birbiriyle karşılaştırmak da zorlaşır. Bu nedenle
güvenirlik düşer.
6-Öğrenciler cevaplarını
düşünüp hatırlayarak yazdıklarından,
bazı ölçmecilerce yazılı yoklamaların
davranışları daha geçerli ölçtüğü iddia edilmektedir.
7-Puanlama güvenirliği düşüktür.
8-Analiz, sentez ve değerlendirme gibi
üst düzey basamaklardaki davranışların ölçülmesine uygundur.
9-Cevaplamada özgürlük bulunduğundan,
cevaplayıcılar cevapları ve soruları isteyerek veya istemeden başka tarafa çekerlerse
bu durum puanlama farklılıklarına, dolayısıyla güvenirliğin düşmesine yol açar.
10-Şans başarısı
yoktur. Bu durum güvenirliği dolaysıyla geçerliği artırır.
11-Soruların güçlüğü,
testin geçerliği ve güvenirliği önceden kestirilemez.
12-Anlatımın duru,
yazının güzel, kâğıdın düzenli olması ve kompozisyon yeteneği puanlama yanlılıklarına neden olarak
güvenirliği düşürür. Aynı zamanda bu değişkenler ölçülecek değişkene karışarak geçerliği de düşürür.
13-Soruların belirginliği ve
anlaşılırlığı azaldıkça öğrenciler tarafından istenilen yere çekilme olasılığı artar.
14-Yazılı
sınav soruları şişirme yolla cevaplamaya elverişlidir.
Yazılı Sınav
Hazırlarken Dikkat Edilmesi Gereken Noktalar:
1-Sorular açık,
anlaşılır olmalı; cevaplayıcılar farklı şekilde algılanmamalı.
2-Mümkünse veya amaca uygunsa
açık uçlu sorular
yerine kısa cevap
gerektiren sorular sorulmalı.
3-Sorular birbirinden
bağımsız olarak cevaplandırılabilmeli. Her biri belirli bir davranışlar zincirini yoklamalı.
4-Soru ders kitabından veya bilinen bir
kaynaktan olduğu gibi alınmamalı (Ezberi yoklar ve geçerliği düşürür).
5-Sorularda ifade ve yazım hataları
bulunmamalıdır. Bu hatalar soruların yanlış anlaşılmasına sebep olabilir. "Adamın, eskiden ne yaptığı
ile ilgili bir kaygısı yoktu" ile "Adamın eskiden, ne yaptığı
ile ilgili bir kaygısı yoktu" farklı anlamlarda cümlelerdir.
6-Gereğinden
çok soru yazılmalıdır. Böylece sorular incelenerek düzeltilir ve uygun sorular
seçilir.
Yazılı
sınavlarının puanlanmasında değişik tekniklerden yararlanılabilir.
Yazılı Sınavlarını Puanlama Teknikleri
1-Genel İzlenimle
Puanlama: Puanlayıcının cevaplayıcının kâğıdını baştan sona okunduktan sonra
genel izlenimine göre bir puan vermesidir.
Özellikle kompozisyon kâğıtları genelde böyle puanlanır. Bu tekniğin puanlama güvenirliği düşüktür.
2-Sınıflama: Cevaplayıcıların
kâğıtlarına hızlıca göz atılarak "iyi, orta, zayıf” gibi sınıflara ayrılması
ve daha sonra bu
sınıflardaki kağıtların puanlanmasıdır. İstenirse bu sınıflar da kendi içinde
yeniden sınıflandırılabilir. Genel izlenime göre puanlama güvenirliği yüksektir
ancak yine de puanlama güvenirliğinin düşük olduğu söylenebilir.
3-Sıralama: Tüm cevaplayıcıların kâğıtları puanlayıcı
tarafından birbiriyle karşılaştırılarak en iyiden en zayıfa doğru sıraya konur.
Bütün kâğıtlar bu şekilde sıralandıktan sonra en iyi kâğıda en yüksek not,
diğerlerine de buna göre azalan puanlar
verilir. Puanlar ilk iki yöntemden daha güvenilirdir ancak yeterli puanlama güvenirliği olduğu söylenemez.
4-Anahtarla Puanlama: Cevaplayıcılardan beklenen
cevaplar listelenir. Bu listeye cevap anahtarı denir. Sonra bu listedeki cevaplara göre puanlama cetveli
oluşturulur. Puanlama cetveli ve cevap anahtarı kullanılarak yapılan puanlamaya anahtarla puanlama denir. Puanlar diğer
puanlama tekniklerine göre daha güvenilirdir yani daha az hatalıdır.
Puanlamada Dikkat Edilecek Noktalar
1-Ölçme konusu olmayan etkenlere puan verilmemelidir
(Yazı güzelliği, anlatım gücü vb).
2-Cevaplayıcıyı tanımaktan ileri
gelen puanlama yanlılığını önlemek için isimler kapatılmalıdır.
3-Bir sorunun iyi cevaplanmış olması
diğer sorulara verilecek puanı etkileyebileceğinden puanlama soru-soru yapılmalı. Her kâğıtta aynı soru
okunmalı ve puanlanmalıdır.
4-İyi bir öğrenciden sonra orta bir
öğrenci zayıf, zayıf bir öğrenciden sonra ise aksine iyi görünebilir. Bu etkiyi gidermek için kâğıtlar
sınıflandırılabilir.
5-Mümkünse birden fazla puanlayıcı
kullanılmalıdır.
6-Yorgunluk ve dikkat eksikliği başladığına okuma ve
puanlama bırakılmalıdır
7-Anahtarla puanlama imkânı yaratılmalıdır.
|
Sınıflama
Gerektiren Testler
Tanım: Cevaplayıcılardan soruları /
ifadeleri / maddeleri belli ölçüt(ler)e göre
sınıflamasının istendiği sınav türleridir. En çok uygulananı (bilineni) doğru
yanlış testleridir. Bu testlerde sorular doğru-yanlış önermeler olarak verilir.
Cevaplayıcılar önermeleri/ifadeleri doğru-yanlış olarak sınıflar. İki seçenekli
çoktan seçmeli testlere benzerler.
Madde Tipleri:
1-Doğru-yanlış önermelerden oluşan madde tipleri. 2-Önermeyi yanlış yapan ifadeyi işaretleten madde tipleri.
3-Önermelerin yanlış kısmını düzelttiren madde tipleri (Yanlış önermelerin doğrusunu yazması istenir).
4-İkiden fazla sınıflama gerektiren madde tipler. Aslında bu madde
tipleri doğru-yanlış testlerindeki şans başarısının azaltmak amacıyla geliştirilmiştir. Bu nedenle madde tipleri olarak
almak yerine doğru-yanlış testlerinde şans başarısını azaltmada alınacak önlemler olarak kabul edilebilir.
Özellikleri:
1- Cevaplar bir harf veya işaretle
verildiğinden puanlama hem kolaydır hem objektiftir.
2-Cevaplama zamanı hemen hemen ifadeleri okumaya
ayrıldığından (yani yazmaya ayrılan zaman az olduğundan) çok sayıda soru sorulabilir. Kapsam
geçerliği yüksektir.
3-Madde yapısı basit olmasına rağmen uygulama basamağına
kadar çeşitli düzeylerde davranışları
ölçebildiği söylenir.
4-Sınavda cevaplama işlemi, ölçülen
bilgi veya yeteneğin dışında bir zorluk getirmez. Bu nedenle ilköğretimin alt
basamaklarında da uygulanabilir.
5-Şans başarısı vardır ve diğer
seçmeli testlere göre en yüksek şans başarısına sahiptir
6-Öğrenme eksiklerini belirleme ve tanı
koymaya elverişli değildir (Örneğin yanlış olarak verilmiş bir ifadeyi yanlış diye
işaretleyen bir öğrencinin ifadenin doğrusunu bilip bilmediğinin kanıtı yoktur).
7-Bazı maddelerin yanlış olarak verilmesi test yapısı
için zorunlu fakat eğitim açısından sakıncalıdır.
Eğitimde yanlış cümleleri vermek ve onu vurgulamak öğrenme açısından sakıncalıdır. Önemli olan doğru olanı vurgulamak
ve onun öğrenilmesini sağlamaktır.
8-İfade mutlaka doğru ya da yanlış
olmalıdır. Oysa bazı özelliklerin ölçülmesinde kesin doğru ya da kesin yanlış yargılar
geliştirmek zordur. Bu güçlük doğru yanlış testi uygulayanları sadece bilgi basamağındaki davranışları ölçmeye yöneltir.
9-Sorulan hazırlamak ve puanlamak
kolaydır.
10-Yazı güzelliği, düzen gibi değişkenler işe
karışmadığından geçerlik yüksektir.
Soru Yazarken Dikkat Edilecek Noktalar
1-Her madde bir
davranışı yoklamalıdır (her ifadede bir ana fikir bulunmalıdır). Örneğin: "Güvenirlik madde sayısından etkilenmez."
2-Her madde kesinlikle doğru ya da
yanlış olmalıdır. Cevaplayıcıların ifadenin doğruluğu ve yanlışlığı hakkında karar verebilmesi
için gerekli minimum bilgi verilmelidir. İfadelerde (birçok, birkaç, bazen vb.) belgisiz sıfatlardan
kaçınmalıdır.
3-Önermenin doğru-yanlış olduğunu açığa vuracak
ipuçlarından sakınılmalıdır.
4-Bir maddede birden fazla yanlış ya
da doğru fikir bulunmamalıdır. Bu durumda madde kolaylaşır.
Bunun yerine ifade iki madde haline getirilmelidir.
5-Doğru-yanlış ifadelerin uzunlukları birbirine yakın
olmalıdır.
6-Doğru-yanlış maddelerin sayıları birbirine yakın
olmalıdır.
7-Doğru-yanlış
maddeler testlere belirli bir örüntü halinde yerleştirilmemelidir (İki doğru,
bir yanlış vb. gibi).
8-Bir maddenin yanlışlığı önemsiz
veya aldatıcı bir noktada olmamalıdır.
Örneğin, "Fransız ihtilali 1879 tarihinde gerçekleşmiştir." Bu tip maddeler
dikkati ölçtüğünden geçerliği düşürür.
10-Çift olumsuzlama
kullanılmamalıdır. İfadenin anlaşılmasını zorlaştırır. Bunlardan kurtulmanın yolu cümleyi olumlu ifade
etmektir. Örnek:"Geçerliğin düşüklüğü testin güvenilir olmaması değildir."
11-Doğru bir önermeden yanlış bir
önerme elde etmek için cümlenin fiilinin olumsuz hale getirme yoluna gidilmemelidir. Böyle
maddelerde "me, ma" olumsuzluk ekleri gözden kaçabilir. Üstelik böyle maddelerin yanlış olduğu, zorla
yanlış hale getirildiği anlaşılabilir.
12-Maddelerdeki ifadeler bilinen
bir kaynaktan alınmamalıdır.
13-Kanı ifadeleri bir kaynağa yâda
otoriteye dayandırılarak verilmelidir.
14-Birbiriyle ilgili maddeler
örgütlenerek sunulmalıdır. Örneğin: "Aşağıda doğru yanlış maddeleri ile ilgili olarak verilen ifadeleri
okuyarak karşılarına doğru ise 'D', yanlış ise 'Y' harfi koyunuz.
—Puanlama nesneldir.
—Geniş kapsamda soru
sormaya elverişlidir.
—Sentez ve
değerlendirme basamağında davranış ölçmek için çok kullanılır.)
|
Ödev
Ve Projeler
Tanım: Öğrencilerin soru veya konuları
ders dışında kendi çabalarıyla çözmesi / araştırması;
bir inceleme yaparak sonucunu rapor halinde yazabilmesi; bir konuyu derinlemesine
araştırması; araştırma, bağımsız çalışma, yaratıcı düşünme, farklı kaynaklar kullanabilme, yardım alma becerilerinin
geliştirilmesi; uygulama ve üst düzeydeki davranışların geliştirilmesi
ve ölçülmesi vb. amacıyla kullanılan araçlardır.
Ödevler-projeler
bazı ölçmecilerce bir ölçme yöntemi olarak kabul edilmez. Ancak ödev ve projelerdeki
başarı genel başarının
önemli bir yönünü yansıtır ve tanımdaki amaçlar eğitimin amaçları arasındadır. Bazı ölçmeciler ise
yukarıdaki görüşün aksine ödev ve proje uygulamaları sonucunda sınav kaygısından uzak,
gerçeğe daha yakın bir davranış ölçüsünün elde edileceğini savunur. Bu görüşte de gerçek payı vardır.
Ancak bu uygulamalar gözetimden uzak yapıldığından puanların geçerliği şüphelidir. Ödev öğrencinin
kendisi tarafından yapılmamış olabilir. Bu
tür uygulamalar iyi bir ölçme yöntemi olmasa da iyi bir kendi kendine öğrenme
yöntemidir. Puan verilmediği zaman yeterli etkiyi gösterememe riskini önlemek
için puan verilmeli ama sakıncalarından
dolayı nota katılacak ağırlığı düşük olmalıdır.
Türleri:
1-Bireyse ödev veya projeler.
2-Grup ödevleri veya projeleri
Uygulama Şekilleri:
1-Herkese aynı konu ya da sorunun
verilmesi,
2-Kişilere veya gruplara farklı konu
ya da soruların verilmesi.
Özellikleri
1-Tanımda sayılan becerilerin geliştirilmesi ve ölçülmesi
amaçlarına uygundur. Bu amaçların ölçülmesi ve geliştirilmesi için faydalı hatta zorunludur.
2-Özellikle grup ödevleri görev bilgiyi
paylaşma, görev alma, yardımlaşma-dayanışma, sorumluluk alma, eleştiri ve özeleştiri yapma, empatik
düşünme, hesap verme vb. davranışların
geliştirilmesi ve ölçülmesi için uygundur.
3-Ödev-projelerin öğrencilerin
kendileri tarafından yapılıp yapılmadığının kontrolü zordur.
Bu nedenle önlemler alarak kullanmak, kontrolü sağlamak yararlı olabilir.
4-Verilen puanların geçerliği
düşüktür.
5-Puanlama güvenirliği düşüktür.
Öğretmen kanıları işe diğer sınav türlerinde daha fazla karışmaktadır. Bu yönüyle yazılı
sınavlara benzer.
6-Öğrencilere verilen konu veya soruların güçlüklerin
ayarlamak zordur. Bu nedenle verilen puanlarla
öğrencileri karşılaştırmak da zordur.
7-Derste öğrenilen-öğretilen
davranışların ölçülmesi için uygun bir yöntem değildir.
Uygulamada
Dikkat Edilecek Noktalar
1-Her öğrenciye ya da gruba farklı
konu veya soruların verilmesi amaca daha fazla hizmet edebilir.
2-Ödev veya projeler öğrencilerin
ilgilerine göre dağıtılırsa veya kendilerinin seçmelerine izin verilirse beklenen faydanın
sağlanma olasılığı artar.
3-Verilen konular öğrencilerin
üstesinden kalkabilecekleri bir güçlükte olmalıdır.
4-İnceleme/araştırma amacıyla
yararlanabilecek muhtemel kaynaklar ve bulunabilecekleri yerler belirtilmelidir.
5-Konunun kapsamı
açıkça belirtilmeli, sınırlan çizilmelidir.
6-Puanlama bir anahtara
göre yapılmalıdır. Bu nedenle bir anahtar hazırlanmalıdır.
|
Kısa Cevaplı Testler
Tanım:
Bir kelime, bir rakam, bir cümle veya kısa bir liste ile cevaplandırılabilecek
sorulardan oluşan, cevaplayıcının cevabı
düşünüp hatırlayarak yazılı olarak sunduğu ölçme araçlarına kısa cevaplı
testler denir.
Cevapların
düşünüp hatırlanması ve yazılması bakımından yazılı sınavlara; puanlama
kolaylığı ve objektifliği bakımından çoktan seçmeli testlere benzer.
Soru
Türleri:
1-Soru Kipinde Sorular:
Madde soru cümlesi biçimindedir. “Kim, nasıl, niçin, nerede vb.” soru kipleri
ile biten cümlelerden oluşur.
ÖR: “Bir ölçme aracında aranması
gereken en önemli nitelik hangisidir?”
2-Eksik Cümle Tipinde (Boşluk
Doldurmalı) Sorular: Öğrencilerden ifadelerde, cümlelerde veya
paragraflarda bırakılan boşluk ya da boşluklara uyan kelimeyi veya cümleyi
(kelimeler veya cümleleri, sayıları vb.) yazması beklenen sınav türüdür.
ÖR: “Ölçek türlerinden, .... ....
her işlemi yapmaya uygundur.” Cümledeki boşluğa uygun kavramı yazınız.
3-Tanımlamayı Gerektiren
Sorular: Bu tip sorularda bir kavramın tanımı, bir tanımı belirten kavram
veya bir olgunun belirgin özelliklerinin yazılması istenir.
ÖR: “Random (tesadüfî) hatayı
tanımlayınız.”
4-Tanımayı Gerektiren Sorular:
Bu tip sorularda bir bilginin, kavramın, tanımın, özelliklerin veya işlem
basamaklarının tanınması istenir.
ÖR: “Bu çalışmada, testin
tanımlanan yapıya uygun, soruların birbiriyle ve test puanlarıyla ilişkilerinin
yüksek olup olmadığına bakılmıştır.”
Yukarıda yapılan çalışmada
çalışılan geçerlik türleri nelerdir?
Özellikler:
1-Cevaplayıcı cevabını düşünüp
bularak yazmak zorundadır. Şans başarısı olmadığından güvenirlik yükselir.
2-Cevaplayıcı istediği cevabı
verme özgürlüğüne sahiptir ancak yazılı sınav sorularına verilen cevaplarda
olduğu gibi şişirme yapamaz.
3-Uygulama ve analiz düzeyine
kadar davranışlar yoklanabilir. Bu nedenle kullanışlıdır.
4-Her eğitim düzeyine uygun düşen
sınav tipidir. Her yaştaki öğrenciye uygulanabilir. Bu sebeple kullanışlıdır.
5-Puanlama göreceli kolaydır ama
tamamen objektif (nesnel) olmayabilir. Kullanışlıdır ve kısmen de güvenilirdir.
6-Çok soru sorulabileceğinden
kapsam geçerliği yazılı yoklamalardan yüksektir.
7-Cevaplar kısa ve belirgin
olduğundan puanlama güvenirliği yazılı yoklamalara göre yüksektir. Bu sebeple
güvenirlik artar.
8-Fikirleri kompoze etme, yazı
güzelliği, kâğıdın düzeni gibi etkenler ölçmeye daha az karışacağından
geçerliği yazılı yoklamalardan yüksektir.
9-Soruları hazırlama ve puanlama
kolaydır. Bu nedenle kullanışlıdır.
10-Şans başarısı yoktur. Bu
nedenle güvenirlik artar.
11-Testi tekrar kullanma imkânı
ayrı bir cevap kâğıdı kullanılarak yaratılabilir. Bu durumda kullanışlılık
artar.
12-Sorularda şekil, harita ve
grafiklerden faydalanılabilir. Bu sebeple testin kullanışlılığı yükselir.
Soru
Yazarken Dikkat Edilecek Noktalar:
1-Yoklanmak istenen davranış
önemli bir davranış olmalıdır. Kıyıda köşede kalmış bilgiler yoklanmamalıdır.
2-Maddenin cevaplanabilmesi, bu
madde ile yoklanan davranışın beklenen derecede öğrenilmiş olmasını
gerektirmeli ve sadece buna bağlı olmalıdır.
3-Cevaplayıcıların cevabı
bulabilmesi için gerekli bilgiler eksiksiz verilmiş olmalı, cevaplama için
gereksiz ve şaşırtıcı bilgiler bulunmamalıdır.
4-Cevaplayıcıların cevabı
bulmalarına yardımcı olabilecek ipuçları bulunmamalıdır.
5-Maddenin tek ve kesin doğru
cevabı olmalıdır. Birden fazla cevap var ise ayrı puanlanmalıdır.
6-Madde açık, seçik ve kolay
anlaşılır bir ifadeyle sunulmalıdır.
7-Eksik cümle (Boşluklu)
maddelerinde, eksik olanın ne olduğu açıkça anlaşılmalıdır. Boş bırakılan yer/ler
belirsizliğe yol açmamalıdır.
8-Maddeyi oluşturan cümle
cevaplayıcıların bildiği bir kaynaktan aynen alınmamalıdır.
9-Testte yer alan maddeler
birbirini cevaplandırmayı kolaylaştırıcı veya zorlaştırıcı olmamalıdır.
Maddeler birbirinden bağımsız olmalıdır.
10-Her bir madde ile sadece bir
davranış yoklanmalıdır.
11-Eksik cümle maddelerinde
bırakılan boşluklar aynı boyutta olmalıdır.
12-Eksik cümle maddelerinde
bırakılan boşluk sayısı tercihen bir, en fazla iki olmalıdır.
13-Cevap yeri olarak bırakılan
boşluklar cevaplamayı ve puanlamayı kolaylaştıracak biçimde düzenlenmelidir.
14-Cevap yerleri aynı boyutta,
tek tip olmalıdır.
|
Sözlü Sınavlar
Tanım:
Soruların sözlü olarak sorulup, cevaplayıcının cevaplarını düşünüp hatırlayarak
sözlü olarak sunduğu sınav türleridir. Sözlü yoklamalar da denir. Birçok soru
tipi kullanılabilir. Uygulanmasında çeşitlilik görünmekte belirli
standartlardan uzak sınavlardır. Bu nedenle sınav türlerini sınıflamak zor
olmaktadır.
Kullanıldığı
alanlar:
1-Okul öncesi ve ilköğretimin ilk
yıllarında yararlanılmalıdır.
2-Konuşma becerileri, sözlü
anlatım gücü gibi özellikleri ölçmede kullanılabilir.
3-Müzik alanındaki becerileri
ölçmede de kullanılabilir.
4-Yabancı dil konuşma becerisini
belirlemede kullanılır.
Özellikleri:
1-Sorular ve cevaplar sözlü
olarak sunulur.
2-Cevaplayıcı cevabını düşünüp bulmak zorundadır. Şans başarısı
olmaması güvenirliği artırır.
3-Cevaplayıcının cevabında
belirsiz kalan noktaların deşilmesi yoluyla bilginin derinlemesine ve
genişlemesine ölçülmesi mümkündür.
4-Soruların hazırlanması diğer
sınavlara göre daha kolaydır ve daha az zaman alır. Bu nedenlerle
kullanışlılığı yükselir.
5-Sınav yapanla cevaplayıcı
arasında diğer sınavlara göre daha fazla etkileşim vardır. Sınav yapanın sınav anındaki durumu öğrenciyi
etkilediğinden geçerliği ve güvenirliği düşüktür.
6-Cevaplayıcının cevaplama
anındaki durumu (ses tonu, cevaplama tarzı, duruşu vb.) puanlayıcıyı olumlu ya
da olumsuz etkileyerek puanlama güvenirliğini düşürür.
7-Sözlü sınavlar bireyseldir. Her
öğrenciye ayrı soru sorulur. Soruların kapsamı ve güçlükleri farklı olacağından
puanların karşılaştırılabilirliği, güvenirliği ve geçerliği düşer.
8-Cevaplama, sorudan hemen sonra
yapıldığından öğrencinin düşünme ve cevabını gözden geçirme şansı çoğunlukla
yoktur. Bu durum geçerliği ve güvenirliği düşürür.
9-Az soru sorulduğundan kapsam
geçerliği düşüktür.
10-Her cevaplayıcıya ayrı soru
sorma zorunluluğu vardır. Bu sebeple kullanışlı değildir.
11-Cevapların doğruluk derecesini
puanlayıcı belirler. Bu da puanlama güçlüğü ve yanlılığını getirir. Bu da
güvenirliği düşürür.
12-Sınav yapan sevmediklerine
kasıtlı davranabilir. Güvenirlik düşer.
Aksak
Yanları:
1-Bir sorunun ancak bir
cevaplayıcıya sorulması; cevap yanlış da olsa başka cevaplayıcıya sorulamaması,
2-Az sayıda soru sorulmasının
güvenirliği ve geçerliği düşürmesi,
3-Puanlama güvenirliğinin genelde
düşük olması,
4-Özellikle ölçülmediği
durumlarda konuşma diline hâkimiyet, sözlü anlatım gücü gibi değişkenlerin
ölçülecek değişkene karışarak geçerliği düşürmesi,
5-Cevaplayıcıya fazla zaman
verilmemesi,
6-Soruyu soranla cevaplayıcının
etkileşim içinde olması,
7-Heyecan-sıkılma-korku gibi
etmenlerle soruyu soranın ses tonu-jest ve mimikleri veya cevaplayıcıya karşı
takındığı tavrın geçerliği düşürmesi olarak sayılabilir.
Çoktan Seçmeli Testler
|
Tanım: Cevaplayıcının
cevabını, (sorunun doğru cevabı olasılığı olan) birtakım seçenekler arasından seçerek vermesini
gerektiren sorulardan oluşan testlerdir.
Doğru yanlış testleri seçenek sayısı iki olan çoktan seçmeli test olarak kabul
edilir. Seçmeli testlerde sorulara madde denir. Madde, testin
puanlanabilen en küçük birimidir.
Bir
madde, kök ve seçeneklerden oluşur. Kök sorunun sorulduğu ve çözüm için gerekli bilgilerin verildiği
kısımdır. Seçenekler ise öğrenci için olası cevaplardır. Doğru seçeneğe doğru cevap, yanlış
seçeneklere ise çeldirici adı verilir. Çeldiriciler, madde ile ölçülmek istenen davranışa sahip
olmayanların veya doğru cevabı bilmeyenlerin aklını çelmek, onları yanıltmak amacıyla
yazılmış, doğru olmayan seçeneklerdir.
Madde
Türleri:
1Doğru
Cevaba Göre:
a)Doğru cevabı kesin ve bir tane olan maddeler:
Maddenin seçeneklerinden sadece biri doğru
diğerleri kesinlikle yanlış olan maddelerdir. Sıkça kullanılan madde
tiplerindendir.
b)Anahtarlanmış cevabı en doğru olan maddeler:
Seçeneklerin tümü kısmen doğru olan fakat
biri diğerlerinden daha doğru olan madde tipidir. Bu tip maddelerle daha ileri
düzey davranışlar daha kolay ölçülebilir. Bu tip maddelerde çeldiriciler doğru
cevaba yakındır.
c)Bileşik cevap gerektiren maddeler: Bir
maddenin birden fazla doğru cevabı olduğunda
kullanılan madde türüdür. Bu tip maddeler çok kullanışlıdır. Hem ileri düzey
davranışların ölçülmesinde hem de seçenek bulma zorlaştığında kullanılabilir.
d)Doğru cevabı gizli maddeler: Çoktan seçmeli maddelerin en zayıf
yönlerinden biri, kişinin doğru cevabı
bilmediği halde verilen seçenekler arasında onu gördüğünde tanımasıdır. Bazı hatırlamaların bilgiyi akla getirmesi veya
davranışın gerektirdiği işlem ve düşünceden farklı bir yolla akla getirmeyi önlemek için maddenin cevabı gizlenir.
2-Madde Köküne Göre:
a)Kökü
soru kipinde olan maddeler: Madde kökü soru kelimeleri ile ifade
edilmektedir.
b)Kökü
eksik cümle tipinde olan maddeler: Kökte bir harf, kelime, sembol veya
cümle yazılmayarak boş bırakılır. Verilmesi
gereken cevabın, yani bu boşluğa yazılması gereken cevabın, cevaplayıcının
verilenler arasından seçmesi istenir. Bırakılacak boşluğun o soru ile
ölçülmek istenen davranışı yoklayıcı nitelikte olması gerekir.
c)Kökü olumsuz maddeler: Madde kökünün
olumsuz olarak ifade edildiği madde türüdür.
Olumsuz madde bir sorunun birkaç doğru cevabı bulunduğu durumlarda kullanılır. Olumsuz madde olumlu maddeler içinde yer aldığında
olumlu madde gibi görülebilir. Bu nedenle olumsuz ifadenin koyu, altı
çizili vb. yazılması yoluyla olumsuzluğa dikkat çekerek, dikkatsizlikten kaynaklanacak hataların önüne
geçilir.
3-Maddelerin
Gruplanışına Göre:
a)Ortak
köklü maddeler: Bir paragraf, bir tablo, bir grafik veya harita gibi bir materyalden iki ya da daha fazla
sorunun sorulduğu maddelerdir. Bu tip maddeler, okuduğunu anlama, sayılar arasındaki ilişkiler ve bilginin
ötelenmesi(transferi)ni içeren davranışların yoklanmasında
çok kullanılır. Bu tip maddeleri yazarken dikkate alınacak en önemli noktalar, soruların
madde kökündeki bilgiye dayalı olması ve birbirinden bağımsız olması olarak düşünülebilir. Soruların bağımsız olmasının
sağlanmadığı sık sık görülür. Bu şans başarısını artıran bir hatadır. Ortak köke dayalı olarak sorulan madde sayısı çok
olmamalıdır. Bu durumda soruların bağımsızlığını sağlamak zorlaşır. Sorulacak
soru sayısı konusundan bir kural olmamasına rağmen beşi geçmemesi önerilir.
b)Ortak seçenekli maddeler: Bazı hallerde birden çok davranışın
yoklanmasında aynı seçeneklerin kullanılması
gerekebilir. Böyle durumda seçenekler başa yazılır. Madde köklerindeki
sorular bu seçeneklere göre cevaplandırılır. Bu tip maddelere ortak seçenekli maddeler denir. Bu tip maddeler yazma-okuma zamanı
ve basılı kâğıt miktarında ekonomi sağlar.-Bu
tip maddeleri yazarken seçenek sayısı ile soru sayısının eşit tutulmamasında
yarar vardır. Bu durumda sonuncu sorunun cevabı geriye kalan seçenek olacaktır.
Genel olarak soru sayısının seçenek
sayısından az olması veya bir seçeneğin doğru cevap olarak birden fazla kullanılması önerilir.
Özellikleri:
1 -Doğru cevap
maddenin içinde verilir. Diğer sınav türlerinde böyle bir durum yoktur. Doğru cevabın madde içinde verilmesi, ölçülen davranışa
yeterince sahip olmayanların doğru cevabı görünce
tanımalarını sağladığından; bazı uzmanlar, çoktan seçmeli soruların ileri
düzeydeki karmaşık davranışları
ölçmede yetersiz kaldığını ileri sürerler. Yapılandırılmış olduklarından özellikle yaratıcılık gibi davranışları ölçemezler.
Bu durum kullanışlılığı azaltır.
2-Sınav süresinin önemli bir
kısmı maddeyi okumaya ve doğru cevabı bulmaya ayrılır. Yazma süresi az olduğundan çok soru sorulabilir. Bu durum
kapsam geçerliğini ve dolaylı olarak güvenirliği artırır.
3-Yazı güzelliği, kompozisyon
yeteneği gibi değişkenler işe karışmadığından geçerliği yüksektir.
4-Puanlama objektif ve kolaydır.
Objektif puanlama, bir puanlayıcının cevap kâğıtlarını farklı zamanlarda ve farklı puanlayıcıların da farklı
zamanlarda aynı cevap kâğıtlarını okumaları durumunda puanların değişmemesidir. Çoktan seçmeli testlerde
cevaplayıcının cevabı ve doğru cevap
okuyan kişiye göre değişmez. Bu nedenle puanlama güvenirliği tamdır.
5-Şans başarısı vardır. Bu durum
güvenirliği düşürür. Ancak seçenek sayısının çokluğu şans başarısını azaltır.
Bu nedenle az seçenek yerine çok seçenek yazmak güvenirliği artırır. Ancak
zorlama yazılan seçenekler yazmak bu amaca hizmet edemez.
6-Her ne
kadar bazı ölçmeciler aksini iddia etse de çoktan seçmeli testlerle ileri düzey
davranışların ölçülmesi zordur. Özellikle sentez basamağındaki davranışlar ölçülemez.
7-Uygulanması kolaydır. Bu nedenle, eğitim
basamaklarının çoğunda (basit madde formu kullanmak
şartıyla ilköğretim 3. sınıftan itibaren) uygulanabilir. İlköğretimdeki kullanımlarında ayrı cevap kâğıdı kullanılmaması
önerilir (Dikkatsizliğin getireceği hataları önlemek amacıyla).
8-Hazırlanması zordur.
Soru yazma tekniklerinin bilinmesi ve deneyimi gerektirir. Kullanışlık
düşer.
9-Geniş gruplara
uygulanabilir ve makine ile puanlanabilir. Kullanışlık yükselir.
10-Cevaplama sadece
işaret ile yapılmaktadır. Bu uygulama zamanını kısaltır. Uygulama zamanının kısa oluşu cevaplayıcının
dikkatinin dağılmadan cevaplamayı tamamlamasına olanak verir.
11-Önceden saptanan
özelliklerde sınav yapılması mümkündür. İstatistiksel temellere dayanır. Bu temeller, üzerinde çok
çalışılmış, formülleri geliştirilmiş ilkelerdir. Maddelerle testin bütününü birbirine bağlayan istatistiksel
eşitlikler kurulmuştur. Bu eşitlikler sayesinde maddeleri önceden deneyerek test puanlarının ortalaması, değişkenliği,
güvenirliği vb. yaklaşık olarak
hesaplanabilir.
12-Özelliklerinin çoğu geçerliği, güvenirliği
ve kullanışlılığı artırıcı yöndedir.
13-Çoktan seçmeli testlerde
okuduğunun anlama ve okuma hızı gibi bir değişken de işe karışır. Yeterli zaman
verilerek bu
değişkenlerin etkisi giderilebilir.
14-Maddeler açık,
yalın ve anlaşılır bir dille yazılmalıdır. (İstisnası okuduğunu anlama ve hız
testlerinde mümkündür.)
Soru
Yazmada Dikkat Edilecek Noktalar
1-Madde bir davranışı
yoklamalı ve yoklayacağı davranışa sahip olanların doğru cevabı verebilmeleri için gerekli
bilgileri kapsamalıdır.
2 Madde kökü olabildiğince
açık-seçik ifade edilmiş olmalıdır. Kök hiçbir yoruma meydan vermeyecek açıklıkta
yazılmalıdır. Bu durum maddenin
güvenirliğini düşürür. Soruyu zorlaştırmak için kökte belirsizlikler bırakılmamalı veya
şaşırtma yoluna gidilmemelidir. Soru zorlaştırılacaksa seçenekler doğru cevaba
yakınlaştırılmalıdır.
3-Madde kökünde
gereksiz ifade ve açıklamalardan (anlaşılırlığa katkısı olmayan kelimelerden) kaçınılmalıdır. Madde
kökünde ölçülecek davranışı ortaya koyan ifadeler bulunmalıdır.
4-Madde kökünde seçeneklerden herhangi
birine ipucu veren ifadeler kullanılmamalıdır.
5-Seçeneklerde tekrar
eden kelimeler madde köküne alınmalı ve tekrar edilmemelidir. Yani seçenekler mümkün olduğunca kısa
olmalıdır.
6-Her test maddesi diğerlerinden bağımsız
cevaplandırılacak şekilde yazılmalıdır.
7-Madde noktalama ve yazım kurallarına uygun
yazılmalıdır.
8-Seçeneklerin uzunlukları
birbirine yakın olmalıdır. Seçenekler
ifade tarzı ve kapsam bakımından
birbirine yakın olmalıdır.
9-Çeldiricilerin doğru cevaba yakınlığı
maddenin düşünülen güçlüğüne paralel olmalıdır.
10-"Yukarıdakilerin
hepsi" seçeneği dikkatle kullanılmalıdır. Seçeneklerin birbirine çok yakın
olduğu hallerde
kullanılabilir. Seçeneklerden birinin yanlışlığının açık olması (bu durumda yukarıdakilerin hepsi seçeneği elenir) veya seçeneklerden
birinin doğru olduğunun görülmesi (bu durumda diğer seçenekler elenir)
hallerinde güvenirliği düşürücü etki yapar.
11-"Yukarıdakilerin
hiçbiri" seçeneği de dikkatli kullanılmalıdır. Bu seçenek doğru cevap
olarak kullanılmamalıdır. Doğru cevap olarak kullanılırsa, cevaplayıcının
davranışa sahip olup olmadığı anlaşılamaz.
Kesin bir doğru cevabı olan maddelerde çeldirici olarak kullanılabilir.
12-Birçok madde türünde
"Yukarıdakilerin hepsi" ve "yukarıdakilerin hiçbiri" aynı
madde içinde seçenek olarak kullanılmamalıdır. Kullanılırsa ikisi birden elenir. Mantıksal olarak
ikisinin aynı anda doğru olması
mümkün değildir.
13-Seçenekler arasında
büyüklük sırası varsa bunlar sıralı olarak verilmelidir.
14-Seçenek sayısı
uygulama yapılan cevaplayıcıların düzeyine uygun olmalı, ilköğretim ikinci sınıfta uygulanırsa (ki
önerilmez) iki seçenekli, ilköğretim 3, 4, 5 üç seçenekli, 6, 7, 8 dört seçenekli ve ortaöğretimle yüksek öğretimde beş
seçenekli testler kullanılabilir.
15-Seçenekler birbirinden bağımsız
olmalı, biri diğerini içermemeli, ipucu olmamalıdır.
Böyle bir zorunluluk varsa bileşik cevap gerektiren soru
tipi kullanılmalıdır.
16-Testteki tüm maddelerin seçenek
sayıları aynı olmalıdır.
17-İyi bir test maddesinin madde kökü
okunduğunda seçeneklere bakılmaksızın davranışa sahip olan cevaplayıcı doğru
cevabı verebilmelidir.
18-Çeldirici bulmada güçlük
çekildiğinde madde formu değiştirilmelidir.
19-Doğru cevaplar test içine belli
bir örüntüde yerleştirilmemelidir. Maddelerin doğru cevaplarının yeri belirli bir düzene bağlı olmamalıdır.
20-Doğru cevaplar seçeneklere
yaklaşık olarak eşit dağıtılmalıdır.
21-Olumsuz maddeler olumlu algılanma
riskine karşı, olumsuzluk ifadesinin altını çizme, koyu yazma vb. yoluyla
belirginleştirilmelidir.
22-Maddeler arasında ve madde kökü
ile seçenekler arasında belirli bir boşluk bırakılmalıdır.
23-Ortak köklü ve ortak seçenekli
maddeler başlangıç ve bitimlerinde diğer sorularla karıştırılmaması için çizgi ile
ayrılabilir. Ayrıca bu tip soruların ortak olan kök ve seçenekler ile aynı sayfada olması dikkatin
dağılmasını önleyebilir.
24-Testin ilk sorularının kolay
olması cevaplayıcıyı güdüler.
25-Yazı büyüklüğü uygulanan
kişilerin düzeyine uygun olmalıdır.
26-Aynı seçeneğe art arda çok
sayıda doğru cevap getirilmemelidir.
27-Maddelerdeki ifadeler bilinen
bir kaynaktan olduğu gibi alınmamalıdır.
28-Her test maddesi önemli bir
davranışı yoklamalıdır.
29-Çeldiriciler davranışa sahip olmayanları yanıltmalı
fakat sahip olanları yanıltmamalıdır.
30-Birbirinin zıddı olan
seçeneklerin kullanılmaması gerekir.
Puanlama
a) 1-0 puanlaması, b)Maddelerin kolaylık ve
zorluğuna göre puan vermek, c)Maddelerin ölçtüğü yeteneğe göre puan vermek, d)Madde seçeneklerine
doğruluk derecesine
göre ağırlık vererek puanlamak.
Bütün
ölçme araçlarında uyulması gereken kurallar
1-Sorular açık ve anlaşılır
olmalıdır.
2-Sorularda bilimsel hata
bulunmamalıdır.
3-Sorularda dil ve anlatım bozukluğu
olmamalıdır.
4-Soruların cevaplandırılması için
herkese aynı süre verilmelidir.
5-Cevaplamayla ilgili ve gerektiği
durumlarda puanlama ile ilgili bir yönerge verilmelidir.
6-Sorular birbirinden bağımsız
olarak cevaplandırılabilecek bir yapıda olmalıdır. Bir sorunun doğru ya da
yanlış cevaplandırılması başka bir sorunun doğru ya da yanlış cevaplandırılmasını
etkilememelidir.
7-Her soru önemli bir davranışı
yoklamalı, önemsiz ayrıntılar üzerinde durulmamalıdır.
8-Soruların kökünde davranışa sahip
olmayan cevaplayıcıları doğru cevaba götürecek ipuçları verilmemelidir.
9-Aksi gerekmedikçe her soru bir
davranışı yoklamalıdır.
|
Dereceleme Ölçekleri (Rubric’ler)
Dereceleme
ölçekleri performans değerlendirmede öğrencileri puanlama amacı ile kullanılan
ölçme araçlarından biridir. Dereceleme ölçekleri, performansı tanımlayan ve
herhangi bir çalışmanın puanlanması için geliştirilmiş ölçütleri içeren bir
araçtır. Dereceleme ölçekleri, bir ölçme veya etkinliğin tamamının ya da
bölümlerinin nasıl puanlanacağının ana hatlarıyla gösterilmesidir. Başka bir
tanımıyla dereceleme ölçekleri; kabul edilebilir ya da edilemez performans
sınırlarının öğretmen ve öğrenciler için açıkça belirtildiği kriter grubu
ölçeğidir. En kullanışlı
dereceleme ölçekleri ölçme ve değerlendirme yapacak kişinin kendi yaptığı
dereceleme ölçeğidir. Derecemle ölçekleri bir ölçme sürecinin tamamının ya da
bölümlerinin nasıl puanlanacağını ana hatlarıyla gösterebilir. Öğrenciden
beklenen performansın tüm boyutlarını dikkate alarak puanlama yapmak amacı ile
kullanılırlar. Dereceleme ölçekleri, öğrencinin bir kavrama ilişkin bilgisini,
bir ürünü belirlenen ölçütlere uygun olarak ortaya koyma becerisini, verilen
bir görevi yapma sürecinde uyulması gereken aşamalı adımları yerine getirmedeki
ustalığını veya verilen bir ödevi yapmadaki yeterlik düzeyini belirlemede kullanılabilirler.
Dereceleme ölçekleri kullanılırken, öğrencilerden beklenen performansların iyi
tanımlanması veya sınırlarının iyi çizilmesi gereklidir. Bu amaçla
öğrencilerden beklenen performans belli kategoriye ayrılabilir ve her
kategorideki ölçütler ayrıntılı olarak belirlenebilir.
Dereceleme
ölçeklerinin bütüncül (holistic) ve analitik (analytical) olmak üzere iki
biçimi vardır. Bütüncül dereceleme ölçekleriyle performansın genel sürecinin
veya ürünün bir bütün olarak (parçalarını dikkate almadan) puanlaması, analitik
dereceleme ölçekleriyle önce performansın genel sürecinin veya ürünün
parçalarının ayrı ayrı puanlaması ve sonra da bu kısmî puanların toplanarak
toplam puana ulaşılması söz konusudur. Analitik dereceleme ölçeklerini
kullananlar öğrencilerin verdiği bütün cevapları incelemeli ve belirlenmiş
ölçütlere göre puanlamalıdır. Böylece yanlılığın az olması beklenebilir.
Analitik dereceleme ölçekleri üründen çok süreçle ilgilenmektedir. Bu nedenle
öğrenme eksikliği ya da davranış bozukluğu olan öğrencilerde kullanılması iyi sonuç
vermeyebilir. Bütüncül dereceleme ölçekleri öğrencinin cevabı bütüncül olarak
değerlendirileceği zaman kullanılır. Bütüncül dereceleme ölçekleri süreçten çok
ürünle ilgilenir. Bütüncül dereceleme ölçekleri puanlama ölçütleri bir
problemin çözümünün önemli bölümleriyle ilgili olmalıdır. Uygun durumlarda
farklı açılardan (biri süreç, diğeri ürün) değerlendirmeye olanak
tanıdıklarından dolayı analitik ve bütüncül dereceleme ölçekleri birlikte
kullanılabilirler.
Dereceleme
ölçekleri yazılı sınavların puanlanmasında kullanılan anahtarlara ya da ürün ve
süreç değerlendirilmesi için kullanılan gözlem ölçekleriyle kontrol listelerine
benzer. Dereceleme ölçeklerinde her bir kazanım veya davranış için kriterlerin
mükemmelden kötüye kadar derecelenmesi söz konusudur ve her derece için
performans ölçütlerinin ayrıntılı tanımlanması gerekir.
Dereceleme ölçeklerini kullanma nedenleri
1-İyi bir ürünün nasıl olacağı
konusunda öğretmen ve öğrenci için açık ve anlaşılır bir tanım verir.
2-Öğrencilerin üstlendikleri görevlerde,
görevleri yerine getirmede, ortaya koydukları ürünlerde ve bunların
değerlendirilmesinde daha fazla sorumluluk duymalarını veya almalarını sağlar.
3-Öğretmenin öğrenci çalışmalarını veya
ürünlerini değerlendirmelerini kolaylaştırır.
4-Öğrencilere, kendi performanslarını
değerlendirebilecekleri ölçütler sağlar.
5-İyi ürün veya performansla ilgili
ölçütlerin velilere bildirilmesi, çocuklarına yardımcı olmak isteyen velilere
kolaylık sağlayabilir.
Dereceleme Ölçekleri Geliştirme Aşamaları
1-Ölçeğin amacını belirleme: Ölçekle
elde edilen sonuçların ne amaçla kullanılacağı belirlenmelidir.
4-Ölçeğin hazırlanması: Yukarıdaki
aşamalardan sonra ölçek taslak olarak hazırlanır. Gözden geçirme ve düzeltmeler
yapıldıktan sonra öğrencileri değerlendirmede kullanılabilir. Ölçeği kullanma
sürecinde karşılaşılan sorunlara göre ölçek yetkinleştirilmelidir.
Bölüm Testi
****Uyarı! 1 ve 3. soruları
aşağıdaki seçeneklere göre yapınız.
I- Ortak seçenekli madde
II Birleşik cevap gerektiren madde*
III Kökü olumsuz madde
VI- Cevabı en doğru olan madde
V-Eksik köklü madde
1. Verilenlerden
hangileri sorunun birden fazla cevabı olduğunda kullanılır?
A)I-II B)I-III C)I-VI D)I-V E)II-IV*
2.
Verilenlerden hangileri sorunun birden fazla cevabı olduğunda kullanılamaz.
A)I-II-III B)I-II-IV C)I-II-V D)I-III-V* E)II-III-IV
3. Sorunun kesin doğru
cevabının olmadığı ya da soruya verilen cevapların doğruluk derecesi bakımından
birbirinden farklı olduğu durumda hangi çoktan seçmeli madde tipinin
kullanılması uygundur?
A)I B)II C)III D)IV* E)V
4. Birleşik
cevap gerektiren madde tipi aşağıdaki durumların hangisinde kullanılmalıdır?
A) Birden fazla doğru cevap
olduğunda*
B) Seçenek bulmada güçlük çekildiğinde
C) İleri düzey davranışların ölçülmesinde
D) Orta güçlükte sınavın hazırlanmasında
E) Eğitim sisteminin alt kademelerinde
5. Çoktan
seçmeli test maddelerinde sorunun cevabı ya da doğru olmayan seçeneklere ne ad
verilir?
A) Madde kökü
B) Madde şıkkı
C) Olası cevap
D) Gizli cevap
E) Çeldirirci*
6.
Aşağıdakilerden hangisi çoktan seçmeli madde türlerinden biri değildir?
A) Ortak seçenekli maddeler
B) Kökü eksik cümle olan maddeler
C) Kesin ve biricik cevabı olan maddeler
D) Kesin cevabı olmayan maddeler*
E) Ortak köklü maddeler
7. Bir testin
puanlanabilen en küçük birimine ne ad verilir?
A) Madde * B) Doğru cevap C) Çeldirici D) Olası
cevap E) Doğru seçenek
8.
Aşağıdakilerden hangisi çoktan seçmeli ve doğru yanlış testlerinin ortak bir
özelliği değildir?
A) Kapsam geçerliğini sağlayabilme.
B) Çok soru sorulabilmesi.
C) Şans başarısının eşitliği.*
D) Objektif puanlanma.
E) Kısa zamanda uygulanma.
9. Çoktan
seçmeli test maddesi yazarken aşağıdaki kurallardan hangisine dikkat etmek gerekmez?
A) Cevabı bulmak için gerekli bilgi
verilmeli
B) Kökte gereksiz ipuçları verilmemeli
C) Maddede dil ve bilimsel hatalar
olmamalı
D) Seçeneklerin uzunlukları birbirine
yakın olmalı
E) Soruya göre çeldirici sayısı
değişmelidir.*
10. Puanlama
açısından aşağıdaki ölçme araç ve yöntemlerinden hangisi en kullanışsız
olanıdır?
A) Çoktan seçmeli testler
B) Doğru-yanlış testleri
C) Yazılı yoklamalar*
D) Sözlü yoklamalar
E) Kısa cevaplı testler
11. Aşağıdakilerden hangisi doğru-yanlış ve çoktan seçmeli
testlerde güvenirliği düşüren en önemli özelliktir?
A) Kapsam geçerliğinin düşüklüğü
B) Soruların sayısının sınırlılığı
C) Şans başarısının etkili olması*
D) Kapsam geçerliğinin yüksekliği
E) Okuma hızının işe karışması
12.
Aşağıdakilerden hangisi doğru-yanlış testlerinin olumsuz özelliklerinden biridir?
A) Puanlamanın objektifliği
B) Kolay ve çabuk hazırlanması
C) Şans başarısının yüksekliği*
D) Kapsam geçerliğinin düşüklüğü
E) Tüm eğitim düzeylerinde
kullanılabilmesi
13. Aşağıdakilerden hangisi kısa cevaplı testlerin
güvenirlik ve geçerliğini artırmaz?
A) Çok soru sorulması
B) Objektif puanlama yapılması
C) Kısa zamanda uygulama yapılması*
D) Şans başarısının hiç olmaması
E) Kısa cevaplar gerektirmesi
14. Ödev ve projeler için
aşağıdakilerden hangisi yanlıştır?
A)
Derste öğrenilen davranışların ölçülmesi için en uygun değildir.
B)
Öğrenciyi tanıma puanlama yanlılıklarına sebep olabilir.
C)
Öğrencilere verilen puanların güvenirliği düşüktür.
D)
Ödev ve projeler zorlaştıkça öğrencilerin güdüleri artar.*
E)
Kimin tarafından hazırlandığı kolay anlaşılmaz
15. Aşağıdakilerden hangisi ölçme
aracında aranan nitelikler yönünden en zayıf olandır?
A)
Çoktan seçmeli testler
B)
Yazılı yoklamalar
C)
Sözlü yoklamalar*
D)
Ödev ve projeler
E)
Doğru – yanlış testleri
16. Aşağıdaki
ölçme araçlarında hangisi 70 kişilik bir sınıf için en kullanışlı
olanıdır?
A) Kısa cevaplı testler
B) Çoktan seçmeli testler*
C) Sözlü sınavlar
D) Yazılı yoklamalar
E) Ödev ve projeler
17. Aşağıdakilerden hangisi sözlü sınavlar için doğru değildir?
A) Çok soru sorulmadığından geçerlik düşer.
B) Cevaplayıcının düşünme süresi kısıtlı
olabilir.
C) Konuşma becerileri kazanılan puanları
etkileyebilir.
D) Puanlama anında yapıldığında güvenirliği
yüksektir.*
E) Bazı öğrencilere daha önce sorulan
sorular gelebilir.
18. Yazılı yoklamalarda güvenirliği düşüren en önemli
etken hangisidir?
A) Cevapların uzun verilmesi
B) Anahtarla puanlama yapılması
C) Yazılı anlatım becerilerinin işe
karışması
D) Puanlamanın zaman alması
E) Yansız puanlamanın zorluğu*
19. I-
Puanlamanın zor olması
II- Soru sayısının az olması
III- İleri düzey davranışları ölçebilmesi
IV- Hazırlanmasının kolaylığı
V- Şans başarısının olmaması
Yukarıdaki
ifadelerin hangilerinde yazılı yoklamaların diğer sınavlara göre en zayıf
yönleri doğru olarak verilmiştir?
A) I ve II* B) II ve III C)
III ve IV D) I, II ve III E) II, IV ve V
20. Aşağıdakilerden hangisi eğitimde kullanılan ölçme
araçlarının hepsinde de soru yazımında dikkat edilmesi gereken ortak bir nokta değildir?
A) Dil ve anlatım bozukluğu olmamalı
B) Sorular bağımsız olarak
cevaplanabilmeli
C) Seçeneklerin uzunlukları aynı olmalı*
D) Her soru önemli bir davranışı yoklamalı
E) Sorularda bilimsel hata bulunmamalı
21. I- Üst
düzey davranışların yoklanması
II- Hazırlama açısından kullanışlı olması
III- Kapsam geçerliğinin yüksek olması
IV- Puanlama hatasının az olması
V- Genel izlenimle puanlanması
Yukarıda verilen özelliklerden hangileri çoktan
seçmeli, kısa cevaplı ve doğru-yanlış sınavlarının diğer ölçme araçlarına göre
önemli üstünlükleri arasındadır?
A) I ve V B) III ve IV C)
II, III ve IV D) III, IV * E)IV-V
|
IV- ÖLÇME SONUÇLARI
ÜZERİNDE YAPILAN İSTATİSTİKSEL İŞLEMLER
4.1 Temel Kavramlar
İstatistik : 1- Sayısal
bilgi (Veri)
2-
Bilimin Teknolojisi: Verilerin toplanması, işlenmesi, analizi ve yorumlanması
için kullanılan teknikleri içeren bilim dalı. İki başlık altında inclenebilir.
a)Betimsel
İstatistik: Bir grubu bazı özellikleri bakımından betimleme, gurupla ilgili
bilgileri özetleme vb. amacıyla yapılan istatistiktir. Evren veya örneklem
üzerinde çalışılabilir.
b)Vardamsal
İstatistik: Gözlenen durumdan gözlenemeyen durumların kestirilmesi amacıyla
kullanılan istatistiktir. Örneklemeden evrene genellemeler yapıldığı durumlara vurgu
yapar.
İstatistikte Amaç: Özellikler evren hakkında bilgi edinmektir ya da
evreni betimlemektir.
Dolaylı
Yaklaşım
Örneklem Evren
Dolaysız
Yaklaşım
Şekil 7.
İstatistiksel süreç
1.Dolaysız Yaklaşım: Evrene ulaşmak olanaklı ise evren
parametreleri hesaplanır. Anlamlandırılır.
2.Dolaylı Yaklaşım: Evrene ulaşmak olanaklı veya pratik değilse,
örnekleme yapma, istatistikleri hesaplama, evren parametrelerini kestirme ve
anlamlandırma olarak özetlenebilir. Örneklem evreni ne kadar iyi temsil ederse,
istatistiklerden evren parametreleri o derece iyi kestirilir.
Evren: Araştırma alanına giren birey, obje, özellik vb. tümüdür.
Örneklem: Evreni temsil eden, belirli bir teknikle seçilmiş
örneklerden oluşan birey, obje, özellikler gurubudur.
Evren
ve Örneklem: Ölçme sonuçlarıdır. Örneğin ÖSS sonuçları dediğimizde evren,
herhangi bir dershaneye gidenlerin ÖSS puanları örneklemdir. Belirli bir
özellikler kümesinin evren mi yoksa örneklem mi olduğu araştırma problemine
bağlı olarak değişebilir. Bir araştırma problemi için evren olan grup, başka
bir araştırma problemi için örneklem olarak alınabilir.
4.2 Verilerin Düzenlenmesi
Bireyler
ya da gruplar üzerinde yapılan gözlem sonuçları işlenmeden önce kolay
yorumlanamazlar. Ölçme sonuçlarını yorumlamak, özetlemek, betimlemek veya
karşılaştırma yapmaya uygun hale getirmek için yapılması gereken ilk işlem
verileri düzenlemektir. Gözlem veya ölçme sonuçlarına, yani işlenmemiş verilere
ham veri denir. Üzerinde
matematiksel ve istatistiksel hiçbir işlem yapılmayan verilere ham veri adı
verilir. Verileri düzenlemede kullanılan işlem basamakları aşağıdaki gibi
gösterilebilir.
1-Verileri
büyükten küçüğe ya da küçükten büyüğe sıraya koymak
2-Frekans
tablosunu oluşturmak
3-Verileri
gruplamak
4-Verileri
uygun grafiklerden biriyle göstermek.
Verileri
düzenlemekle ilgili aşamaları örnek üzerinden devam ettirmek faydalı olabilir.
Öncelikle veri toplamamız, gözlem yapmamız gerekir. Tablo 11 50 öğrenciye
uygulanan 10 soruluk testten elde edilen sonuçları göstermektedir. Bu sonuçlar
görüldüğü gibi sadece öğrenciler hakkında bilgi vermekte ve bu bilgileri yorumlamak,
uygulama grubu hakkında fikir yürütmek zor görünmektedir. Bunun için öncelikle
elimizdeki verileri düzenlememiz gerekir.
Tablo
11. 50 Öğrencinin 10 soruluk testte aldığı puanlar
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1-Verileri Sıralamak
Bu
adımda elimizdeki verileri büyükten küçüğe veya küçükten büyüğe sıralamak
gereklidir. Tablo 12’de 50 öğrenciye ait
veriler (tablo 11) sıralanmış olarak görünmektedir.
Tablo
12. 50 Öğrencinin 10 soruluk testte aldığı sırlanmış puanlar
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Verileri
sıralamak bize fazla bir yorum şansı vermemekle beraber sonraki adımlar için
büyük kolaylık getirir. Sıralanmış veriler, en büyük ve en küçük değeri hemen
görmemizi, verilerin değişim aralığını hesaplamamızı sağlayabilir.
2-Frekans Tablosu Oluşturmak
Frekans
sıklık demektir. İstatistikteki anlamı ise bir gözlemin verinin tekrar sayısı
veya bir verinin kaç kez gözlendiğini gösteren sayı olarak tanımlanabilir.
Kısaca verilerin gözlenme sıklığı da denilebilir. Tablo 13’de 50 öğrenciye ait
verilerin frekans tablosu görünmektedir.
Tablo 13. Frekans Tablosu
Xi (Puanlar) |
f (frekans) |
tf |
% |
t % |
1 2 3 4 5 6 7 8 9 10 |
2 3 4 5 6 7 8 7 5 3 |
2 5 9 14 20 27 35 42 47 50 |
4 6 8 10 12 14 16 14 10 6 |
4 10 18 28 40 54 70 84 94 100 |
|
50 |
|
100 |
|
Frekans tablosunun özellikleri
1 )Özel bir gruplamadır. Grup aralığı 1 kabul edilir.
Yaptığımız işlem 1 den 40 kadar her değerin kaç
kez tekrar ettiğini bulmaktır. Ancak tekrarı (frekansı) sıfır olan değerleri
yazmayız. Bu nedenle sabit bir
aralığı dikkate almadığımız söylenebilir.
2)En çok
tekrar eden değer ya da değerleri gösterir.
3)Tablodan faydalanarak puan
dağılımının grafiği çizilebilir. Puanların dağılımı hakkında bilgi verir.
4)Herhangi bir kişinin yeri konusunda bilgi verir. Frekans bir verinin tekrar sayısı
hakkında, toplamlı frekans ise bir puanın (kişinin) yeri hakkında bilgi verir.
% bir verinin toplam veri
içindeki yüzdesini, yığılmalı yüzde ise %'lik dilimler içindeki yerini
(sırasını) verir.
Frekans ve yüzde hacim, tekrar ve alan çağrıştırırken,
yığılmalı frekans ve yüzde sıra çağrıştırmaktadır.
Frekans tablosunun
ilk sütunu gözlenen puanları (bireylerin sınavdan aldıkları puanları)
göstermektedir. Gözlenme olasılığı olduğu halde gözlenmeyen puan bu tabloda
gösterilmez. Çünkü gözlenmeyen puanın frekansı sıfır olduğundan yapılacak
hesaplamalara önemli bir etkisi olmayacaktır. Örneğin sıfır (0) puan gözlenme
olasılığı olan ama gözlenmediği için bu tabloda gösterilmeyen puandır.
Tablonun
ikinci sütununu frekanslar oluşturur. Frekans sütunu bir puanın kaç kez
gözlendiğini ya da aynı puandan kaç tane olduğunu göstermektedir. Frekans
sütununun son satırı toplam gözlem sayısına denk olmalıdır.
Tablonun
üçüncü sütunu yığılmalı frekansları göstermektedir. Yığılmalı frekans sütununa
toplamlı frekans sütunu da denmektedir. Yığılmalı frekans bir puanın kendi
frekansı ile kendinden küçük puanların frekansları toplamıdır. Yığılmalı
frekans sütunu bize puanların sırasını verir. Bunun anlamı yığılmalı frekans
bize bireyin grup içindeki yerini söyler.
Örneğin 6 puan alan
bir birey sınıfta kaç kişiden başarılı veya başarısızdır sorularının cevabını
yığılmalı frekans sütunundan görebiliriz. 6 puan alan bireyin sınıftaki kaç
kişiden daha başarılı olduğunu görmek için 6 puandan bir küçük değerin
yığılmalı frekansına bakarız. Bu durumda 6 puan alan birey 20 kişiden daha
başarılı görünmektedir. 6 puan alan bireyin kaç kişiden daha başarısız olduğunu
belirlemek için ise 6 puanın yığılmalı frekansını toplam frekanstan çıkarmak
gereklidir. Bu durumda 6 puan alan bireyin yığılmalı frekansı 27, topla frekans
50 ve 50 – 27 = 23 olduğundan, 6 puan alan birey sınıftaki 23 kişiden daha
başarısızdır diyebiliriz.
Tablonun dördüncü
sütunu yüzdeleri göstermektedir. Yüzde sütununa bağıl frekans sütunu da
denmektedir. Bir gözlemin % sütunundaki değeri o gözlemin frekans sayısının tüm
gözlemelere oranını 100 ile çarparak elde edilebilir. Örneğin 3 puanı 4 kez
gözlenmiştir, yani frekansı 4’tür. 3 puanının tüm gözlemlere oranı 4 / 50 =
0,08’dir. Bu değeri 100 ile çarparsak 8 değerine ulaşırız. Yüzde sütunu frekans
sütununa benzer, Frekans sütunun verdiği bilgiyi % cinsinden verir.
Tablonun beşinci
sütunu yığılmalı ya da toplamlı yüzde sütunudur. Yığılmalı yüzde, bir gözlemin
kendi yüzdesi ile kendinden küçük gözlemlerin yüzdeleri toplamından oluşur.
Yığılmalı frekans sütununun verdiği bilgiyi yüzde cinsinden verir. Yani bireyin
grup içindeki yerini yüzde cinsinden verir. Zaten yığılmalı yüzdeler, yığılmalı
frekansların yüzdeleridir.
Örneğin, altı puan
alan bireyin sınıfın yüzde kaçından daha başarılı veya başarısız olduğu
sorularının cevabı yığılmalı yüzde sütunundadır. 6 puan alan bireyin sınıfın
yüzde kaçından daha başarılı olduğunu bulmak için6 puandan bir küçük değerin
yığılmalı yüzdesine bakarız. 6 puandan küçük değer 5 puandır ve yığılmalı yüzde
değeri 40’tır. Demek ki 6 puan alan birey sınıfın yüzde 40’ından daha
başarılıdır. 6 puan alan bireyin kaç kişiden başarısız olduğunu bulmak için, 6
puan alan bireyin yığılmalı yüzde değerini 100’den çıkarmak gerekir. Bu durumda
6 puan alan bireyin yığılmalı yüzde değeri 54 ve 100 – 54 = 46 olduğuna göre, 6
puan alan birey sınıfın yüzde 46’sından daha başarısızdır.
Frekans tablosunda
dikkat edilmesi gereken durumlardan biri de, frekansların toplamıyla yığılmalı
frekansların son satırı; yüzdelerin toplamıyla yığılmalı yüzdelerin son satırı
birbirine eşit veya çok yakın çıkmasıdır. Bazen hesaplanan yüzdeleri
yuvarlamadan dolayı bu değerler arasında çok küçük farklılıklar çıkabilir. Bu
farklılığın yuvarlamalardan geldiğinden emin olmak gerekir.
Verileri
düzenlemenin üçüncü adımı verilerin gruplandırılmasıdır.
3-Verileri Gruplama
Verileri gruplama, verileri eşit
aralıklarla düzenleyerek ve bu aralıklara düşen frekansları saptayarak özetleme işlemidir. Verileri gruplamanın temel gerekçesi
şöyle açıklanabilir. Veriler çok geniş bir
aralıkta (ranjda) dağıldığında frekans tablosundan yorum yapılması zorlaşır. Bu
zorluğu gidermenin yollarından biri verileri gruplamaktır. Ayrıca verileri
gruplamak istatistiğin gruplarla ilgilenme mantığına da uygundur. Verileri gruplamak
üç adımda gerçekleşen bir işlemdir.
1.
adım, grup sayısını belirlemek: Keyfidir. Araştırmacı karar verir. Verilere
uygun, bilgi kaybını en aza indirecek şekilde saptanmalıdır. En büyük-en küçük
veriye ve toplam frekansa bakılarak karar verilir. Tek sayı olması yararlıdır.
Eğitimde 5-7 grup oluşturmak yaygındır.
2.adım
grup aralık katsayısını hesaplamak: Grup aralıklarının eşit olması sağlayacak
bir sayı elde etme işidir. Eşit olmayan aralıklarla da gruplama yapılabilir.
Ancak bu durumda veri analizi yapılamaz. Grupların genişliği grup aralık katsayısı denilen sayı ile saptanır. Bu
katsayı şöyle hesaplanır:
a=(Xeb-Xek)/bgs
a: grup aralık katsayısı: gereğinden
küçük (grup sayısı artacağından gruplama anlamsız olur) ve büyük (bilgi kaybı fazla
olacağından) olmamalı.
Xeb: Gözlenen en büyük değer (en büyük
ölçüm-veri)
Xek: Gözlenen en küçük değer (en küçük
ölçüm-veri)
bgs: belirlenen grup sayısı
3. adım, grupları oluşturmak: Grup sayısı ve gurup aralıkları
dikkate alınarak grupları oluşturma basamağıdır. Grupları oluştururken
aşağıdaki koşulların sağlanmasına dikkat edilmelidir.
Grupları
oluştururken sağlanması gereken koşullar:
1.Grup
aralıklarının eşit olması gereklidir.:
gruplar arası karşılaştırma, grupları sürekli hale gştirme, verilerin tamamını temsil edecek istatistiklerin hesaplanabilmesi
için gereklidir.
2.Verilerin birden çok gruba girmemesigereklidir. her verinin temsil edilmesinin
sağlanması, frekans hesabında hatanın önlenmesi ve verilerin hangi gruba ait
olduğunun tartışılmaması için gereklidir. Bir veri yalnız bir grupta olmalı.
3.İlk veri ilk grupta son veri son grupta olmalıdır.
Verileri grupladığımızda, istatistikleri ve analizleri
gruplar üzerinden yürüttüğümüz için verilerle ilgili bilgi kaybı olur. Ancak işleri kolaylaştırması bakımından bir miktar
bilgi kaybını göze alırız. Kurallara uyulursa bilgi kaybı az olur.
Tablo 14. Gruplanmış veriler
Gruplar |
Kesikli Grup
Aralıkları |
Sürekli Grup Aralıkları |
Grup Orta Noktaları
|
Frekanslar |
Toplamlı Frekanslar |
Yüzde |
Toplamlı Yüzde |
(X0) |
(f) |
(tf) |
(%) |
(t%) |
|||
1. Grup |
0 – 2 |
-0,50 – 2,5 |
1 |
5 |
5 |
10 |
10 |
2. Grup |
3 – 5 |
2,5 – 5,5 |
4 |
15 |
20 |
30 |
40 |
3. Grup |
6 – 8 |
5,5 – 8,5 |
7 |
22 |
42 |
44 |
84 |
4. Grup |
9 – 11 |
8,5 – 11,5 |
10 |
8 |
50 |
16 |
100 |
Gözlem sonuçları
ve kesikli grup aralıkları doğal sayılarla ifade edilmişlerdir. Kesikli (süreksiz)
sayılar üzerinde bölme işlemi yapılamadığından grup aralıkları sürekli hale
getirilir. Kesikli grup aralıklarının sürekli grup aralıklarına çevirme, grup
aralıklarının başlangıç ve bitim değerlerini yarımşar puan sağa ve sola kaydırılarak
yapılır.
Verileri sürekli
hale getirirken, verilerin ifade ettiği değişkenin sürekli sayılarla ifade
edilip edilmeyeceği dikkate alınmalıdır. Ölçülen değişken yetenek, başarı
veya tutum ise sürekli kabul edilebilir. Ama sınıf mevcudu, illerin nüfusları
kesiklidir. Veriler sürekli olarak kabul edilmesi mümkün değilse sürekli hale
getirme işlemi yapılmamalıdır. Kesikli grup aralıklarının ifade ettiği
bilgilerle yetinilmelidir.
Grup orta noktaları(Xo); grupları
temsil amacıyla hesaplanır. Grubun başlangıç değeri ve bitiş değerinin
toplamının ikiye bölünmesi ile elde edilir.
Xo1=(0+2)/2= 1 veya Xo1=(-0,50 +2,5)/2= 1
vb.
4-
Verileri grafikle gösterme
Grafik: bir değişkene veya
birbiriyle ilgili değişkenlere ait verilerin şekille gösterilmesidir. Ölçme
sonuçlarının özetlenmesi ve düzenlenmelinde başvurulan yollardan biridir. Göze
hitap ettiklerinden tablolardan daha kolay anlaşılır ve yorumlanır. Veriler
farklı ölçeklerden elde edildiğinden farklı grafiklerle gösterilirler. Yani
verileri elde ettiğimiz ölçeğe göre grafik kullanılır.
Şekil 8. Çubuk Grafiği
|
1)Sütun Grafiği: Verilerin
dikdörtgensel bölgelerle gösterildiği grafiklerdir. Kesikli değişkenler için
kullanılana_çubuk_grafiği sürekli veriler için kullanılana histogram denir.
a)
Çubuk grafiği
*Kesikli değişken için kullanılır.
*Adlandırma (sınıflama_veya sıralama
ölçeklerimle elde edilmiş veriler) için kullanılır.
*Frekansların sayılabildiği veya
frekansların toplam frekansa oranının hesaplanabildiği durumlar için
kullanılır.
*Değişkenler eksenlere anlamayı
kolaylaştıracak biçimde yerleştirilir.
*Grupların (sınıflarını başlangıç ve bitişleri çakışmaz.
Şekil 9. Histogram
|
*Frekanslar alanla ifade
edilmektedir. Her çubuğun alanı o grubun frekansını, çubukların alan toplamları
da toplam
frekansı verir.
*Frekans yerine yüzdeler de
kullanılabilir.
Histogram:
*Çubuk grafiğe benzer ancak
çubuk grafiğinin aksine sürekli grup aralıkları ile çizilir. *Sürekli olan ya sa
sürekli hale getirilebilen gruplandırılmış veriler için kullanılır. Başka
deyişle sürekli grup aralıkları, sürekli olan ya da sürekli hale getirilebilen
değişkenler için kullanılır.
*Genellikle gruplar yatay,
frekanslar-yüzdeler düşey eksende gösterilmektedir
*Aralıklar sürekli olduğundan
grup başlangıç ve bitişlerinde boşluk bırakılmaz.
Şekil 10 Çizgi grafiği
|
*Frekanslar veya yüzdeler
alanla temsil edilirler, her çubuğun alanı o grubun frekansını; çubukların alan
toplamı toplam frekansı verir.
2)Çizgi Grafiği: Gruplanmış
verilerde grup orta noktalarının, gruplandırılmamış verilerde frekans
alanlarının uç noktalarının birleştirilmesiyle
elde edilen, kırık çizgilerden oluşmuş grafik türüdür. Sadece gruplandırılmış
verileri değil, veriler sürekli olmak koşuluyla her türlü frekans dağılımını
göstermek amacıyla kullanılabilir.
*Gruplanmış verilerde grup orta noktaları dikkate alınarak
çizilir.
*Frekans
ve yüzdeler için çizilebilir.
*Gruplandırılmış
veriler için çizginin altında kalan alan (gruplandırılmamış veriler için doğru
parçalarının uzunlukları toplamı) toplam frekansı verir.
*Yığılmalı frekans tablosunu göstermede de kullanılabilir.
Şekil 11. Frekans Poligonu
|
3) Frekans Poligonu (çokgeni):
Süreklileştirilmiş verilerde ilk değerle son değerin X ekseniyle
birleştirilmesi sonucu elde edilir.
*Sürekli veriler için çizilir.
*Yüzde ve frekanslar için
çizilebilir.
*Frekans çok geninin alanı toplam
frekansa eşittir.
*Gözlemlerin dağılımını alanlarla
göstermeye yarar.
4)Pasta Grafiği:
Verilere ait frekans veya yüzdelerin dairenin parçalarıyla (açılarla)
gösterilmesine dayanan tekniktir.
*Hem sürekli hem de süreksiz
değişkenleri göstermede kullanıldığına rastlanmaktadır.
Şekil 12 Pasta grafiği
|
*Her bir daire parçası gözlemlerin
frekans veya yüzdesini, daire parçalarının toplamı toplam frekansı (yüzdeyi)
verir.
Verileri sıralama, gruplandırma
ve grafikle gösterme veriler hakkında genel bilgiler verir.
Bu işlemeler verilerin tümü hakkında
bir bilgi vermez. Verilerin
yorumlanabilmesi için daha ileri düzeyde işlemlere gerek vardır. Verilerin
bütününe ait özellikleri belirtecek bilgilere ihtiyaç vardır. Bunlardan
biri merkezi yığılım (eğilim) ölçüleri, diğeri de değişme
ölçüleridir.
4.3 Merkezi Eğilim Ölçüleri
Ortanca
Ortanca
aşağıdaki yöntemlerin hangisi kullanılarak bulunursa bulunsun her biri için
verileri tam ortadan ikiye ayıran değer olarak tanımlanabilir. Ortancanın hesap
edilmesi için aşağıdaki aşamalı işlemleri yapmak gerekir.
a)Ölçümler büyüklük sırasına
konur (Eğer veriler sıralı verilmiş ise bu işlem adımı geçilir).
b)n+1/2 yardımıyla ortancanın
dağılımdaki sırası belirlenir.
c)Duruma göre aşağıdaki
formüllerden biri kullanılarak ortanca hesaplanır.
1-Veri sayısı tekse (yani ölçüm
sayısı 3, 5, 7 gibi tek sayı ise) ortanca n+1/2 formülü ile bulunur.
Örnek: 1, 7, 13, 16, 19, 22, 24,
27, 26 gibi değerler verildiğinde (n+1)/2 = (9+1)/2 = 5 bulunur ki bu değer
ortancanın sırasını verecektir. Sağdan ve soldan sayıldığında veri grubu için
ortancanın 19 değerine (gözlemine) karşılık geldiği söylenebilir.
2-Veri sayısı çift ise ortancanın
sırası belirlendikten sonra Xa + (Xb-Xa)/2 formülü kullanılarak ortancayı
hesaplamak doğru olacaktır. Burada Xa çift sayıda olan gözlemi ikiye ayırdıktan
sonra elde edilen ilk grubun son değeri, Xb ise ikinci grubun ilk değeridir.
Örnek 1: 5, 7, 8, 10, 14,
16, 17, 18 verilerini ikiye bölüyoruz.
Xa
Xb olur.
Ortancayı hesaplarsak 10 +
(14-10) / 2= 12 elde ederiz.
Dikkatli
bakıldığında ortancanın denk geldiği aralığın sağında ve solunda bulunan değerlerin
ortalaması alındığında ortancanın bulunabildiği görülecektir.
3-Tekrarlı verilerde: Bir veri
grubunda ortanca tekrarlı verilere rastlıyorsa herhangi birini alamayız. Bunun yerine o değerin gerçek sınırlarını
düşünürüz. Örneğin ortanca bir veri grubunda 20 değerine rastlasın ve 20
değerinin 3 kez tekrarladığını (frekansının 3 olduğunu) kabul edelim. Bu
durumda ortancayı 20 alamıyoruz. Bu durumda 20 değerlerinin 20’nin gerçek
sınırları içinde eşit olarak dağıldığı kabul edilir. Örneğimiz için 19,5 ve
20,5 aralığında bu üç değerin bulunduğu kabul edilecektir. Yani 19,5 ve 20,5 aralığını
3 eşit parçaya böleceğiz. Eğer ortanca değerimiz üç kez tekrar eden sayılardan
birincisine denk geliyorsa formül Xaltsınır + (1/frekans) olacaktır. Formüle
göre çözersek ortancamız 19,5 + (1/3) = 19,83 gibi bir değer alır. Eğer ikinci
tekrar eden değere denk gelseydi 20,16 ya yakın bir değer olacaktı.
Aynı
tekniği kullanarak Tablo 13’de verilen 50 kişiye ait örnek veriler için
ortancayı hesaplamak mümkündür. (50+1)/2 = 25,5. sıra ortancayı vermektedir. Bu
sırada yer alan değer 6 gözlemidir ve 7 kez gözlenmiştir. Ortanca bu 6
gözlemden 5. sıradakine gelmektedir. Yukarıdaki formülü uyguladığımızda 5,5 +
(5/7) = 6,21 değerini (yaklaşık olarak) buluruz. Verilerimiz için ortancanın bu
olduğunu söyleyebiliriz.
4-Gruplanmış verilerde aşağıdaki
işlemler gerçekleştirilir.
a)Yığılmalı frekans hesap edilir.
b)n/2 bulunur.
c)Yığılmalı frekanslar sütununun
bir ucundan başlanarak n/2’nin olduğu gruba kadar frekanslar sayılır.
d)n/2 değerinin rastladığı grup
(aralık) bulunur.
e)Aralığın frekansa bölünmesi
gerçekleştirilir.
Bu
işlemler yapıldıktan sonra elde edilenler aşağıdaki formüle yerleştirilir.
Formüldeki simgelerin anlamları
şöyledir;
L:Ortancanın içine rastladığı
aralığın alt sınırı
Tfa: “ “ “ aralıktan önceki (düşük puanlı
gruplardaki) toplamlı frekans
Fb: “ “ “ aralıktaki ölçüm sayısı (gözlenen
frekans)
a: aralık katsayısı
Formül
Tablo 14’te verilen gruplanmış verilere uygulanırsa n/2= 25 çıkacaktır. 25.
verinin 3. grupta olduğu görülmektedir. Bu sonuçlara göre formül aşağıdaki gibi
uygulanabilir.
Ortanca = 5,5 + ((25–20)/22)x3 = 6,18
olarak elde edilir.
Mod
Ölçümlerde en çok tekrar eden
değere mod denir. Kaba bir ölçüdür. Ortalamanın ve ortancanın hesap edilmediği
durumlarda kullanılır.
Özellikleri:
1-Gözlenen frekanslar birbirine
eşit ise mod olmaz yani dağılım modsuzdur.
2-Ardışık iki veya daha çok ölçüm
birbirine eşit sayıda ve diğer ölçümlerden daha çok tekrar etmişse bu durumda
mod ardışık ölçümlerin orta noktasıdır.
3-Ardışık olmayan iki ya da daha
çok ölçüm eşit sayıda ve diğer ölçümlerden daha çok tekrar etmiş ise bu durumda
dağılım çok modludur.
4-Gruplanmış verilerde frekansı en
çok olan aralığın orta noktası mod olarak alınır. Bunun dışında üsteki
açıklamalar gruplanmış veriler içinde geçerlidir.
5-Sadece bir değer diğerlerinden
fazla tekrar etmişse dağılım tek modludur.
6-Eğer 2 değer diğer değerlerden
fazla tekrar etmiş (gözlenmiş) ve eşit sayıda tekrar etmiş ise bu durumda
dağılım çift modludur.
Örnek verilerimiz için mod Tablo
14’e göre en çok (8 kez) gözlenen 7 değeridir. Bu durumda dağılımın tek modlu
olduğu söylenebilir. Tablo 14 incelendiğinde gruplanmış veriler için frekansı
en yüksek olan grubun 3. grup olduğu ve grup orta noktasının da 7 olduğu
görülecektir. Yani gruplanmış veriler için de ortanca 7 bulunmuştur.
Aritmetik
Ortalama
Ölçümlerin (verilerin) ağırlık
merkezidir. Verilerin toplamının veri sayısına bölümü olarak da tanımlanabilir.
En çok kullanılan yığılma ölçüsüdür.
Özellikleri:
1-Örneklemeden örnekleme en az
değişme gösteren dolayısıyla en kararlı yığılma ölçüsüdür.
2-Verilerin hemen hepsini
kullanır.
3-Birçok istatistiksel işlem için
uygundur.
4-Evren ya da örneklemden hesap
edilebilir.
5-Verilerin aritmetik ortalamadan
farkları 0’a eşittir.
6-Aritmetik ortalama alanları
dengeleyen bir noktadır.
7-Veri sayısı az ise uç
değerlerden etkilenir. Bu aritmetik ortalamanın verilerin ağırlık merkezi
olmasından kaynaklanır.
Düzenlenmemiş verilerden hesap
edilmesi:
; Eğer veri sayısı (30’dan)az ise Payda N-1 alınır.
Örnek verilerimiz için ortalama
düzenlenmemiş verilerde
bulunur.
Ortalamanın frekans tablosundan
hesap edilmesi durumunda formül değişir ancak ortalama değeri değişmez. Frekans
tablosundan ortalama değerini veren formül aşağıdaki gibidir. Düzenlenmemiş
verilerden farkı gözlemleri gözlem sayısıyla çarpmaktır.
Gruplanmış verilerde ise hem
formül hem de ortalamanın değeri değişmektedir. Çünkü gözlem değeri olarak
artık veriler değil grup orta noktaları ile gruptaki frekans kullanılmaya
başlanır. Yani X yerine grup orta noktaları frekans yerine de gruptaki ölçüm
sayısı (frekans) alındığı için bilgi kaybı olur. Ortalama düzenlenmemiş
verilerden duruma göre düşük veya yüksek bir değer çıkabilir. Ancak yine de çok
büyük bir fark çıkmaması beklenir. Çok büyük bir fark çıkarsa hesaplamada ya da
gruplama da bir hata yapıldığına işarettir.
Gruplanmış verilerde ortalamanın
hesabı aşağıdaki formülle yapılabilir.
Örnek verilerimiz için aritmetik
ortalama;
olarak bulunur. Grup sayısı yeterli olarak alındığından
gruplanmış verilerde hiçbir önemli bir bilgi kaybı ortaya çıkmamıştır.
Genellikle gruplanmamış veriler ile gruplanmış verilere ait sonuçlar birbirini
tutmaktadır veya birbirine çok yakındır.
Ortanca, Mod ve Ortalamanın
Karşılaştırılması:
1-Ortalama, ortanca ve moda göre
daha fazla bilgiye dayanır. Ortalama hesaplanırken verilerin tümü işleme
katılır. Ortancada yarısı, modda ise biri ya da birkaçı işleme katılmaktadır.
Verilerin tümünü dikkate alması ortalamayı daha istikrarlı ve daha güvenilir
yapar. Örneğin bir evrenden random olarak seçilecek örneklemlerde ortalama
diğerlerine göre daha istikrarlı daha yakın değerler verecektir.
2-Ortalamanın değeri ölçümlerin
değerine bağlıdır. Uç değerler ortalamayı etkiler. Ortalama uç değerler doğru
çekilir. Dizideki ölçümlerin birinin değeri değişirse ortalamanın değeri de
değişir. Ortanca ve mod ise uç değerlerden daha az etkilenir. Dizinin tam
ortasındaki değer değişmeden ortanca, ölçümlerin dağılış biçimi (frekansları)
değişmeden de modun değeri değişmez.
3-Ortalama diğer matematik
işlemler için de uygundur. Diğer yandan ortanca ve mod merkezi eğilim ölçüsü
olmanın dışında pek fazla kullanılmaz.
4-Herhangi bir durumda hangi
merkezi eğilim ölçüsünün kullanılacağı, incelemeye ya da cevabı aranan soruya
bağlıdır. Genel bir kural olarak birden fazla eğilim ölçüsü kullanılabilecekse
bunlardan en fazla ölçüm kullanılarak hesaplanan (en fazla bilgi içeren) ve
diğer işlemlere de elverişli olan seçilir.
5-Kullanımda tercih sırası
ortalama, ortanca ve mod şeklindedir.
6-Uç değerlerin olması durumunda
uygun olan ortancadır.
7-Mod ortalama ve ortancanın
hesaplanamadığı durumlarda ve en çok tekrarlayan ölçümü belirlemenin önemli
olduğu durumlarda kullanılır.
4.4 Dağılım Ölçüleri
Merkezi
eğilim ölçüsü bir gruptaki verilerin etrafında toplanma eğilimi gösterdiği bir
değerdir. Bu değer veri grubunun bir özelliğini gösterir. Veri grubunu bir
yönüyle betimler.
Verilerin
hangi değer etrafında yığıldıklarını bilmek önemlidir ancak verileri
betimlemeye yetmeyebilir. Çünkü verilerin birbirinden ne kadar uzaklaştıkları,
yayılmalarının nasıl olduğu da önemlidir. Ölçme sonuçları birbirine eşit
olsaydı, veriler arasında farklılaşma olmazdı. Değişimden söz edilmezdi. Ölçme
sonuçlarının yayılması bu değişimin bir sonucudur.
Bir
grup verideki değişmelerin ölçüsü “değişme, yayılma veya dağılma” ölçüleri
olarak adlandırılır.
Verileri
sadece merkezi eğilim ölçüleri ile betimleyemeyiz. Çünkü aynı merkezi eğilim
ölçüsü değerine sahip olduğu halde değişik şekillerde dağılan veriler vardır.
Aşağıda ortancası ve ortalaması eşit olan 3 veri grubunun dağılımlarının
farklılaştığı görülmektedir.
F f f
3 3 3
2 3 2
2
4 6 8 10 X 2
4 6 8
10 X 2 4
6 8 10
X
Şekil 13. Ortalamaları ve ortancaları eşit,
değişim ölçüleri farklı dağılımlar
Yukarıdaki dağılımlar
incelendiğinde ortalamaları ve ortancalarının 3 olduğu görülür. Buna rağmen
dağılımları oldukça farklıdır. Merkezi eğilim ölçüleri incelendiğinde benzer
grup veya aynı grup denilebilecekken dağılımları incelendiğinde farklı gruplar
olduğu görülmektedir. Dolayısıyla verilerin değişim ölçülerini bilmeden onları
betimlemek bilgi yetersizliğinden dolayı hata yapmamıza neden olabilir. Sadece
merkezi eğilim ölçülerinden hareketle verileri betimlemek onlar arasıdaki
farkları görmemizi engeller.
Ranj
En büyük ölçme (gözlem) sonucu
ile en küçük ölçme sonucu arasındaki farka ranj denir.
Ranj = Xeb - Xek
Örnek verilerimiz için ranj= 10 -1
=9 olarak bulunacaktır.
Sadece veri grubundaki iki değere
bağlı olduğundan verilerin dağılımı hakkında fazla bilgi vermez. Çok kullanışlı
bir dağılım ölçüsü değildir. Merkeze yığılma ölçüsü olarak modun kullanıldığı
veri gruplarında dağılım ölçüsü olarak kullanılır.
Yüzdelikler
ve Çeyrekler
Ortanca
sıraya konulmuş verilerin tam ortasını gösteren (bir yer gösteren) değer olarak
merkezi yığılma ölçüsüdür. Sıraya konulmuş verilerde tam ortayı gösteren ölçme
sonucu yanında başka sıradakilerde dikkate alınabilir. Örneğin verilerin %
25’ini sağında % 75’ini solunda bırakan değere ihtiyaç olabilir. Bir dağılımda
bir verinin yerini gösteren ölçüler yüzdeliklerdir. Buna göre ortanca bir
yüzdelik ve merkeze yığılma ölçüsüdür ancak diğer yüzdelikler yer bildirmekle
birlikte merkezi eğilim ölçüsü değildir.
Yüzdelik:
Bir dağılımda belirli bir verinin yerini gösteren ölçülerdir.
P
bir yüzde olmak üzere p. Yüzdelik küçükten büyüğe sıralanmış veriler için ölçme
sonuçlarının p kadarından büyük, (1-p) kadarından küçük ölçme sonucudur.
p.
yüzdelik ölçme sonuçlarının % p’sini solunda, % (1-p)’sini sağında bırakan
değerdir. P. Yüzdeliği Yp olarak gösterirsek, ortanca Y50
olarak gösterilebilir.
Bir
dağılıma ait p. Yüzdelik aşağıdaki gibi gösterilebilir.
P (1-p)
Şekil 14. Yüzdeliğin Grafiksel Gösterimi
formülü p. Yüzdeliği
verir.
Eleman
sayısı az olduğunda yüzdeliğe başvurulmaz. Fazla veri varsa ve gruplanmış
veriler için yüzdelik hesabı yapılır.
Yp’nin
hesabı gruplanmış veriler için ortancanın hesaplanmasında kullanılan formülün
özel bir haliyle yapılır. Formülde sadece simgeler değişir. Anlamları neredeyse
aynıdır.
Ap: p. Yüzdeliğin bulunduğu
aralığın alt sınırı
p: Değeri hesaplanacak yüzdelik
tfa : p. Yüzdeliğe
kadar olan toplamlı frekans
fp : p. Yüzdeliğin
bulunduğu grubun frekansı
a : Grup aralık katsayısı
Yüzdelikleri
hesaplama işi 3 adımda gerçekleştirilir.
1-
Verilerin sıralanması.
2-
formülü yardımıyla Yp’nin (p. Yüzdeliğin) kaçıncı veri
olduğunu saptamak
3-
Gruplanmış veriler için kullanılan formülü işe koşmak.
Örnek 1: 2, 3, 5, 6, 8, 10, 11,
13, 14, 15 şeklinde sıralanmış verilerimiz olsun. Bu veriler ait 20. yüzdeliği
hesaplayacak olursak
Birinci adım: Verileri
sıralayacağız. (sıralı verilmiş durumda)
İkinci adım: yardımıyla Y20
nin kaçıncı veriye rastladığını bulacağız.
=
İkinci sıradaki
verimiz Y20’dir. Değeri ise 3’tür.
Çeyrek
Kayma
Üçüncü ve
birinci çeyreğin farkının yarısıdır.
Q=
Veriler simetrik dağılmışsa 3.
çeyrek ortancanın çeyrek kayma (Q) kadar sağında; birinci çeyrek de ortancanın
Q kadar solundadır.
Y25 Xort Y75 Şekil 15. Çeyrek sapmanın Grafiksel Gösterimi |
Çeyrek kaymada ölçme sonuçlarından
sınırlı sayıda veriye dayandığından çok kullanışlı ve bilgi verici değildir.
Ortancanın merkezi eğilim ölçüsü olarak kullanıldığı durumlarda dağılım ölçüsü
olarak kullanılabilir.
Varyans
Ölçme sonuçlarının aritmetik
ortalamadan farklarının karelerinin aritmetik ortalamasına varyans denir. Verilerin
ortalamadan uzaklıklarının bir ölçüsüdür. Bir değişim ölçüsüdür. Grubun
değişkenliğini diğer gruplarla karşılaştırmada ve yorumlamada kullanılabilir. Genel
formülü şöyledir;
bu formülü örnek
verilerimize uyguladığımızda varyans 5,90 çıkmaktadır.
Varyans tekrarlı ölçümlerden
hesap edilirken formül değişir ancak sonuç değişmez. Tekrarlı verilerdeki
formül aşağıdaki gibidir.
Bunun dışında
varyansın ortalamayı hesap etmeden ham puanlardan hesap etme formülü vardır.
Aslında bütün ölçüler ham puanlardan hesap edilebilir. Ham puanlardan varyansı
hesap etme formülü;
Gruplanmış verilerde ise hem
formül hem de sonuç değişir. Gruplanmış veriler için varyans formülü ve örnek
veriler için sonucu aşağıda verilmiştir.
Burada kullanılacak
ortalama gruplanmış verilerden hesaplanan ortalamadır. Formüldeki X0
ise grup orta noktalarıdır. Örnek veriler için sonuç 6,70 olarak bulunur. Gruplanmamış
verilerden daha yüksek bir varyans bulunmuştur. Ancak bu değerlerin çık farklı
olmadıkları da söylenebilir.
Varyansın
büyüklüğü arttıkça puanlar arasındaki fark artar. Bu durumda grup heterojendir
denir. Varyans azaldıkça puanlar arasındaki farklar da azalır. Bu durumda da
grup homojendir denir. Ancak büyüklüğü ve küçüklüğü için nesnel bir sınır
yoktur. Varyans büyüdükçe örneğin bir test puanlarını ele aldığımızda testin
ayırt edici olduğu söylenebilir. Yani test davranışlara sahip olanlarla olamayanları
ayırıyor denir. Varyansın büyük ya da küçük olarak yorumlanabilmesi için nesnel
bir sınır olmadığından en doğru işlem bir grubun varyansını başka grup(lar)la
karşılaştırmaktır.
Buna göre
varyansı büyük olan grup heterojen, basık veya değişkenliği büyük olarak;
varyansı küçük olan grup ise homojen, sivri veya benzeşik (değişkenliği
küçük-az) olarak yorumlanabilir.
Standart
Kayma (Sapma)
Veri grubunda
merkezi yığılım ölçüsü olarak ortalama kullanılmışsa dağılım ölçüsü olarak
kullanılır. Verilerin aritmetik ortalamadan ne kadar uzaklaştığının ortalama
bir ölçüsünü verir. Ölçme sonuçlarının aritmetik ortalamadan farklarının
karelerinin aritmetik ortalamasının karekökü olarak tanımlanabilir. Yani
varyans değerinin karaköküdür.
Örnek verilerimizdeki ham veriler
için standart sapma 2,43; gruplanmış veriler için 2,59 olarak bulunmuştur.
Standart
sapma ölçme sonuçlarının aritmetik ortalamaya göre yayılmalarının bir ölçüsünü
verir. Standart kayma (ve varyans) ile dağılımın sivriliği ve basıklığı
arasında bir ilişki vardır. Ölçme sonuçları ortalamaya yaklaştıkça farklar
küçülür uzaklaştıkça büyür. Farkların küçülmesi dağılımın sivrileşmesine,
büyümesi basıklaşmasına yol açar. Yani dağılım sivrileştikçe standart sapma
küçülür, dağılım basıklaştıkça standart sapma büyür.
Standart
sapma dağılımın birimi olarak kabul edilir. Bu nedenle varyantsan daha çok
kullanılır.
Standart sapma da varyans gibi
yorumlanır. Standart sapma da ancak bir başka grupla karşılaştırıldığında
anlamlı olur. Kendi başına büyük ya da küçük diye yorumlamak mümkün değildir.
Standart sapması büyük olan grup heterojen, basık veya değişkenliği fazla
olarak; standart sapması küçük olan grup ise homojen, sivri veya benzeşik
(değişkenliği küçük-az) olarak yorumlanabilir.
Bağıl
Değişim Katsayısı
Standart kayma ortalamaya bağlı
olarak hesaplandığından belirli sınırlılıklar taşır. En önemlisi de ortalamaya
göre yanlılık göstermesidir. Bu nedenle her iki dağılımı da içeren iyi bir
dağılım ölçüsü olarak bağıl değişim katsayısı hesaplanabilir. Bağıl değişim
katsayısı standart sapmanın aritmetik ortalamaya göre değeri olarak
tanımlanabilir. Formülü;
BDK=standart sapma / ortalama x
100
olarak gösterilir.
Bu formülden elde edilen sonuçlar
hem birden fazla grubun değişkenliğini karşılaştırmada hem de bir grubun
değişkenliğini yorumlama da kullanılabilir.
Eğer bir grubun;
-bağıl değişim katsayısı 25’den
büyükse (V>25) dağılım basık, heterojen, farklı,
-bağıl değişim katsayısı 20 ile
25 arasında ise (20<V<25) dağılım normal, simetrik,
-bağıl değişim katsayısı 20’den
küçükse (V<20) dağılım sivri, homojen, benzeşik denir.
Örnek veriler için BDK = 40,61
bulunmuştur (gruplanmış veriler için 43,28). Bu durumda dağılımın basık olduğu,
varyans ve standart sapmanın büyük olduğu ve veriler arasındaki farkların fazla
olduğu söylenebilir.
Birçok
durumda varyans veya standart sapmaya bakarak grubun homojen mi yoksa heterojen
mi olduğunu yorumlamak yanıltıcı sonuçlara götürebilir. Bu nedenle grupları
homojenlik heterojenlik bakımlarından karşılaştırmada hesaplamanın mümkün
olduğu her durumda bağıl değişim katsayısını kullanılması önerilebilir.
Çarpıklık
(Kayışıklık)
Ortalama,
Ortanca ve moda bakarak çarpıklığın olup olmadığı, eğer varsa yönü hakkında
yorumlar yapabiliriz. Ancak çarpıklığın büyüklüğü hakkında bir şey diyemeyiz.
İki dağılımın çarpıklığını bu ölçülerle karşılaştırmak güç olur.
Tanım: Verilerin simetrik dağılıp
dağılmadığını görmemizi (yorumlamamızı) sağlayan değişim ölçüsüdür.
1- basit olarak şu formülle bulunabilir.
Bu basit bir
formüldür. Çarpıklık hakkında fikir sahibi olmamızı sağlar. Ancak çarpıklığın
tam değeri değildir. Çarpıklığın en doğru değeri aşağıdaki formülle elde
edilir.
2- Eğer frekanslı veriler
varsa
şeklinde kullanılır.
3-Gruplanmış veriler söz konusu
ise
şeklindeki formülü
kullanırız.
4-Dağılımın merkezi eğilim ölçüsü
olarak ortanca kullanılmışsa ÇK çeyrekler yardımıyla elde edilir.
- Formül Çarpıklığın kaba bir ölçüsüdür.
- formül çarpıklığın doğru değerini verir.
- formül gruplanmış veriler için çarpıklığın
hesabında kullanılır.
- formül merkezi eğilim ölçüsü ortanca alındığında,
özellikle çarpık dağılımlarda ve kategorik verilerde kullanılır.
Çarpıklık Katsayısı Aşağıdaki
gibi yorumlanır.
A) ise katsayı pozitif, dağılım sağa(sağı) çarpık, sağa(sağı –
pozitif) kayışlıdır.
B) ise
Kayışıklılık(çarpıklık 0 civarında, dağılım simetrik
C) ise katsayı negatif,
dağılım sola(sola) çarpık, sola(solu – negatif) kayışlıdır
Yukarıdaki formüller yardımıyla
hesaplanan bütün çarpıklık katsayıları birbirinden farklı olacaktır. Değerleri
farklı olmasına rağmen hepsi doğrudur. Tercih değişkenin yapısı ve kullanıcıya
kalmıştır.
Basıklık
(Yayvanlık) Katsayısı
Standart
kayma ve varyans büyüdükçe dağılımın sivrileştiğini, büyüdükçe dağılımın
basıklaştığını biliyoruz. Ancak bunlar bize basıklıkla ilgili bir ölçü vermez.
Bir dağılımın basıklığının (yayvanlığının) veya sivriliğinin ölçüsü basıklık
katsayısı adını alır.
Genel formülü;
Bs = BK =
Basıklık katsayısı değeri için
aşağıdaki durumlar söz konusudur.
a)
BK < 0 ise dağılım normalden basık, yayvan ve
veriler hetorojendir.
b)
BK = 0 ise dağılımın basıklığı normal dağılım kadardır.
c)
BK > 0 ise dağılım normalden sivridir ve veriler
homojendir.
Aşağıda
merkezi eğilim ve değişme ölçülerine bağlı olarak karşılaşabilecek tipik
dağılımlarla ilgili örnekler verilmiştir.
Aiağıdaki
dağılımların en basığı, en heterojeni modsuz dağılımdır. Çift modlu
dağılımlarda ise, ölçülen değişken yönünden düzeyleri birbirinden çok farklı
iki gruba ait sonuçların grafiksel yapısı görülmektedir. Solu çarpık
dağılımlarda ortalama düşük değerler alabilmesine rağmen grup genelde başarılı
kabul edilir. Tersine, sağa çarpık dağılımlarda ise ortalama yüksek değer
almasına rağmen grup genellikle başarısız kabul edilir.
Normal
dağılımlarda: ortalama = ortanca = mod
Sağa çarpık
dağılımlarda: ortalama > ortanca > mod
Sola çarpık
dağılımlarda: mod >ortanca > mod ilişkileri vardır.
|
Çift modlu dağılım Sağı çarpık (pozitif kayışlı) dağılım Solu çarpık (negatif kayışlı) dağılım Modsuz dağılım |
Şekil 16. Tipik
dağılımlardan örnekler
Standart Puanlar
Z Puanı:
Normal dağılıma sahip bir ölçme kümesi ortalaması 0,00 ve standart kayması 1
olan dönüşüme tabi tutulabilir. Bu dönüştürmeden elde edilen yeni dağılıma
Standart Normal Dağılım ya da Birim Normal Dağılım denir. Birim normal dağılım
istatistiksel işlemlerde ve çeşitli karşılaştırmalarda kolaylık sağlar. Aşağıda
birim normal dağılım grafiği görülmektedir.
|
Şekil 17. Birim (standart) Normal dağılım
Standart Puan: Verilerin ortalamadan farklarının standart
sapmaya bölümü standart puan veya Z puanı olarak adlandırılır.
evrende veya
örneklemde kullanılan
formüldür.
Bu
dönüştürmeyle ölçme sonuçları birbiriyle karşılaştırılabilir. Z puanlarının,
dağılımların ortalaması 0,00’a getirildiğinden mutlak olmayan, izafi bir
başlangıç noktası vardır. Diğer yandan standart puanlar elde edilirken, bir
ölçme kümesinde sabit bir değer olan standart sapmaya bölme işlemiyle birim
cinsinden ifade edilmiş olurlar. Bu nedenle standart puanların bir birimi
vardır ve standart puanlar eşit aralıklı ölçektedir. Z puanlarına eşit aralıklı
ölçeklerdeki tüm işlemler yapılabilir.
Z
puanlarının 2 temel işlevi olduğu söylenebilir. Öncelikle bir bireyin grup
içindeki yerini gösterir. Örneğin z puanı 2 olan bir bireyin şekil 17’deki
değerlerden hareketle grubun % kaçından daha başarılı veya daha başarısız
olduğu belirlenebilir. Buna göre
Z
= 2 için başarılı olma olasılığı = (50+34+13,5) = 97,5 olur.
Yapılan
işlem bireyin z puanının solunda kalan alanı toplamaktır. Birim normal dağılım
ortalamaya (0’a) göre simetrik olduğundan eksi sonsuzdan sıfıra kadar olan alan
50 (+) 0 ile 1 arasındaki alan 34 (+) 1 ile 2 arasındaki alan 13,5 = 97,5
olmaktadır. Buna göre birey grubun % 97,5’undan daha başarılı olmuştur. Bu
değeri 100’den çıkarırsak bireyin grubun % kaçından başarısız olduğunu
bulabiliriz. 100 – 97,5 = 2,5’tur. Yani birey grubun % 2,5’ğundan başarısız
olmuştur.
Z
puanının ikinci işlevi farklı gruplardaki bireyleri birbiriyle
karşılaştırmaktır. Sıralama ölçeğinde elde edilen ham puanlarda farkların
görünememesi nedeniyle karşılaştırma mümkün olamadığından, farklı gruplardaki
bireyler standart puanlar elde edildikten sonra, yani puanlar eşit aralığa
dönüştürüldükten sonra karşılaştırılır. Böyle bir karşılaştırma da z standart
puanı büyük olan bireyler başarılı; z standart puanı küçük olan bireyler
başarısız kabul edilir. Yani en başarılı birey z standart puanı en büyük
olandır.
Z puanı elde
edildikten sonra, bu standart puanların ortalaması ve birimi (standart sapması)
değişen çeşitli standart puanlara dönüştürülmesi mümkündür. Temel standart puan
z puanıdır. Örneğin T standart puanları ortalaması 50, standart sapması 10 olan
standart bir puan türüdür. İstenirse bu doğrusal dönüştürme kullanılarak başka
standart puanlar da elde edilebilir. Z değerlerinin T değerlerinde dönüşümü
şöyledir.
T
puanı z puanının eksi değerlerinden (eksi değerler bazı durumlarda işlemleri
güçleştirdiğinden) kurtulmak için hesaplanan bir standart puandır. Dolayısıyla T
puanı da bir standart puandır ve z puanıyla aynı işlevlere sahiptir. Ayrıca z
puanı nasıl yorumlanıyorsa aynı şekilde yorumlanır. Yani t puanı en büyük olan
birey en başarılı kabul edilir.
Norm
Belli bir
gruptaki kişiler için ortamla veya tipik kabul edilen değere, ölçüt veya kural
olarak kabul edilen ölçüye norm denir. Ölçme sonuçları belli bir yaş grubu veya
belirli özellikleri bakımından benzer olan bir gruptan elde edilir (kadın veya
erkeklerden, 3. sınıflardan, 12 yaşındaki çocuklardan vb.). Bu özellikler
ölçülen değişkeni bir ölçüde etkilediğinden ve bazen de yorumlanmalarını
kolaylaştırdığından elde edilen değerler bunlara göre yorumlanırsa daha anlamlı
olur. Bu nedenle normlar sık başvurulan ölçütlerdendir. Normlar ölçülen
değişkene göre değişir. Beklenen ya da olması gereken bir değeri değil,
ortalama bir değeri gösterir. Sınıf, yaş cinsiyet, bölge, ülke vb. normlar
vardır. En çok kullanılan normlar standartlaştırılmış normlardır. Çünkü
karşılaştırmayı kolaylaştırır. Standart norm oluşturmak için standart puan
kullanılır. Standart puanlar ham puanların ortalaması başlangıç noktası, standart
sapması da birim kabul edilerek elde edilen z puanlarıdır.
Bu formülde değerlerin başlangıç
noktası 0, birimi ise 1 olan bir dağılıma dönüşür. Bu durumda puanlar sıralı
ölçekten eşit aralık ölçeğine dönüşmüş olur. Eksi değerler de olduğundan işlem
zorluklarından kurtulmak için T standart puanına çevrilebilir.
Örnek soru ve çözümler
sınıflar |
|
s |
1 |
12 |
3 |
2 |
11 |
3 |
3 |
10 |
4 |
4 |
9 |
2 |
5 |
8 |
5 |
Sağdaki
tabloda 5 sınıfa uygulanan 20 soruluk testten elde edilen istatistikler
görünmektedir. Aşağıdaki soruları bu tabloya göre cevaplayınız.
1-Sınıflarda 15 doğru yapan
bireyler karşılaştırılmak istenmektedir. Sınıfların her birinde 15 puan alan
bireylerden hangisi diğerlerine göre daha başarılı olmuştur?
2- Sınıflarda 15 puan alan
bireylerden hangi sınıftaki birey en başarısızdır?
3-Hangi sınıf en homojendir?
4-Hangi sınıf en heterojendir?
5-3 numaralı sınıfta 15 puan alan
bireyin T puanı kaçtır?
6-4 numaralı sınıfta 15 puan alan
öğrenci grubun % kaçından daha başarılıdır?
7-En simetrik dağılım gösteren
grup hangisidir?
Cevaplar:
İlk iki soru z puanlarının
hesaplanmasını gerektirmektedir. Buna göre sınıfların z standart puan formülü
kullanılmalıdır.
Z değerlerini büyükten küçüğe
sıraya koyarsak Z1 < Z3 < Z2 < Z5
< Z4
1-Hesaplanan z değerlerine göre
en büyük z değerine 4. sınıfta 15 puan alan birey sahip olduğundan en başarılı
birey 4. sınıftaki öğrencidir.
2. En başarısız birey z değeri en
küçük olan 1. sınıftaki öğrencidir.
Üçüncü ve dördüncü sorular için
bağıl değişim katsayılarının hesaplanması gereklidir.
3-En homojen grup bağıl değişim
katsayısı en küçük olan grup olacağına göre 4 numaralı sınıf en homojen,
benzeşik ve sivri gruptur.
4-En heterojen grup bağıl değişim
katsayısı en büyük olan grup olacağına göre 5 numaralı grup en heterojen, en
farklı ve en basık gruptur.
5-T3 = Z3 x
10 + 50 = (1,25) x 10 + 50 = 62,5 tur.
6- Z4 = 3 olduğuna
göre;
Tablo 17 deki standart normal
dağılım alanlarının toplamı = 50 + 34 + 13,5
+ 2 = 99,5 olacaktır. Bu da 4 numaralı sınıfta 15 puan alan öğrencinin
sınıftaki bireylerin % 99,5’undan başarılı olduğunu gösterir. Sınıftaki en
başarılı öğrencilerden biri olduğu söylenebilir.
7-Simetriklik elimizdeki verilere
göre bağıl değişim katsayısından anlaşılmalıdır. Buna göre bağıl değişim
katsayısı 20 ile 25 arasında olan dağılım simetriktir. Buna göre 4 numaralı
sınıfın en simetrik dağılım olduğu görünmektedir. 1 numaralı sınıfında belirli
bir düzeyde simetrik olduğu söylenebilir.
4.6 Madde Analizi
Madde analizi,
bir testteki maddelerin iyi işleyip işlemediğini ortaya koymak amacıyla
uygulanan bir tekniktir. Çeşitli yolları vardır. En çok kullanılanı Henrysson
ve alt-üst grup yöntemidir. Henryson yöntemi özellikle gözlem sayısının ve
madde sayısının çok olduğu durumlarda yorucu olmaktadır. Bu durumda alt – üst
grup tekniği ile elde edilen madde analizi sonuçları ile Hneryson analizi
sonuçlarının birbirine yakınlaştığı söylenebilir. Bu tekniklerden alt üst grup
tekniği ile yapılan madde analizi üzerinde durulacaktır.
Madde Güçlüğü: Maddeye doğru cevap verenlerin
maddeyi cevaplayan tüm cevaplayıcılara oranı olarak tanımlanır. O ile 1
arasında değerler alır. 1’e yaklaştıkça madde kolaylaşır. O’a yaklaştıkça madde
zorlaşır. Orta güçlükteki madde iyi maddedir. Alt üst grup tekniğinde aşağıdaki
formülle hesaplanır.
: Maddenin güçlük indeksi
n(d,ü):
Maddeyi üst grupta doğru cevaplandıranların sayısı
n(d,a):
Maddeyi alt grupta doğru cevaplandıranların sayısı
N:
Üst ve alt gruptaki toplam öğrenci sayısı
Madde Varyansı
ve Standart Sapması: İki çıktısı olan dağılımlarda varyans ilgilenile olayın
olasılığı ile diğer olasılıkların çarpımıdır. Bir maddede ilgilenilen olayı
doğru cevaplandırılması olarak ele alabiliriz. Yanlış seçenekleri işaretlemek
ise diğer olayların olasılıklarıdır. Madde varyansı aşağıdaki formülle
hesaplanır.
Maddenin varyansı
Maddenin güçlük
indeksi
Madde varyansı
ve standart sapması madde güçlük indeksine bağlıdır. Madde güçlük indeksinin 0
ya da 1'e eşit olduğu durumlarda madde varyansı 0 değerini alır. Mdde güçlük
indeksi 0.50 olan maddelerin madde varyansları en yüksek değeri alır. Bu
sebeple, güçlük indeksi 0.50 değerini alan maddelerin en ayırıcı maddeler
olduğu söylenebilir.
Madde
Geçerliği: Bir maddenin bilenle bilmeyeni, bir davranışa sahip olanla olmayanı
ortaya koyabilme işlevine denir. -1 ile +1 arasında değerler alır. Eğer değeri
eksi ise ölçülmek istenen değişkenin zıttı bir değişkeni ölçtüğü, sıfır ile
0,20 arasında geçersiz bir madde olduğu, 0,20 – 0,30 aralığında düzeltilmesi
gereken bir madde olduğu ve 0,30’u aşıp 1’e yaklaştıkça geçerliği artan bir
madde olduğu söylenebilir.
Madde ayırıcılık gücü indeksi
n(d,ü):
Maddeyi üst grupta doğru cevaplandıranların sayısı
n(d,a):
Maddeyi alt grupta doğru cevaplandıranların sayısı
n:
üst ya da alt gruptan herhangi birisinde yer alan birey sayısı.
ÖRNEK
Aşağıda 30
soruluk bir test maddesine cevap veren gruptan ikiyüz öğrencinin cevap dağılımı
görülmektedir. Bu dağılıma göre 20. sorunun güçlük ve ayırt edicilik
değerlerinin hesaplayalım.
Soru no: 20 |
A |
B* |
C |
D |
E |
Boş |
Er |
Toplam |
Üst grup |
5 |
70 |
5 |
10 |
5 |
5 |
- |
100 |
Alt grup |
20 |
30 |
15 |
20 |
10 |
5 |
- |
100 |
Toplam |
25 |
100 |
20 |
30 |
15 |
10 |
- |
200 |
Madde
Güçlüğünün Hesabı
Madde güçlük
hesabında hem alt grupta maddeye doğru cevap verenleri hem de üst grupta
maddeye doğru cevap verenleri dikkate alıyoruz. İki gruptan doğru cevap
verenlerin sayısını tüm cevaplayıcı sayısına oranlıyoruz. Böylece maddenin
gruba zor mu yoksa kolay mı geldiğini anlıyoruz.
Elde edilen
madde güçlük değerine göre 20. madde orta güçlükte bir maddedir. Grubun hemen
yarısı civarında öğrenci doğru cevap vermiş, diğer yarısı ise doğru cevap
verememiştir.
Madde
Geçerliği Hesabı
Maddenin
bilenle bilmeyeni ayırması olarak tanımlanmıştı. Bunun için maddeye üst gruptan
doğru cevap verenlerle alt gruptan doğru cevap verenler arasındaki fark
büyüdükçe madde geçerli hale gelecektir. Aksi durumda madde geçerli
olmayacaktır.
Elde edilen
madde geçerlik değerine göre maddenin yeterince geçerli olduğu, maddenin
sorunun cevabını bilenle bilmeyeni ayırabildiğini söyleyebiliriz. Bu anlamda
madde bilenle bilmeyeni ayırabilmektedir.
Aynı zamanda
iki hesaptaki sonuçlar birbirini desteklemektedir. Madde orta güçlükte olduğu
zaman genellikle maddenin ayırıcı olması beklenebilir. 20. madde de bu
beklentiye uygun bir sonuç vermiştir.
Bölüm Testi
1. Bir soruya 22 kişi doğru, 10 kişi yanlış yanıt vermiş ve 8
kişi de boş bırakmıştır. Bu sorunun güçlük düzeyi (p) nedir?
A) 0,40 B)
0,45 C) 0,50 D) 0,55* E) 0,60
2. Bir
sorunun güçlük düzeyi (P) 0,90 bulunmuştur. Bu soru için aşağıdakilerden
hangisi söylenebilir?
A) Soru sınıfın % 90’ı tarafından yanlış
cevaplandırılmıştır.
B) Sınıfın yarısından azı soruyu yanlış
cevaplandırmıştır.
C) Sınıfın % 10’u soruyu boş bırakmıştır.
D) Sınıfın % 90’i soruyu şansla
cevaplamıştır.
E) Sınıfın % 90’i soruyu doğru
cevaplamıştır.*
3. Standart
puanların en önemli faydası nedir?
A) Farklı bireyleri karşılaştırmayı
kolaylaştırır*
B) Ölçme sonuçlarına karışan hataları
azaltır.
C) Değerlendirmelerin nasıl yapılacağını
belirler.
D) Ölçme sonuçlarının güvenirliğini
gösterir.
E) Puan dağılımının normalliğinin kontrol
etmeyi sağlar.
4. Ölçme
sonuçları üzerinde istatistiksel işlem yapmanın en önemli faydası nedir?
A) Değerlendirmeler için ölçütler vermesi
B) Grubu daha iyi tanıma fırsatı vermesi*
C) Öğrenme eksiklik ve yanlışlarını
belirlemesi.
D) Puanlamayı kolaylaştırması
E) Ölçme sonuçlarına karışan hataları
azaltması
5. Puan
dağılımlarının grafikle gösterilmesinin gerekçesi aşağıdakilerden hangisidir?
A) Başarının daha iyi yorumlanması*
B) Başarılı öğrencilerin belirlenmesi
C) Öğrenme eksikliklerinin saptanması
D) Öğretmenin değerlendirilmesi
E) Eğitim programının değerlendirilmesi
6.
Aşağıdakilerden hangisi/hangileri ham puanların standart puanlara çevrilmesinin
gerekçesi olabilir?
I- Not vermeyi kolaylaştırır.
II- Yorumlamayı kolaylaştırır.
III- Puanları karşılaştırmayı sağlar.
IV- Güvenirliği artırır.
A) I B)
II ve III* C) I ve III D) III ve IV E) I ve IV
7. Bir aracın geçerlik çalışması aynı değişkeni ölçtüğü
bilinen bir araçtan elde edilen puanların korelasyonu ile kanıtlanmaya
çalışılmış ve sıfır (0) civarında korelasyon bulunmuştur. Bu durumda aracın
geçerliği hakkında aşağıdakilerden hangisi en doğru olur?
A) Araç ölçmek istediği değişkeni
ölçmektedir.
B) Araç ölçmek istediği değişkeni yetersiz
ölçmektedir.
C) Araç ölçmek istediği değişkenin tam
zıddı bir değişkeni ölçmektedir.
D) Aracın hangi değişkeni ölçtüğünü
bilemeyiz.
E) Araç ölçmek istediği değişkeni
ölçememektedir.*
8. Bir ölçme aracı iki gruba uygulanmıştır. Grupların
ortalamaları aynı olmasına rağmen ikinci grubun standart sapması birinci grubun
standart sapmasının iki katı bulunmuştur. Aşağıdakilerin hangisi ikinci grup
için kesinlikle söylenebilir?
A) İkinci grubun varyansı birinci grubun
varyansına eşittir.
B) İkinci grubun puan dağılımı birinci
gruba göre homojendir.
C) İkinci grubun ortancası birinci grubun
ortancasına eşittir
D) İkinci grubun puan dağılımı birinci
gruba göre hetorejendir.*
E) İkinci gurup birinci gruba göre daha
başarılıdır.
9. Bir ölçme aracının hesaplanan KR-20 güvenirlik katsayısı
0,95 bulunmuştur. Buna göre aşağıdakilerden hangisi kesinlikle
söylenebilir.
A) Aracın güvenirliği yeterli değildir.
B) Araç ikinci uygulamada kararlı sonuçlar
verir.
C) Araçta bulunan sorular arasında ilişki
yüksektir.*
D) Araç aynı değişkeni ölçen başka araçla
tutarlı sonuç verir.
E) Araç güvenilir olmamasına fakat geçerli
olabilir.
|
V. DEĞERLENDİRME
(SINAMA DURUMLARI)
Ölçme
sonuçlarını bir ölçütle karşılaştırıp karar verme sürecidir. Eğitimde bu
öğrenci başarısını, öğrenme hızını, öğrenme güçlüklerini belirlemede
kullanılabilir. Değerlendirmede üç öğe olduğu açıkça anlaşılmaktadır.
1-Ölçme=Gözlem sonuçlarıdır.
Ölçme sonuçları değerlendirme değildir.
2-Ölçüt=Amaca göre değişir.
Geçerli, güvenilir ve kullanışlı olmalıdır.
3-Karar=Ölçüte ve karar verene
göre değişir.
Öğrencide gözlemeye karar verdiğimiz doğrudan ve
dolaylı davranışları onun kazanıp kazanmadığını, kazandıysa ne ölçüde kazandığını, kazanmadıysa niçin kazanamadığını, kazanması için eğitim durumlarında nelerin
yapılması gerektiğini belirleme
değerlendirmenin kapsamı içindedir; çünkü değerlendirme, ölçme sonuçlarını
bir ölçüte vurup, yargıya varma süreci olarak tanımlanabilir.
Eğitimde değerlendirme, sürecin
tamamında yapılmaktadır. En belirgin ve bilinenleri;
1-Hazır bulunuşluluk yada düzey
belirleme amacıyla,
2-Öğrenme eksiklerini saptamak
amacıyla=biçimlendirmeye yönelik,
3-Öğrenci başarısını saptamak
amacıyla=değer biçmeye yönelik; not verme,
4-Öğretimin etkililiği hakkında
bir karar vermek amacıyla,
5-Öğretim programının sağlamlığı
hakkında karar vermek amacıyla,
6-Öğretmen ve diğer eğitim
görevlilileri hakkında karar vermek amacıyla,
7-Değerlendirme yöntem ve
ölçütleri hakkında karar vermek amacıyla,
8-Sistem hakkında karar vermek
vb. amacıyla yapılan değerlendirmeler ve bunlara eklenebilecek olanlardan söz
edilebilir. Gözden kaçmaması gereken değerlendirme hangi amaç için yapılırsa
yapılsın sistemin onarılması anlamını kapsamaktadır.
Değerlendirme
Çeşitleri:
Değerlendirme
ölçüte bağlı olarak ikiye ayrılır.
1-Mutlak
(Ölçüt Dayanaklı) Değerlendirme (Ör; hedef-davranışlara göre yapılan
değerlendirme): Ölçüt ölçme işleminden önce belirlenmiştir. Örneğin programın
hedef-davranışları veya kazanımlarının % 60 gibi. Bir sistem ya da yetişeğin hedeflerini gerçekleştirme derecesine
bakılarak yapılan değerlendirmedir. Bu tür değerlendirmede
ölçüt hedeflerdir. Hedef dayanaklı değerlendirme de denir. Sistem ve yetişeğin etkinliğini değerlendirmede işe
koşulmalıdır. Ayrıca ünite ve hedef analizlerinde,
sıkı aşamalılık ilişkisi bulunduğu derslerde, yarım, eksik öğrenmelerin hayati tehlike doğurduğu kurslarda ve bir alana
belli bir beceri, bilgi üzerindeki kişilerin alınacağı durumlarda bu
değerlendirme türüne başvurulabilir.
Öğrenciler mutlak ölçütlere göre değerlendirildiklerinde
Mutlak Başarı Yüzdesi hesaplanır. Bu formül aşağıdaki gibidir.
|
MBY= Mutlak başarı yüzdesi
Xb = Öğrencinin (Bireyin) puanı
Xmak = Testten alınabilecek en yüksek puan
2-Bağıl
Değerlendirme
(Ör; Sınıf ortalamasına göre yapılan değerlendirme): Ölçüt sonradan ölçme
yapılan gruba bağlı olarak elde ediliyor ve değişiyorsa bağıl değerlendirme
yapılmış olur. Bir grup içinde bireyleri
birbiriyle karşılaştırmak, sıralamak
ve bir okul sistemine ya da kursa alınacakları seçmek için işe koşulan
değerlendirme türüdür. Bu tür değerlendirme aşamalılık ilişkilerinin sıkı
olmadığı derslerde, öğrenci başarısını belirlemede de işe koşulabilir. Sistemi
ya da yetişeği değerlendirmede ise yeterli
değildir.
Değerlendirme
amaca bağlı olarak üçe ayrılır:
1)Tanımaya yerleştirmeye yönelik
değerlendirme (hazırbulunuşluk testleri veya seviye tespit sınavları): Ders
ya da kursa başlamadan önce ön koşul davranışlardan ne kadarına sahip
olunduğunu belirlemek amacıyla yapılan değerlendirmelerdir (örneğin; İngilizce
kur sınavları). Bu sınavlardaki değerlendirme mutlaktır.
2)Biçimlendirmeye yönelik değerlendirme
(izleme testleri): Ders ya da kurs sürecinde öğrenme eksik veya yanlışlarını
belirlemek amacıyla yapıla değerlendirmelerdir (örneğin, konu testleri,
quizler, dershane tarama testleri, yaprak testler gibi). Bu sınavlardaki değerlendirme
mutlaktır.
3)Değer
biçmeye yönelik değerlendirme (sonuç değerlendirme, başarı testleri):Ders ya da kurs bitiminde
öğrencilerin kazandırılması planlanan davranışlardan veya kazanımlardan ne
kadarını kazandığını belirleme işidir (final sınavları; sertifikalar; yeterlik
belgeleri gibi).Öğrencilerin erişilerini
belirleme amacıyla kullanılır. Bu sınavlardaki değerlendirmeler genlikle
bağıldır ancak mutlak değerlendirmeler de yapılabilir.
Alternatif değerlendirme teknikleri
Öğrenci
Ürün Dosyası (portfolyo):

Öğrenci ürün
dosyası öğrencilerin çalışmalarını, harcadıkları çabayı ve gelişmelerini gösterebilir.
Öğrencinin çalışmalarını, çabalarını ve gelişimini, velisinin, öğretmenlerinin ve
diğer ilgililerin izlemesini kolaylaştırır.
Öğrenci ürün dosyasının amaçları:
1-Öğrencinin öz disiplin ve sorumluluk
bilincini geliştirir
2-Öğrencilere kendini değerlendirme becerisi
kazandırır.
3-Ürün değerlendirme araçlarının
yanında süreç (performans) değerlendirme araçlarının da kullanılmasına olanak
tanır.
4-Öğrencinin
gelişimini izleyebilme olanağı sağlar.
5-Öğrencinin gelecekteki öğrenmelerine
yol gösterir.
6-Öğrencilerin yeteneklerini
sergilemelerine ve ilgi alanlarını geliştirmelerine fırsat verir.
7-Öğrencilere arkadaşlarının
gelişimlerini izleme ve değerlendirme şansı verir.
8-Grup çalışmalarına katılımı ve
öğrencilerin birbirlerine yardımcı olmalarını kolaylaştırır.
9-Öğrencilerin çalışmalarını kendilerinin
ve arkadaşlarının değerlendirmelerine olanak vererek öğrencinin değerlendirme
sürecine aktif katılımını sağlar.
10-Öğretmene öğrenciyi tüm yönleriyle
(bilgi, beceri, ilgi, kişilik vb.) tanıma olanağı verir.
11-Aile ve öğrenci arasında iletişim güçlendirir.
12-Öğrencini bir bütün olarak
görülmesi ve değerlendirilmesi amacına hizmet eder.
Öğrenci Ürün Dosyasını Oluşturmada
Kullanılacak Teknikler
5-Öğretmenin, öğrencinin, akranların (grup çalışmasında)
ve velinin seçtiği çalışmalar
Ürün Dosyası Oluşturma Sürecinin Temel
Aşamaları
1-Öğretimin genel hedefleri ve
kazanımları belirlenir.
4-Öğrencilere ürün dosyalarını
oluşturmada rehber olması açısından örnek bir ürün dosyası gösterilir.
Tablo
10. Geleneksel - ürün dosyası değerlendirme karşılaştırması
Geleneksel Değerlendirme |
Ürün Dosyası Değerlendirme |
· Öğrencinin yeteneği, tutumu, bilgisi vb.
tek bir zamanda ölçülür · Öğrenci ölçütlerden habersizdir
Değerlendirmeyi öğretmen yapar · Öğrenciler içinde bulundukları öğrenci
grubuna göre değerlendirilir · Öğrenciye değerlendirme konusunda aktiflik
ve sorumluluk vermez, · Değerlendirmeler öğrenme sürecinde bağımsız
olarak yapılır |
· Öğrencinin yeteneği, tutumu, bilgisi vb.
süreç içinde ölçülür · Öğrenci ölçütlerden haberdardır ve
değerlendirme sürecinde aktifitr · Öğrencilerin bireysel olarak
değerlendirilmesi söz konusudur, · Öğrenci aktiftir, sorumluluk verilir ve
sorumluluk almayı öğrenir. · Öğrenme ve değerlendirme süreci bir bütün
olarak görülür. |
1-Öz
değerlendirme (kendini değerlendirme)

Öz
değerlendirmenin olumlu ve olumsuz yönleri vardır. İnsanların genellikle kendi
performanslarını değerlendirirken yanlı davranma olasılıkları göz ardı
edilmemelidir. Öz değerlendirme, ilk başlarda öğrencilerin deneyimsizliği nedeniyle
yanılgılara neden olabilir. Öğrenciler deneyim kazandıkça daha doğru kararlar
alacaklardır.
|
Akran değerlendirme sınıf içinde öğrenciler tarafından yapılan
çalışmayla ilgili olarak öğrencilerin bir birini değerlendirmesi anlamına
gelmektedir. Öğrencilerin değerlendirme sürecine sokulması onların kendi
yaptıkları işler için yargılarını geliştirme amacı gütmektedir. Öğrencilerin
değerlendirme işlemlerinde başarılı olabilmeleri için eğitim almaya ihtiyaçları
olabilir. Bu amaçla değerlendirme ölçütleri öğrencilerle tartışılarak
kararlaştırılabilir. Değerlendirmelerin nasıl yapılacağına ilişkin öğrencilere
geri bildirim verilebilir.
Akran değerlendirme, öğrenmeyle yakından ilişkilidir. Akran
değerlendirme, yaşam boyu öğrenmenin önemi, biliş bilgisi, öğrenmede öğrenci
sorumluluğu üzerine odaklanmayı içerir. Yaşam boyu öğrenme, bireylerin yalnızca
bağımsız çalışmalarını değil, aynı zamanda kendi performans ve gelişimlerini
değerlendirmelerini zorunlu kılar. Değerlendirme süreci ile ilgilenmek,
öğrencinin öğrenmeye yaklaşımı, öğrencinin kendi güç ve zayıflıkları ve
becerileri hakkında değerlendirme yapmasını sağlar.
Akran değerlendirmesinde ortaya çıkan anahtar soru, öğrencilerin
verdiği notların geçerli olup olmayacağıdır. Bu soruya en kolay cevabı
bulabilmek için öğrencilerin birbirlerine verdikleri notlar ile öğretmenin
öğrencilere verdiği notlar arasındaki ilişkiye bakılabilir.
Akran değerlendirmesinin kişiler arası ilişkiler ve akademik kendine
güven üzerinde olumsuz etkileri olabilir. Bir öğrencinin yazısını
arkadaşlarının değerlendirmesine sunmak riskli olabilir, ancak rekabet
körüklenmez ve işbirliği ortamı yaratılırsa öğrenciler yararlı eleştiriler
getirebilirler. Öğrencilerin akranlarını değerlendirmede yapıcı olmaları, onları
değerlendirmede doğru ölçütler kullanmalarına bağlıdır. Bu ölçütlerden oluşan
akran değerlendirme ölçekleri hazırlanarak öğrencilerin kullanması için
verilebilir.
Not
Öğrenci hakkında varılan değer
yargısıdır. Değerlendirmedir.
Not verirken onun etkili ve
amaçlara uygun olması için şunlara dikkat etmek yararlıdır.
1-Not başarılı öğrencinin
motivasyonunu artırır, başarısız olanın düşürür. Bu nedenle notlar öğrencinin
başarısız olduğu değil, başarılı olduğu alanlar vurgulamalıdır.
2-Notlar öğretimin niteliği
hakkında bilgi verir. Bu nedenle notlara bakarak öğretmenler kendilerini
değerlendirebilirler.
3-Notlar okul yöneticilerine,
diğer yetkililere ve velilere de bilgi verir. Bu nedenle geçerli, güvenilir ve
gerçeği yansıtan bir ölçüte dayanmalıdır. Notlar ölçme araçlarının geçerliği ve
güvenirliği de dikkate alınarak verilmelidir. Uygun ve hatasız bir ölçüt
kullanılırsa notlar gerçeğe daha yakın olur.
Not Vermede Ölçütler
1-Öğretmen Kanısı: Yeteri kadar
güvenilir ve geçerli bir ölçüt değildir. Dayanak öğretmenlerin kendi bilgi,
beceri, duygu ve düşünce çerçevesidir. Öğretmenden öğretmene değişir.
2-Öğrencinin Yeteneği: Yeteneğin
ölçülmesi bazı alanlarda yapılabilmekte bazı alanlarda ise yapılamamaktadır.
Yapıldığı alanlarda ise geçerliği ve güvenirliği tartışmalıdır. Pek güvenilir
ve geçerli bir ölçüt değildir. Nota yansıtmak, ölçüt almak yerine öğrencilerin
yönlendirilmesinde kullanılmalıdır.
3-Öğrencinin Gösterdiği Gelişme:
Erişi de denir. Dersin başında sahip olunan davranışlarla dersin sonunda sahip
olunanlar arasındaki farktır. Gelişmenin ölçüt alınması doğru değildir. Çünkü
her öğrencinin başlangıç davranışları aynı olmadığından aradaki farkı
belirlemek çoğunlukla mümkün olmaz. Hazır bulunuşluk testleri uygulama yoluyla
bunları belirleme imkanı olsa da pek sağlıklı bir yol değildir. Hatalar
içermektedir.
4-Sınıfın Ortalama Başarısı: Bazı
ülkelerde çokça kullanılır. Bu ölçütte sınıf ortalaması orta noktaya denk
getirilir. Diğer başarı düzeyleri de buna göre iyi, pekiyi vb. gibi belirlenir.
Öğrenme ortamı, öğretmen ve diğer etkenlerin öğrencilere veya öğrenmeye etkisi
aynı olduğu için savunulabilir. Ancak bu yaklaşımda programın
hedef-davranışları dikkate alınmaz. Bu yaklaşım davranışları yeterince
kazanamayanlara diploma verme, buna karşılık davranışların çoğuna sahip olan
birçok öğrencinin sınıfta kalmasına sebep olabilir. Eğitim sisteminin çelişkili
sonuçlar vermesine neden olur. Bu yaklaşımında geçersiz ve güvenilmez olduğu
sonucuna varılır.
5-Hedef ve Davranışlar: Ölçüt
kazandırılması hedeflenen davranışlardır. Davranışların asgarisine sahip olan
öğrenciler minimum geçer not alır. Bu yaklaşımda notlar öğretmen, öğrenme
ortamı vb. dış etkenlerden etkilenir. Bu etkilerden gelen başarısızlık
sebepleri notlara yansır. Bu durum olumsuz taraflarıdır. Bu yöntem özellikle
ön-şart ilişkilerin yüksek olduğu matematik, fizik, laboratuar ve atölye
derslerinde kullanılabilir.
Bölüm Testi
1. Aşağıdakilerden hangisi değer biçmeye yönelik
değerlendirme değildir?
A) Vize sınavı
B) Final Sınavı*
C) Bütünleme sınavı
D) Üniversite seçme sınavı
E) Ünite sınavı
2.
Aşağıdakilerden hangisi değerlendirme ile ilgili değildir?
A) Bir yargılama ve karar verme işidir.
B) İki özelliğin karşılaştırılmasına
dayanır.*
C) Ölçümlerden bir anlam çıkarmadır.
D) Davranış derecesini belirleme işidir.
E) Bir değer yargısına varmaktır.
3.
Aşağıdakilerden hangisi tanıma-yerleştirmeye yönelik değerlendirme için
yapılır?
A) Öğrencileri cinsiyetine göre ayırmak
B) Öğrencilerin hazır-bulunuşluk düzeyini
belirlemek
C) Ünite bitiminde yazılı yoklama yapmak*
D) Dönem sonunda bitirme sınavları yapmak
E) Öğrencileri boy ve ağırlıklarına göre
ayırmak
4. Bir öğretmen ham puanı sınıf ortalamasının 2 standart
sapma üstünde olan öğrencilere “pekiyi” notu vermiştir. Bu değerlendirmede
ölçüt nedir?
A) Sınıfın ortalama başarısı*
B) Öğrencinin gelişim farkı
C) Dersin hedef davranışları
D) Öğretmenin kanısı
E) Testin ortalama güçlüğü
5. Aşağıdakilerden hangisi sınıfın ortalama başarısı ölçüt
alınarak yapılan değerlendirmenin olumlu bir yönüdür?
A) Öğrencileri çalışmaya yönlendirmesi*
B) Daha adil bir değerlendirme yapması
C) Ölçme hatalarından etkilenmemesi
D) Daha kullanışlı olması
E) Öğrencilerde kaygıyı düşürmesi
6. Eğitim
sisteminde değerlendirmenin önemini aşağıdakilerden hangisi daha iyi
açıklar?
A) Sistemin kendini yenilemesine katkı
sağlar.*
B) Girdilerdeki eksikliği kontrol eder.
C) Süreçte olan aksaklıkları saptar.
D) Çıktıların hedeflerle tutarlılığını
denetler.
E) Öğrencilerin başarısı hakkında bilgi
verir.
7. Aşağıdakilerden
hangisi bir değerlendirme türü değildir?
A) Programın sağlamlığını denemek
B) Öğretim yönteminin etkililiğine bakmak
C) Öğrencilerin başarısını izlemek
D) Öğretilenlerdeki eksiklikleri saptamak
E) Ölçme aracının güvenirliğini
belirlemek*
8. “Bir öğretmen sınav sonunda Ahmet’e 64 puan ve buna
dayalı olarak 6 notu vermiştir.” İfadesi için aşağıdakilerden hangisi
söylenebilir?
A) 64 karar, 6 yargı
B) 64 ve 6 ölçme sonucu
C) 64 ve 6 değerlendirme sonucu
D) 64 ölçme sonucu, 6 karar*
E) 64 yargı, 6 değerlendirme
9. “Öğrencileri bütün yönleriyle
tanıma; öğrencilerin bireysel gelişimlerini izleme; öğrencilerin yeteneklerini
belirleme; öğrenciler hakkında toplanan bilgiyi onların yönlendirilmesinde
kullanma; öğrencilere kendi ürünlerini değerlendirme imkanı verme” gibi
amaçlara hizmet eden değerlendirme aşağıdakilerden hangisidir?
A)
Dereceleme ölçekleri B)
Ürün dosyaları*
C)
Ödevler D)Projeler E)Yazılı sınavlar
KAYNAKÇA
Ölçme ve Değerlendirme bölümü oluşturulurken
aşağıdaki kaynaklardan yararlanılmıştır.
Cemal YILDIRIM |
Eğitimde Ölçme ve Değerlendirme |
ÖSYM Yayınları |
Ankara: 1999 |
Çiğdem KAĞITÇIBAŞI |
İnsan ve İnsanlar |
Evrim Basın, yayım, dağıtım |
İstanbul, 1988 |
D. Ali ÖZÇELİK |
Ölçme ve Değerlendirme |
ÖSYM Yayınları |
Ankara: 1992 |
Halil TEKİN |
Eğitimde Ölçme ve Değerlendirme |
Yargı Yayınları |
Ankara: 1993 |
Harry Grover TUTTLE |
Rubrics |
||
Hüseyin ÖNCÜ |
Eğitimde Ölçme ve Değerlendirme |
YAYSAN A.Ş. |
Ankara: 1999 |
İbrahim Ethem ÖZGÜVEN |
Psikolojik Testler |
PDREM Yay. |
Ankara, 1998 |
M. Fuat TURGUT |
Eğitimde Ölçme ve Değerlendirme Metotları |
Saydam Matbaa |
Ankara: 1992 |
MİLLİ EĞİTİM BAKANLIĞI |
http://ttkb.meb.gov.tr/ogretmen/ İlköğretim Programları ve Öğretim Materyalleri |
|
Ankara, 2004 |
Ömer BEYDOĞAN |
Okullarda Ölçme ve Değerlendirme |
A.Ü. KKEF yayınları |
Erzurum: 1998 |
Özcan DEMİREL |
Planlamadan Değerlendirmeye Öğretme Sanatı |
PEGEMA |
Ankara: 2004 |
Terri L WENZLAFF, Jennifer J. FAGER, Marta J. COLEMAN |
What is a Rubric?
Do Practitioners and the Literature Agree? |
||
Yaşar BAYKUL |
Eğitimde ve Psikolojide Ölçme |
ÖSYM yayınları |
Ankara: 2000 |
Yaşar BAYKUL |
İstatistik: Metotlar ve Uygulamalar |
Anı Yayınları |
Ankara, 1999 |
Yaşar BAYKUL, Selahattin GELBAL Hülya KELECİOĞLU |
Eğitimde Ölçme ve Değerlendirme |
MEB Yayınları |
Ankara: 2001 |
Veysel SÖZNMEZ |
Öğretmen El Kitabı |
PEGEM Yayınları |
Ankara, 1994 |
DENEME 1
1. Bir testin güvenirliğini
aşağıdakilerden hangisi daha iyi açıklar?
a)
Test bir çok durumda kullanılmaya uygundur
b)
Testin başka bir testle korelasyonu yüksektir
c)
Test bireylerin başarısını az hata ile ölçebilir
d)
Test şans başarısını azaltmada kullanılabilir
e)
Test konu kapsamını ölçebilecek niteliktedir
2. 1.
Bir davranışa sahip olanla olmayanı ayırabilme düzeyi
2.
Ölçmelere karışan ortalama hata miktarı
3.
Gözlemlerin hatalardan arınıklık derecesi
4.
Ölçme aracının amaca uygunluk derecesi
5.
Ölçme sonuçlarının bir ölçütle karşılaştırılması
Yukarıdakilerden
hangileri geçerliği tanımlamada kullanılabilir?
a)
2-3 b) 1-4 c) 2-4 d) 2-5 e)
3-5
***3 ve 4. soruları aşağıdaki tabloya göre
cevaplayınız.
|
I. TEST |
2. TEST |
3. TEST |
4. TEST |
5. TEST |
Güvenirlik |
0,77 |
0,65 |
0,99 |
0,50 |
0,45 |
Geçerlik |
0,77 |
0,60 |
0,30 |
0,40 |
-0,15 |
3. Geçerlik güvenirlik arasındaki
ilişkilere bağlı olarak yukarıdaki testlerin hangisinde güvenirlik katsayısı
yanlış hesaplanmıştır?
a)
1 b) 2 c) 3 d) 4 e)
5
4. Yukarıdaki testlerden
hangisini kullanmak daha doğru olur?
a)
1 b) 2 c) 3 d) 4 e)
5
5. Bir dershane, on gün önce
öğrencilerinin Ö.S.S deneme sınavından aldığı puanlarla Ö.S.S. sınavından
aldığı puanlar arasındaki ilişkiyi araştırmaktadır. Elde edilecek sonuç deneme
sınavının hangi özelliğini gösterir?
a)
İç Tutarlığını b) Standart
Hatasını c) Yordama
Geçerliği
d)
Kararlılık Düzeyi e) Yapı
Geçerliği
6. Bir puan dağılımı hakkında
özet bilgiler veren tipik değerlere ne ad verilir?
a)
Merkezi eğilim ölçüleri
b)
Değişim ölçüleri
c)
Sabit ölçüler
d)
Dağılım ölçüleri
e)
Saçılım ölçüleri
7. Bir testin kolay mı yoksa zor
mu olduğunu belirlemek için aşağıdaki katsayılardan hangisini hesaplamak
gerekir?
a)
Basıklık b) Regresyon c) Korelasyon
d)
Değişim e)
Çarpıklık
8. Bir testte 40 soru sorulmuş ve standart sapması 5,
ortalaması 20 bulunmuştur. Bu sınavdan 30 alan bir öğrencinin T puanı kaçtır?
a) 40 b) 50 c) 60 d) 70 e)
80
9. Uygulanan bir matematik testi sonucunda bütün
sınıf başarılı olmuştur. Bu durumda aşağıdakilerden hangisini kesinlikle
söyleyemeyiz?
a)
Testteki maddeler ayırt edicidir
b)
Testteki maddeler kapsamı iyi örneklemiştir
c)
Testteki maddeler çok kolaydır
d)
Öğrenciler matematik başarısı bakımından benzeşiktir
e)
Öğrenciler ölçülecek davranışları kavramıştır
***10-12 soruları aşağıdaki dağılımlara göre cevaplayınız.
10.
Yukarıdaki dağılımların hangisinde merkezi eğilim ölçüsü olarak ortancayı
kullanmak doğru olur?
a)
1 b) 2 c) 3 d) 4 e)
5
11. Yukarıdaki dağılımların
hangisinde birden fazla mod vardır?
a)
1 b) 2 c) 3 d) 4 e)
5
12.
Yukarıdaki dağılımların en basık olanı hangisidir?
a)
1 b) 2 c) 3 d) 4 e)
5
13. Aşağıdakilerden hangisi kısa cevaplı testlerin
özelliklerinden biri değildir?
a)
Puanlama kolaydır
b)
Bilgi düzeyi davranışları ölçer
c)
Cevaplar şişirilebilir
d)
Her eğitim düzeyine uygundur
e)
Çeşitli yetenek alanına uygundur
14.
Aşağıdakilerden hangisi eşit aralık ölçeğinde elde edilmiştir?
a)
Günlük görüşülen hasta sayısı
b)
Ayakkabı numarası
c)
Sahadaki takım sayısı
d)
Öğrenim görülen fakülte
e)
Standartlaştırılmış başarı puanı
***15-16. soruları aşağıdaki tabloya göre yanıtlayınız.
S
Sınıf
1 50 15
Sınıf
2 40 5
Sınıf
3 50 10
Sınıf
4 60 15
Sınıf
5 70 10
15. Yukarıdaki tabloya göre
öğrencilerin başarıları arasındaki farklar hangi sınıfta daha büyüktür?
a)
1 b)2 c) 3 d) 4 e)5
16.
Yukarıdaki tabloya göre hangi sınıftaki öğrenciler birbirlerine daha yakın not
almışlardır?
a)
1 b)2 c) 3 d) 4 e)5
17.Aşağıdakilerden
hangisi sınıflı ölçekler için kullanılabilecek istatistiksel tekniklerden
biridir?
a)
Ortalama b) Korelasyon c) Varyans
d)
Ortanca e) Mod
18.
Aşağıdakilerden hangisi değerlendirme ile ilgili değildir?
a) Bir yargılama ve
karar verme işidir.
b) İki özelliğin
karşılaştırılmasına dayanır.
c) Ölçümlerden bir anlam
çıkarmadır.
d) Davranış derecesini
belirleme işidir.
e) Bir değer yargısına
varmaktır.
19.
Aşağıdakilerden hangisi bir yargıya varmak amacıyla yapılmaz?
a) Programın sağlamlığını
denemek
b) Öğretim yönteminin
etkililiğine bakmak
c) Öğrencilerin
başarısına karar vermek
d) Öğretilenlerdeki
eksiklikleri saptamak
e) Ölçme aracının
güvenirliğini belirlemek
20. Aşağıdaki
önermelerden hangisi yanlıştır?
a) Güvenirlik arttıkça
hata azalır.
b) Güvenirlik +1 ile –1
arasında değer alır.
c) Madde sayısı arttıkça
güvenirlik artar.
d) Güvenirlik geçerlik
için ön şarttır.
e) Tutarlık güvenirliğin
anlamlarındandır.
DENEME 2
1- Öğrencilerin derste öğrenemedikleri
konuları saptayıp, konularla ilgili, yeni etkinlikleri yapmaya olanak tanıyan sınav türlerine genel olarak ne isimi
verilir?
A) Zeka Testleri
B) Performans Testleri
C) Başarı Testleri
D) İzleme Testleri
E) Seçme Testleri
2- Sınav planını aşağıdakilerden
hangisi daha iyi açıklar?
A)Öğrencilerin sınava gireceği
koşulları belirleme
B)Öğrencilere sorulacak soruları
belirleme ve yazma
C)İstenilir özelliklere sahip bir
ölçme aracı elde etme süreci
D)Uygulanmış bir testin geçerli
olan maddelerini seçme
E)Seçenekleri iyi işlemeyen
maddeleri seçeneklerini düzeltme
3- Aşağıdakilerden hangisinde
ölçme işlemi yoktur?
A)Bir sınıftaki öğrencileri
sarışın, esmer ve kumral diye gruplamak
B)Bir ceket üzerindeki kol
düğmelerini saymak
C)Bir otobüsün iki durak arasını
kaç dakikada aldığını belirlemek
D)Bir sınıftaki kız ve erkek
öğrencilerin sayılarını saptamak
E)İyi bir bilgisayar almak için
minimum donanım özelliklerini belirlemek
4- Bir dersane öğrencilerine
deneme sınavı uygulanmış ve ÖSS’de öğrencilerinin bu sınavdan alacağı puanlara
yakın puan alacağını iddia etmiştir. Dersanenin
iddiasının gerçekleşmesi deneme sınavının en çok hangi özelliğine
bağlıdır?
A) İç tutarlığına
B) Yapı geçerliğine
C) Objektifliğine
D) Yordama geçerliğine
E) Duyarlığına
5- Aşağıdakilerden hangisi
testtin güvenirliğini artırmayı sağlamaz?
A)Ölçülecek her davranışla ilgili
soru sorulması
B)Soruların çok beğenilen bir
kitaptan alınması
C)Öğrencilere gereğinden fazla
süre verilmemesi
D)Testin tümünün çok zor
sorulardan oluşturulması
E)Sınav koşullarının motivasyonu
düşürecek etkilerden arındırılması
6- Aşağıdakilerden hangisi
portfolya (dosya) değerlendirmenin öğrenciye sağladığı avantajlardan biri değildir?
A)Öğrencilerin yaratıcılıklarını
geliştirmede etkilidir
B)Öğrencilere sorumluluk almayı
öğretir
C)Öğrencinin kendi
değerlendirmesine katılımını sağlar
D)Öğrencilere hangi
arkadaşlarından daha fazla bilgi sahibi olduğunu gösterir
E)Öğrenciler bir sınavla değil
süreç içinde değerlendirilir.
7- Aşağıdakilerden hangisi bir değerlendirme
işlemi değildir?
A)Doktorun muayene ettiği kişinin
hasta olduğunu belirlemesi
B)Yönünü kaybetmiş birinin kutup
yıldızına bakarak yönünü belirlemesi
C)Türkçe öğretmenin ders kitabını
inceleyerek yetersiz bulması
D)Öğretmenin geliştirdiği testin
güvenirlik değerine yüksek demesi
E)Bir kişinin bir numara büyük
ayakkabı almaya karar vermesi
8- Doğru yanlış testlerinin eğtim
bilim açısından uygun olmayan en önemli özelliği nedir?
A)Seçenek sayısının az olması
B)Yanlışı vurgulaması
C)Alt eğitim sevilerine uygun
olmaması
D)Çoktan seçmeli testlere
benzemesi
E)Üst düzey davranışları
yoklayamaması
9-Çoktan seçmeli testlerde
seçenek sayısını azaltmanın temel gerekçesi ne olmalıdır?
A)Şans başarısını artırmak
B)Puanlama hatasını azaltmak
C)Soruları zorlaştırmak
D)Alt eğitim kademelerinde
kullanmak
E)Soruları kolaylaştırmak
10- I. Sınıflama
ölçekleri
II. Sıralama
ölçekleri
III. Eşit
aralıklı ölçekler
IV. Oranlı
ölçekler
Öğretimde kullanılan ölçek türleri hangisidir?
A)I ve II
B)II ve III
C)I, II ve III
D)II, III ve IV
E)III ve IV
11- Nesneler
arasındaki nitelik farklarının miktarını gösteren ölçek türüne ne ad verilir?
A)Sınıflama
B)Sıralama
C)Eşit aralıklı
D)Oranlı
E)Adlandırma
12- Aşağıdakilerden hangisi güvenirliğin tanımlarından biri değildir?
A)Bir ölçme aracının ölçme
sonuçlarına hata karıştırmadan ölçme yapabilmesi
B)Özelliği ölçülen varlık veya
olayların bu özelliğinde bir değişme olmadıkça, onları hep aynı sıraya koyan
ölçüler vermesi
C)Bir ölçme aracının, ölçmesi
amaçlanan özelliği başka değişkenlerle karıştırmadan ölçmesi
D)Bir ölçme aracının ölçtüğü
özelliği ne derece bir kararlılıkla yansıtabildiği
E)Aynı bireyler üzerinde yapılan
bir niteliğe ait ölçümlerin benzer şartlarda tekrar elde edilebilirliği
13-Ortalaması eşit iki gruptan birincinin bağıl değişim
katsayısı 30, ikincinin 15’dir. Bu bilgilere dayanarak iki grubun st. sapması
için aşağıdakilerden hangisini söyleyebiliriz?
A) Birinci grubun st. sapması ikinci grubun st. sapmasından
büyüktür.
B) Birinci grubun st. sapması ikinci grubun st. sapmasına
eşittir.
C) Birinci grubun st. sapması ikinci grubun st. sapmasından
küçüktür.
D) Grup st. sapmalarını karşılaştırmak için yeterli bilgi
yoktur.
E) İkinci grubun st. sapması birinci grup st. sapmasının iki
katıdır.
14- Bir gruba Türkçe ve Matematik testi uygulanıyor.
Gruptaki bireyler bu testlerden elde
ettikleri z puanlarına göre sıraya konuluyor. Ardından grubun t puanları
hesaplanıyor ve t puanlarına göre sıralama yapılıyor. Bu iki sıralama
arasındaki korelasyon katsayısı için aşağıdakilerden hangisi doğru olur?
A)Negatif olur
B)Negatif mükemmel olur
C)Sıfır olur
D)Pozitif olur
E)Pozitif mükemmel olur
15-
Dersler |
Ortalama |
St. sapma |
Not |
Türkçe |
80 |
10 |
90 |
Matematik |
50 |
5 |
55 |
Fen |
60 |
15 |
75 |
Yukarıdaki tabloda, bir öğrencinin Türkçe, Matematik ve Fen
derslerine ait sınav notları ve bu sınavların ortalamaları ile standart
sapmaları görünmektedir. Bu bilgilere göre öğrencinin üç dersteki başarısı
hakkında varılacak hangi karar doğru olur?
A) Öğrenci en yüksek başarıyı Matematik dersinde
göstermiştir.
B)Öğrenci en yüksek başarıyı Türkçe dersinde göstermiştir.
C)Öğrenci en yüksek başarıyı Fen dersinde göstermiştir.
D) Öğrenci her üç derste de aynı düzeyde başarılı olmuştur.
E)Verilen bilgiler karşılaştırma yapmak için yeterli
değildir.
***16-18 soruları tabloya göre cevaplayınız
Gruplar |
A |
B* |
C |
D |
E |
Toplam |
Üst Grup Alt Grup |
20 20 |
30 20 |
20 20 |
20 25 |
10 15 |
100 100 |
Toplam |
40 |
50 |
40 |
45 |
25 |
200 |
*B doğru cevap olduğuna göre
16- Sorunun güçlük indeksi
kaçtır?
A) 0.60
B) 0.50
C) 0.30
D) 0.25
E) 0.20
17- Sorunun ayırıcılık gücü
indeksi kaçtır?
A) 0.10
B) 0.20
C) 0.30
D) 0.40
E) 0.50
18- Bu soruda yapılması gereken en
önemli işlem ne olmalıdır?
A)A ve C seçenekleri doğru cevaba
yakınlaştırılmalıdır.
B)Doğru cevap alt gruptan çok
öğrenci çektiği için değiştirilmelidir.
C)Zor bir soru olduğundan
kolaylaştırılmalıdır.
D)D çeldiricisi alt gruptan çok
öğrenci çektiğinden değiştirilmelidir.
E)Maddenin geçerliğini artırmak
gereklidir.
DENEME 3
1.Bir okul müdürü, kayıt yaptırmak için başvuran öğrencileri
iyi, orta, zayıf diye üç gruba ayırıp, buradan elde edeceği sonuçlara göre
öğrencileri uygun şubelere yerleştirmek istemektedir. Buna göre amaca en iyi
hizmet edecek test türü hangisidir?
A) Zeka Testi
B) Hazır bulunuşluk Testi
C) Kişilik Testi
D) Başarı Testi
E) İzleme Testi
2.Test palanında madde seçme işleminde önceki ve sonraki
aşamaları aşağıdakilerden hangisinde doğru verilmiştir.
A)Önceki:
Maddelerin düzeltilmesi
Sonraki: Deneme formunun
oluşturulması
B)Önceki:
Ölçülecek davranışların belirlenmesi
Sonraki: Asıl
test formunun oluşturulması
C) Önceki: Deneme uygulamasının yapılması
Sonraki: Asıl
test formunun oluşturulması
D) Önceki: Sınav türüne ve soru tipine karar verme
Sonraki: Deneme
uygulamasını yapma
E) Önceki: Madde analizlerini yapma
Sonraki: Asıl test formunu
oluşturma
3.
I. Ayşe’nin boy uzunluğu
II. Ayşe matematik sınavından 65 puan alarak geçmiştir
III. Ayşe voleybol takımına seçilecek boy uzunluğuna
sahiptir
IV. Ayşe ÖSS’ de 250 puan almıştır
V. Ayşe’nin puanı sınıfını geçmeye yetmemiştir.
Yukarıdaki
ifadelerin hangilerinde ölçme işlemi vardır?
A) I-IV B)
I-V C) II-IV D) II-III E) III-V
4.Bir ölçme aracı göz önüne alınmasa; kazandırılmak istenen
davranışların konu ve hedeflere göre dağılımını gösteren belirtke tablosunun en
önemli yararı nedir?
A)Güvenirliği yüksek bir test oluşturmak için sormamız
gereken soru sayısını gösterir
B)Kapsam geçerliğini belirlemeye veya sağlamaya dayanak
oluşturur
C)Özellikle kazandırılacak kritik davranışları belirlememizi
kolaylaştırır
D)Hangi konuya ne kadar zaman ayıracağımıza çabuk karar
vermemizi sağlar
E))Her konuda kazandırılacak davranışlara açıkça görmemizi
sağlar
5.Aşağıdakilerden hangisi bir öğretmenin yazılı sınav sonuçlarının
güvenirliğini artırmak için alabileceği önlemler arasında değildir?
A)Tanıdık öğrencilere daha hoş görüsüz davranarak düşük puan
vermek
B) Cevaplara verdiği puanları dikkatli toplayıp kaydetmek
C) önceden hangi cevaplara ne kadar puan vereceğini
belirlemek
D) Birkaç gün sonra kağıtlara yeniden puanlamak
E) aynı konuda uzman en az bir kişiye daha puanlama
yaptırmak
6.Portfolyo (dosya) değerlendirmenin bir sınıf öğretmenine
sağlayacağı avantajların en önemlisi nedir?
A)Bir öğrencinin tüm yönleri ile gelişimini izleme fırsatı
vermesi
B)Öğrencinin sevdiği ve sevmediği dersleri görmemizi
sağlaması
C)Öğrencinin yetenekli olduğu alanları açığa çıkarması
D)Öğrencilerin psikolojik sorunlarını tespit etmeyi olanaklı
kılması
E)Öğrencilerin arkadaşları hakkındaki düşüncelerini
açıklayabilmeleri
7.Ciddi bir lokanta ilginç bir uygulama başlatarak kravat
takmayan müşterileri lokantaya almamaktadır. Bu uygulama açısından kravat için
aşağıdaki nitelemelerin hangisi doğru olur?
A) Ölçüttür B)
Kuraldır C) Geçerliktir D) Değer
Yargısıdır E) Değerlendirmedir
8.Aşağıdakilerden hangisi kısa cevaplı sınavların yazılı
sınavlardan en üstün yönüdür?
A)Geniş bir kapsamı ölçmesi
B)Şans başarısının olmaması
C)Cevapların sınırlı olması
D)Soruların objektif puanlanması
E)Daha kullanışlı olması
9.Aşağıdakilerden hangisi çoktan seçmeli test maddelerinden
soru köküne göre maddedir?
A)Soru kipinde
B)Tek bir cevabı olan
C)Ortak köklü
D)Ortak seçenekli
E)Birleşik cevap gerektiren
10. Bir çoktan seçmeli teste
verilen doğru cevaplar, o testi alan grubun ortalaması ve standart sapması
dikkate alınarak tekrar hesaplanmıştır. Bu şekilde elde edilen puanlara
standart puanlar denir. Standart puanlar hangi ölçek niteliğindedir?
A)Sınıflama B)Sıralama C)Eşit aralıklı
D)Oranlı E)Adlandırma
11. Çoktan
seçmeli bir testin maddelerinin herkes tarafından aynı biçimde anlaşılmaması,
bu testin hangi niteliğini düşürür?
A)Güvenirliğini
B)Kapsam geçerliğini
C)Yapı geçerliğini
D)Kullanışlılığını
E)Uygunluk geçerliğini
12. 100 metreyi, yarışa katılanlar arasından ilk 5’e girerek
tamamlayanlar okul takımına seçilecektir. Bu seçme işlemi, aşağıdaki
ifadelerden hangisini açıklamak için iyi bir örnektir?
A)Bağıl değerlendirme
B)Mutlak değerlendirme
C)Temel ölçme
D)Dolaylı ölçme
E)Ölçüt dayanaklı ölçme
**13-15. soruları aşağıdaki tabloya
göre cevaplayınız.
9. SORU |
D |
Y |
T |
Üst grup |
30 |
20 |
50 |
Alt grup |
20 |
30 |
50 |
T |
50 |
50 |
100 |
13. Sorunun güçlük indeksi kaçtır?
A) 0,35 B)0,45 C)0,50
D)0,55 E)0,60
14. Sorunun ayırıcılık indeksi
kaçtır?
A) 0,20 B)0,40 C)0,50
D)0,60 E)0,80
15. Bu madde için aşağıdaki
yorumlardan hangisi daha doğrudur?
A) Madde orta güçlükte ve
ayırıcılığı yeterlidir.
B) Madde orta güçlükte ama
ayırıcılığı sıfırdır.
C) Amacına hizmet edemeyen zor bir
maddedir.
D) Madde orta güçlükte fakat
düzeltilmelidir.
E) Madde hem zor hem de ayırıcılığı
yüksektir.
**50 soruluk bir test 5 ayrı
sınıfa uygulanmış ve aşağıdaki istatistikler elde edilmiştir.
|
Ortalama |
Mod |
Ortanca |
St. sapma |
1. sınıf |
35 |
45 |
40 |
4 |
2. sınıf |
35 |
30 |
32 |
5 |
3. sınıf |
35 |
15 |
20 |
7 |
4. sınıf |
35 |
40 |
37 |
8 |
5. sınıf |
35 |
35 |
35 |
6 |
16.Tabloya göre hangi sınıfın puan
dağılımı simetriktir?
A) 1 B) 2 C) 3 D) 4 E) 5
17.Tabloya göre en yüksek öğrenme
düzeyi hangi sınıfta gerçekleşmiştir?
A) 1 B) 2 C) 3 D) 4 E) 5
18.Tabloya göre en düşük öğrenme
düzeyi hangi sınıfta gerçekleşmiştir?
A) 1 B) 2 C) 3 D) 4 E) 5
1- Öğrencilerin derste
öğrenemedikleri konuları saptayıp, konularla ilgili, yeni etkinlikleri yapmaya
olanak tanıyan sınav türlerine genel olarak ne isimi verilir?
A) Zeka Testleri
B) Performans Testleri
C) Başarı Testleri
D) İzleme
Testleri
E) Seçme Testleri
2- Sınav planını aşağıdakilerden
hangisi daha iyi açıklar?
A)Öğrencilerin sınava gireceği
koşulları belirleme
B)Öğrencilere sorulacak soruları
belirleme ve yazma
C)İstenilir
özelliklere sahip bir ölçme aracı elde etme süreci
D)Uygulanmış bir testin geçerli
olan maddelerini seçme
E)Seçenekleri iyi işlemeyen maddeleri
seçeneklerini düzeltme
3- Aşağıdakilerden hangisinde
ölçme işlemi yoktur?
A)Bir sınıftaki öğrencileri
sarışın, esmer ve kumral diye gruplamak
B)Bir ceket üzerindeki kol
düğmelerini saymak
C)Bir otobüsün iki durak arasını
kaç dakikada aldığını belirlemek
D)Bir sınıftaki kız ve erkek
öğrencilerin sayılarını saptamak
E)İyi bir
bilgisayar almak için minimum donanım özelliklerini belirlemek
4- Bir dersane öğrencilerine
deneme sınavı uygulanmış ve ÖSS’de öğrencilerinin bu sınavdan alacağı puanlara
yakın puan alacağını iddia etmiştir. Dersanenin
iddiasının gerçekleşmesi deneme sınavının en çok hangi özelliğine
bağlıdır?
A) İç tutarlığına
B) Yapı geçerliğine
C) Objektifliğine
D)
Yordama geçerliğine
E) Duyarlığına
5- Aşağıdakilerden hangisi testtin
güvenirliğini artırmayı sağlamaz?
A)Ölçülecek her davranışla ilgili
soru sorulması
B)Soruların
çok beğenilen bir kitaptan alınması
C)Öğrencilere gereğinden fazla
süre verilmemesi
D)Testin tümünün çok zor
sorulardan oluşturulması
E)Sınav koşullarının motivasyonu
düşürecek etkilerden arındırılması
6- Aşağıdakilerden hangisi
portfolya (dosya) değerlendirmenin öğrenciye sağladığı avantajlardan biri değildir?
A)Öğrencilerin yaratıcılıklarını
geliştirmede etkilidir
B)Öğrencilere sorumluluk almayı
öğretir
C)Öğrencinin kendi
değerlendirmesine katılımını sağlar
D)Öğrencilere
hangi arkadaşlarından daha fazla bilgi sahibi olduğunu gösterir
E)Öğrenciler bir sınavla değil
süreç içinde değerlendirilir.
7- Aşağıdakilerden hangisi bir
değerlendirme işlemi değildir?
A)Doktorun muayene ettiği kişinin
hasta olduğunu belirlemesi
B)Yönünü kaybetmiş birinin kutup
yıldızına bakarak yönünü belirlemesi
C)Türkçe öğretmenin ders kitabını
inceleyerek yetersiz bulması
D)Öğretmenin geliştirdiği testin
güvenirlik değerine yüksek demesi
E)Bir
kişinin bir numara büyük ayakkabı almaya karar vermesi
8- Doğru yanlış testlerinin eğtim
bilim açısından uygun olmayan en önemli özelliği nedir?
A)Seçenek sayısının az olması
B)Yanlışı
vurgulaması
C)Alt eğitim sevilerine uygun
olmaması
D)Çoktan seçmeli testlere
benzemesi
E)Üst düzey davranışları
yoklayamaması
9-Çoktan seçmeli testlerde
seçenek sayısını azaltmanın temel gerekçesi ne olmalıdır?
A)Şans başarısını artırmak
B)Puanlama hatasını azaltmak
C)Soruları zorlaştırmak
D)Alt
eğitim kademelerinde kullanmak
E)Soruları kolaylaştırmak
10- I. Sınıflama
ölçekleri
II. Sıralama
ölçekleri
III. Eşit
aralıklı ölçekler
IV. Oranlı
ölçekler
Öğretimde kullanılan ölçek türleri hangisidir?
A)I ve II
B)II ve III
C)I, II
ve III
D)II, III ve IV
E)III ve IV
11- Nesneler arasındaki nitelik
farklarının miktarını gösteren ölçek türüne ne ad verilir?
A)Sınıflama
B)Sıralama
C)Eşit aralıklı
D)Oranlı
E)Adlandırma
12- Aşağıdakilerden hangisi güvenirliğin tanımlarından biri değildir?
A)Bir ölçme aracının ölçme
sonuçlarına hata karıştırmadan ölçme yapabilmesi
B)Özelliği ölçülen varlık veya
olayların bu özelliğinde bir değişme olmadıkça, onları hep aynı sıraya koyan
ölçüler vermesi
C)Bir
ölçme aracının, ölçmesi amaçlanan özelliği başka değişkenlerle karıştırmadan
ölçmesi
D)Bir ölçme aracının ölçtüğü
özelliği ne derece bir kararlılıkla yansıtabildiği
E)Aynı bireyler üzerinde yapılan
bir niteliğe ait ölçümlerin benzer şartlarda tekrar elde edilebilirliği
13-Ortalaması eşit iki gruptan birincinin bağıl değişim
katsayısı 30, ikincinin 15’dir. Bu bilgilere dayanarak iki grubun st. sapması
için aşağıdakilerden hangisini söyleyebiliriz?
A) Birinci grubun st. sapması ikinci
grubun st. sapmasından büyüktür.
B) Birinci grubun st. sapması ikinci grubun st. sapmasına
eşittir.
C) Birinci grubun st. sapması ikinci grubun st. sapmasından
küçüktür.
D) Grup st. sapmalarını karşılaştırmak için yeterli bilgi
yoktur.
E) İkinci grubun st. sapması birinci grup st. sapmasının iki
katıdır.
14- Bir gruba Türkçe ve Matematik testi uygulanıyor.
Gruptaki bireyler bu testlerden elde
ettikleri z puanlarına göre sıraya konuluyor. Ardından grubun t puanları
hesaplanıyor ve t puanlarına göre sıralama yapılıyor. Bu iki sıralama
arasındaki korelasyon katsayısı için aşağıdakilerden hangisi doğru olur?
A)Negatif olur
B)Negatif mükemmel olur
C)Sıfır olur
D)Pozitif olur
E)Pozitif mükemmel olur
15-
Dersler |
Ortalama |
St. sapma |
Not |
Türkçe |
80 |
10 |
90 |
Matematik |
50 |
5 |
55 |
Fen |
60 |
15 |
75 |
Yukarıdaki tabloda, bir öğrencinin Türkçe, Matematik ve Fen
derslerine ait sınav notları ve bu sınavların ortalamaları ile standart
sapmaları görünmektedir. Bu bilgilere göre öğrencinin üç dersteki başarısı
hakkında varılacak hangi karar doğru olur?
A) Öğrenci en yüksek başarıyı Matematik dersinde göstermiştir.
B)Öğrenci en yüksek başarıyı Türkçe dersinde göstermiştir.
C)Öğrenci en yüksek başarıyı Fen dersinde göstermiştir.
D) Öğrenci her üç derste de aynı
düzeyde başarılı olmuştur.
E)Verilen bilgiler karşılaştırma yapmak için yeterli
değildir.
***16-18 soruları tabloya göre cevaplayınız
Gruplar |
A |
B* |
C |
D |
E |
Toplam |
Üst Grup Alt Grup |
20 20 |
30 20 |
20 20 |
20 25 |
10 15 |
100 100 |
Toplam |
40 |
50 |
40 |
45 |
25 |
200 |
*B doğru cevap olduğuna göre
16- Sorunun güçlük indeksi
kaçtır?
A) 0.60
B) 0.50
C) 0.30
D) 0.25
E) 0.20
17- Sorunun ayırıcılık gücü
indeksi kaçtır?
A) 0.10
B) 0.20
C) 0.30
D) 0.40
E) 0.50
18- Bu soruda yapılması gereken en
önemli işlem ne olmalıdır?
A)A ve C seçenekleri doğru cevaba
yakınlaştırılmalıdır.
B)Doğru cevap alt gruptan çok
öğrenci çektiği için değiştirilmelidir.
C)Zor bir soru olduğundan
kolaylaştırılmalıdır.
D)D çeldiricisi alt gruptan çok
öğrenci çektiğinden değiştirilmelidir.
E)Maddenin
geçerliğini artırmak gereklidir.