Güvenirlik

Güvenirlik
Doç. Dr. Fatma SADIK

Güvenirlik
 Ölçme aracının her uygulandığında aynı özelliği aynı ya da benzer sonuçlar verecek tarzda
ölçmesidir
 Ölçme aracının hatalardan arınıklık düzeyidir. Yani, ölçme aracının ölçme sonuçlarına hata
karıştırmadan ölçme yapabilmesi, gerçeği yansıtabilme derecesidir. Ölçme işlemine karışan
hata miktarı azaldıkça güvenirlik artar.
 Güvenirliğin bir anlamı da duyarlılıktır. Bir ölçme aracının hassasiyet ya da duyarlılığının
artması, o ölçme aracından elde edilecek puanların güvenirliğinin artmasını sağlar.
 Güvenirlik, aynı zamanda ölçme aracının kararlılığı ve tutarlılığı ile yani, birkaç kez
uygulandığında aynı ya da benzer sonuçlar vermesi ile ilgilidir.
 Güvenirlik, güvenirlik katsayısı adı verilen bir katsayı ile ifade edilir ve korelasyona dayalı
olarak hesaplanır. Korelasyon katsayısı -1 ile +1 arasında değişen değerler almakla birlikte
güvenirlik katsayısı hemen her zaman sıfır (0) ile (+1) arasında değişen değerler
almaktadır. Bir ölçme aracı ya da ölçme sonuçları bu katsayının +1'e yakınlığı oranında
tesadüfi hatalardan arınık yani güvenilir olarak kabul edilir.
Güvenirliği etkileyen faktörler
 Testteki soru sayısı: Bir testteki soru sayısı arttıkça testin güvenirliği de
yüksek olur.
 Testin anlaşılırlığı: Testte yer alan yönerge ve soruların tüm öğrenciler için
açık ve anlaşılır olması önemlidir
 Sınavın yapıldığı ortam: Ortamın ısı, ışık, havalandırma, nem, güneş alma,
gürültü, öğrenci sayısı, oturma düzeni gibi değişkenleri güvenirliği etkiler.
 Zaman: Testin cevaplama süresinin gereğinden uzun ya da kısa olması
güvenirliği etkiler. Ayrıca bir testin güvenirlik katsayısı için yapılan test
tekrar test yöntemindeki iki uygulama arasında geçen zaman da makul
olmalıdır.
 Şans Başarısı: Öğrencinin cevabını hiç bilmediği bir soruyu şans
yardımıyla cevaplayabilmesi, puanını arttırabileceği için ölçmeye karışan bir
hata olarak güvenirliği etkiler.
 Testin uygulanma koşulları: Öğrencilerin sınav ortamına
ilişkin rahatsızlıkları, hızlı okuma ve anlama becerilerinin düşük
olması, sınav günü hasta ya da yorgun oluşu, sınavla ilgili
açıklama ve soruları anlayamaması güvenirliği olumsuz yönde
etkiler.
 Kopya: Sınavda kopya çekilerek elde edilen puanlar öğrencinin
gerçek bilgisini göstermez. Ayrıca yanlış dönütten dolayı,
öğrencinin öğrenme eksikleri de belirlenemez.
 Testin Güçlük düzeyi: Test maddeleri çok kolay ya da çok zor
olduğunda testin güvenirliği düşer. Sorular orta güçlükte
olmalıdır.
 Testin puanlanma biçimi: Testin puanlanmasının nesnel
(objektif, tarafsız) olması güvenirliği arttırır.
 Öğrencilerin tutumu: Sınava karşı olumsuz tutum, kaygı ve
stres durumu güvenirliği olumsuz etkiler.
 Ranjda Daralma: Ranjda daralma ile kastedilen, testin uygulandığı grubun evreni temsil etme
gücünün zayıf olması yani, ya çok üstün yetenekli ya da çok düşük yetenekli bireylere uygulanmış
olmasıdır. Ranjda daralma sorunu olduğunda, sınavı alan kişiler, sınavın hazırlandığı grup ya da
düzeyi temsil etmede yetersiz bir örneklemi oluşturur. Eğer testi alan grubun yeteneği evren ortala
masının altında ise, testin kestirilen güvenirliği olduğundan küçük çıkar.
 Test maddelerinin homojenliği: Testte yer alan maddeler ölçtükleri özellik bakımından birbirine
ne kadar benzer olursa testin güvenirliği o kadar yüksek olur. Aynı testte birden fazla özellik
(Matematik, Türkçe, Sosyal Bilgiler vb.) ölçülüyorsa testin güvenirliği düşer. Örneğin 20 soruluk
bir tarih testi, 60 soruluk ve içerisinde tarih, coğrafya ve turizm sorularının bulunduğu bir testten
daha güvenilirdir. Aynı test, benzeşik (homojen) gruplarda da heterojen gruplara göre daha
güvenilirdir.
Güvenirlik ArttırmaYolları
Testin Hazırlanmasına Yönelik Önlemler
 Az sorulu testlerden ziyade mümkün olduğunca daha çok soru sorulabilecek test türleri tercih edilmelidir.
 Soruların açık ve net olmasına, testi alacak grubun gelişim özellikleri açısından anlaşılabilir bir dil
seviyesiyle yazılmasına özen gösterilmelidir.
 Test süresi, testin amacına, soru sayısına, soruların türüne, öğrencilerin gelişim özelliklerine vb. dikkat
edilerek uygun bir şekilde belirlenmelidir.
 Soruların güçlük düzeyi, testin amacına uygun olmalıdır.
 Soruların ayırt edici olması için soruların güçlüğünün orta düzeyde olmasına dikkat edilmelidir.
 Şans başarısı azaltılmalıdır.
 Testin yapısı, dizgisi ve yazı karakterinin büyüklüğünün öğrencilerin gelişim düzeyine uygun olmasına
dikkat edilmelidir.
 Öğretmenler, soru kâğıdının (kitapçığının) başına bir açıklama kısmı (yönerge) koyarak, soru sayısı, süre,
cevaplamada dikkat edilecek hususlar gibi konulara açıklık getirmelidir.
 Çok zor soruları testin başına yerleştirmemeye dikkat edilmelidir.
 Testte yer alan soruların, ölçtükleri özellik bakımından homojen olmasına özen gösterilmelidir.
 Objektif puanlanabilen testlerin güvenirliği daha yüksektir.
Testin uygulanması ve puanlanmasına yönelik
önlemler
 Öğretmenler, sınavları öğrenciler için bir ölüm kalım savaşı haline getirmemeli, sınavların onların kendi
durumlarını görebilmesinde bir araç görevi gördüğünü açıklayarak öğrencileri, testi cevaplamaya motive
etmelidir.
 Uygulama ortamı fiziksel değişkenler açısından hazırlanmalıdır.
 Ölçülecek davranışın yapısına göre klasik test yapılması gerekiyor ise, mutlaka puanlama anahtarı
kullanılmalı ve puanlama hataları veya ortaya çıkarabilecek durumlara karşı dikkatli olunmalıdır.
 Testin hazırlanmasında, uygulanmasında ve puanlanmasında objektiflik korunmalıdır.
 Uygulama esnasında oturma düzeni, testin özelliklerine uygun hazırlanmalı, kopya çekilmesine ortam
hazırlanmamalıdır.
Güvenirlik Kestirme Yöntemleri
1- Test- Tekrar Test Yöntemi
 Test-tekrar test yönteminde, aynı ölçme aracı değişik iki zamanda (genel olarak iki hafta arayla)
aynı gruba uygulanarak bu iki uygulamadan elde edilen puanlar arasındaki korelasyon katsayısı
bulunur.
 Bu katsayının elde edilmesinde Pearson Çarpım Momentleri Korelasyon tekniğinden
yararlanılır Elde edilen korelasyon katsayısı kararlılık anlamındaki güvenirlik katsayısı olarak
kullanılır.
 Bu yöntem daha çok ölçülen özelliğin uzun süreli değişim göstermediği durumlarda işe
koşulmalıdır.
 İki uygulama arasındaki zaman aralığı yeni öğrenmelerin oluşmasına, unutmalara, ölçülen
özelliğin olumlu ya da olumsuz anlamda değişmesine imkân verecek kadar uzun olduğunda iki
uygulamadan elde edilen puanların farklılaşması söz konusu olur. Bu durum ölçme aracının ya
da ölçme sonuçlarının güvenirliğinin azalmasına neden olur. Bu durum test- tekrar test
yönteminin önemli bir sınırlılığıdır.
2- Paralel Test (Eşdeğer form) Yöntemi
 Paralel testler yönteminde, aynı özelliği ölçmeye yönelik olarak farklı sorularla
hazırlanmış olan iki paralel (eşdeğer) test, aynı gruba aynı anda veya ölçülecek özellikte
bir değişme olmayacak kadar kısa bir zaman aralığı ile uygulanır ve elde edilen puanlar
arasındaki korelâsyona bakılır.
 Bu katsayının elde edilmesinde Pearson Çarpım Momentleri Korelasyon tekniğinden
yararlanılır
 Eşdeğer form, iki testin maddelerinin kapsamı, sayısı, güçlüğü ve niteliği bakımından
denk olmaları anlamına gelir. Ancak pratikte bir testin paralel bir formunu oluşturmak
çok zordur.
 Genellikle bu yöntemle elde edilen güvenirlik katsayısı diğer yöntemlerle elde edilen
katsayıdan küçük çıkar.
Test- A Test- A
ZAMAN
Birinci Uygulama Birinci Uygulama
GRUP
Paralel testler aynı gruba belirli bir zaman aralığı ile uygulanması durumunda elde edilen katsayı
kararlılık, aynı anda uygulanması durumunda ise eşdeğerlik anlamındaki güvenirliğe karşılık
gelmektedir.
3- Testi Yarılama Yöntemi (İç tutarlık)
 Testi yarılama (eşdeğer iki yarı) yöntemi, bir gruba bir kez uygulanmış olan bir testin iki eşit yarıya
bölünmesi ve öğrencilerin birinci ve ikinci yarıdan elde ettikleri puanlar arasındaki korelasyonun
hesaplanmasıdır.
 Testin iki eşit yarıya bölünmesinde çeşitli yollar kullanılabilir. Örneğin, 1.,3.,5. vb. tek sayılı
sıralarda yer alan maddelere verilen cevaplar birinci yarı; 2.,4.,6. gibi çift sayılı sıralarda yer alan
maddelere verilen cevaplar ikinci yarı olarak düşünülebilir.
 Bu yolla hesaplanan katsayı testin bir yarısına ilişkin güvenirliği vermektedir (r). Testin bütününe
ilişkin güvenirliği bulmak için Spearman Brown düzeltme formülü kullanılır. Bu yöntemle elde
edilen katsayı testin iç tutarlığının bir ölçüsü olarak yorumlanır.
2r Örnek Bir testin iki yarısı arasındaki korelasyon katsayısı 0,75 ise
rx  testin güvenirliği kaçtır?
1 r
2 x0,75
rx   0,85
1  0,75
4. KR-20 Yöntemi (İç tutarlık)
 KR-20 güvenirlik katsayısı bir defada uygulanan bir ölçme aracının iç tutarlılığını veren bir
katsayıdır. Test içerisindeki her bir maddenin güçlük derecesinden, yani her bir maddeye doğru
cevap veren öğrencilerin toplam öğrencilere oranından hesaplanır. Testteki her bir maddenin aynı
değişkeni ölçtüğü bir diğer ifadeyle testtin ölçtüğü şeyin HOMOJEN olduğu sayıltısına dayanır.
 KR-20 formülü sadece doğru cevaplandırılan maddelere 1 puan vererek yanlış cevaplandırılan ve
boş bırakılan maddelere ise hiç puan verilmeksizin puanlanan testlere uygulanabilir. Eğer testteki
maddeler farklı ağırlıklar ile puanlanmış ise bu yöntem kullanılmaz.
 Testi oluşturan maddelerin güçlük dereceleri birbirinden farklı ise ve şans başarısını ortadan
kaldırmak için düzeltme formülü kullanılmadıysa KR-20 formülü kullanılabilir.
 Testin bütünü öğrencilerin çoğunluğu tarafından yanıtlanmadıkça kullanılması, güvenirlik
katsayısının olduğundan büyük çıkmasına yol açar. Bu nedenle ancak öğrencilerin çoğu tüm
maddeleri cevaplandırmışsa kullanılması doğru olur.
5. KR-21 Yöntemi (İç tutarlık)
 KR-21 güvenirlik katsayısı da bir defada uygulanan bir ölçme aracının iç
tutarlılığını veren bir katsayıdır. Testteki her bir maddenin aynı değişkeni ölçtüğü
yani testtin ölçtüğü şeyin HOMOJEN olduğu sayıltısına dayanır.
 Sorulara farklı ağırlıkta puanlar verildiyse, maddelerin güçlük dereceleri bilinmiyor
ise veya aynı olduğu varsayılıyorsa, puanları şans başarısından arındırmak için
düzeltme formülü uygulanmışsa güvenirlik hesaplamada KR-21 kullanılır.
Her iki yöntemden elde edilen
sonuçlar aynı şekilde yorumlanır.
 Testin yapı geçerliği yüksektir
 Puanlar tesadüfi hatalardan arınıktır
(Duyarlıdır)
 Ölçülen değişkenlik tek boyutludur
 Grup heterojendir
 Test grubu birbirinden ayırmıştır
 Testi oluşturan maddeler homojendir
Katsayı Yorum
0.00 - 0.69 Güvenilir değildir
0.70 - .079 Kısmen güvenilir (tatışılır)
0.80 – 0.89 Orta düzeyde

0.90 ve üzeri Yüksek düzeyde
1.00 Tam (teoride mümkün)
6-Cronbach Alpha (İç Tutarlılık)
 Kuder Richardson formülleri gibi bir defada uygulanan bir ölçme aracının (tek form) iç
tutarlığını veren bir katsayıdır.
 Bu katsayı daha çok testi oluşturan maddelerin dereceleme ölçeğine göre puanlandığı
(1’den 5’e kadar veya 0’dan 4’e kadar gibi) durumlarda ya da testlerde, sorular için
güçlük derecesinin söz konusu olmadığı durumlarda kullanılır.
 Genellikle psiko-motor becerileri ölçmek amacıyla hazırlanan ölçme araçlarında veya ilgi,
tutum gibi psikolojik testlerde kullanılan bir güvenirlik katsayıdır.
 Cronbach Alfa Katsayısı, testte veya ölçekte yer alan soruların homojen bir yapıyı
açıklamak üzere bir bütün oluşturup oluşturmadıklarını araştırır.
Cronbach Alpha formülü ve yorumu
Katsayı Yorum
0.90 üzeri Mükemmel
0.80 - 0.90 İyi
0.70 - 0.79 Kabul edilebilir
0.60 - 0.69 Tartışılır
0.50 – 0.59 Zayıf
0.50’ den küçük Kabul edilemez

Puanlayıcı Güvenirliği
Puanlaması subjektif olan ölçme araçlarında (yazılı testler, sözlü testler vb.) kullanılan bir
güvenirlik kestirme yoludur. Cevap kağıtlarının birden fazla puanlayıcı tarafından
puanlanması ve bu puanlar arasındaki korelasyonunu hesaplanması ile bulunur.
Puanlama güvenirliği
Bir puanlayıcının bir sınav kağıdına farklı zamanlarda (en az iki kez) verdiği puanlar
arasındaki korelasyon yöntemidir. Puanlayıcının kararlılığı ve yansızlığı hakkında bilgi verir.
Daha çok yazılı sınavlarda, ödevlerde, projelerde kullanılır. Dereceli puanlama cetveli
kullanmak güvenirliği artırır.
Güvenirlik ve Ölçmede Standart Hata
Ölçme işlemine farklı nedenlerden dolayı çeşitli hatalar karışabilir. Bu hataların standart bir
değeri, kullanılan ölçme aracının güvenirliği ve standart sapması (kayması) bilindiğinde
belirlenebilir. Ölçmenin standart hatası aşağıdaki formül ile hesaplanır.
Örnek: Bir testin güvenirlik

Ölçmenin standart hatası katsayısı 0.64 ve standart sapması
10 ise bu testin standart hatası
kaçtır?
( Se)  Sx (1  rx )
( Se)  Sx (1  rx )
Se: Standart hata
Sx: Test puanlarının standart kayması (sapması) Se  10 (1 - 0,64)  10
rx: Testin güvenirliği
Se  0,36  10 x0,6  6
-24-
Teşekkürler!!!

Güvenirlik

Uploaded by

Copyright:

Available Formats

Güvenirlik

Uploaded by

Document Information

Original Description:

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Güvenirlik

Uploaded by

Copyright:

Available Formats

Güvenirlik

Doç. Dr. Fatma SADIK

rx  testin güvenirliği kaçtır?

0.80 – 0.89 Orta düzeyde

0.90 üzeri Mükemmel

0.80 - 0.90 İyi

0.70 - 0.79 Kabul edilebilir

0.60 - 0.69 Tartışılır

0.50 – 0.59 Zayıf

0.50’ den küçük Kabul edilemez

Örnek: Bir testin güvenirlik

You might also like