PT6123 Ujian dan Pengukuran Psikologi
PENGGUNAAN UJIAN PSIKOLOGI DALAM PENDIDIKAN
SUZIYANAH MOHD SALLEH
Fakulti Psikologi dan Pendidikan
Universiti Malaysia Sabah
Abstrak
Ujian bukan penilaian atau penaksiran, tetapi pada masa yang sama ia mungkin menjadi cara
untuk mendapatkan maklumat, data atau bukti yang diperlukan untuk penilaian dan penaksiran.
Ujian adalah salah satu alat yang penting dan teknik yang boleh digunakan dalam mana-mana
sistem peperiksaan atau penilaian. Ia menerangkan penggunaan instrumen atau alat untuk
mengumpulkan maklumat atau data. Dalam peperiksaan bertulis, kertas soalan ialah salah satu
alat yang paling kuat digunakan untuk mengumpul dan mendapatkan maklumat mengenai
pencapaian murid. Ujian dan penilaian dalam pendidikan bertujuan untuk mengukur
pencapaian akademik pelajar di sekolah. Ujian pencapaian dilaksanakan bagi menilai individu
mengenai apa yang telah dipelajari berdasarkan kursus pendidikan yang khusus dan juga untuk
meramal pencapaian pada masa hadapan.
Kata kunci: ujian dalam pendidikan, pencapaian akademik, ujian pencapaian.
1
PT6123 Ujian dan Pengukuran Psikologi
Pengenalan
Menurut Kaplan & Saccuzzo (2018), ujian adalah alat pengukuran atau teknik yang
digunakan untuk mengukur tingkah laku atau atau membantu dalam pemahaman dan meramal
tingkah laku. Peperiksaan di institut-institut pendidikan contohnya merupakan teknik ujian
untuk menilai sejauh mana pelajar memahami dan mengaplikasikan apa yang diajar di dalam
bilik darjah. Pengujian memerlukan pelajar menjawab secara lisan atau bertulis atau
mendemonstrasikan perubahan tingkah laku yang berkaitan dengan perkara-perkara yang telah
dipelajari. Namun demikian, ujian yang diberikan mungkin tidak dapat mengukur sejauh mana
pemahaman individu terhadap apa yang ingin diuji oleh penguji. Hal ini demikian, menurut
Kaplan & Saccuzzo (2018), sesebuah ujian pengukuran hanya sampel tingkah laku dan
kesilapan sentiasa berkaitan dengan proses pensampelan. Oleh itu, skor ujian bukanlah ukuran
yang sempurna untuk menguji tingkah laku atau perwatakan namun ianya signifikan dalam
proses meramal tingkah laku (Kaplan & Saccuzzo, 2018). Menurut Scannell & Tracy (1975),
pengukuran adalah proses untuk memberikan nilai berangka terhadap sesuatu objek atau
kriteria bagi seseorang individu mengikut peraturan atau formula yang eksplisit. Antara perkara
yang diukur dalam pendidikan adalah kecerdasan pelajar, pencapaian akademik, kriteria
pelajar, minat terhadap suatu mata pelajaran, dan sebagainya.
Pengujian pula adalah suatu bentuk pengukuran yang bertujuan mendapatkan
maklumat tentang pencapaian pelajar dari aspek kognitif, psikomotor ataupun afektif yang
dilaksanakan dengan sistematik, formal dan biasanya dalam bentuk bertulis (Vincent A. Pang
& Denis Andrew D. Lajium, 2008). Dalam proses pengujian, pemerhatian dan ujian formal
biasanya digunakan sebagai instrumen pengukuran. Kehendak masyarakat terhadap
akauntabiliti juga mencadangkan peningkatan penggunaan ujian dalam pendidikan pada masa
hadapan. Markah ujian pencapaian tahunan merupakan satu cara untuk mencapai akauntabiliti.
2
PT6123 Ujian dan Pengukuran Psikologi
Menurut Kubiszyn & Borich (1987), salah satu indikasi peningkatan peranan ujian dalam
pendidikan pada hari ini adalah ujian kompetensi memasuki sekolah pendidikan tinggi.
Menurut Kaplan & Saccuzzo (2018), ujian psikologi atau ujian pendidikan adalah
sebuah set item yang dibentuk untuk mengukur ciri-ciri manusia yang berait dengan tingkah
laku. Tingkah laku overt menurut Kaplan & Saccuzzo (2018) adalah aktiviti pengamatan
seseorang individu manakala tingkah laku covert iaitu apa berlaku di dalam diri seseorang
individu dan tidak dapat dilihat secara langsung. Sebagai contoh, perasaan dan pemikiran
adalah jenis tingkah laku covert. Sesetengah ujian yang dijalankan adalah untuk menguji
tingkah laku-tingkah laku ini. Oleh itu, ujian psikologikal dan ujian pendidikan mengukur
tingkah laku yang lepas mahupun tingkah laku semasa. Terdapat juga ujian yang digunakan
untuk meramal tingkah laku seperti kejayaan di kolej atau dalam program ijazah lanjutan. Hal
ini demikian menurut Kaplan & Saccuzzo (2018), markah ujian juga boleh berkait kepada
keadaan, status atau keadaan khusus seseorang individu.
Tujuan dan Fungsi Pengujian Dalam Pendidikan
Menurut Kubiszyn & Borich (1987), ujian mewakili percubaan untuk menyediakan
data objektif yang boleh digunakan dengan tanggapan subjektif untuk membuat keputusan
yang lebih baik dan lebih dapat dipertahankan. Tujuan pengujian dalam pendidikan adalah
untuk membantu dalam pembuatan keputusan dalam kalangan pendidik. Kombinasi antara
pertimbangan subjektif dan data objektif akan menghasilkan pembuatan keputusan yang lebih
berpatutan berbanding dengan pembuatan keputusan yang kurang berpatutan. Namun
demikian, walaupun data tersebut adalah objektif ianya hanyalah anggaran tingkah laku
seseorang pelajar (Kubiszyn & Borich, 2018). Secara keseluruhannya, pengujian dalam
pendidikan adalah bertujuan untuk mendapatkan maklumat objektif yang digabungkan dengan
tanggapan subjektif untuk membuat keputusan dalam pendidikan yang lebih baik. Kubiszyn &
3
PT6123 Ujian dan Pengukuran Psikologi
Borich (2018), menyatakan terdapat lapan jenis keputusan pendidikan iaitu; (1) pengajaran, (2)
penggredan, (3) diagnostik, (4) pemilihan, (5) penempatan, (6) kaunseling dan bimbingan, (7)
program atau kurikulum, dan (8) polisi pentadbiran. Menurut Hopkins (1998), tujuan penilaian
dalam pendidikan boleh diklasifikasikan kepada empat kategori yang saling berkaitan iaitu; (1)
pengajaran, (2) pentadbiran, (3) penilaian program dan penyelidikan, dan (4) bimbingan. .
Fungsi Pengujian Dalam Pendidikan
Fungsi dalam pengajaran
Fungsi ujian dalam pengajaran adalah bertujuan untuk membuat suatu keputusan yang
sangat penting dalam pendidikan yang perlu dibuat oleh setiap pendidik. Proses membuat ujian
mendorong penjelasan objektif kursus yang lebih bermakna. Maklum balas daripada ujian juga
boleh membantu guru menyediakan bimbingan pengajaran yang lebih sesuai untuk pelajar
individu serta kelas secara keseluruhan. Selain itu juga, ujian yang dikendalikan dengan baik
akan memberi motivasi dalam pembelajaran. Pelajar akan menguasai objektif pembelajaran
dengan lebih gigih apabila mereka mengetahui mereka akan dinilai melalui ujian. Disamping
itu, ujian dapat membantu memudahkan proses pembelajaran dalam kalangan pelajar. Melalui
ujian pelajar akan melakukan pembelajaran berulang-ulang dan mengingati apa yang dipelajari
agar dapat menjawab ujian dengan baik.
Fungsi dalam pentadbiran
Ujian menyediakan satu mekanisme kawalan kualiti dalam pendidikan. Norma
antarabangsa atau tempatan boleh memberikan asas untuk menilai kekuatan dan kelemahan
kurikulum tertentu. Kawalan kualiti dalam pendidikan adalah sangat penting untuk melihat
perkembangan pendidikan secara keseluruhannya. Selain itu juga, ujian memudahkan
pengkelasan dan penempatan keputusan yang lebih baik. Mengumpul sekumpulan pelajar
berdasarkan kemampuan mereka merupakan salah satu contoh pengelasan yang mana memberi
nilai kepada ujian. Disamping itu, ujian boleh meningkatkan kualiti dalam pembuatan
4
PT6123 Ujian dan Pengukuran Psikologi
keputusan. Skor akademik dan skor pencapaian telah berulang kali menunjukkan nilai dalam
mengenal pasti pelajar yang mungkin atau tidak mungkin berjaya dalam pelbagai kolej.
Penyelidikan dan penilaian
Ujian sangat berguna dan penting dalam penyelidikan dan penilaian. Hasil pengukuran
sangat penting dan diperlukan untuk menentukan sama ada program inovatif lebih baik atau
tidak berbanding program konvensional dalam memudahkan pencapaian objektif kurikulum
tertentu. Piawai ujian pencapaian telah menjadi sumber utama data untuk menilai kejayaan
program, walaupun beberapa kriteria lain diperlukan untuk sebarang penilaian komprehensif
yang lain.
Fungsi bimbingan
Ujian boleh menjadi nilai dalam mendiagnosis kebolehan dan kemampuan khas
individu. Mendapatkan ukuran mengenai kebolehan akademik, pencapaian, miinat dan
personaliti seringkali menjadi aspek penting dalam proses kaunseling. Informasi daripada ujian
kebolehan akademik dan inventori boleh menjadi sumber yang sangat membantu untuk
membimbing pemilihan kolej, pemilihan kursus yang bersesuaian, meneroka kemampuan yang
belum pernah dikenal pasti dan sebagainya. Namun demikian, tidak semua ujian memberikan
keputusan yang baik kerana keputusan dari ujian tersebut boleh disalah guna atau disalah tafsir
dan dalam situasi yang salah sesebuah ujian boleh menjadi senjata berbanding alat yang
memberikan faedah. Hal ini bermaksud ujian tidak semestinya sempurna kerana ujian adalah
tertakluk kepada kesilapan dan salah tafsir.
Ujian Berkumpulan Dalam Pendidikan
Tujuan ujian ini adalah untuk mengukur tahap pencapaian pelajar di sekolah. Terdapat
tiga jenis ujian yang biasa dilakukan dalam pendidikan menurut Kaplan & Saccuzzo (2018)
iaitu ujian pencapaian, ujian kebolehan dan ujian kecerdasan. Kebanyakan ujian ini adalah
5
PT6123 Ujian dan Pengukuran Psikologi
untuk melihat pencapaian, kebolehan serta kecerdasan pelajar di sekolah. Keputusan ujian juga
selalu digunakan untuk meramal pencapaian pelajar pada masa hadapan.
Ujian Pencapaian vs Ujian Kebolehan
Menurut Kaplan & Saccuzzo (2018), ujian pencapaian digunakan untuk menilai apa
yang telah dipelajari oleh seseorang berdasarkan apa yang telah dipelajari dalam kursus-kursus
spesifik. Piawai ujian pencapaian digunakan ssebagai matlamat untuk penilaian akhir
pengetahuan pelajar selepas tamatnya sebuah piawai kursus latihan. Ujian-ujian ini dikira sah
jika ianya mempunyai sample pembinaan domain untuk dinilai sebagai contoh Matematik,
Sains ataupun Sejarah. Manakala ujian kebolehan pula digunakan untuk menilai potensi pelajar
untuk belajar berbanding sebanyak mana pelajaran yang telah dipelajari oleh pelajar (Kaplan
& Saccuzzo, 2018). Berbeza dengan ujian pencapaian, ujian kebolehan menilai lebih luas
mengenai pengalaman yang diperoleh daripada pelbagai cara melalui penilaian kesan daripada
pengalaman yang tidak diketahui dan tidak terkawal. Kesahan bagi ujian ini dinilai terutamanya
terhadap kebolehan ujian ini untuk meramal pencapaian individu pada masa depan. Menurut
Kaplan & Saccuzzo (2018), ujian kecerdasan hanya menilai kebolehan secara umum. Sama
seperti ujian kebolehan, ujian ini digunakan untuk meramal pencapaian pada masa depan.
Namun demikian, ujian ini meramal secara umum dan lebih meluas berbeza dengan ujian
kebolehan yang biasanya meramal potensi dalam bidang-biidang tertentu seperti matematik,
sains atau sejarah. Secara kesimpulannya, walaupun terdapat perbezaan dalam penggunaan
ketiga-tiga ujian ini tetapi ketiga-tiga ujian ini juga saling berkaitan antara satu sama lain.
Ujian Pencapaian Berkumpulan
Menurut Kaplan & Saccuzzo (2018), terdapat dua jenis ujian piawai pencapaian iaitu
Stanford Achievement Test (SAT) dan Metropolitan Achievement Test (MAT). SAT dan MAT
adalah ujian pencapaian yang terkini. Dokumentasi psikometrik bagi ujian ini adalah sangat
baik. Ujian itu boleh dipercayai pada sampel yang sangat besar seperti pelbagai subjek di
6
PT6123 Ujian dan Pengukuran Psikologi
sekolah dan meliputi semua tahap gred akademik. Menurut Gardner et. al (1982), SAT adalah
ujian piawai pencapaian yang yang paling awal digunakan dalam sistem sekolah (Kaplan &
Saccuzzo, 2018). Ujian ini mempunyai norma yang baik dan kriteria rujukan dengan contoh
dokumentasi psikometrik. Menurut Kaplan & Saccuzzo (2018), ujian ini juga menilai
pencapaian dari peringkat pendidikan awal kanak-kanak sehingga peringkat sekolah tinggi
dalam bidang-bidang yang berikut: mengeja, kefahaman bacaan, pembelajaran kata dan
kemahiran, seni bahasa, sains, matematik dan kefahaman mendengar. Menurut Kaplan &
Saccuzzo (2018), satu lagi ujian pencapaian kumpulan dan psikometrik yang baik ialah
Metropolitan Achievement Test (MAT) yang mana ujian ini menilai pencapaian membaca
melalui penilaian perbendaharaan kata, pengenalan ayat dan kefahaman membaca. MAT edisi
yang ke-8 juga mengukur matematik dengan penilaian konsep nombor, penyelesaian masalah
dan pengiraan. Ejaan dalam ujian MAT-8 ini adalah dalam format ujian ejaan normal yang
mana pelajar akan diminta untuk mengeja perkataan yang diarahkan secara lisan dibentangkan
dalam satu ayat. Melalui ujian ini, kemahiran bahasa akan dinilai melalui ujian tatabahasa sama
seperti mengukur kemahiran abjad. Seterusnya, MAT-8 mempunyai beberapa item kajian
sosial iaitu pengetahuan pelajar mengenai geografi, ekonomi, sejarah, sains politik,
antropologi, sosiologi dan psikologi juga turut diuji.
Ujian Kebolehan Mental Berkumpulan
Menurut Kaplan & Saccuzzo (2018), terdapat empat kumpulan ujian kebolehan mental
iaitu Kuhlmann-Anderson, Hennon-Nelson, Cognitive Abilities Test, dan Developing Cognitive
Abilities Test.
1) Kuhlman-Anderson Test (KAT)-Eight Edition
KAT adalah sebuah ujian kecerdasan berkumpulan dengan lapan tahap yang berbeza
merangkumi tahap pendidikan awal kanak-kanak sehingga sekolah tinggi. Setiap tahap ujian
KAT mengandungi pelbagai jenis ujian dengan pelbagai item. Nonverbal menjadi keutamaan
7
PT6123 Ujian dan Pengukuran Psikologi
item KAT pada tahap rendah yang memerlukan pembacaan dan pengetahuan bahasa yang
minima. Selain itu juga, KAT bukan sahaja sesuai terhadap kanak-kanak tapi juga kepada
golongan yang kurang upaya dari segi lisan. KAT juga berkemungkinan sesuai digunakan
untuk populasi bukan penutur bahasa Inggeris dengan andaian norma yang sesuai. Menurut
Kaplan & Saccuzzo (2018), sebahagian besar tinjauan telah memuji KAT untuk pembinaannya,
penyeragaman dan kualiti psikometrik yang sangat baik. Data normatif sentiasa ditingkatkan
dengan berdasarkan lebih 10,000 subjek. Pekali kebolehpercayaan adalah agak baik, dengan
koefisien split-half pada pekali .90 dan pekali uji cuba yang rendah dari .80 ke tahap .90.
Kesahan juga didokumenkan dengan baik.
2) Henmon-Nelson Test (H-NT)
Menurut Kaplan & Saccuzzo (2018), H-NT adalah ujian kedua piawai terbaik, banyak
digunakan dan dibina dengan cermat bagi mengukur kebolehan mental pada semua peringkat
akademik. Walaupun ujian ini hanya menghasilkan skor tunggal namun terdapat dua set norma
yang tersedia iaitu set pertama adalah berdasarkan skor mentah yang diagihkan mengikut umur
dan set kedua diagihkan mengikut gred. Skor mentah juga boleh ditukar kepada sisihan IQ serta
persentil. H-NT adalah alat ujian yang sangat menakjubkan. Hal ini demikian kerana alat ujian
ini meramal kejayaan dalam akademik dengan sangat pantas. Namun demikian alat ujian ini
memiliki limitasi penting tersendiri apabila digunakan sebagai digunakan sebagai alat
penyaringan tunggal untuk memilih kecerdasan atau mengenal pasti ketidakupayaan
pembelajaran dalam minoriti, kanak-kanak pelbagai budaya dan tidak mempunyai kelebihan
dari segi ekonomi. Selain itu, dalam buku panduan ujian ini tidak memberikan data yang
berkaitan dengan norma-norma untuk kumpulan kaum, etnik, atau sosioekonomi khusus dan
juga ujian ini tidak dibangunkan untuk digunakan terhadap kanak-kanak dari pelbagai budaya.
8
PT6123 Ujian dan Pengukuran Psikologi
3) Cognitive Abilities Test (COGAT) Form 7
COGAT Form 7 menonjol sebagai ujian kecerdasan (Kaplan & Saccuzzo, 2018). Menurut
Kaplan & Saccuzzo (2018), dari segi kesahan dan kebolehpercayaan, ujian ini setanding
dengan H-NT. COGAT menyediakan tiga skor yang berbeza iaitu skor lisan, kuantitatif dan
bukan lisan. Kebolehpercayaan untuk skor lisan adalah tinggi .90, kuantitatif rendah .90 dan
untuk bukan lisan tinggi .90. Pemilihan item bagi ujian ini adalah lebih tinggi berbanding HNT dalam aspek pemilihan minoriti, kepelbagaian budaya dan kanak-kanak yang kurang
bernasib baik dari segi ekonomi. COGAT juga dibangunkan khas untuk golongan yang lemah
dalam membaca, kurang mendapat pendidikan dan orang yang menggunakan bahasa Inggeris
sebagai bahasa kedua. COGAT juga menawarkan kelebihan berbanding H-NT dalam menilai
golongan minoriti, kepelbagaian budaya dan kanak-kanak yang kurang bernasib baik dari segi
ekonomi. Selain itu, ujian ini menyediakan penilaian yang boleh dipercayai dalam kemampuan
akademik pada kedua-dua pelajar bahasa Inggeris dan pelajar yang menggunakan bahasa
Inggeris sebagai bahasa utama.
Ujian Kemasukan Kolej
Menurut Kaplan & Saccuzzo (2018), terdapat dua ujian kemasukan kolej yang terkenal
iaitu 2016 SAT dan American College Test (ACT).
1) The New (2016) SAT
Menurut Schalkwyk (2017), SAT dahulunya dikenali sebagai Scholastic Aptitude Test ataupun
Scholastic Achievement Test adalah ujian standard yang direka untuk mengukur kemahiran
penting yang diperlukan untuk berjaya ditahap akademik yang lebih tinggi. Menurut Kaplan &
Saccuzzo (2018), SAT 2016 yang moden tampil lebih kepada ujian mengukur pencapaian
berbanding ujian untuk mengukur kebolehan akademik. Selain itu juga, ujian ini bersesuaian
dengan kurikulum sekolah tinggi dan merangkumi penanda aras teras umum yang diterima
oleh kebanyakan negara. Ianya juga lebih mudah berbanding versi SAT yang awal iaitu
9
PT6123 Ujian dan Pengukuran Psikologi
menguji ayat yang biasa dipelajari di kolej dan bukannya ayat esoterik yang hanya ditemui
oleh pelajar pada ujian SAT yang awal. Skor dalam SAT 2016 berdasarkan julat skala titik 400
hingga 1600 bersama dengan esei pilihan dengan julat skala antara 2 dan 8. Menurut lembaga
kolej, ujian lanjutan telah dijalankan terhadap alat ujian ini bagi memastikan tiada kelebihan
perbezaan diberikan kepada mana-mana kaum atau kumpulan berpendapatan.
2) The American College Test (ACT)
Menurut Kaplan & Saccuzzo (2018), ACT juga merupakan antara ujian yang terkenal dan
digunakan secara meluas untuk tujuan ujian kemasukan kolej. Ujian ini telah dinaik taraf pada
2005 dan ianya digunakan terutamanya untuk bukan penutur bahasa Inggeris. ACT
menghasilkan kandungan skor dan komposit yang khusus. Kandungan skor adalah bahasa
Inggeris, penggunaan matematik, pembacaan kajian sosial dan pembacaan sains semulajadi.
ACT menggunakan skala Iowa Test of Educational Development (IETD) untuk menyatakan
hasil ujian. Skor dalam skala ini boleh berubah-ubah antara 1 hingga 36 dengan sisishan piawai
5 dan min 16 untuk pelajar sekolah tinggi dan mean 19 untuk pelajar kolej.
Ujian Kemasukan Sekolah Graduan dan Profesional
Sebelum memasuki sekolah graduan dan professional, pelajar perlu mengambil ujian
untuk memasuki sekolah graduan dan professional. Menurut Kaplan & Saccuzzo (2018),
terdapat dua ujian yang terkenal adalah Graduate Record Examination Aptitude Test (GRE)
dan Miller Analogies Test.
1) Graduate Record Examination Aptitude Test
Menurut Kaplan & Saccuzzo (2018), GRE adalah ujian yang selalu digunakan untuk
kemasukan ke sekolah graduan yang bertujuan untuk mengukur keupayaan skolastik dan
ditawarkan di universiti dan kolej di Amerika Syarikat dan negara-negara lain di seluruh dunia.
GRA paling kerap digunakan seiring dengan GPA, surat cadangan dan faktor-faktor akademik
lain dalam proses pemilihan sekolah graduan yang sangat kompetitif. GRE mengandungi
10
PT6123 Ujian dan Pengukuran Psikologi
seksyen umum yang menghasilkan skor GRE-V iaitu lisan, dan skor GRE-Q iaitu kuantitatif.
Pada tahun 2002, seksyen ketiga dalam GRE yang menilai penaakulan analitik iaitu GRE-A
diubah daripada format pilihan jawapan kepada format esei. Sebagai tambahan kepada ujian
umum ini untuk semua major kolej, GRE mengandungi seksyen lanjutan yang mengukur
pencapaian sekurang-kurangnya 20 bidang seperti psikologi, sejarah dan kimia. Kestabilan
GRE berdasarkan Kuder-Richardson dan kebolehpercayaan ganjil adalah memadai dengan
pekali sedikit rendah berbanding SAT. Namun, ramalan kesahan GRE ini jauh dari
meyakinkan. Menurut House (1998), GRE lebih meramalkan pencapaian pelajar muda dan
kurang meramal prestasi pelajar yang lebih tua. Manakala menurut Morrison & Morrison
(1995), dengan melihat skor GRE yang selaras dengan GPA, kejayaan graduan dapat
diramalkan dengan lebih tepat berbanding tanpa GRE.
2) Miller Analogies Test
Menurut Kaplan & Saccuzzo (2018), ujian Miller Analogies adalah ujian kedua terbanyak
digunakan bagi ujian kemasukan ke sekolah graduan. Sama seperti GRE, ujian ini digunakan
untuk mengukur kebolehan akademik untuk pembelajaran siswazah. Bagaimanapun ujian ini
lebih kepada ujian lisan dimana pelajar perlu membezakan hubungan logik untuk 120 masalah
analogi yang berbeza-beza, termasuk perkara yang paling sukar dijumpai pada sebarang ujian
dalam masa 60 minit. Secara umumnya, kecukupan psikometrik ujian ini adalah munasabah
apabila dibandingkan dengan ujian keupayaan secara umum, namun skor GRE dan GPA akan
terus menjadi korelasi utama. Data kesahan ganjil bagi ujian ini mencukupi dengan pekali yang
tinggi iaitu .80 dilaporkan dalam panduan ujian. Namun, sama seperti GRE, ujian ini kurang
sokongan ramalan kesahan. Walaupun terdapat korelasi yang besar dengan GRE (pekali pada
tahap rendah .80), pekali kesahan yang dilaporkan dalam manual untuk gred berbeza dari
sampel ke sampel dan hanya sederhana (median tinggi .30). Tambahan lagi, ujian ini tidak
meramal kebolehan penyelidikan, kreativiti dan faktor-faktor lain kepada sekolah graduan dan
11
PT6123 Ujian dan Pengukuran Psikologi
prestasi professional. Namun, sebagai bantuan dalam membezakan antara aplikasi sekolah
graduan dan orang dewasa pada tahap keupayaan lisan tertinggi, ujian ini adalah alat yang
sangat baik selagi seseorang tetap mengingati bias yang mungkin. Sama seperti GRE, ujian
Analogi Miller ini mempunyai bias umur. Ujian Analogi Miller ini lebih meramal pencapaian
GPA kumpulan umur 25 hingga 34 tahun dan kurang meramalkan GPA kumpulan umur 35
hingga 44 tahun. House & Keeley (1996), menyatakan Analogi Miller ini lebih meramalkan
pencapaian kumpulan umur 45 tahun. Hal ini demikian kerana motivasi untuk pencapaian
akademik mungkin tinggi dalam pertengahan umur dewasa menyebabkan pelajar mendapat
gred lebiht itnggi dari skor ramalan ujian mereke.
3) The Law School Admission Test (LSAT)
Menurut Kaplan & Saccuzzo (2018), LSAT adalah contoh ujian untuk program ijazah
professional yang baik. Permasalahan dalam ujian ini tidak memerlukan pengetahuan yang
spesifik. Pelajar daripada mana-mana bidang boleh mengambil ujian ini tanpa sebarang bias.
Sama seperti ujian Miller Analogies, ujian ini juga merupakan ujian yang agak sukar
berbanding ujian piawai lain. LSAT mengandungi tiga permasalahan iaitu kefahaman
membaca, pertimbangan logik dan pertimbangan analitikal. Kefahaman membaca dalam ujian
ini mempunyai persamaan dengan GRE. Anggaran separuh daripada permasalahan LSAT ini
adalah permasalahan pertimbangan logik. Kebolehpercayaan koefisien bagi LSAT adalah .90.
Ujian ini meramal GPA tahun pertama di sekolah undang-undang. Melalui ujian ini, lebih
ramai wanita mendapat skor yang rendah berbanding lelaki namun ianya tidak menghalang
wanita dari memohon kemasukan ke sekolah-sekolah yang berprestij. Secara khusus, golongan
wanita dan minoriti cenderung untuk mendapat skor yang rendah dalam LSAT, namun LSAT
dan index skor GPA cencerung untuk meramal kejayaan mereka dalam tahun pertama di
sekolah undang-undang. Sebaliknya, lelaki bukan minoriti cenderung mendapat GPA tahun
pertama yang lebih tinggi daripada yang akan diramalkan oleh skor indeks mereka.
12
PT6123 Ujian dan Pengukuran Psikologi
Kesimpulan
Secara kesimpulannya, ujian dan alat pengukuran memainkan peranan penting dalam
sistem pendidikan dan aspek kehidupan lain. Oleh itu pengguna ujian dan informasi kuantitatif
yang lain mesti tahu cara menggunakan ujian tersebut dan mengintepretasikan alat ujian
tersebut dengan baik. Selain itu, tujuan ujian adalah untuk mengumpulkan maklumat objektif
yang boleh digunakan bersamaan dengan maklumat subjektif untuk membuat keputusan
pendidikan yang lebih baik. Penilaian perlu dilakukan kerana untuk matlamat tertentu. Melalui
ujian dan penilaian juga akan membolehkan kita membuat anggaran, sama ada matlamat yang
telah ditetapkan itu tercapai atau sebaliknya. Selain itu juga, ujian dan penilaian adalah sebagai
satu cara untuk mendapatkan bukti yang tepat tentang sesuatu perkara dan amat penting dalam
menyelesaikan sesuatu masalah. Pengujian, pengukuran dan penilaian yang tepat dan berkesan
yang dijalankan oleh guru di bilik darjah membantu guru dalam mempertingkatkan pencapaian
pengajaran dan pembelajaran yang berkesan serta membantu guru dalam memperkembangkan
lagi teknik, kaedah dan mengesan kelemahan pelajar ataupun sebaliknya.
Ujian keupayaan piawaian disediakan untuk tujuan apa sahaja. Pemarkahan dan
pentadbiran ujian yang mudah memberikan ujian keupayaan kumpulan kelebihan utama
berbanding ujian individu. Dalam kebanyakan kes, keputusan dari ujian berkumpulan jauh
lebih stabil dan sahih berbanding ujian individu. Namun, bagi sebarang keraguan dalam ujian
berkumpulan, pengguna ujian kebolehan berkumpulan perlu merujuk masalah tersebut kepada
profesional kompeten yang boleh mengendalikan ujian kebolehan individu. Sistem sekolah
awam membuat penggunaan ujian kebolehan kumpulan menjadi lebih meluas. Terdapat
banyak ujian-ujian untuk menguji setiap tahap akademik dari pendidikan awal kanak-kanak
sehingga sekolah tinggi. Ujian pencapaian bagi ketagori ini termasuklah Standford
Achievement Test dan Metropolitan Achievement Test (MAT). Manakala ujian kemasukan ke
kolej dan sekolah graduan juga menggunakan ujian kebolehan berkumpulan terutamanya di
13
PT6123 Ujian dan Pengukuran Psikologi
Amerika Syarikat dan juga beberapa negara-negara lain. Antara ujian yang yang terkenal
adalah seperti SAT dan American College Test (ACT). Bagi pelajar yang ingin melanjutkan
pelajaran ke tahap yang lebih tinggi ujian yang selalu digunakan adalah GRE, Miller Analogies
Test atau ujian yang lebih spesifik bagi sekolah-sekolah tertentu seperti Law School Admission
Test (LSAT). Kesemua ujian ini digunakan bagi mengukur kebolehan pelajar dan bertujuan
untuk meramal kebolehan dan pencapaian pelajar pada masa hadapan.
14
PT6123 Ujian dan Pengukuran Psikologi
RUJUKAN
Gardner, E. F. ., Rudman, H. C., Karlsen, B., & Merwin, J. C. (1982). The Stanford Achivement
Test (7th ed.). New York: Harcourt Brace Jovanovich.
Hopkins, K. D. (1998). Educational and psychological measurement and evaluation. USA:
Allyn and Bacon.
House, J. D. (1998). Age differences in prediction of student acheivement from graduate record
examination scores. Journal of Genetic Pyshology, 159, 379-382.
House, J. D. & Keeley, E. J. (1996). Differential prediction of adult student performance from
Miller Analogies Test scores. Journal of Genetic Psychology, 157, 501-503.
Kaplan, R. M. & Saccuzzo, D. P. (2018). Psychological testing: Principles, applications, and
issues. USA: Cengage Learning.
Kubiszyn, T. & Borich, G. (1987). Educational testing and measurement: Classroom
appliction and practice. USA: Scott, Foresman and Company.
Scannell, D. P. & Tracy, D. (1975). Testing and measurement in the classroom. USA: Cengage
Learning.
Van Schalkwyk, Gertina. (2017). Scholastic Aptitude Test. Encyclopedia of Clinical
Neuropsychology, 1-4.
Vincent A. Pang. & Denis A. D. Lajium. (2008). Pengetahuan pedagogi guru. Kota Kinabalu:
Penerbit UMS.
15