Evaluasi Pembelajaran
Evaluasi Pembelajaran
Evaluasi Pembelajaran
Makalah
Diajukan Untuk Memenuhi Tugas Mata Kuliah Evaluasi Pembelajaran Bahasa Arab
Prodi Pascasarjana Pendidikan Bahasa Arab
Oleh:
Rezki Awalia
NIM 80400222047
PROGRAM PASCASARJANA
2024
ii
KATA PENGANTAR
Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa
yang telah menunjukkan kepada kita jalan yang lurus berupa ajaran
ini sebagai salah satu tugas mata kuliah yaitu evaluasi, penulis
makalah ini tentu jauh dari kesempurnaan maka kritik dan saran
waktu mendatang.
Penulis
3
Daftar Isi
KATA PENGANTAR................................................................................................................................. i
Daftar Isi..................................................................................................................................................ii
BAB I ..................................................................................................... Error! Bookmark not defined.
PENDAHULUAN ..................................................................................................................................... 1
A. Latar Belakang ......................................................................................................................... 1
B. Rumusan Masalah ................................................................................................................... 2
C. Tujuan........................................................................................................................................ 2
BAB II ..................................................................................................................................................... 3
PEMBAHASAN ...................................................................................................................................... 3
A. Analisis Kualitas Soal .............................................................................................................. 3
B. Validitas .................................................................................................................................... 4
C. Reliabilitas ................................................................................................................................ 7
D. Daya Pembeda .......................................................................................................................... 8
E. Tingkat Kesukaran ................................................................ Error! Bookmark not defined.
BAB III.................................................................................................. Error! Bookmark not defined.
PENUTUP............................................................................................. Error! Bookmark not defined.
A. Kesimpulan ............................................................................. Error! Bookmark not defined.
Daftar Pustaka ................................................................................... Error! Bookmark not defined.
4
BAB I
PENDAHULUAN
A. Latar Belakang
oleh banyak faktor, baik faktor yang ada di dalam diri siswa seperti intelegensi,
bakat, minat dan motivasi, maupun faktor yang datang dari guru, lingkungan
pengaruh dan peranan yang berbeda dalam pencapaian prestasi belajar yang
optimal. Ketersediaan dari seluruh faktor ini akan menunjang pembentukan dan
belajar (proses belajar mengajar), dan hasil belajar. Kegiatan penilaian dalam
bagian dari proses belajar mengajar. Evaluasi hasil belajar dilakukan oleh
merupakan hal yang penting untuk mengukur dan menilai kualitas pendidikan
1
Ina Magdalena and others, ‘Analisis Validitas, Reliabilitas, Tingkat Kesulitan Dan Daya Beda Butir
Soal Ujian Akhir Semester Tema 7 Kelas III SDN Karet 1 Sepatan’, BINTANG : Jurnal Pendidikan Dan Sains,
3.2 (2021), 198–214 <https://ejournal.stitpn.ac.id/index.php/bintang>.
2
Mik Salmina and Fadlillah Adyansyah, ‘Analisis Kualitas Soal Ujian Metematika Semester Genap
Kelas XI SMA Inshafuddin Kota Banda Aceh’, Jurnal Numeracy, 4.1 (2017), 37–47.
1
2
terhadap hasil asesmen dalam pembelajaran yang sesuai dengan standar yang
telah ditetapkan.3
B. Rumusan Masalah
C. Tujuan
3
Sri Nurhalimah and others, ‘Hubungan Antara Validitas Item Dengan Daya Pembeda Dan Tingkat
Kesukaran Soal Pilihan Ganda Pas’, Natural Science Education Research, 4.3 (2022), 249–57
<https://doi.org/10.21107/nser.v4i3.8682>.
3
BAB II
PEMBAHASAN
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk
menge- tahui derajat kualitas suatu tes, baik secara keseluruhan maupun butir soal
yang men- jadi bagian dari tes tersebut. Dalam penilai- an hasil belajar, tes
diharapkan dapat meng- gambarkan sampel perilaku dan menghasil- kan nilai yang
objektif serta akurat. Jika tes yang digunakan dosen kurang baik, maka hasil yang
diperoleh pun tentunya kurang baik pula. Hal ini dapat merugikan mahasis- wa itu
sendiri, artinya hasil yang diperoleh mahasiswa menjadi tidak objektif. Oleh se- bab
Tes hendaknya disusun berdasarkan prinsip dan prosedur penyu- sunan tes.
Setelah digunakan perlu diketahui apakah tes tersebut berkualitas baik atau tidak
Soal tes yang telah dibuat kemudian diujikan kepada siswa. Setelah diujikan
kepada siswa, uji akurasi dan kualitas analisis butir soal perlu dilakukan. Uji akurasi
dan kualitas analisis butir soal meliputi uji validitas, reliabilitas, kesukaran, daya
beda, dan pengecoh pada setiap butir soal. Soal yang telah dibuat tidak hanya
sekedar jadi, tapi perlu melalui tahap uji akurasi dan kualitasnya.5
B. Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauh mana
4
Akbar Iskandar and Muhammad Rizal, ‘Analisis Kualitas Soal Di Perguruan Tinggi Berbasis Aplikasi
TAP’, Jurnal Penelitian Dan Evaluasi Pendidikan, 22.1 (2018), 12–23
<https://doi.org/10.21831/pep.v22i1.15609>.
5
Pramestyawati Jati and others, ‘Analisis Kualitas Butir Soal Geografi’, Jurnal Pendidikan Geosfer,
8.2 (2023), 287–98 <https://doi.org/10.24815/jpg.v8i2.32500>.
3
4
fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat
tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari
pengukurannya. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang
hendak diukur. Menurut Arikunto validitas sebuah tes dapat diketahui dari hasil
pengalaman. Validitas tes tersebut dibagi menjadi dua kelompok, yaitu validitas
logis dan validitas empiris. Validitas logis meliputi validitas isi (content validity)
validitas “ada sekarang” atau konkruen (concurrent validity) dan validitas prediksi
(predictive validity).7
proporsional perilaku sampel yang dikenai tes tersebut. Artinva tes itu valid
yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi
6
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
7
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>.
8
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
5
moment Pearson dimana skor pada masing-masing butir soal dikaitkan dengan
skor keseluruhan. Menurut (Alpusari, 2014), suatu butir soal dianggap memiliki
validitas yang tinggi jika skor butir soal memiliki korelasi yang baik dengan skor
keseluruhan. Dalam anates, hasil korelasi antara skor butir soal dan skor
valid jika hasilnya signifikan, sedangkan butir soal dikatakan tidak valid jika
Keterangan :
9
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
10
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
11
https://medium.com/statistics-uii/uji-validitas-dan-reliabilitas-menggunakan-spss-144640e4f9d3
6
Y= Skor total
N= Jumlah responden
Correlations
Soal1 Soal2 soal3 Soal4 Soal5 Soal6
Soal1 Pearson 1 .443* .429* .553** .489** .302
Correlation
Sig. (2-tailed) .014 .018 .002 .006 .105
N 30 30 30 30 30 30
Soal2 Pearson .443* 1 .681** .356 .443* -.089
Correlation
Sig. (2-tailed) .014 <.001 .053 .014 .640
N 30 30 30 30 30 30
soal3 Pearson .429* .681** 1 .196 .429* -.131
Correlation
Sig. (2-tailed) .018 <.001 .299 .018 .491
N 30 30 30 30 30 30
Soal4 Pearson .553** .356 .196 1 .302 .630**
Correlation
Sig. (2-tailed) .002 .053 .299 .105 <.001
N 30 30 30 30 30 30
Soal5 Pearson .489** .443* .429* .302 1 .050
Correlation
Sig. (2-tailed) .006 .014 .018 .105 .792
N 30 30 30 30 30 30
Soal6 Pearson .302 -.089 -.131 .630** .050 1
Correlation
Sig. (2-tailed) .105 .640 .491 <.001 .792
N 30 30 30 30 30 30
Soal7 Pearson .099 .117 .171 .024 .263 -.218
Correlation
Sig. (2-tailed) .604 .539 .366 .899 .160 .247
N 30 30 30 30 30 30
Soal8 Pearson .337 .239 .088 .745** .135 .447*
Correlation
Sig. (2-tailed) .069 .203 .645 <.001 .477 .013
N 30 30 30 30 30 30
Soal9 Pearson .302 .356 .196 .259 .302 .259
Correlation
Sig. (2-tailed) .105 .053 .299 .167 .105 .167
N 30 30 30 30 30 30
Soal10 Pearson .641** .535** .539** .667** .452* .389*
Correlation
Sig. (2-tailed) <.001 .002 .002 <.001 .012 .034
N 30 30 30 30 30 30
SkorTo Pearson .775** .650** .594** .760** .671** .403*
tal Correlation
Sig. (2-tailed) <.001 <.001 <.001 <.001 <.001 .027
N 30 30 30 30 30 30
9
Correlations
SkorTot
Soal7 Soal8 Soal9 Soal10 al
Soal1 Pearson .099 .337 .302 .641** .775**
Correlation
Sig. (2-tailed) .604 .069 .105 <.001 <.001
N 30 30 30 30 30
Soal2 Pearson .117 .239 .356 .535** .650**
Correlation
Sig. (2-tailed) .539 .203 .053 .002 <.001
N 30 30 30 30 30
soal3 Pearson .171 .088 .196 .539** .594**
Correlation
Sig. (2-tailed) .366 .645 .299 .002 <.001
N 30 30 30 30 30
Soal4 Pearson .024 .745** .259 .667** .760**
Correlation
Sig. (2-tailed) .899 <.001 .167 <.001 <.001
N 30 30 30 30 30
Soal5 Pearson .263 .135 .302 .452* .671**
Correlation
Sig. (2-tailed) .160 .477 .105 .012 <.001
N 30 30 30 30 30
Soal6 Pearson -.218 .447* .259 .389* .403*
Correlation
Sig. (2-tailed) .247 .013 .167 .034 .027
N 30 30 30 30 30
Soal7 Pearson 1 .098 -.218 .036 .257
Correlation
Sig. (2-tailed) .608 .247 .849 .170
N 30 30 30 30 30
Soal8 Pearson .098 1 .149 .447* .595**
Correlation
Sig. (2-tailed) .608 .432 .013 <.001
N 30 30 30 30 30
Soal9 Pearson -.218 .149 1 .389* .454*
Correlation
Sig. (2-tailed) .247 .432 .034 .012
N 30 30 30 30 30
Soal10 Pearson .036 .447* .389* 1 .834**
Correlation
Sig. (2-tailed) .849 .013 .034 <.001
N 30 30 30 30 30
SkorTot Pearson .257 .595** .454* .834** 1
al Correlation
Sig. (2-tailed) .170 <.001 .012 <.001
10
N 30 30 30 30 30
C. Reliabilitas
Kata reliabilitas diambil dari bahasa Inggris yaitu reliability, dari kata reliable
yang artinya dapat dipercaya. Apabila suatu alat pengukur itu menghasilkan data
yang ajeg, maka alat pengukur tersebut bisa disebut reliable atau dapat dipercaya.12
Reliability Statistics
12
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
13
https://medium.com/statistics-uii/uji-validitas-dan-reliabilitas-menggunakan-spss-144640e4f9d3
11
D. Daya Pembeda
peserta didik yang sudah dan yang belum menguasai suatu keterampilan
berdasarkan kriteria yang telah ditentukan. Semakin kuat koefisien daya pembeda
pada item pertanyaan, semakin baik dalam membedakan antara peserta didik yang
kompetensi.14
Daya beda butir soal merupakan suatu indeks yang menunjukkan tingkat
kemampuan butir soal membedakan kelompok atas (peserta tes yang berprestasi
tinggi) dari kelompok bawah (peserta tes yang berprestasi rendah). Pernyataan ini
soal untuk dapat membedakan siswa yang berkemampuan tinggi dengan siswa
yang berkemampuan rendah. 15 Indeks daya pembeda tes atau daya pembeda (Dp)
14
Ahmad Suryadi. Evaluasi Pembelajaran II. (bojonggenteng: CV Jejak. 2020) hlm 30
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
15
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
12
16
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
17
Mochammad Noor Akhmadi, ‘Analisis Butir Soal Evaluasi Tema 1 Kelas 4 Sdn Plumbungan
Menggunakan Program Anates’, Ed-Humanistics : Jurnal Ilmu Pendidikan, 6.1 (2021), 799–806
<https://doi.org/10.33752/ed-humanistics.v6i1.1464>.
13
Item-Total Statistics
Corrected Cronbach's
Scale Mean if Scale Variance Item-Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
Soal1 6.87 3.223 .680 .797
Soal2 6.67 3.885 .575 .816
soal3 6.73 3.789 .458 .824
Soal4 6.70 3.597 .721 .798
Soal5 6.87 3.499 .489 .824
Soal6 6.70 4.010 .344 .834
Soal8 6.77 3.702 .465 .824
Soal9 6.70 3.941 .404 .829
Soal10 6.80 3.200 .796 .782
E. Tingkat Kesukaran
butir soal yang dilambangkan dengan huruf p yaitu proportion. Tingkat kesukaran
adalah peluang untuk menjawab benar pada suatu soal pada tingkat kemampuan
menunjukkan proporsi peserta didik yang dapat mengerjakan soal secara benar
dengan yang menjawab benar setiap soal, maka tingkat kesulitan soal dapat
mendekati 1,00.19
18
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
19
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
14
𝐵
𝑃=
𝐽𝑠
Dengan:21
P : Tingkat kesukaran
20
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
21
Lia Hamimi, Riszki Zamharirah, and Rusydy Rusydy, ‘Analisis Butir Soal Ujian Matematika Kelas
VII Semester Ganjil Tahun Pelajaran 2017/2018’, Mathema: Jurnal Pendidikan Matematika, 2.1 (2020), 57
<https://doi.org/10.33365/jm.v2i1.459>.
15
soal berbentuk pilihan ganda. Adapun untuk soal yang berbentuk uraian,
Statistics
Soal Soal soal Soal Soal Soal Soal Soal Soal Soal
1 2 3 4 5 6 7 8 9 10
N Vali 30 30 30 30 30 30 30 30 30 30
d
Mis 0 0 0 0 0 0 0 0 0 0
sing
Mean .73 .93 .87 .90 .73 .90 .70 .83 .90 .80
Maximu 1 1 1 1 1 1 1 1 1 1
m
16
BAB III
PENUTUP
A. Kesimpulan
untuk menge- tahui derajat kualitas suatu tes, baik secara keseluruhan
maupun butir soal yang men- jadi bagian dari tes tersebut. Baik meliputi
apa yang hendak diukur. Kata reliabilitas diambil dari bahasa Inggris yaitu
reliability, dari kata reliable yang artinya dapat dipercaya. Daya pembeda
menjawab benar pada suatu soal pada tingkat kemampuan tertentu yang
16
17
Daftar Pustaka
Fahmi, Bahrudin, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal
Bahasa Arab MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah:
<https://doi.org/10.15575/jpba.v6i1.16193>
Hamimi, Lia, Riszki Zamharirah, and Rusydy Rusydy, ‘Analisis Butir Soal Ujian
Matematika Kelas VII Semester Ganjil Tahun Pelajaran 2017/2018’, Mathema: Jurnal
Iskandar, Akbar, and Muhammad Rizal, ‘Analisis Kualitas Soal Di Perguruan Tinggi
Berbasis Aplikasi TAP’, Jurnal Penelitian Dan Evaluasi Pendidikan, 22.1 (2018), 12–
23 <https://doi.org/10.21831/pep.v22i1.15609>
Jati, Pramestyawati, Alia Alawiati, Ahmad Jibril H, Ali Mudin, and Cindy Prisma S, ‘Analisis
Kualitas Butir Soal Geografi’, Jurnal Pendidikan Geosfer, 8.2 (2023), 287–98
<https://doi.org/10.24815/jpg.v8i2.32500>
Khasanah, Iswatul, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika
Magdalena, Ina, Septy Nurul Fauziah, Siti Nur Faziah, and Fika Sulaehatun Nupus,
‘Analisis Validitas, Reliabilitas, Tingkat Kesulitan Dan Daya Beda Butir Soal Ujian
Akhir Semester Tema 7 Kelas III SDN Karet 1 Sepatan’, BINTANG : Jurnal Pendidikan
Mochammad Noor Akhmadi, ‘Analisis Butir Soal Evaluasi Tema 1 Kelas 4 Sdn
humanistics.v6i1.1464>
Nurhalimah, Sri, Yunin Hidayati, Irsad Rosidi, and Wiwin Puspita Hadi, ‘Hubungan Antara
18
Validitas Item Dengan Daya Pembeda Dan Tingkat Kesukaran Soal Pilihan Ganda
<https://doi.org/10.21107/nser.v4i3.8682>
Ramadhan, Muhammad Fakhri, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas
<https://doi.org/10.31004/joe.v6i2.4885>
Salmina, Mik, and Fadlillah Adyansyah, ‘Analisis Kualitas Soal Ujian Metematika Semester
Genap Kelas XI SMA Inshafuddin Kota Banda Aceh’, Jurnal Numeracy, 4.1 (2017), 37–
47