Evaluasi Pembelajaran

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 24

1

ANALISIS KUALITAS SOAL (VALIDITAS, RELIABILITAS, DAYA BEDA

DAN TINGKAT KESUKARAN SOAL)

Makalah

Diajukan Untuk Memenuhi Tugas Mata Kuliah Evaluasi Pembelajaran Bahasa Arab
Prodi Pascasarjana Pendidikan Bahasa Arab
Oleh:

Rezki Awalia
NIM 80400222047

PROGRAM PASCASARJANA

UNIVERSITAS ISLAM NEGERI ALAUDDIN MAKASSAR

2024
ii

KATA PENGANTAR
Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa

karena rahmat-Nya kita masih tetap bisa menikmati indahnya ciptaan-

Nya. Shalawatdan salam kita curahkan kepada baginda Rasulullah

yang telah menunjukkan kepada kita jalan yang lurus berupa ajaran

agama yang sempurna dengan bahasa yang sangat indah. Penulis

akhirnya dapat menyelesaikan makalah kami yang berjudul

“merancang dan mendesain instrumen ranah kognitif”.

Ucapan terima kasih kepada ibu Prof. Dr.Sitti Mania, M.Ag,

sebagai dosen pemandu dan kepada semua pihak yang sudah

membantu dalam penulisan makalah dari awal hingga selesai. Tugas

ini sebagai salah satu tugas mata kuliah yaitu evaluasi, penulis

mengucapkan banyak terima kasih kepada semua pihak yang telah

membantu menyelesaikanmakalah ini. Penulis sangat memahami jika

makalah ini tentu jauh dari kesempurnaan maka kritik dan saran

sangat kami butuhkan guna memperbaikimakalah-makalah di waktu-

waktu mendatang.

Tolitoli, 24 April 2024

Penulis
3

Daftar Isi
KATA PENGANTAR................................................................................................................................. i
Daftar Isi..................................................................................................................................................ii
BAB I ..................................................................................................... Error! Bookmark not defined.
PENDAHULUAN ..................................................................................................................................... 1
A. Latar Belakang ......................................................................................................................... 1
B. Rumusan Masalah ................................................................................................................... 2
C. Tujuan........................................................................................................................................ 2
BAB II ..................................................................................................................................................... 3
PEMBAHASAN ...................................................................................................................................... 3
A. Analisis Kualitas Soal .............................................................................................................. 3
B. Validitas .................................................................................................................................... 4
C. Reliabilitas ................................................................................................................................ 7
D. Daya Pembeda .......................................................................................................................... 8
E. Tingkat Kesukaran ................................................................ Error! Bookmark not defined.
BAB III.................................................................................................. Error! Bookmark not defined.
PENUTUP............................................................................................. Error! Bookmark not defined.
A. Kesimpulan ............................................................................. Error! Bookmark not defined.
Daftar Pustaka ................................................................................... Error! Bookmark not defined.
4
BAB I

PENDAHULUAN

A. Latar Belakang

Pembelajaran merupakan suatu proses, dimana keberhasilanya ditentukan

oleh banyak faktor, baik faktor yang ada di dalam diri siswa seperti intelegensi,

bakat, minat dan motivasi, maupun faktor yang datang dari guru, lingkungan

keluarga dan masyarakat. Namun demikian setiap faktor tersebut mempunyai

pengaruh dan peranan yang berbeda dalam pencapaian prestasi belajar yang

optimal. Ketersediaan dari seluruh faktor ini akan menunjang pembentukan dan

pencapaian hasil belajar yang memuaskan.

Pendidikan yang berkualitas berhubungan erat dengan proses kegiatan

pembelajaran yang dilaksanakan di sekolah. Tiga unsur dalam proses

pembelajaran adalah tujuan pengajaran (tujuan instruksional), pengalaman

belajar (proses belajar mengajar), dan hasil belajar. Kegiatan penilaian dalam

dunia pendidikan dikenal dengan istilah kegiatan evaluasi. Evaluasi merupakan

bagian dari proses belajar mengajar. Evaluasi hasil belajar dilakukan oleh

pendidik untuk memantau proses, kemajuan, pencapaian dan perbaikan hasil

belajar peserta didik secara berkesinambungan.1 Evaluasi dalam pendidikan

merupakan hal yang penting untuk mengukur dan menilai kualitas pendidikan

guna mencapai tujuan dari pembelajaran.2

Pada umumnya penilaian dan evaluasi adalah sistem yang secara

1
Ina Magdalena and others, ‘Analisis Validitas, Reliabilitas, Tingkat Kesulitan Dan Daya Beda Butir
Soal Ujian Akhir Semester Tema 7 Kelas III SDN Karet 1 Sepatan’, BINTANG : Jurnal Pendidikan Dan Sains,
3.2 (2021), 198–214 <https://ejournal.stitpn.ac.id/index.php/bintang>.
2
Mik Salmina and Fadlillah Adyansyah, ‘Analisis Kualitas Soal Ujian Metematika Semester Genap
Kelas XI SMA Inshafuddin Kota Banda Aceh’, Jurnal Numeracy, 4.1 (2017), 37–47.

1
2

sistematis untuk mengetahui tingkat keberhasilan dan efisiensi proses

pembelajaran. Evaluasi pendidikan sebagai kegiatan pemberian nilai dan makna

terhadap hasil asesmen dalam pembelajaran yang sesuai dengan standar yang

telah ditetapkan.3

B. Rumusan Masalah

1. Bagaimana validitas soal ?

2. Bagaiman reliabilitas soal?

3. Bagaimana daya beda tingkat kesukaran soal?

C. Tujuan

1. Untuk mendeskripsikan bagaimana validitas soal

2. Untuk mendeskripsikan bagaiman reliabilitas soal

3. Untuk mendeskripsikan bagaimana daya beda dan tingkat kesukaran soal

3
Sri Nurhalimah and others, ‘Hubungan Antara Validitas Item Dengan Daya Pembeda Dan Tingkat
Kesukaran Soal Pilihan Ganda Pas’, Natural Science Education Research, 4.3 (2022), 249–57
<https://doi.org/10.21107/nser.v4i3.8682>.
3
BAB II

PEMBAHASAN

A. Analisis Kualitas Soal

Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk

menge- tahui derajat kualitas suatu tes, baik secara keseluruhan maupun butir soal

yang men- jadi bagian dari tes tersebut. Dalam penilai- an hasil belajar, tes

diharapkan dapat meng- gambarkan sampel perilaku dan menghasil- kan nilai yang

objektif serta akurat. Jika tes yang digunakan dosen kurang baik, maka hasil yang

diperoleh pun tentunya kurang baik pula. Hal ini dapat merugikan mahasis- wa itu

sendiri, artinya hasil yang diperoleh mahasiswa menjadi tidak objektif. Oleh se- bab

itu, tes yang digunakan harus memiliki kualitas yang baik.

Tes hendaknya disusun berdasarkan prinsip dan prosedur penyu- sunan tes.

Setelah digunakan perlu diketahui apakah tes tersebut berkualitas baik atau tidak

maka perlu dilakukan analisis kualitas tes.4

Soal tes yang telah dibuat kemudian diujikan kepada siswa. Setelah diujikan

kepada siswa, uji akurasi dan kualitas analisis butir soal perlu dilakukan. Uji akurasi

dan kualitas analisis butir soal meliputi uji validitas, reliabilitas, kesukaran, daya

beda, dan pengecoh pada setiap butir soal. Soal yang telah dibuat tidak hanya

sekedar jadi, tapi perlu melalui tahap uji akurasi dan kualitasnya.5

B. Validitas

Validitas berasal dari kata validity yang mempunyai arti sejauh mana

ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan

4
Akbar Iskandar and Muhammad Rizal, ‘Analisis Kualitas Soal Di Perguruan Tinggi Berbasis Aplikasi
TAP’, Jurnal Penelitian Dan Evaluasi Pendidikan, 22.1 (2018), 12–23
<https://doi.org/10.21831/pep.v22i1.15609>.
5
Pramestyawati Jati and others, ‘Analisis Kualitas Butir Soal Geografi’, Jurnal Pendidikan Geosfer,
8.2 (2023), 287–98 <https://doi.org/10.24815/jpg.v8i2.32500>.

3
4

fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat

tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang

sesuai dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari

pengukuran tersebut merupakan besaran yang mencerminkan secara tepat fakta

atau keadaan sesungguhnya dari apa yang diukur.6

Validitas merupakan kecermatan tes dalam menjalankan fungsi

pengukurannya. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang

hendak diukur. Menurut Arikunto validitas sebuah tes dapat diketahui dari hasil

pengalaman. Validitas tes tersebut dibagi menjadi dua kelompok, yaitu validitas

logis dan validitas empiris. Validitas logis meliputi validitas isi (content validity)

dan validitas konstruk (construct validity), sedangkan validitas empiris meliputi

validitas “ada sekarang” atau konkruen (concurrent validity) dan validitas prediksi

(predictive validity).7

a) Validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir dalam

suatu tes atau instrumen mampu mewakili secara keseluruhan dan

proporsional perilaku sampel yang dikenai tes tersebut. Artinva tes itu valid

apabila butir-butir tes itu mencerminkan keseluruhan konten atau materi

yang diujikan atau yang seharusnya dikuasai secara proporsional.8

b) Validitas konstruk (construct validity) adalah validitas yang

mempermasalahkan seberapa jauh butir-butir tes mampu mengukur apa

yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi

6
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
7
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>.
8
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
5

konseptual yang telah ditetapkan. Validitas konstruk biasa digunakan untuk

instrumen yang dimaksudkan mengukur variabel konsep, baik yang sifatnya

performansi tipikal seperti instrumen untuk mengukur sikap, minat konsep

diri, lokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan lain-lain,

maupun yang sifatnya performansi maksimum seperti instrumen untuk

mengukur bakat (tes bakat), inteligansi (kecerdasan intelektual),

kecerdasan, emosional dan lain-lain.9

Validitas butir soal ditentukan dengan menggunakan rumus korelasi product

moment Pearson dimana skor pada masing-masing butir soal dikaitkan dengan

skor keseluruhan. Menurut (Alpusari, 2014), suatu butir soal dianggap memiliki

validitas yang tinggi jika skor butir soal memiliki korelasi yang baik dengan skor

keseluruhan. Dalam anates, hasil korelasi antara skor butir soal dan skor

keseluruhan dapat digunakan untuk menentukan validitas. Butir soal dianggap

valid jika hasilnya signifikan, sedangkan butir soal dikatakan tidak valid jika

hasilnya tidak signifikan.10 Adapun rumus yang digunakan untuk melakukan

validitas soal dengan menggunakan SPSS sebagai berikut : 11

Keterangan :

rxy = Koefisien korelasi product moment

9
Muhammad Fakhri Ramadhan, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas and
Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75 <https://doi.org/10.31004/joe.v6i2.4885>.
10
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
11
https://medium.com/statistics-uii/uji-validitas-dan-reliabilitas-menggunakan-spss-144640e4f9d3
6

X= Skor masing-masing butir soal

Y= Skor total

XY = Skor butir dikalikan skor total

N= Jumlah responden

Formula Uji Validitas (Koefisien Korelasi)


7
nama
sisw nomo JUMLA
a r soal H
1 2 3 4 5 6 7 8 9 10
A 0 1 1 1 1 1 1 1 1 1 9
B 1 1 1 1 1 0 1 1 1 1 9
A 0 0 0 0 0 1 0 0 1 0 2
B 1 1 1 1 1 1 0 1 1 1 9
A 1 1 1 1 1 1 1 1 1 1 10
B 1 1 1 1 1 1 1 1 1 1 10
A 0 1 1 0 0 0 1 0 0 0 3
B 1 1 1 1 1 1 1 1 1 0 9
A 1 1 1 1 1 1 1 1 1 1 10
B 1 1 1 1 0 1 1 1 1 1 9
A 1 1 1 1 0 1 0 1 1 1 8
B 0 0 0 1 0 1 1 1 0 4
A 1 1 1 1 1 1 1 0 1 1 9
B 1 1 1 1 1 1 1 1 1 1 10
A 1 1 1 1 1 1 0 1 1 1 9
B 1 1 1 1 0 1 1 1 1 1 9
A 1 1 1 1 1 1 1 1 1 1 10
B 0 1 1 0 1 0 1 0 1 0 5
A 1 1 1 1 1 1 1 1 1 1 10
B 1 1 1 1 1 1 1 1 1 1 10
A 1 1 1 1 1 1 0 1 1 1 9
B 1 1 1 1 1 1 1 1 1 1 10
A 1 1 1 1 1 1 1 1 1 1 9
B 0 1 1 1 0 1 0 1 1 1 7
A 1 1 1 1 1 1 1 1 1 1 10
B 1 1 1 1 1 1 1 1 0 1 9
A 0 1 1 1 1 1 1 1 1 1 9
B 1 1 1 1 1 1 0 0 1 1 8
A 0 1 0 1 0 1 0 1 1 0 5
B 1 1 0 1 1 1 1 1 1 1 9
Uji validitas dengan menggunakan SPSS 8

Correlations
Soal1 Soal2 soal3 Soal4 Soal5 Soal6
Soal1 Pearson 1 .443* .429* .553** .489** .302
Correlation
Sig. (2-tailed) .014 .018 .002 .006 .105
N 30 30 30 30 30 30
Soal2 Pearson .443* 1 .681** .356 .443* -.089
Correlation
Sig. (2-tailed) .014 <.001 .053 .014 .640
N 30 30 30 30 30 30
soal3 Pearson .429* .681** 1 .196 .429* -.131
Correlation
Sig. (2-tailed) .018 <.001 .299 .018 .491
N 30 30 30 30 30 30
Soal4 Pearson .553** .356 .196 1 .302 .630**
Correlation
Sig. (2-tailed) .002 .053 .299 .105 <.001
N 30 30 30 30 30 30
Soal5 Pearson .489** .443* .429* .302 1 .050
Correlation
Sig. (2-tailed) .006 .014 .018 .105 .792
N 30 30 30 30 30 30
Soal6 Pearson .302 -.089 -.131 .630** .050 1
Correlation
Sig. (2-tailed) .105 .640 .491 <.001 .792
N 30 30 30 30 30 30
Soal7 Pearson .099 .117 .171 .024 .263 -.218
Correlation
Sig. (2-tailed) .604 .539 .366 .899 .160 .247
N 30 30 30 30 30 30
Soal8 Pearson .337 .239 .088 .745** .135 .447*
Correlation
Sig. (2-tailed) .069 .203 .645 <.001 .477 .013
N 30 30 30 30 30 30
Soal9 Pearson .302 .356 .196 .259 .302 .259
Correlation
Sig. (2-tailed) .105 .053 .299 .167 .105 .167
N 30 30 30 30 30 30
Soal10 Pearson .641** .535** .539** .667** .452* .389*
Correlation
Sig. (2-tailed) <.001 .002 .002 <.001 .012 .034
N 30 30 30 30 30 30
SkorTo Pearson .775** .650** .594** .760** .671** .403*
tal Correlation
Sig. (2-tailed) <.001 <.001 <.001 <.001 <.001 .027
N 30 30 30 30 30 30
9

Correlations
SkorTot
Soal7 Soal8 Soal9 Soal10 al
Soal1 Pearson .099 .337 .302 .641** .775**
Correlation
Sig. (2-tailed) .604 .069 .105 <.001 <.001
N 30 30 30 30 30
Soal2 Pearson .117 .239 .356 .535** .650**
Correlation
Sig. (2-tailed) .539 .203 .053 .002 <.001
N 30 30 30 30 30
soal3 Pearson .171 .088 .196 .539** .594**
Correlation
Sig. (2-tailed) .366 .645 .299 .002 <.001
N 30 30 30 30 30
Soal4 Pearson .024 .745** .259 .667** .760**
Correlation
Sig. (2-tailed) .899 <.001 .167 <.001 <.001
N 30 30 30 30 30
Soal5 Pearson .263 .135 .302 .452* .671**
Correlation
Sig. (2-tailed) .160 .477 .105 .012 <.001
N 30 30 30 30 30
Soal6 Pearson -.218 .447* .259 .389* .403*
Correlation
Sig. (2-tailed) .247 .013 .167 .034 .027
N 30 30 30 30 30
Soal7 Pearson 1 .098 -.218 .036 .257
Correlation
Sig. (2-tailed) .608 .247 .849 .170
N 30 30 30 30 30
Soal8 Pearson .098 1 .149 .447* .595**
Correlation
Sig. (2-tailed) .608 .432 .013 <.001
N 30 30 30 30 30
Soal9 Pearson -.218 .149 1 .389* .454*
Correlation
Sig. (2-tailed) .247 .432 .034 .012
N 30 30 30 30 30
Soal10 Pearson .036 .447* .389* 1 .834**
Correlation
Sig. (2-tailed) .849 .013 .034 <.001
N 30 30 30 30 30
SkorTot Pearson .257 .595** .454* .834** 1
al Correlation
Sig. (2-tailed) .170 <.001 .012 <.001
10

N 30 30 30 30 30

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

C. Reliabilitas

Kata reliabilitas diambil dari bahasa Inggris yaitu reliability, dari kata reliable

yang artinya dapat dipercaya. Apabila suatu alat pengukur itu menghasilkan data

yang ajeg, maka alat pengukur tersebut bisa disebut reliable atau dapat dipercaya.12

Adapun rumus yang digunakan menggunakan SPSS sebagai berikut : 13

Formula Uji Reliabilitas (Koefisien Reliabilitas)

Contoh uji Reliabilitas menggunakan SPSS

Case Processing Summary


N %
Cases Valid 30 100.0
Excludeda 0 .0
Total 30 100.0
a. Listwise deletion based on all variables
in the procedure.

Reliability Statistics
12
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
13
https://medium.com/statistics-uii/uji-validitas-dan-reliabilitas-menggunakan-spss-144640e4f9d3
11

Cronbach's Alpha Part 1 Value .776


N of Items 5a
Part 2 Value .681
N of Items 4b
Total N of Items 9
Correlation Between Forms .634
Spearman-Brown Equal Length .776
Coefficient Unequal Length .778
Guttman Split-Half Coefficient .757
a. The items are: Soal1, Soal2, soal3, Soal4, Soal5.
b. The items are: Soal5, Soal6, Soal8, Soal9, Soal10.

D. Daya Pembeda

Daya pembeda adalah penilaian kemampuan suatu item untuk memisahkan

peserta didik yang sudah dan yang belum menguasai suatu keterampilan

berdasarkan kriteria yang telah ditentukan. Semakin kuat koefisien daya pembeda

pada item pertanyaan, semakin baik dalam membedakan antara peserta didik yang

memahami kompetensi dengan peserta didik yang kurang memahami

kompetensi.14

Daya beda butir soal merupakan suatu indeks yang menunjukkan tingkat

kemampuan butir soal membedakan kelompok atas (peserta tes yang berprestasi

tinggi) dari kelompok bawah (peserta tes yang berprestasi rendah). Pernyataan ini

sesuai dengan pendapat Sundayana bahwa daya pembeda merupakan kemampuan

soal untuk dapat membedakan siswa yang berkemampuan tinggi dengan siswa

yang berkemampuan rendah. 15 Indeks daya pembeda tes atau daya pembeda (Dp)

adalah angka yang mewakili derajat daya pembeda.

Kriteria indeks daya pembeda butir soal antara lain

14
Ahmad Suryadi. Evaluasi Pembelajaran II. (bojonggenteng: CV Jejak. 2020) hlm 30
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
15

MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
12

Tabel.1.1 Tabel.1 Kriteria Indeks Daya Pembeda Soal16

No Indeks Daya Pembeda Kriteria Kesukaran

1. Dp ≤ 0,00 Sangat Kurang

2. 0,00 < Dp ≤ 0,20; Kurang

3. 0,20 < Dp ≤ 0,40; Cukup

4. 0,40 < Dp ≤ 0,70; Baik

5. 0,40 < Dp ≤ 0,70 Sangat Baik

Tabel.1.2 Kriteria Indeks Daya Pembeda Soal17

Indeks Daya Pembeda Kriteria Daya Pembeda

Negatif – 9% Sangat buruk

10% – 19% Buruk

20% – 29% Cukup

30% – 49% Baik

50% ke atas Sangat baik

16
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
17
Mochammad Noor Akhmadi, ‘Analisis Butir Soal Evaluasi Tema 1 Kelas 4 Sdn Plumbungan
Menggunakan Program Anates’, Ed-Humanistics : Jurnal Ilmu Pendidikan, 6.1 (2021), 799–806
<https://doi.org/10.33752/ed-humanistics.v6i1.1464>.
13

Contoh menggunakan SPSS

Item-Total Statistics
Corrected Cronbach's
Scale Mean if Scale Variance Item-Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
Soal1 6.87 3.223 .680 .797
Soal2 6.67 3.885 .575 .816
soal3 6.73 3.789 .458 .824
Soal4 6.70 3.597 .721 .798
Soal5 6.87 3.499 .489 .824
Soal6 6.70 4.010 .344 .834
Soal8 6.77 3.702 .465 .824
Soal9 6.70 3.941 .404 .829
Soal10 6.80 3.200 .796 .782

E. Tingkat Kesukaran

Tingkat kesukaran (difficulty level) disebut juga sebagai indeks kesukaran

butir soal yang dilambangkan dengan huruf p yaitu proportion. Tingkat kesukaran

adalah peluang untuk menjawab benar pada suatu soal pada tingkat kemampuan

tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran

menunjukkan proporsi peserta didik yang dapat mengerjakan soal secara benar

dari suatu tes/ujian.18 Dengan membandingkan jumlah siswa secara keseluruhan

dengan yang menjawab benar setiap soal, maka tingkat kesulitan soal dapat

ditentukan. Kategori soal dianggap semakin mudah jika indeks kesukaran

mendekati 1,00.19

18
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
19
Iswatul Khasanah, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika Bentuk
Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25.
14

Indeks Tingkat Kesukaran Hasil20

Indeks kesukaran Kriteria

0.00 < P < 0.03 Sulit

0.00 < P < 0.70 Sedang

0.70 < P < 1.00 Mudah

Dapat dihitung dengan rumus sebagai berikut :

𝐵
𝑃=
𝐽𝑠

Dengan:21

P : Tingkat kesukaran

B : Jumlah siswa menjawab benar

Js: Total seluruh siswa

Kriteria indeks kesukaran soal menurut Sudjana sebagai berikut :

0 - 0,30 : Soal kategori sukar

0,31 - 0,70 : Soal kategori sedang

0,71 - 1,00 : Soal kategori mudah.

Formula tersebut dipergunakan untuk menentukan nilai tingkat kesukaran

20
Bahrudin Fahmi, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal Bahasa Arab
MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah: Jurnal Pendidikan Bahasa Arab &
Kebahasaaraban, 6.1 (2022), 95–105 <https://doi.org/10.15575/jpba.v6i1.16193>
21
Lia Hamimi, Riszki Zamharirah, and Rusydy Rusydy, ‘Analisis Butir Soal Ujian Matematika Kelas
VII Semester Ganjil Tahun Pelajaran 2017/2018’, Mathema: Jurnal Pendidikan Matematika, 2.1 (2020), 57
<https://doi.org/10.33365/jm.v2i1.459>.
15

soal berbentuk pilihan ganda. Adapun untuk soal yang berbentuk uraian,

penentuan nilai tingkat kesuakran dilakukan menggunakan ketentuan bedasarkan

Antony (2012) berikut:

Contoh Tingkat kesukaran spal dengan menggunakan SPSS

Statistics
Soal Soal soal Soal Soal Soal Soal Soal Soal Soal
1 2 3 4 5 6 7 8 9 10
N Vali 30 30 30 30 30 30 30 30 30 30
d
Mis 0 0 0 0 0 0 0 0 0 0
sing
Mean .73 .93 .87 .90 .73 .90 .70 .83 .90 .80
Maximu 1 1 1 1 1 1 1 1 1 1
m
16
BAB III

PENUTUP

A. Kesimpulan

Analisis kualitas tes merupakan suatu tahap yang harus ditempuh

untuk menge- tahui derajat kualitas suatu tes, baik secara keseluruhan

maupun butir soal yang men- jadi bagian dari tes tersebut. Baik meliputi

dari vailidits, reliabilitas, daya pembeda dan kesukaran soal.

Validitas merupakan kecermatan tes dalam menjalankan fungsi

pengukurannya. Suatu tes dikatakan valid apabila tes tersebut mengukur

apa yang hendak diukur. Kata reliabilitas diambil dari bahasa Inggris yaitu

reliability, dari kata reliable yang artinya dapat dipercaya. Daya pembeda

adalah penilaian kemampuan suatu item untuk memisahkan peserta didik

yang sudah dan yang belum menguasai suatu keterampilan berdasarkan

kriteria yang telah ditentukan. Tingkat kesukaran adalah peluang untuk

menjawab benar pada suatu soal pada tingkat kemampuan tertentu yang

biasanya dinyatakan dalam bentuk indeks.

16
17

Daftar Pustaka

Fahmi, Bahrudin, Syahrul Rizqi, and Nurul Elmira Harmeilinda, ‘Analisis Butir Soal

Bahasa Arab MAS Pondok Pesantren Assalam Kampar Riau’, Ta’lim Al-’Arabiyyah:

Jurnal Pendidikan Bahasa Arab & Kebahasaaraban, 6.1 (2022), 95–105

<https://doi.org/10.15575/jpba.v6i1.16193>

Hamimi, Lia, Riszki Zamharirah, and Rusydy Rusydy, ‘Analisis Butir Soal Ujian

Matematika Kelas VII Semester Ganjil Tahun Pelajaran 2017/2018’, Mathema: Jurnal

Pendidikan Matematika, 2.1 (2020), 57 <https://doi.org/10.33365/jm.v2i1.459>

Iskandar, Akbar, and Muhammad Rizal, ‘Analisis Kualitas Soal Di Perguruan Tinggi

Berbasis Aplikasi TAP’, Jurnal Penelitian Dan Evaluasi Pendidikan, 22.1 (2018), 12–

23 <https://doi.org/10.21831/pep.v22i1.15609>

Jati, Pramestyawati, Alia Alawiati, Ahmad Jibril H, Ali Mudin, and Cindy Prisma S, ‘Analisis

Kualitas Butir Soal Geografi’, Jurnal Pendidikan Geosfer, 8.2 (2023), 287–98

<https://doi.org/10.24815/jpg.v8i2.32500>

Khasanah, Iswatul, Anies Fuady, and Sunismi, ‘Analisis Soal Ulangan Harian Matematika

Bentuk Pilihan Ganda’, Mathema Journal, 5.2 (2023), 110–25

Magdalena, Ina, Septy Nurul Fauziah, Siti Nur Faziah, and Fika Sulaehatun Nupus,

‘Analisis Validitas, Reliabilitas, Tingkat Kesulitan Dan Daya Beda Butir Soal Ujian

Akhir Semester Tema 7 Kelas III SDN Karet 1 Sepatan’, BINTANG : Jurnal Pendidikan

Dan Sains, 3.2 (2021), 198–214 <https://ejournal.stitpn.ac.id/index.php/bintang>

Mochammad Noor Akhmadi, ‘Analisis Butir Soal Evaluasi Tema 1 Kelas 4 Sdn

Plumbungan Menggunakan Program Anates’, Ed-Humanistics : Jurnal Ilmu

Pendidikan, 6.1 (2021), 799–806 <https://doi.org/10.33752/ed-

humanistics.v6i1.1464>

Nurhalimah, Sri, Yunin Hidayati, Irsad Rosidi, and Wiwin Puspita Hadi, ‘Hubungan Antara
18

Validitas Item Dengan Daya Pembeda Dan Tingkat Kesukaran Soal Pilihan Ganda

Pas’, Natural Science Education Research, 4.3 (2022), 249–57

<https://doi.org/10.21107/nser.v4i3.8682>

Ramadhan, Muhammad Fakhri, Rusydi A. Siroj, and Muhammad Win Afgani, ‘Validitas

and Reliabilitas’, Journal on Education, 6.2 (2024), 10967–75

<https://doi.org/10.31004/joe.v6i2.4885>

Salmina, Mik, and Fadlillah Adyansyah, ‘Analisis Kualitas Soal Ujian Metematika Semester

Genap Kelas XI SMA Inshafuddin Kota Banda Aceh’, Jurnal Numeracy, 4.1 (2017), 37–

47

Anda mungkin juga menyukai