PENDAHULUAN
A.
Latar Belakang Masalah
Evaluasi
pembelajaran adalah sistem. Artinya suatu rangkaian kegiatan yang melibatkan
berbagai unsur sebagai satu kesatuan. Masing-masing unsur mempunyai fungsi dan
peran tersendiri dan perubahan dalam salah satu unsur akan berpengaruh pada
unsur yang lainnya. Dalam dunia pendidikan, evaluasi merupakan suatu kegiatan
yang tak terpisahkan dan sama pentingnya dengan proses pembelajaran. Pembelajaran tanpa
kegiatan evaluasi akan kehilangan makna. Sebab guru tidak akan memperoleh
informasi penting tentang tingkat pencapaian tujuan, tingkat penguasaan materi
belajar, kekuatan, kelemahan siswa dalam belajar, serta kekuatan-kelemahan guru
dalam proses pembelajaran yang dikembangkan. Walaupun
evaluasi dianggap penting dan sudah merupakan pekerjaan rutin guru, namun dalam
kenyataan sehari-hari di lapangan sistem evaluasi dalam pembelajaran bukan
berarti tanpa persoalan. Berdasar pengamatan sepintas di lapangan, beberapa
persoalan tersebut paling tidak berkaitan dengan pemahaman konsep dasar
evaluasi, pelaksanaan dan pemanfaatannya, serta evaluasi program pengajaran.
Dalam
proses pembelajaran ada tiga komponen utama yang merupakan satu kesatuan, yaitu
tujuan pembelajaran,
proses pembelajaran, dan evaluasi hasil belajar. Masing-masing komponen
dalam proses pembelajaran tersebut saling bergantung. Oleh karena itu ketiga
komponen harus senantiasa sesuai satu sama lainnya.Dalam melakukan evaluasi
terhadap alat pengukur yang telah digunakan untuk mengukur keberhasilan belajar
dari para peserta didiknya (muridnya, siswa, mahasiswa dan lain-lain). Alat
pengukur dimaksud adalah tes hasil belajar, yang sebagai mana telah kita
maklumi, batang tubuhnya terdiri dari kumpulan butir-butir soal (item, tes).
Dalam aplikasinya mempunyai fungsi dan peranan yang sangat penting dalam hal
untuk mengetahui tujuan yang ingin dicapai.
Salah satu upaya dalam meningkatkan kualitas proses
dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat
dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar
siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana
penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar
mengenai materi yang disampaikan. Dalam melaksanakan kegiatan evaluasi, berhasil atau
tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk
melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya
adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir
soal tertulis yang disediakan bagi setiap tes, atau sekurang-kurangnya pokok
pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek,
maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati
beserta rentang skor masing-masing. Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus
memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan perlu
diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan
indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu
analisis butir soal
B.
Rumusan Masalah
1. Bagaimanakah analisis tingkat kesukaran
kualitas tes dan butir soal?
2. Bagaimanakah analisis daya pembeda kualitas
tes dan butir soal?
3. Bagaimanakah analisis pengecoh kualitas tes
dan butir soal?
4. Bagaimanakah analisis fungsi opsi kualitas tes
dan butir soal?
C. Tujuan Penyelesaian
Masalah
1. Untuk menjelaskan analisis tingkat kesukaran
kualitas ts dan butir soal
2. Untuk menjelaskan analisis daya pembeda
kualitas tes dan butir soal
3. Untuk menjelaskan analisis pengecoh kualitas
tes dan butir soal
4. Untuk menjelaskan analisis fungsi opsi kualitas
tes dan butir soal
BAB II
PEMBAHASAN
A. ANALISIS
TINGKAT KESUKARAN KUALITAS TES DAN BUTIR SOAL
Soal yang baik
adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi outuas asa
dan tidak mempunyai semangat untuk mencoba lagi, karena diluar jangkauannya.
Misalnya, guru A memberikan soal ulangannya mudah mudah dan sebaliknya guru B
memberikan soal ulangannya sukar sukar. Dengan pengetahuannya dan kebiasaan ini
maka siswa akan belajar giat jika menghadapi ulangan dari guru B dan sebaliknya
jika akan mendapat ulangan dari guru A siswa tidak mau giat belajar atau bahkan
mungkin tidak mau belajar sama sekali. Bilangan yang menunjukkan sukar dan
mudahnya suatu soal disebut indeks kesukaran (Difficult Indexs).
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukkan
bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya
terlalu mudah.[1]
0,0
1,0
Sukar _______________________________ Mudah
Di dalam istilah evaluasi, indeks kesukaran
ini diberi simbol P (P besar), singkatan dari kata “Proporsi”. Rumus mencari P
adalah

Dimana :
P
= Indeks kesukaran
B
= banyaknya siswa yang menjawab soal itu
dengan benar
JS = jumlah seluruh siswa peserta tes
JS = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks
kesukaran sering diklasifikasikan sebagai berikut:
-
Soal dengan
P = 0,00 sampai 0,30 adalah soal sukar
-
Soal dengan P = 0,30 sampai 0,70 adalah soal sedang
-
Soal dengan P = 0,7 sampai 1,00 adalah soal mudah
|
Walaupun demikian ada yang
berpendapat bahwa soalsoal yang dianggap baik, yaitu soal soal
sedang yaitu soal-soal yang mempunyai indeks
kesukaran 0,30 – 0,70. Perlu diketahui bahwa
soal-soal yang terlalu mudah atau terlalu sukar tidak berarti tidak boleh digunakan. Hai ini tergantung kegunaannya.[2]
Contoh perhitungan :
Ada 20 orang dengan nama kode A-T yang
mengajarkan test terdiri dari 20 soal. Jawaban tesnya dianalisa dan jawabannya
tertera seperti dibawah ini
(1 = jawaban betul, 0 = jawaban salah)
Tabel 1.1 Analisis item untuk Tingkat Kesukaran
Siswa
|
Nomor Soal
|
Skor Total
|
|||||||||||||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
||
A
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
13
|
B
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
11
|
C
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
12
|
D
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
0
|
9
|
E
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
14
|
F
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
8
|
G
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
13
|
H
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
9
|
I
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
17
|
J
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
13
|
K
|
1
|
1
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
0
|
10
|
L
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
4
|
M
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
13
|
N
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
16
|
O
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
12
|
P
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
10
|
Q
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
9
|
R
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
11
|
S
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
14
|
T
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
10
|
J
L
H
|
10
|
14
|
4
|
9
|
15
|
6
|
18
|
17
|
7
|
11
|
10
|
18
|
20
|
10
|
9
|
7
|
10
|
14
|
13
|
13
|
Dari tabel yang disajikan di atas dapat
ditafsirkan bahwa :[3]
1. Soal nomor 1 mempunyai taraf kesukaran
= 0,5

2. Soal nomor 13 adalah soal
paling mudah karena seluruh siswa peserta tes dapat menjawab:
Indeks kesukarannya =
= 1,0

B. ANALISIS DAYA
PEMBEDA KUALITAS TES DAN BUTIR SOAL
Daya pembeda soal adalah kemampuan sesuatu soal
untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa
yang kurang pintar (berkemampuan rendah).20 Angka yang menunjukkan besarnya
daya pembeda disebut indeks diskriminasi, disingkat (d besar). Indeks
diskriminasi berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran
tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda
negatif. Tanda negatif pada indeks diskriminasi digunakan jika sesuatu soal
“terbalik” menunjukkan kualitas testee.[4]
Angka yang menunjukkan besarnya daya beda
disebut Indeks Diskriminasi berkisar antara 0,00 sampai 1,00. Akan
tetapi pada indeks diskriminasi ini mengenal/ ada tanda negatif (-) yakni -1,0
------------0,0----------1,0 (semakin ke kanan soal semakin baik, semakin ke
kiri maka soal semakin jelek, sebab semakin ke kanan siswa yang pandai semakin
sulit/tidak bisa menjawab dan sebaliknya siswa yang kurang pintar (kiri) bisa
menjawab dengan asal-asalan).[5]
D = Indek diskriminasi (daya beda) JA =
Banyaknya peserta kelompok atas JB = Banyaknya peserta kelompok bawah BA =
Banyaknya peserta kelompok atas yang menjawab soal dengan benar BB = Banyaknya
peserta kelompok bawah yang menjawab soal dengan benar PA = Proporsi peserta
kelompok atas yang menjawab benar PB = Proporsi peserta kelompok bawah yang
menjawab benar D = 0,00 ---------- 0,20 → Jelek (poor) D = 0,21
---------- 0,40 → Cukup (satisfactory) D = 0,41 ---------- 0,70 → Baik (good)
D = 0,71 ---------- 1,00 → Baik Sekali (exellent) D = Negatif,
semuanya → tidak baik, jadi semua butir soal yang mempunyai nilai D negatif
sebaiknya dibuang saja.23 Dalam kegiatan analisis kualitas tes dan butir soal
terdapat manfaat daya pembeda butir soal sebagaimana kami kutip berdasarkan
pendapat Karjono Natar berikut ini.
1) Untuk meningkatkan mutu setiap butir soal
melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal
dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.
2) Untuk
mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi
yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua
kemampuan siswa itu, maka butir soal itu dapat dicurigai “kemungkinannya”
seperti berikut ini: (a) kunci jawaban butir soal itu tidak tepat; (b) butir
soal itu memiliki 2 (dua) atau lebih kunci jawaban yang benar; (c) kompetensi
yang diukur tidak jelas; (d) pengecoh tidak berfungsi; (e) materi yang
ditanyakan terlalu sulit, sehingga banyak siswa yang menebak; (f) sebagian
besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah
informasi dalam butir soalnya.[6]
Butir soal tes yang baik juga harus dapat
menunjukan daya pembedanya. Sebagaimana penuturan Arikunto di atas, “daya beda
adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai
(berkemampuan tinggi) dengan siswa yang kurang (berkemampuan rendah).”[7]
Menurut Anastasi dan Urbina dalam Purwanto, daya beda berhubungan dengan
derajad kemampuan butir membedakan dengan baik prilaku pengambil tes dalam tes
yang dikembangkan. Soal dapat dikatakan mempunyai daya pembeda jika soal
tersebut dapat dijawab oleh siswa berkemampuan tinggi dan tidak dapat dijawab
oleh siswa berkemampuan rendah. Jika suatu soal dapat dijawab oleh siswa pintar
maupun kurang, berarti soal tersebut tidak mempunyai daya beda, demikian juga
jika soal tersebut tidak dapat dijawab oleh siswa pintar dan siswa kurang,
berarti soal tersebut tidak baik sebab tidak mempunyai daya pembeda.[8]
C. ANALISIS
PENGECOH KUALITAS TES DAN BUTIR SOAL
Perlunya dilakukan analisis pengecoh
(distactors) pada setiap butir soal, untuk mengetahui efektif dan tidaknya
pengecoh pada tes pilihan ganda. Pada alternatif jawaban benar, kelompok tinggi
harus memilih lebih banyak jawaban yang benar. Sebaliknya untuk alternatif
jawaban yang merupakan pengecoh, kelompok bawah harus memilih secara lebih
banyak. Disamping itu semua alternatif jawaban yang disediakan harus ada siswa
yang memilihnya. Jika terjadi penyimpangan terhadap hal-hal tersebut, dalam
arti tidak seorang siswa pun yang terkecoh atau kelompok atas justru lebih
banyak yang terkecoh, berarti pengecoh yang disdiakan tidak efektif.[9]
Menurut sukiman analisis yang
berhubungan dengan distraktor dilakukan khusus untuk bentuk tes pilihan ganda (multiple
choice item) yang mempunyai opsi jawaban antara 3 sampai dengan 5 buah. Di
dalam soal pilihan ganda terdapat satu jawaban yang benar dan beberapa jawaban
salah atau distraktor.[10]
Menurut Zainal Arifin butir soal yang baik adalah soal pengecoh yang dipilih
peserta tes secara merata. Sebaliknya, butir soal yang buruk pengecohnya tidak
dipilih secara merata.[11]
Suatu distraktor (pengecoh) berfungsi dengan baik apabila pengecoh paling tidak dipilih oleh 5% peserta tes atau
lebih banyak dipilih oleh kelompok bawah.[12]
Jadi distraktor dikatakan berfungsi dengan baik apabila pengecoh dipilih paling
sedikit 5% dari peseta tes.
Menurut Suharsimi Arikunto tidak
lanjut setelah dilakukan analisis keefektifan distraktor, dapat diperlakukan
dengan 3 cara berikut ini:
a.
Diterima karena sudah baik. Artinya semua distraktor pada soal
sudah dipilih 5% dari peserta tes.
b.
Ditolak karena tidak baik. Artinya distraktor sama sekali tidak
dipilih peserta tes (0%).
c.
Ditulis kembali karena kurang baik. Artinya distraktor belum
menjalankan fungsinya dengan baik (distraktor dipilih kurang dari 5%).
Kekurangannya mungkin hanya terletak
pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan
seperlunya. Menulis soal adalah suatu pekerjaan yang sulit, sehingga apabila
masih dapat diperbaiki, sebaiknya diperbaiki saja, tidak dibuang. Suatu
distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih 5%
pengikut tes.[13]
D. ANALISIS FUNGSI
OPSI KUALITAS TES DAN BUTIR SOAL
Setelah
tingkat kesukaran soal, daya pembeda, homogenitas dan analisis pengecoh
dihitung, selanjutnya perlu diketahui pula apakah suatu opsi (alternative
jawaban) dari setiap soal berfungsi secara efektif atau tidak. untuk itu, dapat
digunakan langkah-langkah sebagai berikut :
1. Menentukan
jumlah peserta didik
2. Menentukan
jumlah sampel (n), baik untuk kelompok atas maupun kelompok bawah yaitu 27%
3. Membuat
table pengujian efektifitas opsi
4. Menghitung
jumlah alternative jawaban yang dipilinh peserta didik, baik untuk kelompok
atas maupun kelompok bawah.
5. Menentukan
efektifitas fungsi opsi dengan kriteria:
a. Opsi kunci
a) Jumlah
pemilih kelompok atas dan bawah antara 25& - 75%
b) Jumlah
pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok bawah .
b. Opsi
pengecoh
a) Jumlah
pemilih kelompok atas danbawah tidak kurang dari 25%
b) Jumlah
pemilih kelompok bawah harus lebih besar daripada kelompok atas[14]
BAB III
PENUTUP
A. KESIMPULAN
1. Soal yang baik adalah soal yang tidak terlalu
mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan
menyebabkan siswa menjadi outuas asa dan tidak mempunyai semangat untuk mencoba
lagi, karena diluar jangkauannya
2. Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar
(berkemampuan rendah). Menurut Anastasi dan Urbina dalam Purwanto, daya beda
berhubungan dengan derajad kemampuan butir membedakan dengan baik prilaku
pengambil tes dalam tes yang dikembangkan. Soal dapat dikatakan mempunyai daya
pembeda jika soal tersebut dapat dijawab oleh siswa berkemampuan tinggi dan
tidak dapat dijawab oleh siswa berkemampuan rendah. Jika suatu soal dapat
dijawab oleh siswa pintar maupun kurang,
3. Menganalisis fungsi pengecoh (distractor) yaitu menganalisis pola penyebaran jawaban
butir soal pada soal bentuk pilihan ganda. Pola tersebut diperoleh dengan
menghitung banyaknya testee yang memilih pilihan jawaban butir soal atau yang
tidak memilih pilihan manapun (blangko). Dari pola penyebaran jawaban butir
soal dapat ditentukan apakah pengecoh berfungsi dengan baik atau tidak. Suatu
pengecoh dapat dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh
5 % pengikut tes.
Setelah
tingkat kesukaran soal, daya pembeda, homogenitas dan analisis pengecoh
dihitung, selanjutnya perlu diketahui pula apakah suatu opsi (alternative
jawaban) dari setiap soal berfungsi secara efektif atau tidak.
[4]
Daryanto, Evaluasi Pendidikan, 180-182. Arikunto, Prosedur,
212-214. Subana dan Sudrajat, Dasar-Dasar Penelitian Ilmiah, 133-135.
[5]
Ibid
[6] Karjono Natar, Panduan Analisis Butir Soal
(Lampung: UNILA Press, 2011), 12.
[7]
Arikunto, Dasar-Dasar Evaluasi Pendidikan, 219.
[8] Purwanto, Evaluasi Hasil Belajar (Yogyakarta:
Pustaka Pelajar, 2011), 102.
[9]
Sunarti & Selly Rahmawati, Penilaian dalam Kurikulum 2013,
(Yogyakarta: Andi, 2014), hal. 139
[10]
Sukiman, Pengembangan Sistem Evaluasi, (Yogyakarta: Insan Madani, 2012),
hal. 222
[11]
Zainal Arifin, Evaluasi Pembelajaran, (Bandung: Remaja Rosdakarya,
2013), hal. 279
[12]
Daryanto, Evaluasi Pendidikan, (Jakarta: Rineka Cipta, 2012), hal. 193
[13]
Suharsimi, Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: Bumi
Aksara, 2016), hal. 234
[14] Sukardi, dewa ketut, Bimbinagn Karir di Sekolah-
Sekolah,(Jakarta: PT Rineka Cipta, 2013) hal. 32
No comments:
Post a Comment