Kamis, 21 Juli 2011

Analisis Butir Soal Kuantitatif

Analisis kuantitatif disebut juga sebagai validitas empiris (empirical validity). Soal yang baik adalah soal yang valid dan reliabel. Sifat reliabel dan valid diperlihatkan oleh tingginya koefisien reliabilitas dan validitas hasil ukur suatu tes.
Hasil analisis secara kuantitatif dimaksudkan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dengan peserta tes yang kemampuannya rendah. Informasi lainnya adalah bagaimana soal dapat membedakan antara individu maupun antar kelompok.

Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas.


Tingkat Kesukaran Butir Soal

Pada analisis butir soal secara klasikal, tingkat kesukaran (p) dapat diperoleh dengan beberapa cara antara lain:
1. skala kesukaran linear,
2. skala bivariat,
3. indeks Davis
4. proporsi menjawab benar
Cara yang paling mudah dan umum dan paling umum digunakan adalah skala rata-rata atau proporsi menjawab benar atau proportion correct (p), yaitu jumlah peserta tes yang menjawab benar pada soal yang dianalisis dibandingkan dengan peserta tes seluruhnya. Persamaan yang digunakan untuk menentukan tingkat kesukaran (p) ini adalah:

p = ∑B

Ν

p = proporsi menjawab benar pada butir soal tertentu
∑В = banyaknya peserta tes menjawab benar
N = jumlah peserta tes yang menjawab

Contoh:

Misalnya dari 100 orang peserta tes, jumlah yang dapat menjawab benar pada soal nomor 1 adalah 70 siswa. Dengan demikian maka ”proportion correct” atau tingkat kesukaran (p) soal itu adalah:

70
p = ─- = 0,70
100

Tingkat kesukaran sebenarnya merupakan ukuran kemudahan soal karena makin tinggi indeks tingkat kesukaran (p) maka makin mudah soalnya dan sebaliknya makin rendah tingkat kesukaran (p) makin sulit soalnya. Dengan demikian makin tinggi nilai p makin mudah soal tersebut.


Besarnya tingkat kesukaran berkisar antara 0 sampai dengan 1. Tingkat kesukaran dikategorikan menjadi tiga bagian seperti nampak pada table berikut ini:

Proportion Correct (p) Kategori Soal
p > 0,70 Mudah
0,30 ≤ p ≤ 0,70 Sedang
p < 0,30 Sukar

Suatu soal kadang-kadang dikategorikan ke dalam ekstrim sukar yaitu apabila p mendekati nol dan ekstrim mudah yaitu apabila p mendekati satu.

Daya Pembeda Soal

Daya pembeda atau daya beda suatu soal berfungsi untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada pada kelompok itu. Tujuan dari pengujian daya pembeda adalah untuk melihat kemampuan butir soal dalam membedakan antara peserta didik yang berkemampuan tinggi dengan peserta didik yang berkemampuan rendah.

Salah satu cara untuk mengetahu daya pembeda soal adalah dengan menghitung korelasi point biserial maupun korelasi biserial adalah korelasi product moment yang diterapkan pada data, variable-variabel yang dikorelasikan sifatnya masing-masing berbeda satu sama lain. Variabel soal bersifat dikotomi sedangkan variable skor total atau sub skor total bersifat kontinum. Variabel soal dinamakan dikotomi karena, skor-skor yang terdapat pada soal hanya ada satu dan nol. Seperti halnya pada bentuk soal pilihan ganda, soal yang benar diberi angka satu dan yang salah diberi angka nol. Variabel skor total atau sub skor total peserta tes bersifat kontinum atau non dikotomi yang diperoleh dari jumlah jawaban yang benar.

c. Reliabilitas Tes

Reliabilitas tes (test reliability) adalah suatu hal yang sangat penting pada alat pengukuran yang standar. Reliabilitas dihubungkan dengan pengertian adanya ketepatan suatu tes dalam pengukurannya. Reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari suatu pengukuran ke pengukuran lainnya. Jadi reliabilitas dapat dikatakan sebagai tingkat konsistensi atau kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi. Dengan perangkat tes yang reliabel, apabila tes itu kita berikan dua kali pada orang yang sama tetapi dalam selang waktu yang berbeda, sepanjang tidak ada perubahan kemampuan, maka skor yang diperoleh akan konstan.

Uji validitas dan reliabilitas dapat dilakukan denganuji statistik menggunakan software-software statisik, maupun program Excel.

Demikian, semoga bermanfaat.

Imam yang Tak Dirindukan

"Aku besok gak mau tarawih lagi, " gerutu si bungsu saat pulang tarawih tadi malam.  "Loh, kenapa?" Tanya Saya sambil ...