ANALISIS BUTIR TES
A. Tujuan Analisis Butir
Analisis tes hasil belajar merupakan kegiatan penting dalam upaya
memperoleh instrumen yang berkategori baik. Analisis ini meliputi (1)
menentukan validitas dan realibilitas tes, dan (2) analisis butir (item analysis).
Menurut Thorndike dan Hagen (Purwanto, 1992) analisis terhadap buti
tes yang telah di jawab siswa suatu kelas mempunyai dua tujuan yakni (1)
jawaban-jawaban soal tersebut merupakan informasi diagnostik untuk meneliti
pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya
untuk membimbing ke arah cara belajar yang lebih baik; dan (1) jawaban terhadap
soal dan perbaikan (review) soal-soal
yang didasarkan atas jawaban-jawaban tersebut merupakan dasar bagi penyiapan
tes-tes yang lebih baik.
Dengan melakukan analisis butir sedikitnya kita dapat mengetahui empat
hal penting, yakni:
Ø Bagaimana
taraf kekuasaan setiap butir tes?
Ø Apakah
setiap soal memiliki daya pembeda baik?
Ø Apakah
setiap soal memiliki daya pembeda baik?
Ø Sejauh
mana tiap butir tes dapat mengukur hasil pembelajaran?
B. Analisis Butir Tes Acuan Norma
Tujuan penilai acuan norma adalah untuk mengetahui posisi kemampuan
seorang siswa di dalam kelompok. Misalkan ingin mengetahui kualitas instrumen
tes objektif yang menggunakan acuan norma. Untuk itu, setelah instrumen tes
tersebut kita buat (susun), maka kegiatan selanjutnya adalah sebagai berikut:
Ø Berikan
instrumen tes tersebut untuk dikerjakan siswa.
Ø Periksa
hasil pekerjaan siswa dan berikan skor. Butir yang benar diberi skor 1,
sedangkan butir yang salah diberikan skor 0
Ø Daftar
skor setiap siswa dalam tabel, terurut dari yang tertinggi sampai dengan
terendah (untuk menghitung reliabilitas)
Ø Pilih
27% siswa yang mendapat skor tertinggi (disebut kelompok atas). Misalkan siswa
yang mengikuti tes berjumlah 30 orang. Maka kita pilih 8 orang pada kelompok
atas dan 8 orang pada kelompok bawah. Ini berguna untuk menghitung indeks
kesuksesan, daya pembeda dan efektivitas option
Ø Kemudian
selain menghitung (menetapkan) reliabilitas dan validitas instrumen, kita perlu
menentukan indeks kesukaran, daya pembeda, korelasi point biserial, dan efektivitas
option.
Berikut akan diuraikan secara garis besar mengenai indeks kesukaran,
daya pembeda, korelasi point biserial, dan efektivitas option secara contoh
perhitungannya.
Ø Tingkat
Kesukaran
Suatu instrumen tes yang baik memiliki butir-butir dengan tingkat
kesukaran yang proporsional. Maksudnya instrumen tersebut tidak didominasi
butir-butir yang relatif mudah.
Tingkat kesukaran suatu butir tes dinyatakan dengan indeks kesulitan (difficulty indeks) bilangan tersebut
adalah bilangan riel pada interval (kontinum) 0,00 – 1,00. Indeks kesukaran,
(p) suatu butir ditentukan dengan rumus
Keterangan
P = Indeks Kesukaran
PH
= Proporsi siswa kelompok atas yang menjawab benar butir tes
P1 = proporsi siswa kelompok bawah yang menjawab
benar butir tes
Kriteria untuk
menentukan indeks kesukaran adalah sebagai berikut
Tabel 6.1 Kriteria
Indeks Kesukaran Butir
Indeks
Daya Pembeda
|
Kategori
|
p
≤ 0,25
|
Sukar
|
0,25 < p ≤ 0,75
|
Sedang
|
0,75 < p
|
Mudah
|
Untuk menentukan tingkat kesukaran, kita cukup memperhatikan data hasil
tes dari kelompok bawah. Sebagai contoh, tabel 6.2 berikut menunjukkan hasil
tes siswa kelompok atas dan kelompok bawah, serta persiapan perhitungan indeks
kesukaran butir.
Table 6.2 Tabel Persiapan Perhitungan Indeks Kesukaran Kelompok Atas
No.
|
Nama
|
Skor
Tes Untuk Butir Nomor
|
Total
(Xl)
|
|||||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
|||
1
|
Fredi
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
11
|
2
|
Rosmi
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
10
|
3
|
Tanu
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
10
|
4
|
Jaya
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
9
|
5
|
Samy
|
1
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
9
|
6
|
Suro
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
9
|
7
|
Wisnu
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
7
|
8
|
Adin
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
9
|
Np.
(Jumlah Bnr)
|
7
|
5
|
7
|
6
|
6
|
6
|
7
|
7
|
6
|
7
|
3
|
7
|
||
pH
(Proporsi atas)
|
0,80
|
0,63
|
0,88
|
0,75
|
0,75
|
0,75
|
0,88
|
0,88
|
0,75
|
0,88
|
0,33
|
0,88
|
Kelompok Bawah
23
|
Susi
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
5
|
24
|
Lisa
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
5
|
25
|
Lusi
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
4
|
26
|
Seli
|
1
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
4
|
27
|
Isul
|
0
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
5
|
28
|
Heru
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
0
|
3
|
29
|
Herry
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
0
|
1
|
0
|
3
|
30
|
Usi
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
2
|
Np. (Jumlah Bnr)
|
2
|
3
|
3
|
1
|
2
|
4
|
1
|
2
|
3
|
2
|
6
|
2
|
|
|
pH (Proporsi atas)
|
0.25
|
0.38
|
0.38
|
0.13
|
0.25
|
0.5
|
0.13
|
0.25
|
0.38
|
0.25
|
0.75
|
0.25
|
|
Dari data pada tabel 6.2 di atas dapat dihitung indeks kesukaran setiap
butir tes, sebagai berikut:
Untuk
butir 1, p =
= 0,565 (taraf kesukaran sedang)
Untuk
butir 2, p =
= 0,505 (taraf kesukaran sedang)
Untuk
butir 3, P =
= 0,63 (taraf kesukaran sedang)
Untuk butir 4,
P =
= 0,44 (taraf kesukaran sedang)
Untuk butir 5,
P =
= 0,50 (taraf kesukaran sedang)
Untuk butir 6,
P =
= 0,625 (taraf kesukaran sedang)
Ø Daya
Pembeda
Daya pembeda suatu butir menyatakan seberapa jauh kemampuan butir tersebut
mampu membedakan antara kelompok testi (siswa) pandai dengan kelompok testi
(siswa) lemah.
Daya
pembedaan (D) butir tes dihitung dengan rumus.
D
= PH - PL
Keterangan
D
= Indeks Daya Pembeda
PH = Proporsi Siswa kelompok atas yang menjawab benar
butir tes
PL = Proporsi siswa kelompok bawah yang
menjawab benar butir tes
Daya
pembeda ini sekurang-kurangnya harus berkualitas cukup kriteria yang digunakan
untuk menetukan indeks daya pembeda adalah sebagai berikut
Tabel
6.3 Penafsiran Indeks Daya Pembeda
Indeks
Daya Pembeda
|
Kategori
|
0,40 < D
|
Butir sangat baik
|
0,30 < D ≤ 0,40
|
Butir baik
|
0,20 < D ≤ 0,30
|
Butir cukup
|
D ≤ 0,20
|
Butir jelek
|
Dari,
data pada Tabel 6.2 di atas dihitung indeks kesuksesan setiap butir tes,
sebagai berikut
Untuk
butir 1, p = 0,88 - 0,25 = 0,63 (daya
pembedaan sangat baik)
Untuk
butir 2, p = 0,63 - 0,38 = 0,25 (daya
pembedaan cukup)
Untuk
butir 3, p = 0,88 - 0,38 = 0,50 (daya
pembedaan sangat baik)
Untuk
butir 4, p = 0,75 - 0,13 = 0,62 (daya
pembedaan sangat baik)
Untuk
butir 5, p = 0,75 - 0,25 = 0,50 (daya
pembedaan sangat baik)
Untuk
butir 6, p = 0,75- 0,50 = 0,25 (daya
pembedaan cukup)
Ø Kelorasi
Point Biserial
Satu situasi yang sering terjadi dalam analisis butir adalah jika
pengembangan tes ingin mengetahui seberapa jauh hubungan antara jawaban pada
suatu butir tes yang diskor secara dikotomis (0 dan 1) dengan skor total (atau
kriteria lain yang memiliki distribusi secara kontinyu). Untuk keperluan ini
digunakan rumus korelasi point berserial, yakni:
Keterangan
= koefisien korelasi point biserial
= Rata-rata
skor dari subjek yang menjawab benar untuk butir soal yang akan dicari
validitasnya
= Rata-rata
skor total
St =
simpangan baku skor total
P =
Proposal siswa yang menjawab benar pada butir soal dinamakan
q =
proposal siswa yang menjawab salah pada butir soal dimaksud
Sebagai contoh, perhatikan kembali data tabel
3.6
Untuk butir 1,
Menurut Nur (1987), nilai kriteria menimal
korelasi point biserial ditetapkan pada 2 kekeliruan baku di atas nol, dimana
Keterangan:
sp =
Kekeliruan
N = Ukuran
sampel
Dengan demikian, dalam kasus contoh di atas diperoleh
Sehingga dari 4 butir yang telah dihitung nilai korelasi
point biserialnya di atas, hanya butir 2 dan 3 yang memenuhi kriteria minimal,
sedangkan butir 1 dan 4 tidak memenuhi kriteria minimal
Ø Efektivitas
Option
Suatu option
di katakan efektif jika memenuhi fungsi atau tujuan disajikan option tersebut.
Option kunci dikatakan efektif jika memenuhi kriteria sebagai berikut:
-
Jumlah pemilih sekolah atas harus lebih banyak
dari jumlah pemilih kelompok bawah; dan
-
Jumlah pemilih kelompok atas dan kelompok bawah
lebih dari 25% dan tidak lebih dari 75% testi (siswa) pada kelompok atas dan
kelompok bawah tersebut.
Selanjutnya option pengecoh dikatakan efektif jika
memenuhi kriteria sebagai berikut:
Tabel 6.4 Sebaran
Pilihan Option Pada Suatu Butir
Kelompok
|
Option
|
Omit
|
|||
a
|
b
|
c
|
d
|
||
Atas
|
0
|
2
|
5
|
1
|
0
|
Bawah
|
1
|
1
|
3
|
2
|
1
|
-
Jumlah pemilih kelompok atas harus lebih sedikit
(kurang) dari pemilih pada kelompok bawah;
-
Jumlah pemilih paling sedikit (minimal) 5% dari
testi (siswa) pada kelompok atas dan kelompok bawah;
-
Jika testi (siswa) tidak memilih satu option
pada butir tes tersebut (disebut omit), maka jumlahnya tidak lebih dari 10%
jumlah siswa pada kelompok atas dan
kelompok bawah.
Sebagai contoh
misalnya sebesar pilihan option pada suatu butir soal adalah sebagai berikut
Dari data pada
tabel 6.4. dapat disimpulkan sebagai berikut
Ø Option
a sebagai salah satu option pengecoh berfungsi efektif sebab:
-
Jumlah pemilih kelompok atas kurang dari jumlah
pemilih kelompok bawah
-
Jumlah pemilih kelompok atas dan kelompok bawah
sebanyak 1 orang. In lebih dari 5% x 16 = 0,8
Ø Option
b sebab salah satu option pengecoh, tidak berfungsi efektif, sebab jumlah
pemilih kelompok atas lebih banyak dari pada jumlah pemilih bawah
Ø Option
c sebagai option kunci berfungsi efektif, sebab
-
Jumlah pemilih
kelompok atas lebih dari jumlah pemilih kelompok bawah
-
Jumlah pemilih kelompok atas dan kelompok bawah
sebanyak 8 orang atau 50%, ini lebih besar dari 25% dan kurang dari 75%
Ø Option
d sebagai salah satu option pengecoh berfungsi efektif
-
Jumlah pemilih kelompok atas lebih banyak dari
jumlah pemilih kelompok bawah
-
Jumlah pemilih kelompok atas dan kelompok bawah
sebanyak 3 orang. Ini lebih besar dari 5% x 16 = 0,8
Ø Omit
masih di bawah toleransi, karena jumlahnya hanya 1, tidak lebih dari 10% x 16 =
1,6
C. Analisis Butir Tes Acuan Patokan
Tujuan penilaian acuan patokan adalah untuk mengetahui kemampuan
seseorang menurut patokan tertentu. Syarat penilaian ini adalah (1) butir soal
yang digunakan harus mencerminkan indikator kemampuan yang diharapkan
(ditargetkan), dan (2) kemampuan yang diharapkan tersebut adalah kemampuan yang
tidak dapat dikuasai siswa sebelumnya siswa mengikuti proses pembelajaran
Dalam analisis butir tes acuan patokan, yang perlu ditentukan
(dianalisis) adalah (1) indeks kesukaran butir, (2) indeks sensivitas butir,
dan (3) indeks persesuaian, indeks
kesukaran butir telah dibahas pada bagian analisis butir penilaian acuan norma,
oleh karena itu tidak lagi dibahas pada bagian ini.
Ø Indeks
sensitivitas butir
Indeks
sinsitivitas butir pada dasarnya merupakan ukuran seberapa baik tersebut membedakan
antara siswa yang telah dan yang belum mengikuti KMB. Cox dan Vargas (Crocker
dan Algina, 1986), memperkenalkan prosedur penentuan sensitivitas pembelajaran
dengan cara memberikan pre-test dan post-tes kepada kelompok siswa yang sama.
Statistik daya pembeda dinyatakan sebagai:
D = Ppost
- Ppre
Keterangan
Ppost = Proporsi yang menjawab butir soal secara
benar pada post-test
PPre = Proporsi yang menjawab butir soal
secara benar pada pre-test
Masih 30 siswa
mengajarkan suatu tes yang terdiri atas 10 butir, sebelum dan sesudah
pembelajaran. Hasil tes tersebut dan sensitivitas butirnya disajikan pada tabel
berikut:
Indeks
sensitivitas butir yang efektif berada di antara 0,00 – 1.00. Semakin besar
indeks sensitivitas butir menunjukkan semakin besar keberhasilan
pembelajarannya.
Ø Indeks
Persesuaian
Ada kalanya pengembangan tes perlu mengkaji kemiripan jawaban dari satu
kelompok siswa terhadap setiap kemungkinan pasangan butir yang dibuat dengan
spesifikasi sama. Untuk menentukan indeks persesuaian digunakan rumus.
Keterangan
n = Banyaknya siswa keseluruhan
a = Banyaknya siswa yang menjawab
benar kedua butir
b = Banyaknya siswa yang menjawab salah satu butir 1, tetapi benar
pada butir 2
c = Banyaknya siswa yang
menjawab benar butir 1, tetapi salah pada butir 2
d = Banyaknya siswa yang
menjawab salah kedua butir
Selanjutnya dapat pula
ditentukan proporsi persesuaian yang menunjukkan kekonsistenan dalam menjawab
kedua butir. Rumus yang digunakan adalah
P =
Keterangan
P = Proporsi
persetujuan
Selain itu, dapat pula ditentukan apakah taraf kesukaran butir sama
dalam populasi siswa. Dengan kata lain, apakah kedua butir tes telah dipelajari
siswa dengan cara yang sama baik; ataukah siswa secara signifikan tampil lebih
baik pada satu butir dibandingkan dengan butir yang lain untuk itu digunakan
rumus.
Misalnya dari hasil uji coba pada 60 siswa diketahui bahwa 30 siswa
menjawab kedua butir dengan benar; 12 siswa menjawab butir satu salah tetapi
butir dua benar; 8 siswa menjawab butir satu benar tetapi butir dua salah; dan
10 orang yang menjawab kedua butir salah. Data ini dapat dinyatakatan dalam
tabel sel berikut
|
|
Butir
1
|
|
|
Butir
1
|
||
|
+
|
-
|
|
+
|
-
|
||
Butir 2
|
+
|
a
|
b
|
Butir 2
|
+
|
30
|
12
|
-
|
c
|
d
|
-
|
8
|
10
|
Sehingga didapatkan
indeks persesuaiannya
a.
Indeks persesuaian
Nilai X2
ini lebih dari X2 tabel = 3,84 (untuk α
= 0,05). Dengan demikian, dapat disimpulkan bahwa kedua butir tersebut mengukur
hal (isi) yang benar.
b.
Proporsi persesuaian
Ini menunjukan
bahwa terdapat konsistensi penampilan pada kedua butir tersebut bagi 66,7 %
siswa
c.
Uji X2 untuk perbedaan taraf
kesukaran butir
Nilai X2
ini kurang dari X2 tabel =
3,84 (untuk a = 0,05). Dengan demikian, taraf kesukaran kedua butir sama.
Dengan kata lain, siswa telah belajar sama baiknya terhadap isi yang diukur
oleh kedua butir.
D.
Kesimpulan
Analisis tes hasil belajar merupakan kegiatan penting dalam upaya
memperoleh instrumen yang berkategori baik. Analisis tes bertujuan untuk
mengidentifikasi butir-butir manakah yang termasuk dalam kategori baik, kurang
baik, dan jelek. Analisis butir memungkinkan kita memperoleh informasi mengenai
baik-tidaknya suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
0 comments :