MAKALAH
ANALISIS KUALITAS TES
BAB II
PEMBAHASAN
A. ANALISIS KUALITAS TES
Analisis kualitas tes merupakan
suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes,
baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes
tersebut. Dalam penilaian hasil
belajar, tes diharapkan dapat menggambarkan sampel perilaku dan menghasilkan
nilai yang objektif serta akurat. Jika tes yang digunakan guru kurang baik,
maka hasil yang diperoleh pun tentunya kurang baik. Hal ini dapat merugikan
peserta didik itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi
tidak objektif dan tidak adil.
Analisis kualitas tes berkaitan
dengan pertanyaan apakah tes sebagai suatu alat ukur benar – benar mengukur apa
yang hendak dan seharusnya di ukur ? Sampai mana tes tersebut dapat di andalkan
dan berguna? Kedua pertanyaan ini sebenarnya menunjuk pada dua hal pokok, yaitu
validitas dan reliabilitas. Kedua hal ini sekaligus merupakan karakteristik
alat ukur yang baik.[1]
B. ANALISIS EMPIRIS
- Indeks Kesukaran
Asumsi
yang digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi validitas dan reliabilitas,
adalah adanya keseimbangan dari tingkat kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya sosl-soal
yang termasuk mudah, sedang, dan sukar secara proporsional. Tingkat kesukaran
soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan
dilihat dari sudut guru pembuat soal. Persoalan yang penting dalam melakukan
analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal
yang termasuk mudah, sedang, dan sukar.[2]
Ada beberapa dasar
pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang, dan
sukar. Pertimbangan pertama adalah adnya keseimbangan, yakni jumlah soal sama
untuk ketiga kategori tersebut dan kedua proporsi jumlah soal untuk ketiga
kategori tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal
berada dalam kategori sedang, sebagian lagi termasuk kategori mudah dan sukar
dengan proporsi seimbang.
Persolan
lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan apakah soal
tersebut termasuk mudah, sedang, atau sukar. Dalam menentukan kriteria ini
digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan
tertentu. Misalnya : abilitas yang di ukur dalam pertanyaan tersebut, sifat
materi yang di uji atau di tanyakan, isi bahan yang di tanyakan sesuai dengan
bidang keilmuannya dan bentuk soalnya.[3]
Cara
melakukan analisis untuk menentukan tingkat kesukaran soal adlah dengan menggunakan rumus sebagai berikut :
I
= S
N
I
= indeks kesulitan untuk setian butir soal
S
= banyaknya siswa yang menjawab benar setiap butir soal
N
= banyaknya siswa yang memberikan jawaban pada soal yang dimaksudkan
Kriteria
yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal
tersebut. Sebaliknya makin besar indeks yang diperoleh makin mudah soal
tersebut. Kriteria indeks kesulitan soal itu adalah sebagai berikut :
0 - 0,30 =
soal kategori sukar
0,31 - 0,70 =
soal kategori sedang
0,71 - 1,00 =
soal kategori mudah
- Daya Beda
Item
yang baik sebagaimana dijelaskan di halaman terdahulu adalah item yang mampu
membedakan antara kemampuan siswa yang pandai dan siswa yang rendah. Adapun
rumus untuk mengetahui daya pembeda adalah dari Rose dan Stanley yaitu :
SR
– ST
keterangan
:
SR
= jumlah siswa yang menjawab salah kelompok rendah
ST
= jumlah siswa yang menjawab salah kelompok tinggi
contoh
:
Tes
pilihan ganda dengan option 4 diberikan kepada 30 orang siswa. Jumlah soal 15,
setelah diperiksa datanya adalah sebagai berikut :
No soal
|
Jumlah
siswa yang menjawab salah kelompok rendah (SR)
|
Jumlah
siswa yang menjawab salah kelompok tinggi (ST)
|
SR-ST
|
Ket.
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
6
6
5
6
2
5
2
7
7
4
3
6
2
6
5
|
1
1
2
1
1
1
1
1
1
2
1
1
1
1
2
|
5
5
3
5
1
4
1
6
6
2
2
2
5
1
3
|
|
N = 30 orang N = 27% dari 30 = 8
Kriteria
yang digunakan dari Tabel Ross dan Stanley adalah sebagai berikut :
Jumlah testi (N)
|
N
(
27 % N )
|
|
Option
|
|
|
|
|
2
|
3
|
4
|
5
|
28 – 31
32
– 35
36
– 38
dst.
lihat
|
8
9
10
tabel
pd lamp.
|
4
5
5
|
5
5
5
|
5
5
5
|
5
5
5
|
Kriteria
pengujian daya pembeda adalah sbb. : Bila SR – ST sama atau lebih besar dari
nilai tabel, artinya butir soal itu mempunyai daya pembeda.[4]
Dari data
di atas, batas pengujian adalah 5, yakni yang pertama dalam demikian dapat
disimpulkan sbb. :
No. item
|
SR - ST
|
Batas nilai tabel
|
Keterangan
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
5
5
3
5
1
4
1
6
6
2
2
5
1
5
3
|
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
|
Diterima
Diterima
Ditolak
Diterima
Ditolak
Ditolak
Ditolak
Diterima
Diterima
Ditolak
Ditolak
Diterima
Ditolak
Diterima
Ditolak
|
Dari
kesimpulan diatas hanya soal no 1, 2, 4, 8, 12, dan 14 yang memenuhi daya
pembeda, sedangkan soal no lainnya tidak memiliki daya pembeda.
Dari
contoh diatas dapat disimpulkan bahwa cara menghitung daya pembeda adalah
dengan menempuh langkah sbb. :
a)
Memeriksa
jawaban soal semua siswa peserta tes
b)
Membuat
daftar peringkat hasil tes berdasarkan skor yang dicapainya.
c)
Menetukan
jumlah sampel, kelompok pandai 27% dan siswa kurang 27%
d)
Melakukan
analisis butir soal : menghitung jumlah siswa yang menjawab salah dari semua no
soal, baik kelompok pandai maupun kurang.
e)
Menghitungselisih jumlah siswa yang menjawab pada kelompok
kurang dengan kelompok pandai ( SR - ST ).
f)
Membandingkan
nilai selisih yang diperoleh dengan nilai Ross & stanley. Menentukan ada
tidaknya daya pembeda pada setiap no soal dengan kriteria “memiliki daya
pembeda” bila selisih nilai selisih jumlah siswa yang menjawab salah antara
kelompok kurang dan kelompok pandai ( SR – ST ) sama /lebih besar dari nilai
tabel.[5]
- Pengecoh
Pada soal bentuk pilihan ganda ada
alternatif jawaban (opsi) yang merupakan pengecoh. Butiran soal yang , pengecoh
akan dipilih secara merata dipilih oleh pesrta didik yang menjawab salah.
Sebaiknya, butir soal yang baik, pengecoahan akan dipilih secara merata.
Pengecoh
dianggap baik bila jumlah didik yang memilih pengecoh itu yang atau sama
mendekati jumlah idea. Indeks penecoh dihitung dengan rumus :
IP = P X 100%
(N
– B) / (n -1)
Keterangan :
IP = indeks penecoh
P = jumlah pesrta didik yang memilih pengecoh
N = jumlah pesrta didik yang ikut tes
B = jumlah pesrta didik yang menjawab benar
pada setiap soal
n = jumlah altrnatif jawaban ( opsi )
1 = bilangan tetap
Catatan:
Jika semua peserta didik
menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka IP = 0
yang berarti soal tersebut jelek. Denagan demikian, pengecoh tidak berfungsi.
Contoh:
50 orang pesrta didik di tes
dengan 10 soal bentuk pilihan-ganda. Tiap soal memiliki 5 alternatif
jawaban (a, b, c, d, dan e). Kunci
jawaban (jawaban yang benar) soal no 8 adalah c, Setelahsoal no 8 diperiksa untuk
semua didik, ternyata dari 50 orang peserta didik, 20 peserta didik menjawab
benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara
merata, artinya semua pengecoh secara merata ikut menyesatkan pesrta didik.
Perhatikan contoh soal no 8 berikut ini:
Alternatif jawaban a b c d e
Distribusi jawaban peserta
didik 7 8 20 7 8
IP 93% 107% **
93% 107%
Kualitas pengecoh ++ ++ ** ++ ++
keterangan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
- : jelek
- - : sangat jelek
- Validitas
Validitas adalah
suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang
seharusnya diukur[6]
Macam-macam
validitas
Di dalam buku Encyclopedia of Educational
Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan
:
“A test is valid if it measures what it purpose to
measure” atau jika di artikan lebih kurang demikian :
Sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak di
ukur.
Sebenarny pembicaraan validitas ini
bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau
skornya.
Secara garis
besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a. Validitas logis
adalah sebuah instrumen evaluasi
menunjuk pada kondisi bagi seluruh
instrumen evaluasi yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang
bersangkutan sudah dirangcang secara baik, mengikuti teori dan ketentuan yang
ada.
Ada
dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu :
1.
Validitas isi, yaitu sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi
kurikulum atau materi buku pelajaran.
2.
Validitas
konstruksi, yaitu sebuah tes dikatakan memiliki validitas konstruksi apabila
butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir
seperti yang disebutkan dalam tujuan instruksional khusus.[7]
b. Validitas
empiris
Validitas empiris
adalah ketepatan mengukur yang berdasarkan pada hasil analisis yang bersifat
empiris dengan kata lain validitas empiris adalah validitas yang bersumber pada
atau diperoleh atas dasar pengamatan dilapangan. Bertitik tolak dari itu, maka
tes hasil belajar dapat dikatakan telah memiliki validitas empiris apabila
berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan
dilapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah
dapat mengukur hasil belajar yang sesungguhnya diungkap atau diukur lewat tes
hasil belajar tersebut.[8]
Ada dua
macam validitas empiris yang dapat dicapai oleh sebuah instrumen, yaitu :
1. Validitas ada sekarang (Conten validity)
Validitas ini
lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengamalan. Jika ada istilah
“sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada ( ada sekarang, concurren).
Dalam
membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat
banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya
dibawah ini dikemukakan sebuah contoh. Misalnya seorang guru ingin mengetahui
apakah tes sumatif yang disusun sudah valid apa belum. Untuk ini diperlukan sebuah
kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan
harian atau nilai ulangan sumatif yang lalu.[9]
2.
Validitas Prediksi (Prediktifve Validity)
Memprediksi
artinya meramal, dengan meramal selalu mengenai hal yang akan datang jadi
sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau
validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan datang.
Misalnya tes
masuk perguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilannya
kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki tes
yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan
datang.
- Reabilitas tes
Reabilitas
berhubungan dengan kepercayaan. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila
diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.[10]
Beberapa hal yang
sedikit banyak mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat dikelompokkan menjadi 3 hal,
yaitu :
1.
Hal yang
berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas
butir-butirsoalnya. Semakin panjang tes, maka realibilitas dan validitasnya
semakin tinggi.
2.
Hal yang
berhubungan dengan tercoba (testee). Tes yang dicobakan kepada bukan kelompok
terpilih, akan menunjukkan realibilitas yang lebih besar daripada yang
dicobakan pada kelompok tertentu yang di ambil secara terpilih.
3.
Hal yang
berhubungan dengan penyelenggaraan tes.Faktor penyelenggaraan tes yang bersifat
administratif, sangat menentukan hasil tes antara lain: petunjuk yang diberikan
sebelum tes dimulai, pengawasan yang tertib dan suasana lingkungan dan tempat
tes.
BAB III
PENUTUP
Kesimpulan
A. ANALISIS KUALITAS TES
Analisis kualitas tes merupakan suatu tahap yang harus
ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara
keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut.
B. ANALISIS EMPIRIS
- Indeks Kesukaran, Asumsi yang
digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi
validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat
kesulitan soal tersebut.
2. Daya Beda, adalah
item yang mampu membedakan antara kemampuan siswa yang
pandai dan siswa yang rendah
3. Validitas,
Secara garis besar ada dua macam validitas :
a.
Validitas logis
adalah sebuah
instrumen evaluasi menunjuk pada kondisi bagi seluruh instrumen evaluasi yang memenuhi persyaratan
valid berdasarkan hasil penalaran.
b.
Validitas empiris
Validitas empiris adalah
ketepatan mengukur yang berdasarkan pada hasil analisis yang bersifat empiris
dengan kata lain validitas empiris adalah validitas yang bersumber pada atau
diperoleh atas dasar pengamatan dilapangan
4. Reabilitas tes
Reabilitas berhubungan dengan
kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi
jika tes tersebut dapat memberikan hasil yang tetap.
DAFTAR PUSTAKA
Zainal Arifin. Evaluasi Pembelajaran, Bandung:
Rosda, 2011.
Sulistyorini. Evaluasi Pendidikan dalam
Meningkatkan Mutu Pendidikan, Yogyakarta: teras, 2009.
Suharsini Arikunto. Dasar-dasar Evaluasi
Pendidikan, Jakarta: PT.Bumi Aksara, 2010.
Anas sudijono. Pengantar evaluasi pendidikan, Jakarta:
PT. Raja Grafindo persada, 2003.
Sumarna
surappranata. Interprestasi hasil tes, Bandung: PT. Remaja Rosda karya, 2004
[1] Zainal Arifin. Evaluasi
Pembelajaran, (Bandung: Rosda, 2011), hlm. 246
[2] Sulistyorini. Evaluasi
Pendidikan dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: teras, 2009), hlm. 173-174
[3] Sulistyorini. Evaluasi
Pendidikan dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: teras, 2009),
hlm. 174-175
[4] Sulistyorini. Evaluasi
Pendidikan Dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: Teras, 2009),
hlm. 177-178
[5] Sulistyorini. Evaluasi
Pendidikan Dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: Teras, 2009),
hlm. 178-179
[8] Anas sudijono. Pengantar
evaluasi pendidikan, (Jakarta: PT. Raja Grafindo persada, 2003), hlm.
167-168
[9] Suharsini
Arikunto. Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT..Bumi Aksara,
2010), hlm. 68-69
[10] Zainal Arifin. Evaluasi
Pembelajaran, (Bandung: Rosda, 2011), hlm. 258
0 komentar:
Posting Komentar