Pages

Selasa, 22 April 2014

ANALISIS KUALITAS TES

MAKALAH 
ANALISIS KUALITAS TES

BAB II
PEMBAHASAN

A.  ANALISIS KUALITAS TES
            Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil belajar, tes diharapkan dapat menggambarkan sampel perilaku dan menghasilkan nilai yang objektif serta akurat. Jika tes yang digunakan guru kurang baik, maka hasil yang diperoleh pun tentunya kurang baik. Hal ini dapat merugikan peserta didik itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi tidak objektif dan tidak adil.
            Analisis kualitas tes berkaitan dengan pertanyaan apakah tes sebagai suatu alat ukur benar – benar mengukur apa yang hendak dan seharusnya di ukur ? Sampai mana tes tersebut dapat di andalkan dan berguna? Kedua pertanyaan ini sebenarnya menunjuk pada dua hal pokok, yaitu validitas dan reliabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang baik.[1] 


B. ANALISIS EMPIRIS
  1. Indeks Kesukaran
            Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping        memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat kesulitan soal       tersebut. Keseimbangan yang dimaksudkan adalah adanya sosl-soal yang termasuk mudah, sedang, dan sukar secara proporsional. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang, dan sukar.[2]
                   Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang, dan sukar. Pertimbangan pertama adalah adnya keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut dan kedua proporsi jumlah soal untuk ketiga kategori tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal berada dalam kategori sedang, sebagian lagi termasuk kategori mudah dan sukar dengan proporsi seimbang.
                   Persolan lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan apakah soal tersebut termasuk mudah, sedang, atau sukar. Dalam menentukan kriteria ini digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu. Misalnya : abilitas yang di ukur dalam pertanyaan tersebut, sifat materi yang di uji atau di tanyakan, isi bahan yang di tanyakan sesuai dengan bidang keilmuannya dan bentuk soalnya.[3]
             Cara melakukan analisis untuk menentukan tingkat kesukaran soal adlah dengan menggunakan rumus sebagai berikut :
                               I = S
                                   N
       I = indeks kesulitan untuk setian butir soal
      S = banyaknya siswa yang menjawab benar setiap butir soal
      N = banyaknya siswa yang memberikan jawaban pada soal yang                                      dimaksudkan
                   Kriteria yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal tersebut. Sebaliknya makin besar indeks yang diperoleh makin mudah soal tersebut. Kriteria indeks kesulitan soal itu adalah sebagai berikut :
                   0          - 0,30   = soal kategori sukar
                   0,31     - 0,70   = soal kategori sedang
                   0,71     - 1,00   = soal kategori mudah

  1. Daya Beda
                              Item yang baik sebagaimana dijelaskan di halaman terdahulu adalah item yang mampu membedakan antara kemampuan siswa yang pandai dan siswa yang rendah. Adapun rumus untuk mengetahui daya pembeda adalah dari Rose dan Stanley yaitu :
                              SR – ST
      keterangan :
      SR = jumlah siswa yang menjawab salah kelompok rendah
      ST = jumlah siswa yang menjawab salah kelompok tinggi
      contoh :
      Tes pilihan ganda dengan option 4 diberikan kepada 30 orang siswa. Jumlah soal 15, setelah diperiksa datanya adalah sebagai berikut :
No soal
Jumlah siswa yang menjawab salah kelompok rendah (SR)
Jumlah siswa yang menjawab salah kelompok tinggi (ST)
  SR-ST
Ket.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
6
5
6
2
5
2
7
7
4
3
6
2
6
5
1
1
2
1
1
1
1
1
1
2
1
1
1
1
2
5
5
3
5
1
4
1
6
6
2
2
2
5
1
3


N = 30 orang                                               N = 27% dari 30 = 8
      Kriteria yang digunakan dari Tabel Ross dan Stanley adalah sebagai berikut :
Jumlah testi (N)
N
( 27 % N )

Option




2
3
4
5
28 – 31
32 – 35
36 – 38
dst. lihat
8
9
10
tabel pd lamp.
4
5
5

5
5
5
5
5
5
5
5
5

            Kriteria pengujian daya pembeda adalah sbb. : Bila SR – ST sama atau lebih besar dari nilai tabel, artinya butir soal itu mempunyai daya pembeda.[4]
            Dari data di atas, batas pengujian adalah 5, yakni yang pertama dalam demikian dapat disimpulkan sbb. :
No. item
SR - ST
Batas nilai tabel
Keterangan
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
5
5
3
5
1
4
1
6
6
2
2
5
1
5
3
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
Diterima
Diterima
Ditolak
Diterima
Ditolak
Ditolak
Ditolak
Diterima
Diterima
Ditolak
Ditolak
Diterima
Ditolak
Diterima
Ditolak

             Dari kesimpulan diatas hanya soal no 1, 2, 4, 8, 12, dan 14 yang memenuhi daya pembeda, sedangkan soal no lainnya tidak memiliki daya pembeda.
             Dari contoh diatas dapat disimpulkan bahwa cara menghitung daya pembeda adalah dengan menempuh langkah sbb. :
a)                                                        Memeriksa jawaban soal semua siswa peserta tes
b)                                                       Membuat daftar peringkat hasil tes berdasarkan skor yang dicapainya.
c)                                                        Menetukan jumlah sampel, kelompok pandai 27% dan siswa kurang 27%
d)                                                       Melakukan analisis butir soal : menghitung jumlah siswa yang menjawab salah dari semua no soal, baik kelompok pandai maupun kurang.
e)                                                        Menghitungselisih  jumlah siswa yang menjawab pada kelompok kurang                                          dengan kelompok pandai ( SR - ST ).
f)                                                        Membandingkan nilai selisih yang diperoleh dengan nilai Ross & stanley. Menentukan ada tidaknya daya pembeda pada setiap no soal dengan kriteria “memiliki daya pembeda” bila selisih nilai selisih jumlah siswa yang menjawab salah antara kelompok kurang dan kelompok pandai ( SR – ST ) sama /lebih besar dari nilai tabel.[5]
  1. Pengecoh
            Pada soal bentuk pilihan ganda ada alternatif jawaban (opsi) yang merupakan pengecoh. Butiran soal yang , pengecoh akan dipilih secara merata dipilih oleh pesrta didik yang menjawab salah. Sebaiknya, butir soal yang baik, pengecoahan akan dipilih secara merata.
            Pengecoh dianggap baik bila jumlah didik yang memilih pengecoh itu yang atau sama mendekati jumlah idea. Indeks penecoh dihitung dengan rumus :
            IP  =            P             X 100%
                        (N – B) / (n -1)
Keterangan :
IP  = indeks penecoh
P   = jumlah pesrta didik yang memilih pengecoh
N  = jumlah pesrta didik yang ikut tes
B  = jumlah pesrta didik yang menjawab benar pada setiap soal
n  = jumlah altrnatif jawaban ( opsi )
1  = bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Denagan demikian, pengecoh tidak berfungsi.
Contoh:        
50 orang pesrta didik di tes dengan 10 soal bentuk pilihan-ganda. Tiap soal memiliki 5 alternatif jawaban     (a, b, c, d, dan e). Kunci jawaban (jawaban yang benar) soal no 8 adalah c, Setelahsoal no 8 diperiksa untuk semua didik, ternyata dari 50 orang peserta didik, 20 peserta didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata, artinya semua pengecoh secara merata ikut menyesatkan pesrta didik. Perhatikan contoh soal no 8 berikut ini:
Alternatif jawaban                                         a          b          c          d          e
Distribusi jawaban peserta didik                   7          8          20        7          8
IP                                                      93%  107%      **        93% 107%
Kualitas pengecoh                                         ++        ++        **        ++        ++
keterangan:
**   : kunci jawaban
++ : sangat baik
+     : baik
-      : kurang baik
-      : jelek
- -   : sangat jelek
  1. Validitas
                              Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya diukur[6]
      Macam-macam validitas
             Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan :
“A test is valid if it measures what it purpose to measure” atau jika di artikan lebih kurang demikian : Sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak di ukur.
            Sebenarny pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau skornya.
       Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

a. Validitas logis
                adalah sebuah instrumen evaluasi menunjuk pada kondisi bagi seluruh  instrumen evaluasi yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirangcang secara baik, mengikuti teori dan ketentuan yang ada.
            Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu :
1.      Validitas isi, yaitu sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau materi buku pelajaran.
2.      Validitas konstruksi, yaitu sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.[7]
b.  Validitas empiris
               Validitas empiris adalah ketepatan mengukur yang berdasarkan pada hasil analisis yang bersifat empiris dengan kata lain validitas empiris adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan dilapangan. Bertitik tolak dari itu, maka tes hasil belajar dapat dikatakan telah memiliki validitas empiris apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan dilapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat mengukur hasil belajar yang sesungguhnya diungkap atau diukur lewat tes hasil belajar tersebut.[8]
            Ada dua macam validitas empiris yang dapat dicapai oleh sebuah instrumen, yaitu :
1. Validitas ada sekarang (Conten validity)
        Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengamalan. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada ( ada sekarang, concurren).
        Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya dibawah ini dikemukakan sebuah contoh. Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid apa belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.[9]
2. Validitas Prediksi (Prediktifve Validity)
        Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
        Misalnya tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
  1. Reabilitas tes
                              Reabilitas berhubungan dengan kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.[10]
                        Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.     Namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu  :
1.      Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butirsoalnya. Semakin panjang tes, maka realibilitas dan validitasnya semakin tinggi.
2.      Hal yang berhubungan dengan tercoba (testee). Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan realibilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang di ambil secara terpilih.
3.      Hal yang berhubungan dengan penyelenggaraan tes.Faktor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes antara lain: petunjuk yang diberikan sebelum tes dimulai, pengawasan yang tertib dan suasana lingkungan dan tempat tes.

BAB III
PENUTUP

Kesimpulan
A. ANALISIS KUALITAS TES
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut.

B. ANALISIS EMPIRIS
  1. Indeks Kesukaran, Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat kesulitan soal             tersebut.
2.  Daya Beda, adalah item yang mampu membedakan antara kemampuan siswa           yang pandai dan siswa yang rendah
3.   Validitas, Secara garis besar ada dua macam validitas :
a.  Validitas logis
       adalah sebuah instrumen evaluasi menunjuk pada kondisi bagi seluruh  instrumen evaluasi yang memenuhi persyaratan valid berdasarkan hasil penalaran.
b.  Validitas empiris
            Validitas empiris adalah ketepatan mengukur yang berdasarkan pada hasil analisis yang bersifat empiris dengan kata lain validitas empiris adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan dilapangan
4.    Reabilitas tes
Reabilitas berhubungan dengan kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
  



DAFTAR PUSTAKA

Zainal Arifin. Evaluasi Pembelajaran, Bandung: Rosda, 2011.
Sulistyorini. Evaluasi Pendidikan dalam Meningkatkan Mutu Pendidikan, Yogyakarta: teras, 2009.
Suharsini Arikunto. Dasar-dasar Evaluasi Pendidikan, Jakarta: PT.Bumi Aksara, 2010.
Anas sudijono. Pengantar evaluasi pendidikan, Jakarta: PT. Raja Grafindo persada, 2003.
Sumarna surappranata. Interprestasi hasil tes, Bandung: PT. Remaja Rosda karya, 2004


[1]    Zainal Arifin. Evaluasi Pembelajaran, (Bandung: Rosda, 2011), hlm. 246
[2]    Sulistyorini. Evaluasi Pendidikan dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: teras,  2009), hlm. 173-174
[3]    Sulistyorini. Evaluasi Pendidikan dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: teras, 2009), hlm. 174-175

[4]    Sulistyorini. Evaluasi Pendidikan Dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: Teras, 2009), hlm. 177-178
[5]    Sulistyorini. Evaluasi Pendidikan Dalam Meningkatkan Mutu Pendidikan, (Yogyakarta: Teras, 2009), hlm. 178-179
[7]     Suharsini Arikunto. Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT..Bumi Aksara, 2010), hlm. 65

[8]    Anas sudijono. Pengantar evaluasi pendidikan, (Jakarta: PT. Raja Grafindo persada, 2003), hlm. 167-168

[9]              Suharsini Arikunto. Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT..Bumi Aksara, 2010), hlm. 68-69
[10]  Zainal Arifin. Evaluasi Pembelajaran, (Bandung: Rosda, 2011), hlm. 258

0 komentar:

Posting Komentar