Jawa Pos, Rabu PON 17 Desember 1986
Oleh : Wuri Soedjatmiko
Beberapa waktu yang lalu, Menristek
Prof.Dr. B.J. Habibie mempersoalkan dampak langsung tes tipe multiple choice,
atau tes pilihan ganda, terhadap mutu pendidikan. Pada waktu itu, banyak reaksi
sempat bermunculan. Yang baru-baru ini, di IKIP Ujungpandang sempat Mendikbud
Prof.Dr. Fuad Hassan sendiri yang berkomentar bahwa multiple choice dipilih
karena terpaksa, dan pernyataan Menristek itu mungkin benar kalau saja soal
multiple choice disusun oleh bukan ahlinya.
Pernyataan Mendikbud tersebut cukup
bermakna bagi mereka yang terjun dalam pendidikan formal. Tetapi, bagi awam?
Apa yang dimaksudkan dengan terpaksa dan apa pula yag disebut ahli penyusun tes
itu? Bukankah awam selama ini hanya melihat tes yang berisi puluhan hingga
ratusan soal dengan beberapa pilihan untuk dilingkari yang benar menurut
peserta tes? Bukankah selama ini tes multiple choice dibuat bahan tertawaan
karena bisa (?) dijawab dengan menghitung kancing baju?
Gagasan dan terapan, dalam lapangan memang
sering amat bertolak belakang. Di kelas, siswa memang mempunyai seribu cara
untuk “mengalahkan guru” melalui tes multiple choice ini. Contohnya, siswa
menciptakan bahasa lambang seperti:
Pilihan A diwakili oleh telunjuk di hidung,
Pilihan B diwakili dengan pegang telinga,
Pilihan C diwakili dengan pegang rambut, dan sebagainya, sesuai dengan perjanjian. Makna tes yang sebetulnya untuk mencari umpan balik, dikalahkan oleh keinginan siswa untuk mendapatkan nilai baik dengan mudah.
Pilihan B diwakili dengan pegang telinga,
Pilihan C diwakili dengan pegang rambut, dan sebagainya, sesuai dengan perjanjian. Makna tes yang sebetulnya untuk mencari umpan balik, dikalahkan oleh keinginan siswa untuk mendapatkan nilai baik dengan mudah.
TES MULTIPLE CHOICE
Diciptakannya tes tipe ini memang mempunyai
tujuan fungsional, yaitu: (1) menguji peserta ujian dalam jumlah besar secara
serentak; dan (2) memberikan penilaian atau skoring secara objektif. Bagian
pertama mungkin cukup jelas, karena tipe tes skoring dapat dilaksanakan dengan
komputer sehingga (kalau programnya betul dan tidak ada salah ketik), dapatlah
dalam waktu yang relatif singkat diperoleh rekaman hasil peserta ujian beserta
interprestasinya. Dilakukan secara manual pun skoring ini tetap objektif, yaitu
dengan berpedoman pada lembaran jawaban yang telah ada, setiap orang yang tidak
buta huruf dapat ikut memeriksa.
Bagian kedua berarti :
Diteskan kapan saja (senin atau rabu)
hasilnya diharapkan sama;
Diteskan kepada dua kelompok paralel dan
kapan saja hasilnya akan sama;
Diskor kapan saja (senin, selasa dan
jum’at) hasilnya sama; dan
Diskor oleh dua atau tiga pemeriksa yang
kompeten hasilnya akan sama.
Untuk membuat sebuah tes yang dapat
memenuhi tujuan fungsional tersebut tentunya ada beberapa liku-liku prosedur
yang menjamin syarat keterandalan (reliability), dan kesahihan (validity).
KETERANDALAN
Keterandalan atau reabilitas mengacu kepada
ketepatan dan konsistensi sebuah tes seperti diuraikan di atas, dan bukannya
kepada isi (apa yang hendak diukur atau diuji). Ada beberapa cara, untuk
menjaga keterandalan sebuah tes. Pertama, dengan mengetes-ulangkan sebuah tes
dan melihat korelasi hasil tes pertama dan tes ulang. Dengan sendirinya dalam
tes ulang hasilnya lebih baik karena ada kemungkinan peserta tes sudah terbiasa
dengan bentuk soal atau masih samar-samar ingat akan beberapa soal. Karena itu,
sebuah tes multiple choice harus terdiri atas puluhan atau ratusan soal (pada
umumnya soal diberi waktu mengerjakan satu menit) bergantung pada waktunya.
Teknik kedua adalah dengan mengeteskan
kepada dua kelompok paralel dan melihat korelasi hasil tes kedua kelompok
tersebut. Atau, menggunakan dua buah tes yang paralel (soal-soal dengan tingkat
kesukaran yang sama, jumlah sama, tetapi versinya berbeda) kepada sebuah
kelompok.
Teknik ketiga adalah dengan prosedur
“split-half”, yaitu dengan sekali tes kepada satu kelompok. Soal dalam tes
dipisahkan menjadi soal-soal dengan nomor ganjil dan nomor genap sehingga
setiap peserta tes mendapat dua skor (skor untuk soal ganjil dan skor untuk
soal genap). Kedua skor tersebut kemudian dikorelasikan.
Teknik keempat sama dengan teknik
“split-half”, tetapi yang diukur konsistensinya adalah soal itu sendiri
sebagaimana diprediksikan oleh proporsi peserta tes yang mengerjakan soal
tersebut. Soal yang dapat dikerjakan oleh baik yang pandai maupun yang “kurang”
tentunya bukan soal yang tidak dapat dikerjakan oleh kedua-duanya.
Teknik kelima adalah dengan melihat
konsistensi beberapa pemberi skor yang kompeten terhadap kertas tes setiap
peserta secara individual.
Dalam menyiapkan sebuah tes multiple
choice, seorang penyusun harus menyiapkan 40 hingga 50% lebih banyak soal untuk
dipergunakan sebagai soal pengganti apabila terdapat soal-soal yang harus
direvisi.
Pekerjaan menyusun sebuah tes multiple
choice memang bukan main-main. Untuk membuat sebuah tes yang memenuhi
persyaratan “terandal” ini saja sudah diperlukan waktu dan tenaga yang tidak
kecil, belum lagi untuk persyaratan lain-lain.
KESAHIHAN
Ada beberapa jenis kesahihan yang harus
dipenuhi agar sebuah tes dapat dikatakan baik. Pertama-tama adalahkesahihan
penampilan (face vadility) yang mengacu kepada kepercayaan (peserta tes,
penguji, pendidik, dll) pada waktu melihat bentuk tes tersebut. Meski kesahihan
penampilan tidak membawa pengaruh secara teknis, tetapi sebuah tes yang
penampilannya meyakinkan akan membawa pengaruh psikis terhadap mereka yang
terlibat dalam uji-menguji pada saat tes diselenggarakan.
Kesahihan lainnya adalah kesahihan isi
(content validity) yang mengacu kepada kesesuaian materi yang tercermin dalam
setiap soal tes dengan materi yang seharusnya diujikan (materi yang telah
diajarkan, misalnya). Selain materinya sesuai dengan materi yang diajarkan,
setiap soal di dalam tes tersebut juga mencerminkan jenis (kognitif, afektif,
atau psikomotorik) dan tingkat (hafalan, hingga yang tertinggi, yaitu evaluatif
seperti dalam tingkatan taksonomi Bloom). Dalam perencanaan penyusunan tes,
jenis dan tingkatan tersebut dicetakbirukan dalam kisi-kisi dengan rincian
jumlah soal setiap kisi.
Kesahihan empiris terbagi dua, yaitu
kesahihan prediktif dan kesahihan sama-sama (concurrent validity). Yang
pertama, sebuah tes dikatakan mempunyai daya prediksi yang baik apabila tes
tersebut kemudian berkorelasi tinggi dengan prestasi yang dicapai kemudian (pada akhir semester, misalnya).
Kesahihan sama-sama mengacu kepada kesesuaian hasil tes tersebut dengan hasil
sebuah tes standar lain yang diujikan pada saat yang kurang lebih bersamaan.
Apabila korelasinya tinggi, tes tersebut dikatakan sahih.
Tidak setiap kesahihan dipersyaratkan hadir
dalam sebuah tes, tetapi kesahihan masing-masing mempunyai fungsinya sendiri.
TES
ESAI
Tes tipe ini bertolak belakang dengan tes
multiple choice dalam beberapa hal. Jika tes multiple choice berjumlah puluhan
hingga ratusan soal, tes esai biasanya terdiri atas beberapa soal saja. Tes
multiple choice sudah memberikan alternatif (pilihan) yang harus ditandai
(dilingkari atau disilang) mana yang paling benar, tes esai menuntut jawaban
seluruhnya dari peserta tes. Tes esai memang mempunyai tingkat uji yang lebih
tinggi, yaitu dapat menanyakan uraian, tanggapan, bahkan saran-saran dari yang
diuji. Tes esai menuntut peserta tes untuk mempunyai kemampuan menuliskan atau
mengemukakan idenya secara tepat, jelas, dan teratur. Membuat jawaban untuk tes
esai dapat diumpamakan seperti mengarang dengan opiknya adalah jawaban dari
pertanyaan yang dibuat penguji.
Meski tes esai jauh lebih baik daripada tes
multiple choice, menyusun tes esai bukanlah semudah dugaan awam. Karena jumlah
pertanyaan yang sedikit padahal jangkauan materi yang harus diteskan luas,
penyusun tes esai juga harus membuat cetak biru (blue print) sedemikian rupa,
sehingga dengan pertanyaan yang terbatas, tujuan tes tercapai. Penyusun tes
juga harus menysun pertanyaan secara jelas, ringkas, tepat dan teratur.
Pertanyaan yang ambigu, atau mendua arti, menyulitkan siswa dalam menjawab (dan
juga menyulitkan koreksi). Setiap kata yang tertera dalam soal pertanyaan,
harus bermakna lugas.
Jawaban tes esai juga sudah harus
dipersiapkan oleh penyusun tes. Hal ini untuk menguji apakah pertanyaan
dirumuskan secara baik, dan betul-betul dapat dijawab. Disiapkannya jawaban
ini, juga untuk mengurangi subjektivitas pemeriksa. Yang terakhir inilah yang
kemudian membuat tes esai dinamakan juga tes subjektif.
Tes esai juga mempunyai kelebihan daripada
tes multiple choice, karena yang pertama menguji materi secara integratif
sedangkan yang kedua menguji materi secara dipenggal-penggal. Seseorang yang
dapat menjawab tes esai dengan memuaskan, dijamin memang betul-betul memiliki
keterampilan seperti dicantumkan dalam tujuan pengajaran dan tujuan tes.
Selain kebaikan, tes esai ada pula
kelemahannya. Seorang peserta tes esai bisa saja tidak mempunyai ide akan
jawaban suatu pertanyaan dan kemudian mulai mengobrol berhalaman-halaman tanpa
menyentuh masalah inti yang ditanyakan. Jawaban seperti ini cukup melelahkan
pemeriksa, yang sebetulnya bisa saja segera mencoret seluruh jawaban tetapi
tidak melakukannya, karena masih mencoba menelusuri kemungkinan adanya
unsur-unsur yang menyerempet yang menyebabkan siswa berhak atas sejumlah nilai.
Tes esai menuntut jawaban berbentuk
paragraf dengan kalimat topik di atas dan dikembangkan dengan penjelasan dan
contoh-contoh mengikuti kalimat topik tersebut. Yang menjadi masalah adalah,
tidak semua siswa mempunyai kebiasaan menjawab tes esai seperti ini. Siswa yang
berpikir induktif akan bercerita ke timur-barat dengan contoh-contoh, baru
kemudian memberikan kesimpulannya. Perbedaan deduktif-induktif ini memperlambat
waktu koreksi, karena pemeriksa harus setiap kali menyesuaikan cara berpikirnya
dengan jawaban yang dihadapinya. Belum lagi adanya siswa yang tidak menyusun
jawabannya dalam formasi paragraf.
Jawaban tes esai, terutama dalam ilmu
sosial, sering bisa berbeda-beda asal argumentasi yang mendukung jawaban
tersebut benar. Sekali lagi, pemeriksa dihadapkan pada banyaknya kemungkinan
dan subjektivitas yang besar.
Pemeriksa juga bisa lelah, dan kelelahan
pasti mempengaruhi penilaian. Belum lagi kalau pemeriksaan ditunda, masih tetap
dan tepat samakah penilaian yang diberikan suatu hari dan hari berikutnya atau
seminggu sesudahnya? Pasti, terjadi perubahan yang mungkin saja dipengaruhi
oleh hasil pekerjaan dari siswa satu ke siswa lainnya.
MANA
YANG DIPILIH?
Sebetulnya, penggunaan tes multiple choice
bukan sekedar keterpaksaan. Mengetes Ebtanas atau tes masuk, tidaklah mungkin
diselenggarakan dengan tes esai. Waktu, tenaga dan objektivitas penilaian tidak
memungkinkan tes esai digunakan di sini. Prosedur penyusunan teslah yang harus
diperhatikan, agar apabila ada format paralel, beberapa format yang ada
betul-betul mempunyai tingkat kesukaran yang sama. Keterandalan dan kesahihan
tes tersebut, harus tinggi.
Tes yang diberikan dalam proses
belajar-mengajar yang lebih memberikan tekanan kepada proses, sebaiknya adalah
tes esai. Dengan tes esai, siswa dipacu untuk mengembangkan bukan hanya materi,
tetapi juga ide dan wawasan, serta kemampuan untuk menurunkan ide-ide dan
pendapat-pendapatnya dalam sebuah tulisan yang rapi, teratur, singkat dan
lugas. Tes esai, betul-betul mengajarkan kepada siswa cara berpikir logis.
Tentu saja, penggunaan tes esai juga harus diikuti dengan persyaratan yang
diperlukan dalam menyusun sebuah tes esai.
Alternatif untuk tes esai adalah tes
melengkapi (completion test) yang membatasi jawaban siswa dari satu-dua kata
hingga beberapa baris. Tes untuk ilmu eksak seperti matematika, mekanika,
kimia, dll, juga mengajak siswa untuk berpikir logis dan memecahkan soal
melalui cara yang paling singkat tetapi betul. Yang terakhir ini, jugasulit
diperoleh kalau multiple choice digunakan sebagai tes di kelas.
Tes multiple choice yang disusun dengan
kisi-kisi dan cetak biru yang terencana, juga dapat mengujikan tingkat
penalaran yang tinggi. Namun, tes dengan kisi-kisi yang terencana seperti ini
sangat menyita waktu. Tidak semua guru kelas sanggup dan mempunyai cukup waktu
untuk mempersiapkannya. Tes tingkat nasional pun tidak jarang masih menunjukkan
kelemahan-kelemahan di bidang ini.
Bahwa tes multiple choice membuat siswa
menghitung kancing baju atau mengalahkan guru dengan menggunakan bahasa gerak
tangan, sebetulnya bukanlah kesalahan tes itu sebagai alat uji. Teknik
pelaksanaannyalah yang kurang betul. Dan, sekali lagi, siswalah yang masih
hidup dalam budaya “jalan pintas” dan tidak menghargai sekolah sebagai tempat
menimba ilmu, melainkan hanya sekedar tempat mengumpulkan skor.
Alat uji tetap adalah alat. Digunakan
dengan baik, setiap alat uji (yang telah diberi rambu-rambu persyaratan sebagai
alat yang baik) akan berfungsi dengan baik. Kedua jenis tes (yang sudah
dikategorikan baik) mempunyai kelemahan dan kekuatan masing-masing. Tes
multiple choice bukan sekedar mencari-cari pilihan atau memberi jebakan siswa.
Demukian pula tes esai, bukan sekedar suatu tes yang boleh dijawab
berhalaman-halaman seolah makin panjang makin benar. Mana yang dipilih,
bergantung pada tujuan kita menguji.