Tes Esai Versus Multiple Choice

Jawa Pos, Rabu PON 17 Desember 1986
Oleh : Wuri Soedjatmiko

Beberapa waktu yang lalu, Menristek Prof.Dr. B.J. Habibie mempersoalkan dampak langsung tes tipe multiple choice, atau tes pilihan ganda, terhadap mutu pendidikan. Pada waktu itu, banyak reaksi sempat bermunculan. Yang baru-baru ini, di IKIP Ujungpandang sempat Mendikbud Prof.Dr. Fuad Hassan sendiri yang berkomentar bahwa multiple choice dipilih karena terpaksa, dan pernyataan Menristek itu mungkin benar kalau saja soal multiple choice disusun oleh bukan ahlinya.

Pernyataan Mendikbud tersebut cukup bermakna bagi mereka yang terjun dalam pendidikan formal. Tetapi, bagi awam? Apa yang dimaksudkan dengan terpaksa dan apa pula yag disebut ahli penyusun tes itu? Bukankah awam selama ini hanya melihat tes yang berisi puluhan hingga ratusan soal dengan beberapa pilihan untuk dilingkari yang benar menurut peserta tes? Bukankah selama ini tes multiple choice dibuat bahan tertawaan karena bisa (?) dijawab dengan menghitung kancing baju?

Gagasan dan terapan, dalam lapangan memang sering amat bertolak belakang. Di kelas, siswa memang mempunyai seribu cara untuk “mengalahkan guru” melalui tes multiple choice ini. Contohnya, siswa menciptakan bahasa lambang seperti:
Pilihan A diwakili oleh telunjuk di hidung,
Pilihan B diwakili dengan pegang telinga,
Pilihan C diwakili dengan pegang rambut, dan sebagainya, sesuai dengan perjanjian. Makna tes yang sebetulnya untuk mencari umpan balik, dikalahkan oleh keinginan siswa untuk mendapatkan nilai baik dengan mudah.

TES MULTIPLE CHOICE

Diciptakannya tes tipe ini memang mempunyai tujuan fungsional, yaitu: (1) menguji peserta ujian dalam jumlah besar secara serentak; dan (2) memberikan penilaian atau skoring secara objektif. Bagian pertama mungkin cukup jelas, karena tipe tes skoring dapat dilaksanakan dengan komputer sehingga (kalau programnya betul dan tidak ada salah ketik), dapatlah dalam waktu yang relatif singkat diperoleh rekaman hasil peserta ujian beserta interprestasinya. Dilakukan secara manual pun skoring ini tetap objektif, yaitu dengan berpedoman pada lembaran jawaban yang telah ada, setiap orang yang tidak buta huruf dapat ikut memeriksa.

Bagian kedua berarti :
Diteskan kapan saja (senin atau rabu) hasilnya diharapkan sama;
Diteskan kepada dua kelompok paralel dan kapan saja hasilnya akan sama;
Diskor kapan saja (senin, selasa dan jum’at) hasilnya sama; dan
Diskor oleh dua atau tiga pemeriksa yang kompeten hasilnya akan sama.

Untuk membuat sebuah tes yang dapat memenuhi tujuan fungsional tersebut tentunya ada beberapa liku-liku prosedur yang menjamin syarat keterandalan (reliability), dan kesahihan (validity).

KETERANDALAN

Keterandalan atau reabilitas mengacu kepada ketepatan dan konsistensi sebuah tes seperti diuraikan di atas, dan bukannya kepada isi (apa yang hendak diukur atau diuji). Ada beberapa cara, untuk menjaga keterandalan sebuah tes. Pertama, dengan mengetes-ulangkan sebuah tes dan melihat korelasi hasil tes pertama dan tes ulang. Dengan sendirinya dalam tes ulang hasilnya lebih baik karena ada kemungkinan peserta tes sudah terbiasa dengan bentuk soal atau masih samar-samar ingat akan beberapa soal. Karena itu, sebuah tes multiple choice harus terdiri atas puluhan atau ratusan soal (pada umumnya soal diberi waktu mengerjakan satu menit) bergantung pada waktunya.

Teknik kedua adalah dengan mengeteskan kepada dua kelompok paralel dan melihat korelasi hasil tes kedua kelompok tersebut. Atau, menggunakan dua buah tes yang paralel (soal-soal dengan tingkat kesukaran yang sama, jumlah sama, tetapi versinya berbeda) kepada sebuah kelompok.

Teknik ketiga adalah dengan prosedur “split-half”, yaitu dengan sekali tes kepada satu kelompok. Soal dalam tes dipisahkan menjadi soal-soal dengan nomor ganjil dan nomor genap sehingga setiap peserta tes mendapat dua skor (skor untuk soal ganjil dan skor untuk soal genap). Kedua skor tersebut kemudian dikorelasikan.

Teknik keempat sama dengan teknik “split-half”, tetapi yang diukur konsistensinya adalah soal itu sendiri sebagaimana diprediksikan oleh proporsi peserta tes yang mengerjakan soal tersebut. Soal yang dapat dikerjakan oleh baik yang pandai maupun yang “kurang” tentunya bukan soal yang tidak dapat dikerjakan oleh kedua-duanya.

Teknik kelima adalah dengan melihat konsistensi beberapa pemberi skor yang kompeten terhadap kertas tes setiap peserta secara individual.

Dalam menyiapkan sebuah tes multiple choice, seorang penyusun harus menyiapkan 40 hingga 50% lebih banyak soal untuk dipergunakan sebagai soal pengganti apabila terdapat soal-soal yang harus direvisi.
Pekerjaan menyusun sebuah tes multiple choice memang bukan main-main. Untuk membuat sebuah tes yang memenuhi persyaratan “terandal” ini saja sudah diperlukan waktu dan tenaga yang tidak kecil, belum lagi untuk persyaratan lain-lain.

KESAHIHAN

Ada beberapa jenis kesahihan yang harus dipenuhi agar sebuah tes dapat dikatakan baik. Pertama-tama adalahkesahihan penampilan (face vadility) yang mengacu kepada kepercayaan (peserta tes, penguji, pendidik, dll) pada waktu melihat bentuk tes tersebut. Meski kesahihan penampilan tidak membawa pengaruh secara teknis, tetapi sebuah tes yang penampilannya meyakinkan akan membawa pengaruh psikis terhadap mereka yang terlibat dalam uji-menguji pada saat tes diselenggarakan.

Kesahihan lainnya adalah kesahihan isi (content validity) yang mengacu kepada kesesuaian materi yang tercermin dalam setiap soal tes dengan materi yang seharusnya diujikan (materi yang telah diajarkan, misalnya). Selain materinya sesuai dengan materi yang diajarkan, setiap soal di dalam tes tersebut juga mencerminkan jenis (kognitif, afektif, atau psikomotorik) dan tingkat (hafalan, hingga yang tertinggi, yaitu evaluatif seperti dalam tingkatan taksonomi Bloom). Dalam perencanaan penyusunan tes, jenis dan tingkatan tersebut dicetakbirukan dalam kisi-kisi dengan rincian jumlah soal setiap kisi. 

Kesahihan empiris terbagi dua, yaitu kesahihan prediktif dan kesahihan sama-sama (concurrent validity). Yang pertama, sebuah tes dikatakan mempunyai daya prediksi yang baik apabila tes tersebut kemudian berkorelasi tinggi dengan prestasi yang dicapai  kemudian (pada akhir semester, misalnya). Kesahihan sama-sama mengacu kepada kesesuaian hasil tes tersebut dengan hasil sebuah tes standar lain yang diujikan pada saat yang kurang lebih bersamaan. Apabila korelasinya tinggi, tes tersebut dikatakan sahih.

Tidak setiap kesahihan dipersyaratkan hadir dalam sebuah tes, tetapi kesahihan masing-masing mempunyai fungsinya sendiri.

TES ESAI

Tes tipe ini bertolak belakang dengan tes multiple choice dalam beberapa hal. Jika tes multiple choice berjumlah puluhan hingga ratusan soal, tes esai biasanya terdiri atas beberapa soal saja. Tes multiple choice sudah memberikan alternatif (pilihan) yang harus ditandai (dilingkari atau disilang) mana yang paling benar, tes esai menuntut jawaban seluruhnya dari peserta tes. Tes esai memang mempunyai tingkat uji yang lebih tinggi, yaitu dapat menanyakan uraian, tanggapan, bahkan saran-saran dari yang diuji. Tes esai menuntut peserta tes untuk mempunyai kemampuan menuliskan atau mengemukakan idenya secara tepat, jelas, dan teratur. Membuat jawaban untuk tes esai dapat diumpamakan seperti mengarang dengan opiknya adalah jawaban dari pertanyaan yang dibuat penguji.

Meski tes esai jauh lebih baik daripada tes multiple choice, menyusun tes esai bukanlah semudah dugaan awam. Karena jumlah pertanyaan yang sedikit padahal jangkauan materi yang harus diteskan luas, penyusun tes esai juga harus membuat cetak biru (blue print) sedemikian rupa, sehingga dengan pertanyaan yang terbatas, tujuan tes tercapai. Penyusun tes juga harus menysun pertanyaan secara jelas, ringkas, tepat dan teratur. Pertanyaan yang ambigu, atau mendua arti, menyulitkan siswa dalam menjawab (dan juga menyulitkan koreksi). Setiap kata yang tertera dalam soal pertanyaan, harus bermakna lugas.

Jawaban tes esai juga sudah harus dipersiapkan oleh penyusun tes. Hal ini untuk menguji apakah pertanyaan dirumuskan secara baik, dan betul-betul dapat dijawab. Disiapkannya jawaban ini, juga untuk mengurangi subjektivitas pemeriksa. Yang terakhir inilah yang kemudian membuat tes esai dinamakan juga tes subjektif.
Tes esai juga mempunyai kelebihan daripada tes multiple choice, karena yang pertama menguji materi secara integratif sedangkan yang kedua menguji materi secara dipenggal-penggal. Seseorang yang dapat menjawab tes esai dengan memuaskan, dijamin memang betul-betul memiliki keterampilan seperti dicantumkan dalam tujuan pengajaran dan tujuan tes.

Selain kebaikan, tes esai ada pula kelemahannya. Seorang peserta tes esai bisa saja tidak mempunyai ide akan jawaban suatu pertanyaan dan kemudian mulai mengobrol berhalaman-halaman tanpa menyentuh masalah inti yang ditanyakan. Jawaban seperti ini cukup melelahkan pemeriksa, yang sebetulnya bisa saja segera mencoret seluruh jawaban tetapi tidak melakukannya, karena masih mencoba menelusuri kemungkinan adanya unsur-unsur yang menyerempet yang menyebabkan siswa berhak atas sejumlah nilai.
Tes esai menuntut jawaban berbentuk paragraf dengan kalimat topik di atas dan dikembangkan dengan penjelasan dan contoh-contoh mengikuti kalimat topik tersebut. Yang menjadi masalah adalah, tidak semua siswa mempunyai kebiasaan menjawab tes esai seperti ini. Siswa yang berpikir induktif akan bercerita ke timur-barat dengan contoh-contoh, baru kemudian memberikan kesimpulannya. Perbedaan deduktif-induktif ini memperlambat waktu koreksi, karena pemeriksa harus setiap kali menyesuaikan cara berpikirnya dengan jawaban yang dihadapinya. Belum lagi adanya siswa yang tidak menyusun jawabannya dalam formasi paragraf.

Jawaban tes esai, terutama dalam ilmu sosial, sering bisa berbeda-beda asal argumentasi yang mendukung jawaban tersebut benar. Sekali lagi, pemeriksa dihadapkan pada banyaknya kemungkinan dan subjektivitas yang besar. 

Pemeriksa juga bisa lelah, dan kelelahan pasti mempengaruhi penilaian. Belum lagi kalau pemeriksaan ditunda, masih tetap dan tepat samakah penilaian yang diberikan suatu hari dan hari berikutnya atau seminggu sesudahnya? Pasti, terjadi perubahan yang mungkin saja dipengaruhi oleh hasil pekerjaan dari siswa satu ke siswa lainnya.

MANA YANG DIPILIH?

Sebetulnya, penggunaan tes multiple choice bukan sekedar keterpaksaan. Mengetes Ebtanas atau tes masuk, tidaklah mungkin diselenggarakan dengan tes esai. Waktu, tenaga dan objektivitas penilaian tidak memungkinkan tes esai digunakan di sini. Prosedur penyusunan teslah yang harus diperhatikan, agar apabila ada format paralel, beberapa format yang ada betul-betul mempunyai tingkat kesukaran yang sama. Keterandalan dan kesahihan tes tersebut, harus tinggi.

Tes yang diberikan dalam proses belajar-mengajar yang lebih memberikan tekanan kepada proses, sebaiknya adalah tes esai. Dengan tes esai, siswa dipacu untuk mengembangkan bukan hanya materi, tetapi juga ide dan wawasan, serta kemampuan untuk menurunkan ide-ide dan pendapat-pendapatnya dalam sebuah tulisan yang rapi, teratur, singkat dan lugas. Tes esai, betul-betul mengajarkan kepada siswa cara berpikir logis. Tentu saja, penggunaan tes esai juga harus diikuti dengan persyaratan yang diperlukan dalam menyusun sebuah tes esai.

Alternatif untuk tes esai adalah tes melengkapi (completion test) yang membatasi jawaban siswa dari satu-dua kata hingga beberapa baris. Tes untuk ilmu eksak seperti matematika, mekanika, kimia, dll, juga mengajak siswa untuk berpikir logis dan memecahkan soal melalui cara yang paling singkat tetapi betul. Yang terakhir ini, jugasulit diperoleh kalau multiple choice digunakan sebagai tes di kelas.

Tes multiple choice yang disusun dengan kisi-kisi dan cetak biru yang terencana, juga dapat mengujikan tingkat penalaran yang tinggi. Namun, tes dengan kisi-kisi yang terencana seperti ini sangat menyita waktu. Tidak semua guru kelas sanggup dan mempunyai cukup waktu untuk mempersiapkannya. Tes tingkat nasional pun tidak jarang masih menunjukkan kelemahan-kelemahan di bidang ini.

Bahwa tes multiple choice membuat siswa menghitung kancing baju atau mengalahkan guru dengan menggunakan bahasa gerak tangan, sebetulnya bukanlah kesalahan tes itu sebagai alat uji. Teknik pelaksanaannyalah yang kurang betul. Dan, sekali lagi, siswalah yang masih hidup dalam budaya “jalan pintas” dan tidak menghargai sekolah sebagai tempat menimba ilmu, melainkan hanya sekedar tempat mengumpulkan skor.

Alat uji tetap adalah alat. Digunakan dengan baik, setiap alat uji (yang telah diberi rambu-rambu persyaratan sebagai alat yang baik) akan berfungsi dengan baik. Kedua jenis tes (yang sudah dikategorikan baik) mempunyai kelemahan dan kekuatan masing-masing. Tes multiple choice bukan sekedar mencari-cari pilihan atau memberi jebakan siswa. Demukian pula tes esai, bukan sekedar suatu tes yang boleh dijawab berhalaman-halaman seolah makin panjang makin benar. Mana yang dipilih, bergantung pada tujuan kita menguji.