A. Pendahuluan
Kebijakan evaluasi atau penilaian (assessment) merupakan bagian dari reformasi Sistem Pendidikan Nasional sebagaimana tertuang dalam Undang-undang Republik Indonesia Nomor 20 Tahun 2003, yang dalam pelaksanaannya diatur melalui Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan. Dalam Peraturan Pemerintah No. 19 Tahun 2005 itu, terdapat beberapa hal penting yang terkait dengan kebijakan penilaian, yaitu (1) standar isi, (2) standar kompetensi lulusan (3) standar proses, dan (4) standar penilaian.
Wiersma dan Jurs membedakan antara evaluasi, pengukuran dan testing. Mereka berpendapat bahwa evaluasi adalah suatu proses yang mencakup pengukuran dan mungkin juga testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Suharsimi menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif, sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh Norman E. Gronlund (2009:28) yang menyatakan “Measurement is the assigning of numbers to the results of a test or other type of assessment according to a specific rule (e.g. counting correct answers or awarding points for particular aspects of an essay)”.
Pengertian penilaian yang ditekankan pada penentuan nilai suatu obyek juga dikemukakan oleh Nana Sudjana. Ia menyatakan bahwa penilaian adalah proses menentukan nilai suatu obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek. Seperti juga halnya yang dikemukakan oleh Norman E. Gronlund (2009:28) Assessment is a general term that includes the full range of procedures used to gain information about student learning (observations, ratings of performances or projects, paper-and-pencils test).
Ini berarti bahwa penilaian merupakan komponen penting dalam proses pembelajaran. Sekaligus menunjukkan bahwa penilaian sebagai bagian penting dari sistem pendidikan karena mencerminkan perkembangan atau kemajuan hasil pendidikan dari satu waktu ke waktu lain. Disamping itu, berdasarkan penilaian, tingkat pencapaian prestasi pedidikan antara satu sekolah atau wilayah dengan sekolah atau wilayah lainnya dapat dibandingkan. Hal ini sejalan dengan pendapat Gronlund bahwa penilaian adalah sebuah proses sistematis yang memengang peran penting dalam pengajaran yang efektif. Atau sebuah istilah umum yang meliputi semua rangkaian prosedur yang digunakan untuk mendapatkan informasi tentang pembelajaran siswa (observasi, penilaian kinerja atau proyek, tes tertulis) dan bentuk nilai yang menggambarkan pencapaian proses pembelajaran (2009:26 dan 28). Pendapat senada dipaparkan oleh Nurgiyantoro bahwa penilaian merupakan proses sistematis dalam pengumpulan, analisis, dan penafsiran informasi untuk menentukan seberapa jauh seorang peserta didik dapat mencapai tujuan pendidikan (2014:7).
Berdasarkan paparan di atas, dapat disimpulkan bahwa evaluasi atau penilaian adalah sebuah kegiatan yang sangat penting dalam sebuah proses pembelajaran. Melalui kegiatan evaluasi hasil belajar, dapat diketahui tingkat keberhasilan sebuah proses pembelajaran. Makalah ini akan membahas tiga (3) hal penting tentang evaluasi yakni 1) Tujuan, Fungsi, Manfaat dan Macam-Macam Evaluasi; 2) Ruang lingkup dan jenis evaluasi hasil belajar bahasa; dan 3) Interprestasi hasil tes bahasa.
B. Tujuan, Fungsi, Manfaat dan Macam-Macam Evaluasi
Sebagaimana diuraikan pada bagian terdahulu bahwa evaluasi dilaksanakan dengan berbagai tujuan. Khusus terkait dengan pembelajaran, evaluasi dilaksanakan dengan tujuan: 1) mendeskripsikan kemampuan belajar siswa; 2) mengetahui tingkat keberhasilan PBM; 3) menentukan tindak lanjut hasil penilaian; 4) memberikan pertanggung jawaban (accountability).
Fungsi evaluasi diantaranya adalah adalah selektif, diagnostic, penempatan, pengukur keberhasilan. Selain keempat fungsi di atas Asmawi Zainul dan Noehi Nasution menyatakan masih ada fungsi-fungsi lain dari evaluasi pembelajaran, yaitu fungsi: remedial, umpan balik, memotivasi dan membimbing anak, perbaikan kurikulum dan program pendidikan, dan pengembangan ilmu.
Manfaat evaluasi secara umum yang dapat diambil dari kegiatan pembelajaran, yaitu: Pertama, memahami sesuatu: siswa, mahasiswa (entry behavior, motivasi, dll), sarana dan prasarana, dan kondisi guru dan dosen. Kedua, membuat keputusan: kelanjutan program, penanganan masalah, dll. Ketiga, meningkatkan kualitas PBM: komponen-komponen PBM. Sementara secara lebih khusus evaluasi akan memberi manfaat bagi pihak-pihak yang terkait dengan pembelajaran, seperti siswa, guru, dan kepala sekolah.
Melalui hasil evaluasi, siswa dapat mengetahui tingkat pencapaian tujuan pembelajaran yang dicapai: Memuaskan atau tidak memuaskan. Bagi Guru, hasil evaluasi dapat memberikan informasi tentang siswa yang telah dan belum menguasai tujuan : melanjutkan, remedial atau pengayaan, ketepatan materi yang diberikan: jenis, lingkup, tingkat kesulitan, dll, dan ketepatan metode yang digunakan. Hasil evaluasi bagi pihak Sekolah dapat menggambarkan hasil belajar cermin kualitas sekolah, membuat program sekolah dan pemenuhan standar.
Macam-macam evaluasi hasil belajar menurut Gronlund (2009:38) adalah penempatan, formatif, diagnostik dan penilaian sumatif.
1. Penempatan (Placement Test)
Tes penempatan dimaksudkan untuk mengetahui kemampuan siswa di awal proses pembelajaran. Tes ini fokus pada penggalian informasi tentang kemampuan awal siswa terhadap sebuah proses pembelajaran yang dipilih. Hasil dari tes ini akan menentukan pada level atau tingkatan apa seoarng siswa berada.
2. Formatif
Evaluasi formatif adalah evaluasi yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan / topik, dan dimaksudkan untuk mengetahui sejauh manakah suatu proses pembelajaran telah berjalan sebagaimana yang direncanakan. Winkel menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi (feedback) mengenai kemajuan yang telah dicapai. Sementara Tesmer menyatakan formative evaluation is a judgement of the strengths and weakness of instruction in its developing stages, for purpose of revising the instruction to improve its effectiveness and appeal. Evaluasi ini dimaksudkan untuk mengontrol sampai seberapa jauh siswa telah menguasai materi yang diajarkan pada pokok bahasan tersebut. Wiersma menyatakan “
formative testing is done to monitor student progress over period of time”.
Ukuran keberhasilan atau kemajuan siswa dalam evaluasi ini adalah penguasaan kemampuan yang telah dirumuskan dalam capaian pembelajaran (CP) yang telah ditetapkan sebelumnya. CP yang akan dicapai pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan mengacu pada tingkat kematangan siswa. Artinya CP dirumuskan dengan memperhatikan kemampuan awal anak dan tingkat kesulitan yang wajar yang diperkiran masih sangat mungkin dijangkau/ dikuasai dengan kemampuan yang dimiliki siswa. Dengan kata lain evaluasi formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang telah ditetapkan telah tercapai.
3. Diagnostik
Evaluasi diagnostik adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa sehingga dapat diberikan perlakuan yang tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa tahapan, baik pada tahap awal, selama proses, maupun akhir pembelajaran. Pada tahap awal dilakukan terhadap calon siswa sebagai input. Dalam hal ini evaluasi diagnostik dilakukan untuk mengetahui kemampuan awal atau pengetahuan prasyarat yang harus dikuasai oleh siswa. Pada tahap proses evaluasi ini diperlukan untuk mengetahui bahan-bahan pelajaran mana yang masih belum dikuasai dengan baik, sehingga guru dapat memberi bantuan secara dini agar siswa tidak tertinggal terlalu jauh. Sementara pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat penguasaan siswa atas seluruh materi yang telah dipelajarinya.
4. Sumatif
Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya. Winkel mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa atau semua unit pelajaran yang diajarkan dalam satu semester, bahkan setelah selesai pembahasan suatu bidang studi.
C. Ruang Lingkup dan Jenis Evaluasi Hasil Belajar Bahasa
Secara umum ruang lingkup penyelenggaraan evaluasi kemampuan bahasa adalah kemampuan menggunakan bahasa. Secara konvensional kemampuan bahasa meliputi empat jenis kemampuan, yaitu kemampuan menyimak, kemampuan berbicara, kemampuan membaca dan kemampuan menulis. Kemampuan menyimak mengacu kepada kemampuan untuk memahami segala sesuatu yang diungkapkan orang lain secara lisan dalam bentuk kata-kata lepas, wacana pendek lewat kalimat, atau wacana yang lebih panjang seperti paparan lisan, pidato, kuliah dan lain-lain. Kemampuan berbicara berupa kemampuan untuk mengungkapkan pikiran dan isi hati melalui bunyi-bunyi bahasa dan kata-kata yang dirangkai dalam susunan bahasa yang lengkap seperti frasa, kalimat, dan wacana lisan yang lebih panjang seperti cerita, pidato, dan lain-lain. Kemampuan membaca menunjuk pada kemampuan untuk memahami maksud dan pikiran orang yang diungkapkan secara tertulis dalam bentuk catatan singkat, surat, artikel surat kabar, cerita pendek, novel dan lain-lain. Sementara kemampuan menulis adalah kemampuan untuk mengungkapkan diri melalui kata-kata dan kalimat yang disampaikan secara tertulis.
Tes objektif
Jenis tes evaluasi secara umum berdasarkan cara penskoran adalah tes objektif dan tes essay. Tes objektif menurut Mardapi adalah pilihan ganda, benar salah, menjodohkan, dan uraian objektif (2012:109). Sementara menurut Djiwandono tes objektif dapat dituangkan dalam bentuk (a) Tes monjodohkan, (b) Tes benar salah, (c) Tes pilihan ganda (2011:37).
Teks objektif mencakup beberapa bentuk, tetapi pada umumnya dapat diklasifikasikan menjadi dua bagian yaitu peserta didik hsrus menuliskan kata atau kalimat sederhana dan tes yang mengharuskan peserta didik memilih beberapa kemungknan jawaban yang telah disediakan. Disebut tes objektif karena penilaiannya objektif, yaitu apabila jawaban benar diberi skor 1, salah diberi skor 0. Teks obkektif sering juga disebut tes dikotomi, yaitu penilaian 0-1 (dichotomously scored item). (Surapranata, 2004:67).
Tes objektif adalah tes yang penskorannya dapat dilakukan dengan tingkat objektivitas yang tinggi (Djiwandono, 2011:36). Hal ini sejalan dengan pendapat Mardapi bahwa tes yang objektif adalah yang system pengskorannya objektif (2012:109).
1. Tes Menjodohkan (Matching Test)
Tes menjodohkan memberi tugas kepada peserta tes untuk menjodohkan atau mencocokan dua bagian tes yang, dari segi isi atau arti, merupakan dua bagian yang secara nalar saling berkaitan.
Penskoran dalam soal menjodohkan dapat dilakukan setelah toal tersebut digunakan. Penskoran soal menjodohkan sangatlah mudah dilakukan. Skor 1 diberikan untuk jawabaan yang benar, dan skor 0 diberikan apabila jawaban salah.
2. Tes Benar-Salah (True-False Test)
Tes benar-salah terdiri dari sejumlah butir tes, masing-masing berupa pernyataan. Beberapa di antara pernyataan itu benar dalam arti sesuai dengan yang seharusnya, beberapa yang lain berupa pernyataan yang salah, yaitu tidak sesuai atau bertentangan dengan yang seharusnya. Tugas peserta didik adalah untuk membaca, memerhatikan, dan menilain kebenarannya sesuai denganpenguasaan terhadap isi bidang kajian yang menjadi ssaran tes.
Penskoran soal benar salah sangatlah sederhana, yaitu skor 1 diberikan untuk jawaban benar dan skor 0 untuk jawaban salah. Penskoran seperti ini dinamakan penskoran dikotomi.
3. Tes Pilihan Ganda (Multiple-Choice Test)
Karena sifatnya yang lebih komplek dari pada tes bener salah, pembahasan tentang tes pilihan ganda ini meliputi lebih banyak rincian dan meliputi cirri cirri pokok tes pilihan ganda adalah sejenis tes objektif yang masing-masing butir tesnya memiliki lebih dari dua pilihan jawaban. Kelebihan tes pilihan ganda meliputi (1) peluang untuk jawaban benar dengan sekedar menebak dibandingkan dengan tes benar salah, (2) cakupan materi tes yang lebih luas (3), cara menjawab yang sederhana, (4) pemeriksaan jawaban yang lebih sederhana, (5) analisis yang lebih mudah dilakukan terhadap masing-masing butir tes maupun tes secara keseluruhan karena sekedar didasarkan atas jumlah atau peserta termasuk penghitungan reliabilitas tes. Kelemahan tes pilihan ganda yang paling menonjol dalam penggunaan tes adalah tersedianya peluang yang terbuka lebar bagi jawaban peserta tes yang semata-mata didasarkan atas tebakan.
Penskoran dalam soal pilihan ganda dapat dilakukan setelah soal tersebut digunakan. Penskoran pilihan ganda, sebagaiman telah disebutkan sangat mudah dilakukan. Skor 1 diberikan apabila jawaban benar, dan skor 0 diberikan apabila jawaban salah. Penskoran pilihan ganda dapat dilakukan dengan dua cara yaitu (1) tanpa adanya koreksi terhadap jawaban tebakan, (2) dengan koreksi terhadap jawaban tebakan. Penskoran tanpa koreksi terhadap jawaban tebakan menggunakan persamaan sebagai berikut:
Skor = ∑ B/N x 100
∑B = banyaknya soal yang dijawab benar
N = banyaknya soal
Model tes esai
Tes Esay secara umum banyak digunakan untuk merujuk pada tes subjektif pada umumnya yang pengskorannya hanya dapat dilakukan secara subjektif. Secara lebih khusus, tes esai mengacu pada tes yang jawabannya berupa suatu esai atau uraian dalam berbagai gaya penulisan, seperti deskriptif dan argumentative, sesuai dengan permasalahan pokok bahasan.
1. Model Soal Uraian Terbatas (Restricted Response Essay Items)
Tes ini sangat terbatas baik ditinjau dari segi materi maupun jawabannya. Materi yang dicakup serta jawaban peserta didik pada bentuk soal uraian tipe ini dibatasi oleh prinsip atau konsep tertentu (Grondlund, Linn, & Miller, 2009:238)
2. Soal Uraian Tak Terbatas (Extended Response Essays)
Soal ini menuntut siswa dapat memilih sebuah informasi yang terbaru dan sedang ramai diperbincangkan. Kebebasan ini akan memungkinkan siswa menampilkan kemampuan mereka dalam menganalisis masalah, mengatur idea tau gagasan yang digambarkan dengan bahasa sendiri. Tabel berikut menampilkan kompetensi yang diukur dari tiga item penilaian.
Penilaian tes esai
Tes esai adalah jenis tes subjektif yang jawabannya paling panjang dan paling beragam isi dan kemasannya. Hal ini menimbulkan subjektivitas dalam pemberian skor pada setiap jawaban siswa. Penskoran tes esai tidak dilakukan dengan menggunakan bentuk kunci jawaban melainkan atas dasar rambu-rambu penskoran (scoring guide). Rambu-rambu penskoran memuat pedoman, kriteria, yang menyebutkan jawaban yang diharapkan mempunyai relevansi isi, susunan, bahasa berdasarkan kriteria dimana telah ditetapkan skornya. Penilaian tes esai ini dikenal sebagai penilaian analitik dan holistik.
1. Penskoran Analitik
Penskoran analitik adalah penskoran yang mengharuskan para penskor untuk menentukan daftar unsur-unsur penting yang harus dinilai. Kriteria jawaban peserta tes terhadap masing-masing butir tes berdasarkan sejumlah criteria, yaitu aspek-aspek yang dianggap penting yaitu:
- Relevansi isi jawaban peserta tes dengan jawaban yang diharapkan.
- Kecukupan isi jawaban peserta tes tentang masalah yang ditanyakan.
- Kerapian dan kejelasan penyusunan isi jawaban peserta tes.
- Lain-lain yang perlu dan relevan dengan bidang kajian dan titik berat sasaran tes (dengan uraian dan rinciannya), misalnya penggunaan bahasa yang lugas dan mudaah dimengerti.
2. Penskoran Holistik
Penskoran holistik adalah penskoran yang mengharuskan para penulis soal untuk menilai secara sepintas pada kualitas masing-masing unsure yang terdapat pada jawaban pesrta didik. Guru tidak perlu memberikan skor pada masing-masing unsure tersebut. Metode holistic mungkin sangat baik digunakan untuk mengskor tes uraian tak terbatas yang mengandung kemampuan siswa dalam mensintesa dan mengkreasi. Metode holistik umumnya lebih subjektif dibandingkan dengan metode analitik.
Tes bahasa
Kalau kedua jenis tes di atas adalah jenis tes secara umum, maka untuk tes bahasa dibagi dalam empat jenis tes yakni 1) tes bahasa diskret; 2) tes bahasa integrative; 3) tes bahasa pragmatic, dan 4) tes bahasa komunikatif (Djiwandono, 2011:101).
1. Tes Bahasa Diskret
Tes bahasa diskret adalah tes bahasa yang disusun berdasarkan pendekatan diskret dalam lingusitik. Hal ini didasarkan pada pemahaman bahwa bahasa terdiri dari unsur-unsur yang dapat dibedakan dan dipisahkan satu dari yang lain. Sasaran tes diskret adalah bagian terkecil dari bahasa secara terpisah-pisah, baik bagian terkecil dari kemampuan bahasa maupun komponen bahasa.
Dalam praktek pengajaran bahasa sehari-hari, penerapan tes bahasa diskret ini tidak banyak ditemukan. Terutama karena alas an validitas yang banyak dipersoalkan maupun nilai kepraktisan dan tingkat kebutuhannya untuk memusatkan perhatian pada bagian-bagian terkecil itu. Contoh tes diskret meliputi butir tes, yang secara erpisah di luar konteks, missal membedakan satu bunyi bahasa dari bunyi bahasa lain.
2. Tes Bahasa Integratif
Tes bahasa ini berangkat dari penggunaan bahasa dimana bunyi bahasa dan kosakata tidak tampil terpisah-pisah secara diskret, melainkan dalam gabungan dan rangkaian dengan unsur-unsur bahasa lain dalam satuan yang integratif. Fokus tes integrative diletakkan pada gabungan unsure bahasa (Oller, 1983:37). Butir tes yang jawabannya menuntut penggunaan dari gabungan unsur-unsur bahasa semacam itu merupakan butir tes integratif.
3. Tes Bahasa Pragmatif
Tes pragmatic mendasarkan keberadaan dan penggunaannya pada pendapat bahwa orang dapat memahami wacana yang didengar atau dibaca secara utuh meskipun di sana sini diwarnai dengan berbagai kendala yang menyebabkan wacana itu tidak dapat diterima secara utuh (Djiwandono, 2011:106). Contoh tes pragmatik adalah tes cloze. Dalam bentuknya, tes cloze berupa satu teks bacaan mengenai suatu bidang tertentu yang sejumlah katanya secara ajeg setiap beberapa kata tertentu (setiap kata ke-n atau n-th word) telah dihilangkan.
4. Tes Bahasa Komunikatif
Sebagaimana pendekatan pragmatic dapat ditafsirkan sebagai perluasan dan peningkatan dari gagasan pendekatan integrative dalam bentuk penggabungan unsur-unsur yang lebih beragam, termmsuk unsur ekstralinguistik. Pendekatan komunikatif dapat dimengerti sebagai pendekatan terhadap tes bahasa dengan cakupan yang lebih beragam dan kompleks dari pada pendekatan pragmatik (Djiwandono, 2011:108).
D. Interprestasi Hasil Tes
Ada dua jenis pendekatan penilaian yang dapat digunakan untuk menafsirkan sekor menjadi nilai. Kedua pendekatan ini memiliki tujuan, proses, standar dan juga akan menghasilkan nilai yang berbeda. Karena itulah pemilihan dengan tepat pendekatan yang akan digunakan menjadi penting. Kedua pendekatan itu adalah Pendekatan Acuan Norma (PAN) dan Pendekatan Acuan Patokan (PAP).
Sejalan dengan uraian di atas, Glaser (1963) yang dikutip oleh W. James Popham menyatakan bahwa terdapat dua strategi pengukuran yang mengarah pada dua perbedaan tujuan substansial, yaitu pengukuran acuan norma (NRM) yang berusaha menetapkan status relatif, dan pengukuran acuan kriteria (CRM) yang berusaha menetapkan status absolut. Sedangkan untuk mengukur tes yang mengidentifikasi ketuntasan / ketidaktuntasan absolut siswa atas perilaku spesifik, menggunakan konsep pengukuran acuan kriteria (Criterion Reference Measurement).
1. Penilaian Acuan Norma (PAN)/ Norm Reference Test (NRT)
Pada penggunaan tes acuan norma, skor seorang peserta tes ditafsirkan dengan cara membandingkannya dengan skor-skor yang diperoleh semua peserta lain yang telah mengerjakan tes yang sama. Skor-skoer itu ditafsirkan sebagai cerminan tingkat penguasaan peserta tes tehadap pengetahuan atau kemampuan yang sedang dikukur dengan tes yang bersangkutan. Dalam penggunaan tes acuan norma, tingkat penguasaan peserta tes diperbandingkan antara sesame peserta tes berdasarkan suatu norma yang diperhitungkan secara internal atas dasar perolehan skor semua peserta pada tes yang sama. Perhitungan itu mengacu pada cirri-ciri kurva normal yang mengasumsikan bahwa dalam keadaan normal penyebaran segala sesuatu, termasuk tingkat kemampuan peserta tes, mengikuti pola dan bentuk kurva normal.
Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas belajar yang besar. Tes acuan norma dimaksudkan untuk mengetahui status peserta tes dalam hubungannya dengan performans kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan patokan adalah pada standar performan yang digunakan.
Pada pendekatan acuan norma standar performan yang digunakan bersifat relatif. Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat bergantung pada kondisi performan kelompoknya. Dengan kata lain standar pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari standar relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa memandang kesulitan suatu tes secara teliti. Kekurangan dari penggunaan standar relatif diantaranya adalah (1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi beberapa siswa. (2) standar relatif membuat terjadinya persaingan yang kurang sehat diantara para siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan mengurangi kesempatan pada yang lain untuk mendapatkannya.
Contoh:
1. Satu kelompok peserta tes terdiri dari 9 orang mendapat skor mentah:
50, 45, 45, 40, 40, 40, 35, 35, 30
Dengan menggunakan pendekatan PAN, maka peserta tes yang mendapat skor tertinggi (50) akan mendapat nilai tertinggi, misalnya 10, sedangkan mereka yang mendapat skor di bawahnya akan mendapat nilai secara proporsional, yaitu 9, 9, 8, 8, 8, 7, 7, 6
Penentuan nilai dengan skor di atas dapat juga dihitung terlebih dahulu persentase jawaban benar. Kemudian kepada persentase tertinggi diberikan nilai tertinggi.
2. Sekelompok mahasiswa terdiri dari 40 orang dalam satu ujian mendapat nilai mentah sebagai berikut:
55 43 39 38 37 35 34 32
52 43 40 37 36 35 34 30
49 43 40 37 36 35 34 28
48 42 40 37 35 34 33 22
46 39 38 37 36 34 32 21
Penyebaran skor tersebut dapat ditulis sebagai berikut:
Jika skor mentah yang paling tinggi (55) diberi nilai 10 maka nilai untuk :
52 adalah (52/55) x 10 = 9,5
49 adalah (49/55) x 10 = 9,0 dan seterusnya
3. Bila jumlah pesertanya ratusan, maka untuk memberi nilainya menggunakan statistik sederhana untuk menentukan besarnya skor rata-rata kelompok dan simpangan baku kelompok (mean dan standard deviation) sehingga akan terjadi penyebaran kemampuan menurut kurva normal.
Menurut distribusi kurva normal, sekelompok mahasiswa yang memiliki skor di atas rata-rata 60 dalam kelompok itu adalah:
60 sampai dengan (60 + 2 S.B.) adalah 34,13%
(60 + 1 S.B.) sampai dengan (60 + 2 S.B.) adalah 13,59%
(60 + 2 S.B.) sampai dengan (60 + 3 S.B.) adalah 2,14%
Begitu juga dengan mahasiswa yang memiliki skor 60 ke bawah, adalah:
60 sampai dengan (60 – 2 S.B.) adalah 34,13%
(60 – 1 S.B.) sampai dengan (60 – 2 S.B.) adalah 13,59%
(60 – 2 S.B.) sampai dengan (60 – 3 S.B.) adalah 2,14%
Dengan kata lain mahasiswa yang mendapat skor antara (+1 S.B. s.d. -1 S.B.) adalah 68,26%, yang mendapat skor (+2 S.B. s.d. -2 S.B.) adalah 95,44%.
Dengan demikian dapat dibuat tabel konversi skor mentah ke dalam nilai 1-10.
2. Penilaian Acuan Kriteria (PAK)/Criterion Reference Test (CRT)
Pada penggunaan tes acuan kriteria penafsiran terhadap skor yang dihasilkan didasarkan atas suatu kriteria, yaitu tingkat kemampuan minimum yang telah ditetapkan sebelumnya sebagai indicator penguasaan bidang sasaran tes. Keberhasilan tes criteria sepenuhnya didasarkan atas kemampuan untuk mencapai tingkat minimum penguasaan yang telah ditetapkan itu, tanpa memerhatikan dan membandingkannya dengan pencapaian peserta-peserta lain pada tes yang sama seperti yang dilakukan terhadap hasil tes acuan norma.
Tujuan penggunaan tes acuan patokan berfokus pada kelompok perilaku siswa yang khusus. Didasarkan pada kriteria atau standard khusus. Dimaksudkan untuk mendapat gambaran yang jelas tentang performan peserta tes dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan dengan performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk menyeleksi (secara pasti) status individual berkenaan dengan (mengenai) domain perilaku yang ditetapkan/ dirumuskan dengan baik. Pada pendekatan acuan patokan, standar performan yang digunakan adalah standar absolut. Criterion-referenced interpretation is an absolut rather than relative interpetation, referenced to a defined body of learner behaviors. Dalam standar ini penentuan tingkatan (grade) didasarkan pada sekor-sekor yang telah ditetapkan sebelumnya dalam bentuk persentase. Untuk mendapatkan nilai A atau B, seorang siswa harus mendapatkan sekor tertentu sesuai dengan batas yang telah ditetapkan tanpa terpengaruh oleh performan yang diperoleh siswa lain dalam kelasnya. Salah satu kelemahan dalam menggunakan standar absolut adalah sekor siswa bergantung pada tingkat kesulitan tes yang mereka terima. Artinya apabila tes yang diterima siswa mudah akan sangat mungkin para siswa mendapatkan nilai A atau B, dan sebaliknya apabila tes tersebut terlalu sulit untuk diselesaikan, maka kemungkinan untuk mendapat nilai A atau B menjadi sangat kecil. Namun kelemahan ini dapat diatasi dengan memperhatikan secara ketat tujuan yang akan diukur tingkat pencapaiannya.
Dalam menginterpretasi skor mentah menjadi nilai dengan menggunakan pendekatan PAP, maka terlebih dahulu ditentukan kriteria kelulusan dengan batas-batas nilai kelulusan. Umumnya kriteria nilai yang digunakan dalam bentuk rentang skor berikut:
Rentang Skor Nilai
80% s.d. 100% A
70% s.d. 79% B
60% s.d. 69% C
45% s.d. 59% D
< 44% E / Tidak lulus
Cara lain dapat dilakukan dalam penetapan criteria sebagai acuan penilaian adalah dengan menggunakan unjuk kerja suatu kelompok criteria. Kelompok kriteria dimaksud adalah suatu kelompok orang yang karena kepakarannya, diketahui atau secara umum dianggap memiliki kemampuan yang dapat diandalkan dalam bidang sasaran suatu tes. Unjuk kerja mereka dalam melakukan tugas seperti dituntut oleh tes digunakan sebagai criteria atau patokan dalam menentukan tingkat kemampuan yang diharapkan dapat dicapai oleh peserta tes (Djiwandono, 2011: 259).
E. Penutup
Berdasarkan paparan tentang evaluasi hasil belajar bahasa di atas dapat disimpulkan evaluasi atau penilaian kompetensi berbahasa adalah salah satu bagian penting dari evaluasi bahasa yang harus dilakukan. Beberapa jenis tes baik tes secara umum maupun tes khusus bahasa yang dipaparkan disimpulkan bahwa tes bahasa komunikatif adalah jenis tes yang sangat relevan dengan tujuan pembelajaran bahasa dewasa ini yakni mengembangkan kompetensi komunikatif.
Sementara terkait dengan penyusunan hasil akhir atau interpretasi hasil tes, penilaian acuan kriteria atau patokan adalah hal yang relevan dengan penilaian otentik yang disarankan dalam kurikulum 2013. Penggunaan tes acuan kriteria adalah penafsiran terhadap skor yang dihasilkan didasarkan atas suatu kriteria, yaitu tingkat kemampuan minimum yang telah ditetapkan sebelumnya sebagai indicator penguasaan bidang sasaran tes. Keberhasilan tes criteria sepenuhnya didasarkan atas kemampuan untuk mencapai tingkat minimum penguasaan yang telah ditetapkan itu, tanpa memerhatikan dan membandingkannya dengan pencapaian peserta-peserta lain pada tes yang sama seperti yang dilakukan terhadap hasil tes acuan norma.
Referensi
- Asmawi Zainul. (1992). Tes dan pengukuran. Jakarta: Depdikbud Dirjen Dikti PPTKPT.
- Djiwandono, Soenardi. (2011). Tes bahasa pengangan bagi pengajar bahasa. Jakarta: Indeks.
- Grondlund, N. E., Linn, R. L., & Miller, M. D. (2009). Measurement and assessment in teaching. New Jersey: Pearson.
- Mardapi, Djemari. (2012). Pengukuran, penilaian, dan evaluasi pendidikan. Yogyakarta: Nuha Medika.
- Nurgiyantoro, Burhan. (2014). Penilaian pembelajaran bahasa berbasis kompetensi. Yogyakarta: BPFE.
- Oller, Jr. John. W. (1983). Issues in language testing. Mass: Newbury House Publishers Inc.
- Republik Indonesia. (2003). Undang-undang RI Nomor 20, Tahun 2003, tentang Sistem Pendidikan nasional.
- Suharsimi Arikunto. (2009). Dasar-dasar evaluasi pendidikan. Jakarta: PT. Bumi Aksara.
- Surapranata, Sumarna. (2004). Panduan Penulisan Tes Tertulis Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya Offset.
- Wiersma, William. (1986). Research Methods in Education: An Introduction. Massachusetts: Allyn and Bacon, Inc.