PENYUSUNAN INSTRUMEN TES
Keyakinan menjadi pikiran Anda, pikiran menjadi kata-kata Anda, kata-kata
menjadi tindakan Anda, tindakan menjadi kebiasaan Anda, kebiasaan
menjadi nilai-nilai Anda, dan nilai-nilai menjadi takdir Anda
Mahatma Gandi
Pembahasan Materi
Bab ini membahas tentang pengertian tes, pengembangan tes sebagai alat evaluasi, tes benar-salah (true-false), tes pilihan ganda (multiple choice test), ragam bentuk tes pilihan ganda, soal menjodohkan (matching test), tes isian (completion test), dan soal jawaban singkat.
- Pendahuluan
Tes merupakan himpunan pertanyaan yang harus dijawab, harus ditanggapi, atau tugas yang harus dilaksanakan oleh orang yang dites. Tes digunakan untuk mengukur sejauh mana seorang siswa telah menguasai pelajaran yang disampaikan terutama meliputi aspek pengetahuan dan keterampilan. Adapun definisi tes menurut Linn dan Gronlund (1995), adalah “Test is an instrument of systematic procedure for measuring a sample of behavior by posing a set of questions in a uniform manner. Because a test a form of assessment, test also answer the questions how well does the individual perform either in comparison with others or in comparison with a domain of performance task”.
Tes pada umumnya dimaksudkan untuk mengukur aspek-aspek perilaku manusia, seperti aspek pengetahuan (kognitif), aspek sikap (afektif), maupun aspek keterampilan (psikomotor). Hal yang hendak diukur adalah tingkat penguasaan peserta didik terhadap bahan pelajaran yang telah diajarkan (Sumarna, 2004). Dalam uraian ini, perlu dibedakan antara prestasi belajar (achievement) dan hasil belajar (learning outcome). Prestasi belajar hanya mengukur dua aspek yaitu aspek kognitif dan aspek psikomotor. Hasil belajar meliputi aspek pembentukan watak seorang peserta didik, dengan demikian mengukur tiga aspek utama hasil pendidikan, yaitu aspek kognitif, psikomotor, dan afektif.
Tes pada umumnya digunakan untuk meningkatkan pembelajaran. Melalui tes guru dapat memperoleh informasi tentang berhasil tidaknya peserta didik dalam menguasai tujuan-tujuan yang telah ditetapkan dalam kurikulum. Melalui tes guru dapat dengan mudah mendeteksi peserta didik yang sudah menguasai dan yang belum menguasai. Melalui tes juga guru dapat mendeteksi berhasil tidaknya pembelajaran yang telah dilakukan. Hasil tes dapat digunakan untuk memberikan laporan kepada pihak tertentu tentang perkembangan kemajuan belajar peserta didik maupun tentang keberhasilan guru mengajar.
Dalam hal ini kita bedakan atas dua bentuk tes (Suharsimi, 2002), yaitu sebagai berikut: Pertama, tes subjektif, yang pada umumnya berbentuk esai (uraian). Tes bentuk esai adalah sejenis tes kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti; uraikan, jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan sebagainya. Soal-soal bentuk esai biasanya jumlahnya tidak banyak, hanya sekitar 5 – 10 buah soal dalam waktu kira-kira 90 sampai dengan 120 menit. Soal-soal bentuk esai ini menuntut kemampuan siswa untuk dapat mengorganisir, menginterpretasi, menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
Kebaikan-kebaikan tes subjektif: (a) mudah disiapkan dan disusun; (b) tidak memberi banyak kesempatan untuk berspekulasi atau untung-untungan; (c) mendorong siswa untuk berani mengemukakan pendapat serta menyusun dalam bentuk kalimat yang bagus. Memberi kesempatan kepada siswa untuk mengutarakan maksudnya dengan gaya bahasa dan caranya sendiri; dan (d) dapat diketahui sejauh mana siswa mendalami sesuatu masalah yang diteskan. Sedangkan keburukan-keburukannya adalah: (a) kadar validitas dan reliabilitas rendah karena sukar diketahui segi-segi mana dari pengetahuan siswa yang betul-betul telah dikuasai; (b) kurang representatif dalam hal mewakili seluruh scope bahan pelajaran yang akan dites karena soalnya hanya beberapa saja (terbatas); (c) cara memeriksanya banyak dipengaruhi oleh unsur-unsur subjektif; (d) pemeriksaannya lebih sulit sebab membutuhkan pertimbangan individual lebih banyak dari penilai; dan (e) waktu untuk koreksinya lama dan tidak dapat diwakili kepada orang lain.
Kedua, tes objektif, merupakan tes yang dalam pemeriksaannya dapat dilakukan secara objektif. Hal ini memang dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes bentuk esai. Dalam penggunaan tes objektif ini jumlah soal yang diajukan jauh lebih banyak daripada tes esai. Kadang-kadang untuk tes yang berlangsung selama 60 menit dapat diberikan 30 – 40 buah soal. Kebaikan-kebaikan tes objektif, yaitu: (a) mengandung lebih banyak segi-segi positif, misalnya lebih representatif mewakili isi dan luas bahan, lebih objektif, dapat dihindari campur tangannya unsur-unsur subjektif baik dari segi siswa maupun segi guru yang memeriksa; (b) lebih mudah dan cepat cara memeriksanya karena dapat menggunakan kunci tes bahkan alat-alat hasil kemajuan teknologi; (c) pemeriksaannya dapat diserahkan orang lain; dan (d) dalam pemeriksaan, tidak ada unsur subjektif yang mempengaruhi.
Sedangkan kelemahan-kelemahannya adalah: (a) persiapan untuk menyusunnya jauh lebih sulit daripada tes esai karena soalnya banyak dan harus teliti untuk menghindari kelemahan-kelemahan yang lain; (b) soal-soalnya cenderung untuk mengungkapkan ingatan dan proses mental yang tinggi; (c) banyak kesempatan untuk main untung-untungan; dan (d) “kerja sama” antarsiswa pada waktu mengerjakan soal tes lebih terbuka. Adapun cara mengatasi kelemahan yang ada adalah: (a) kesulitan menyusun tes objektif dapat diatasi dengan jalan banyak berlatih terus-menerus hingga betul-betul mahir; (b) menggunakan tabel spesifikasi untuk mengatasi kelemahan nomor satu dan dua; dan (c) menggunakan norma penilaian yang memperhitungkan faktor tebakan (guessing) yang bersifat spekulatif itu.
- Pengembangan Tes sebagai Alat Evaluasi
Penyusunan dan pengembangan tes dimaksudkan untuk memperoleh tes yang valid, sehingga hasil ukurnya dapat mencerminkan secara tepat hasil belajar atau prestasi belajar yang dicapai oleh masing-masing individu peserta tes setelah mengikuti kegiatan belajar mengajar. Untuk itu langkah-langkah konstruksi tes yang ditempuh adalah sebagai berikut (Djaali, 2004):
- Menetapkan tujuan tes. Tes prestasi belajar dapat dibuat untuk bermacam-macam tujuan, seperti: (a) tes yang bertujuan untuk mengadakan ujian nasional atau ujian lain yang sejenis; (b) tes yang bertujuan untuk mengadakan seleksi, misalnya SNMPTN; dan (c) tes yang bertujuan untuk mendiagnosis kesulitan belajar siswa yang dikenal dengan tes diagnosis.
- Analisis kurikulum. Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok bahasan yang akan dijadikan dasar dalam menentukan jumlah item atau butir soal untuk setiap pokok bahasan soal objektif atau bobot soal untuk bentuk uraian, dalam membuat kisi-kisi tes.
- Analisis buku pelajaran dan sumber materi belajar lainnya. Analisis ini mempunyai tujuan yang sama dengan analisis kurikulum, yaitu menentukan bobot setiap pokok bahasan. Namun dalam analisis buku pelajaran menentukan bobot setiap pokok bahasan berdasarkan jumlah halaman materi yang termuat dalam buku pelajaran atau sumber materi belajar lainnya.
- Membuat kisi-kisi. Manfaat kisi-kisi adalah untuk menjamin sampel soal yang baik, dalam arti mencakup semua pokok bahasan secara proporsional. Agar item-item atau butir-butir tes mencakup keseluruhan materi (pokok bahasan atau sub pokok bahasan) secara proporsional, maka sebelum menulis butir-butir tes terlebih dahulu kita harus membuat kisi-kisi sebagai pedoman.
- Penulisan Tujuan Instruksional Khusus (TIK). Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan. TIK harus mencerminkan tingkah laku siswa, oleh karena itu harus dirumuskan secara operasional, dan secara teknis menggunakan kata-kata operasional.
- Penulisan soal. Setelah kisi-kisi dalam bentuk tabel spesifikasi telah tersedia, maka kita akan membuat butir-butir soal. Beberapa petunjuk yang perlu diperhatikan dalam membuat butir-butir soal (khususnya matematika misalnya) adalah:
- Soal yang dibuat harus valid (validitas konstruk) dalam arti mampu mengukur tercapai tidaknya tujuan pembelajaran yang telah dirumuskan.
- Soal yang dibuat harus dapat dikerjakan dengan menggunakan satu kemampuan spesifik, tanpa dipengaruhi kemampuan lain yang tidak relevan.
- Soal yang dibuat harus terlebih dahulu dikerjakan atau diselesaikan dengan langkah-langkah lengkap sebelum digunakan pada tes yang sesungguhnya.
- Menetapkan sejak awal aspek kemampuan yang hendak diukur untuk setiap soal matematika yang dibuat.
- Dalam membuat soal matematika, hindari sejauh mungkin kesalahan-kesalahan ketik betapapun kecilnya, karena hal itu akan mempengaruhi validitas soal.
- Memberikan petunjuk mengerjakan soal secara lengkap dan jelas untuk setiap bentuk soal matematika dalam suatu tes.
- Telaah soal (face validity). Soal-soal yang dibuat masih mungkin terjadi kekurangan atau kekeliruan yang menyangkut aspek kemampuan spesifik yang diukur, bahasa yang digunakan, kesalahan ketik dan sebagainya. Untuk itu sebelum diperbanyak maka soal terlebih dahulu harus ditelaah oleh teman sejawat yang memahami materi tes maupun teknik penulisan soal untuk meneliti validitas permukaan dari soal yang dibuat.
- Reproduksi tes terbatas. Tes yang sudah jadi diperbanyak dalam jumlah yang cukup menurut jumlah sampel uji-coba atau jumlah peserta yang akan mengerjakan tes tersebut dalam suatu kegiatan uji-coba tes.
- Uji-coba tes. Tes yang sudah diperbanyak itu akan diuji-cobakan pada sejumlah sampel yang telah ditentukan. Sampel uji-coba harus mempunyai karakteristik yang kurang lebih sama dengan karakteristik peserta tes yang sesungguhnya.
- Analisis hasil uji-coba. Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir soal yang meliputi validitas butir, tingkat kesukaran, dan fungsi pengecoh. Berdasarkan validitas butir soal tersebut diadakan seleksi soal dengan menggunakan kriteria validitas tertentu.
- Revisi soal. Soal-soal yang valid berdasarkan kriteria validitas empiric dikonfirmasikan dengan kisi-kisi. Apabila soal-soal tersebut sudah memenuhi syarat dan telah mewakili semua materi yang akan diujikan, soal-soal tersebut selanjutnya dirakit menjadi sebuah tes, tetapi apabila soal-soal yang valid belum memenuhi syarat berdasarkan hasil konfirmasi dengan kisi-kisi, dapat dilakukan perbaikan terhadap soal yang diperlukan.
- Merakit soal menjadi tes. Urutan soal dalam suatu tes dilakukan menurut tingkat kesukaran soal, yaitu dari soal yang mudah sampai soal yang sulit.
Dilihat dari tujuan dan fungsinya tes dibagi menjadi empat, yaitu: (a) tes penempatan; (b) tes formatif; (c) tes diagnosis; dan (d) tes sumatif (Daryanto, 2001). Tes formatif adalah tes yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan / topik, dan dimaksudkan untuk mengetahui sejauh manakah suatu proses pembelajaran telah berjalan sebagaimana yang direncanakan. Winkel (2004) menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi (feedback) mengenai kemajuan yang telah dicapai. Sementara Tesmer dalam Winkel (2004) menyatakan formative evaluation is a judgement of the strengths and weakness of instruction in its developing stages, for purpose of revising the instruction to improve its effectiveness and appeal. Wiersma dalam Mukhtar (2003) menyatakan formative testing is done to monitor student progress over period of time. Ukuran keberhasilan atau kemajuan siswa dalam evaluasi ini adalah penguasaan kemampuan yang telah dirumuskan dalam rumusan tujuan (TIK) yang telah ditetapkan sebelumnya. TIK yang akan dicapai pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan mengacu pada tingkat kematangan siswa. Artinya TIK dirumuskan dengan memperhatikan kemampuan awal anak dan tingkat kesulitan yang wajar yang diperkiran masih sangat mungkin dijangkau/ dikuasai dengan kemampuan yang dimiliki siswa.
Dari hasil tes ini akan diperoleh gambaran siapa saja yang telah berhasil dan siapa yang dianggap belum berhasil untuk selanjutnya diambil tindakan-tindakan yang tepat. Tindak lanjut dari evaluasi ini adalah bagi para siswa yang belum berhasil maka akan diberikan remedial, yaitu bantuan khusus yang diberikan kepada siswa yang mengalami kesulitan memahami suatu pokok bahasan tertentu. Sementara bagi siswa yang telah berhasil akan melanjutkan pada topik berikutnya, bahkan bagi mereka yang memiliki kemampuan yang lebih akan diberikan pengayaan, yaitu materi tambahan yang sifatnya perluasan dan pendalaman dari topik yang telah dibahas.
Tes sumatif adalah tes yang dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya. Winkel mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa atau semua unit pelajaran yang diajarkan dalam satu semester, bahkan setelah selesai pembahasan suatu bidang studi.
Evaluasi diagnostik adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa sehingga dapat diberikan perlakuan yang tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa tahapan, baik pada tahap awal, selama proses, maupun akhir pembelajaran. Pada tahap awal dilakukan terhadap calon siswa sebagai input. Sementara pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat penguasaan siswa atas seluruh materi yang telah dipelajarinya.
Tabel 13.1. Perbandingan Tes Diagnostik, Tes Formatif, dan Tes Sumatif
Ditinjau dari | Tes Diagnostik | Tes Formatif | Tes Sumatif |
Fungsinya | mengelompokkan siswa berdasarkan kemampuannya menentukan kesulitan belajar yang dialami | Umpan balik bagi siswa, guru maupun program untuk menilai pelaksanaan suatu unit program | Memberi tanda telah mengikuti suatu program, dan menentukan posisi kemampuan siswa dibandingkan dengan anggota kelompoknya |
Cara memilih tujuan yang dievaluasi | Memilih tiap-tiap keterampilan prasarat. Memilih tujuan setiap program pembelajaran secara berimbang. Memilih yang berhubungan dengan tingkah laku fisik, mental dan perasaan | Mengukur semua tujuan instruksional khusus | Mengukur tujuan instruksional umum |
Skoring (cara menyekor) | Menggunakan standar mutlak dan relatif | Menggunakan standar mutlak | Menggunakan standar relatif |
Berikut dijelaskan berbagai macam tes objektif yang digunakan dalam evaluasi pembelajaran.
- Tes Benar-Salah (True-False)
Soal-soalnya berupa pertanyaan-pertanyaan (statement). Statement tersebut ada yang benar dan ada yang salah. Orang yang ditanya bertugas untuk menandai masing-masing pertanyaan itu dengan melingkari huruf B jika pertanyaan itu betul menurut pendapatnya dan melingkari huruf S jika pertanyaannya salah. Jumlah huruf B-S harus sama banyak dengan jumlah pernyataan atau pertanyaan. Agar soal berfungsi dengan baik, maka hal yang ditanyakan hendaknya homogen dari segi isi. Ciri khusus bentuk soal benar salah adalah terbatas mengukur kemampuan mengidentifikasi informasi berdasarkan hubungan yang sederhana. Kalaupun hendak digunakan untuk mengukur kemampuan yang lebih tinggi, paling tidak dapat digunakan untuk kemampuan menghubungkan antara dua hal yang homogen.
Bentuk benar-salah ada 2 macam (dilihat dari segi mengerjakan/menjawab soal), yaitu: (a) dengan pembetulan (with correction) yaitu siswa diminta membetulkan bila ia memilih jawaban yang salah; dan (b) tanpa pembetulan (without correction) yaitu siswa hanya diminta melingkari huruf B atau S tanpa memberi jawaban yang betul. Kebaikan tes benar-salah, adalah: (a) dapat mencakup bahan yang luas dan tidak banyak memakan tempat karena biasanya pertanyaan-pertanyaannya singkat saja; (b) mudah menyusunnya; (c) dapat digunakan berkali-kali; (d) dapat dilihat secara cepat dan objektif; dan (e) petunjuk cara mengerjakannya mudah dimengerti. Sedangkan kelemahan-kelemahannya adalah: (a) sering membingungkan; (b) mudah ditebak/diduga; (c) banyak masalah yang tidak dapat dinyatakan hanya dengan dua kemungkinan benar atau salahl; dan (d) hanya dapat mengungkap daya ingatan dan pengenalan kembali.
Menurut Surapranata (2004), terdapat beberapa kelebihan dan kelemahan bentuk soal benar-salah yang harus diperhatikan oleh guru ketika mereka mengembangkan soal. Kelebihan pertama adalah mudahnya membuat soal. Hanya dengan mengubah sedikit pernyataan yang terdapat dalam buku atau membuat sama pernyataan yang terdapat dalam buku misalnya, akan diperoleh soal benar-salah. Kelebihan lain adalah banyaknya pokok bahasan atau kompetensi dasar dan indikator yang dapat dicakup dalam soal. Hal ini terjadi karena peserta didik dapat merespon sejumlah soal dalam waktu singkat. Namun demikian permasalahan mujncul ketika tidak semua materi tepat untuk diukur dengan soal benar-salah. Dalam beberapa mata pelajaran, pernyataan atau pertanyaan benar-salah tidak dapat dibuat.
Kelemahan utama soal bentuk benar-salah adalah berkaitan dengan kemampuan yang hendak diukur. Bentuk soal ini sangat terbatas mengukur kemampuan pengetahuan saja. Sangat sulit mengembangkan soal yang berkaitan dengan kemampuan yang lebih tinggi seperti problem solving misalnya. Kemampuan yang dapat diukur adalah kemampuan membedakan antara fakta dan pendapat dan kemampuan mengidentifikasi hubungan sebab akibat. Kelemahan berikutnya adalah tingginya faktor menerka yang dilakukan oleh peserta didik. Dengan hanya dua alternatif benar dan salah, peserta didik memiliki peluang menjawab benar sebesar 50%. Di pihak lain, guru akan mengalami kesulitan dalam menginterpretasi kemampuan siswa yang sebenarnya manakala mereka menjawab benar atupun salah terhadap suatu soal. Akibatnya bentuk soal benar-salah: (a) memiliki tingkat reliabilitas yang sangat rendah; (b) kurang dapat digunakan sebagai alat diagnosa kesulitan belajar siswa; dan (c) validitas soal juga sangat diragukan kebenarannya.
Petunjuk penyusunan:
- Tulislah huruf B–S pada permulaan masing-masing item dengan maksud untuk mempermudah mengerjakan dan menilai (scoring).
- Usahakan agar jumlah butir soal yang harus dijawab B sama dengan butir soal yang harus dijawab S. dalam hal ini hendaknya pola jawaban tidak bersifat teratur misalnya: B–S–B–S–B–S atau SS–BB–SS–BB–SS.
- Hindari item yang masih bisa diperdebatkan:
Contoh:
B–S. Kekayaan lebih penting daripada kepandaian.
- Hindarilah pertanyaan-pertanyaan yang persis dengan buku.
- Hindarilah kata-kata yang menunjukkan kecenderungan memberi saran seperti yang dikehendaki oleh item yang bersangkutan, misalnya: semuanya, tidak selalu, tidak pernah, dan sebagainya.
Cara mengolah skor:
Rumus untuk mencari skor akhir bentuk benar-salah ada 2 macam, yaitu:
- Dengan denda
Dengan pengertian:
S= skor yang diperoleh.
R= right (jawaban yang benar).
W= wrong (jawaban yang salah).
Contoh: Jumlah soal tes =20 buah.
A menjawab betul 16 buah dan salah 4 buah. Maka skor untuk A adalah:
16–4=12
Dengan menggunakan rumus seperti ini maka ada kemungkinan seorang siswa memperoleh skor negatif.
- Tanpa denda
Rumus:
Yang dihitung hanya yang betul (untuk soal yang tidak dikerjakan dinilai 0)
- Tes Pilihan Ganda (Multiple Choice Test)
Di berbagai tingkat dan jenjang pendidikan banyak menggunakan bentuk tes pilihan ganda. Hal ini disebabkan: (a) tipe tes di susun dan digunakan untuk mengukur semua standar kompetensi, mulai dari yang paling sederhana sampai yang paling kompleks; (b) jumlah alternatif jawaban (option) lebih dari dua sehingga dapat mengurangi keinginan siswa untuk menebak (guessing); (c) tipe tes ini menuntut kemampuan siswa untuk membedakan berbagai tingkatan kebenaran sekaligus; dan (d) tingkat kesukaran butir soal dapat dikendalikan dengan hanya mengubah tingkat homogenitas alternatif jawaban. Bentuk tes formatif pilihan ganda di skor secara objektif, karena pemeriksaannya atau penskorannya tidak selalu dilakukan oleh manusia tapi dapat dilakukan mesin misalnya mesin scanner (Lizza, 2010).
Multiple choice test terdiri atas suatu keterangan atau pemberitahuan tentang suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memilih satu dari beberapa kemungkinan jawaban yang telah disediakan. Atau multiple choice test terdiri atas bagian keterangan (stem) dan bagian kemungkinan jawaban atau alternatif (options). Kemungkinan jawaban (option) terdiri atas satu jawaban yang benar yaitu kunci jawaban dan beberapa pengecoh (distractor).
- Ragam Bentuk Tes Pilihan Ganda
Menurut Karmel dan Karmel (1978), ada sepuluh kriteria tes yang baik, yakni: (a) tes harus relevan; (b) ada keseimbangan antara tujuan yang ingin dicapai dengan jumlah butir tes yang mewakilinya; (c) efisiensi waktu yang digunakan untuk melakukan tes, pensekoran dan pengadministrasian sekor tes; (d) objektivitas dalam memberikan sekor dan interpretasinya; (e) kekhususan tes yang mengukur materi pelajaran yang diajarkan di kelas; (f) tingkat kesukaran setiap butir tes; (g) kemampuan butir membedakan kelompok siswa yang memiliki kemampuan tinggi dan rendah; (h) reliabilitas; (i) kejujuran dan pemerataan kesempatan; dan (j) kecepatan menyelesaikan tes.
Beberapa prinsip dasar pengukuran meliputi pengukuran prestasi belajar, yakni tes harus mengukur hasil belajar yang sesuai tujuan pembelajaran, merupakan bagian yang berarti dari materi ajar, berisikan butir tes dengan tipe yang paling tepat, dirancang sesuai tujuan, mempunyai reliabilitas dan validitas yang baik sehingga hasilnya ditafsirkan dengan tepat guna meningkatkan pengukuran prestasi belajar (Gronlund, 1982).
Pada prinsipnya untuk mengevaluasi hasil belajar digunakan tes. Tes hasil belajar (THB) yang digunakan dosen di kelas dibedakan atas bentuk tes pilihan ganda dan tes uraian. Mengenai tes bentuk pilihan ganda, dibedakan atas beberapa macam soal yang biasa dipakai, di antaranya: (a) melengkapi lima pilihan; (b) asosiasi dengan lima pilihan (empat pilihan); (c) hal kecuali; (d) analisis hubungan antara hal; (e) analisis khusus; (f) perbandingan kuantitatif; (g) hubungan dinamik; (h) melengkapi berganda; dan (i) pemakaian diagram, gambar dan grafik. Dalam ujian akhir semester perguruan tinggi dan seleksi nasional masuk perguruan tinggi negeri telah ditetapkan lima dari Sembilan bentuk soal tersebut di atas yakni: melengkapi lima pilihan (tipe A), analisis hubungan antara hal (tipe B), analisis khusus (tipe C), melengkapi berganda (tipe D), dan pemakaian diagram, gambar dan grafik: (tipe E).
Kebanyakan dosen mata kuliah yang mengajar di perguruan tinggi cenderung lebih menyukai tipa A, B, dan D dalam menyajikan soal. Hal ini mungkin dipandang lebih praktis dan ekonomis. Untuk soal tipe A, pada prinsipnya terdiri dari kalimat pokok yang berupa pertanyaan yang belum lengkap. Pertanyaan ini mengungkapkan secara deskriptif permasalahan yang akan ditanyakan dan disebut dengan stem. Kemudian diikuti oleh lima kemungkinan jawaban yang dapat melengkapi pertanyaan. Kalimat yang merupakan kelengkapan dari komponen stem berfungsi pula sebagai alternatif jawaban dan disebut sebagai option. Pada option terdapat satu kunci yaitu jawaban yang tepat dan umpan atau pengecoh (distractor). Peserta ujian diminta untuk memilih salah satu dari lima kemungkinan jawaban. Pada bentuk ini hanya ada satu jawaban yang benar dan dalam hal ini biasanya disebutkan dalam petunjuk soal.
- Tes Pilihan Ganda Biasa
Menurut Gronlund (1984), bentuk tes pilihan ganda dapat digunakan untuk mengukur kemampuan ingatan, pemahaman, dan penerapan yang lebih kompleks. Bentuk tes ini juga dapat digunakan untuk mengukur kemampuan mahasiswa yang lebih tinggi dan dapat disekor secara objektif. Tes pilihan ganda biasa terdiri dari kalimat pokok berupa pernyataan yang tidak lengkap. Untuk melengkapi kesempurnaan kalimat tersebut penerapan pilihan jawaban haruslah berupa jawaban yang dipilih untuk melengkapi pernyataan tersebut. Tidak lengkapnya pernyataan dalam bentuk soal ini ditandai oleh adanya kekosongan atau titik-titik yang perlu diisi untuk melengkapi pernyataan.
Soal bentuk pilihan ganda merupakan soal yang telah disediakan pilihan jawabannya, di mana mahasiswa yang mengerjakan soal itu hanya memilih satu jawaban yang benar dari pilihan jawaban yang disediakan. Wujud soalnya terdiri dari: (a) dasar pernyataan/stimulus (bila ada); (b) pokok soal/stem; dan (c) pilihan jawaban yang terdiri kunci jawaban dan pengecoh. Dalam format tes pilihan ganda dicirikan dengan suatu butir dengan suatu stem atau ungkapan yang menampilkan suatu masalah atau pertanyaan yang biasanya diikuti oleh dua sampai lima pilihan jawaban, di mana satu di antaranya merupakan jawaban yang paling tepat (Osterlind, 1999).
- Tes Pilihan Ganda Assosiasi
Butir tes yang mengukur pengetahuan kompleks ditandai oleh adanya hal-hal yang baru. Pengukuran kompleks menghendaki mahasiswa mampu mengidentifikasi versi baru dari istilah atau illustrasi. Dalam hal yang sama, di mana butir tes pengetahuan dapat dipakai untuk mengidentifikasi prinsip yang sebelumnya telah dipelajari, pengukuran kompleks menuntut interpretasi atau aplikasi dari prinsip itu. Dengan kata lain, butir tes yang digunakan mengukur pengetahuan kompleks mencari fakta yang telah mengaitkan murid dengan pengetahuan, sehingga dapat menggunakan pengetahuan tersebut untuk menyelesaikan masalah baru baginya. Banyak hasil belajar yang dapat diukur dengan tes pilihan ganda biasa, tetapi ada hasil belajar lainnya yang paling baik diukur dengan butir tes yang lebih kompleks. Hasil belajar kompleks dapat diukur lebih efektif dengan mendasarkan serangkaian butir tes, seperti paragraph, tabel, chart, peta atau gambar.
Ada beberapa teknik analisis yang telah diusulkan oleh para ahli bidang ini, antara lain adalah pengecoh. Hal ini sesuai pendapat Brown seperti dikutip oleh Fernandes (1990) bahwa pilihan jawaban dapat dihilangkan atau direvisi kecuali ada yang memilihnya. Dengan dasar itu maka diketahui efektifitas pengecoh pilihan jawaan tersebut. Pembuat tes banyak menemukan kesulitan untuk mengembangkan butir-butir tes yang mampu mengukur tingkat pemahaman dibanding mengukur secara langsung pengetahuan terhadap materi ajar. Variasi dan cara menyusun butir tes objektif untuk mengukur pencapaian tujuan pengajaran sering terdapat pada bentuk tes yang lebih kompleks. Pilihan-pilihan jawaban seperti “seluruh jawaban di atas”, “tidak satu pun jawaban di atas”, “satu dari yang berikut”, semua pilihan jawaban seperti itu dapat membuat peserta tes mengalami kesulitan. Tambahan pula, membuat semua pilihan jawaban benar atau salah memungkinkan peserta tes memilih yang terbaik atau yang paling dekat dengan pilihan jawaban yang sesungguhnya.
Menurut Gronlund (1982), prestasi kompleks mengandung hasil belajar yang didasarkan pada proses mental yang lebih tinggi, misalnya pemahaman, keterampilan berpikir, dan variasi kemampuan pemecahan masalah. Beberapa aspek prestasi kompleks diukur secara objektif meliputi kemampuan untuk menerapkan sebuah prinsip, interpretasi hubungan, menyatakan kesimpulan, membangun dan mempertahankan hipotesis, merumuskan dan mengenali kevalidan keputusan, penerapan asumsi, mengenali keterbatasan data, memahami keberartian masalah, dan untuk merancang prosedur eksperimental.
Dalam kaitan ini, bentuk tes pilihan ganda asosiasi lebih sesuai digunakan. Menurut Nitko (1996) bahwa analisis isi dari jawaban butir tes dapat dikatakan sebagai cara dan pemrosesan jawaban. Thorndike dan Hagen (1977) mengistilahkan tes asosiasi pilihan ganda sebagai variasi butir tes pilihan ganda yang terdiri dari: (a) butir tes pilihan ganda kompleks; dan (b) penggunaan pasangan pernyataan sebagai stimuli.
Menurut Wiersma dan Jurs (1990) dalam pengukuran bentuk asosiasi, mahasiswa diberi kumpulan kata-kata atau ungkapan yang diberi suatu asosiasi, suatu hubungan ide atau istilah untuk masing-masing kata atau ungkapan tersebut. Sebuah pertanyaan menyatakan secara langsung pemakaian butir tes, dan bentuk tes pilihan ganda asosiasi merupakan suatu variasi bentuk pertanyaan. Dalam hal ini, mahasiswa diberi dasar asosiasi tersebut untuk menyatakan pilihan jawaban benar yang diharapkan. Sementara itu, Suryabrata (2000) mengistilahkan tes pilihan ganda asosiasi sebagai tes “jenis kombinasi” yang terdiri atas batang tubuh soal diikuti kemungkinan jawaban, di antaranya satu atau lebih benar.
Bentuk tipe pilihan ganda asosiasi ini hamir sama dengan tipe pilihan ganda biasa, yang membedakan adalah bahwa kemungkinan jawaban benar lebih dari satu. Untuk bentuk tes pilihan ganda asosiasi, pada pokoknya hampir sama dengan bentuk pilihan ganda biasa, namun pada bentuk ini cara menjawabnya lebih kompleks. Contoh itemnya adalah sebagai berikut: untuk item beriku, pilihlah:
- Apabila hanya (1), (2), dan (3) benar
- Apabila hanya (1) dan (3) benar
- Apabila hanya (2) dan (4) benar
- Apabila hanya (4) benar.
- Apabila semuanya benar
Pada hakekatnya bentuk soal ini hampir sama dengan bentuk soal melengkapi pilihan, yaitu satu pernyataan yang tidak lengkap yang diikuti dengan beberapa kemungkinan jawaban. Perbedaannya ialah pada bentuk pilihan ganda asosiasi, kemungkinan jawaban benar satu, dua, tiga, atau empat. Tes semacam ini termasuk ke dalam bentuk tes kombinasi pilihan ganda yang terdiri atas batang tubuh soal diikuti oleh sejumlah kemungkinan jawaban, di antaranya satu atau lebih yang benar.
Ada empat kemungkinan cara menjawab berdasarkan analisa hubungan antar jawaban pada soal pilihan ganda asosiasi, antara lain sebagai berikut. Jika mahasiswa tahu pasti kemungkinan jawaban (4) salah, dan tahu pasti dua dari tiga kemungkinan jawaban lainnya, maka sudah dapat disimpulkan jawabannya yakni option a. Jika mahasiswa tahu pasti bahwa kemungkinan jawaban (2) dan (4) salah, maka sudah dapat disimpulkan bahwa jawabannya adalah b; atau jika yang diragukan pilihan jawaban (4) tetapi yakin tentang kemungkinan jawaban lainnya, maka jawaban b adalah kesimpulannya. Jika mahasiswa tahu pasti bahwa kemungkinan pilihan jawaban (1) salah, maka sudah dapat disimpulkan bahwa jawabannya adalah c, atau jika kemungkinan jawaban (1) dan (2) diragukan sementara kemungkinan jawaban (2) dan (4) diketahui maka kesimpulannya juga adalah c. jika siswa tahu pasti bahwa dua dari empat kemungkinan jawaban sementara yang lainnya diragukan maka dapat disimpulkan bahwa jawabannya adalah d.
Menurut Arikunto (2004), hal-hal yang perlu diperhatikan dalam tes pilihan ganda: (a) instruksi pengerjaannya harus jelas, dan bila dipandang perlu baik disertai contoh mengerjakannya; (b) dalam multiple choice test hanya ada “satu” jawaban yang benar. Jadi tidak mengenal tingkatan-tingkatan benar, misalnya benar nomor satu, benar nomor dua, dan sebagainya; (c) kalimat pokoknya hendaknya mencakup dan sesuai dengan rangkaian mana pun yang dapat dipilih; (d) kalimat pada tiap butir soal hendaknya sesingkat mungkin; (e) usahakan menghindari penggunaan bentuk negatif dalam kalimat pokoknya; (f) kalimat pokok dalam setiap butir soal, hendaknya tidak tergantung pada butir-butir soal lain; (g) gunakan kata-kata: “manakah jawaban paling baik”, “pilihlah satu yang pasti lebih baik dari yang lain”, bilamana terdapat lebih dari satu jawaban yang benar; (h) dilihat dari segi bahasanya, butir-butir soal jangan terlalu sukar; (i) tiap butir soal hendaknya hanya mengandung satu ide. Meskipun ide tersebut dapat kompleks; (j) bila dapat disusun urutan logis antar pilihan-pilihan, urutkanlah (misalnya: urutan tahun, urutan alphabet, dan sebagainya); (k) susunlah agar jawaban mana pun mempunyai kesesuaian tata bahasa dengan kalimat pokoknya; (l) alternatif yang disajikan hendaknya agak seragam dalam panjangnya, sifat uraiannya maupun taraf teknis; (m) alternatif-alternatif yang disajikan hendaknya agak bersifat homogen mengenai isinya dan bentuknya; (n) buatlah jumlah alternatif pilihan ganda sebanyak empat. Bilamana terdapat kesukaran, buatlah pilihan-pilihan tambahan untuk mencapai jumlah empat tersebut. Pilihan-pilihan tambahan hendaknya jangan terlalu gampang diterka karena bentuknya atau isi; dan (o) hindarkan pengulangan suara atau pengulangan kata pada kalimat pokok di alternatif-alternatifnya, karena anak akan cenderung memilih alternatif yang mengandung pengulangan tersebut. Hal ini disebabkan karena dapat diduga itulah jawaban yang benar.
- Soal Menjodohkan (Matching Test)
Dalam bentuk tes yang tradisional, soal menjodohkan adalah bentuk soal yang terdiri dari dua kelompok pernyataan. Kelompok pertama ditulis pada lajur sebelah kiri biasanya merupakan pernyataan soal atau pertanyaan sering juga disebut sebagai stimulus atau premis yang berupa kalimat. Kelompok kedua biasa disebut respon yang ditulis pada lajur sebelah kanan, biasanya merupakan pernyataan jawaban atau pernyataan respon berupa kata, bilangan, gambar, atau simbol. Peserta tes diminta untuk menjodohkan, atau memilih pasangan yang tepat bagi pernyataan yang ditulis pada stimulus yang terdapat di lajur sebelah kiri dengan respon yang terdapat pada lajur sebelah kanan.
Matching test dapat kita ganti dengan istilah mempertandingkann, mencocokkan, memasangkan, atau menjodohkan. Matching test terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai jawabnya yang tercantum dalam seri jawaban. Tugas murid adalah: mencari dan menempatkan jawaban-jawaban, sehingga sesuai atau cocok dengan pertanyaannya (Arikunto, 1998). Bentuk soal menjodohkan sangat baik untuk mengukur kemampuan peserta didik yang sangat sederhana, yaitu kemampuan untuk mengidentifikasi informasi berdasarkan hubungan yang sederhana, dan kemampuan mengidentifikasi kemampuan menghubungkan antara dua hal. Makin banyak hubungan antara premis dengan respon dapat dibuat, maka makin baik soal yang disajikan.
Athanasou dan Lamprianou (2002) menjelaskan keunggulan dan kelemahan bentuk soal menjodohkan. Keunggulannya adalah: (a) luasnya materi yang dapat dicakup; (b) relatif lebih mudah dibuat butir soal, khususnya jika dibandingkan dengan soal bentuk pilihan ganda; (c) ringkas dan ekonomis dilihat dari segi cara memberikan jawaban; dan (d) dapat dilakukan dengan mudah, cepat, dan mudah dalam pensekorannya. Sedangkan kelemahannya adalah: (a) adanya kecenderungan untuk mengukur kemampuan mengingat dan kurang tepat digunakan untuk mengukur kemampuan kognitif yang lebih tinggi; (b) sukarnya menjaga kehomogenan isi premis maupun respon khususnya ditinjau dari segi kesamaan kemampuan yang hendak diukur; dan (c) kemungkinan menebak dengan benar relatif tinggi, karena jumlah pernyataan soal (dalam lajur sebelah kiri) dengan pernyataan jawaban (dalam lajur sebelah kanan) tidak banyak berbeda.
Contoh:“Pasangkanlah pertanyaan yang ada pada lajur kiri dengan yang ada pada lajur kanan dengan cara menempatkan huruf yang terdapat di muka pernyataan lajur kiri pada titik-titik yang disediakan di lajur kanan.”
………………………….. |
|
Bentuk matching test ini dapat pula dipandang sebagai multiple choice berganda. Petunjuk-petunjuk yang perlu diperhatikan dalam menyusun tes bentuk matching ialah: (a) seri pertanyaan-pertanyaan dalam matching test hendaknya tidak lebih dari sepuluh soal (item). Sebab pertanyaan-pertanyaan yang banyak itu akan membingungkan murid. Juga kemungkinan akan mengurangi homogenitas antara item-item itu. Jika itemnya cukup banyak, lebih baik dijadikan dua seri; (b) jumlah jawaban yang harus dipilih, harus lebih banyak daripada jumlah soalnya (lebih kurang 1 ½ kali). Dengan demikian murid dihadapkan kepada banyak pilihan, yang semuanya mempunyai kemungkinan benarnya, sehingga murid terpaksa lebih mempergunakan pikirannya; dan (c) antara item-item yang tergabung dalam satu seri matching test harus merupakan pengertian-pengertian yang benar-benar homogen.
Misalnya:
Di sebelah kiri terdapat nama kota. Di sebelah kanan terdapat nama provinsi. Coba isi titik-titik yang tersedia di sebelah kiri dengan huruf di depan nama provinsi di mana kota tersebut berada.
|
|
Cara mengolah skor: dihitung
Artinya skor terakhir dihitung jawaban yang benar saja.
- Tes Isian (CompletionTest)
Completion test biasa kita sebut dengan istilah tes isian, tes menyempurnakan, atau tes melengkapi. Completion test terdiri atas kalimat-kalimat yang ada bagian-bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang harus diisi oleh murid ini adalah merupakan pengertian kita minta dari murid.
Contoh:
- Columbus menemukan Benua Amerika pada tahun ………..
- Air akan membeku pada suhu ……… derajat Fahrenheit.
Ada juga completion test yang tidak berbentuk kalimat-kalimat pendek seperti di atas, tetapi merupakan kalimat-kalimat berangkai dan memuat banyak isian.
Misalnya:
- Di mulut, makanan dikunyah dan dicampur dengan ………… (1) yang mengandung ……….. (2) berguna untuk menghancurkan ……….. (3) kemudian ditelan melalui ………… (4) masuk ke ………….. (5) Di sini dicampur lagi dengan …………. (6) …………. Dan seterusnya.
Jawaban-jawaban tidak perlu ditulis di tempat yang dikosongkan, sebab cara demikian akan menyukarkan pemeriksa. Tetapi sediakanlah tempat tersendiri dengan nomor urut ke bawah. Oleh karena itu dalam membuat soal, tempat-tempat isian harus diberi nomor seperti di atas.
Contoh tempat jawaban:
- …………………………..
- …………………………..
- …………………………..
- …………………………..
Dengan demikian akan mempermudah dan mempercepat waktu pemeriksaan. Perlu diperhatikan bahwa dalam menyusun soal-soal melengkapi, jangan lupa memberikan “kunci pembuka” untuk dapatnya soal-soal itu dikerjakan.
Misalnya:
………….. menemukan ……………… pada tahun …………………..
Soal di atas adalah tidak memberikan kunci pembuka. Oleh karena itu tidak dapat dikerjakan, atau dapat dikerjakan dengan berbagai macam jawaban. Tetapi dengan membutuhkan completion test, “Columbus” atapun “Edison” di bagian muka, maka menjadi tegaslah jawabannya.
Cara scoring: S=R (sama dengan bentuk matching)
Petunjuk penyusunan
Saran-saran dalam menyusun tes bentuk isian ini adalah sebagai berikut:
- Perlu selalu diingat bahwa kita tidak dapat merencanakan lelbih dari satu jawaban yang kelihatan logis.
- Jangan mengutip kalimat/pernyataan yang tertera pada buku/catatan.
- Diusahakan semua tempat kosong hendaknya sama panjang.
- Diusahakan hendaknya setiap pernyataan jangan mempunyai lebih dari satu tempat kosong.
- Jangan mulai dengan tempat kosong.
Misalnya:
Ibukota Indonesia adalah ………. (lebih baik).
…………………… adalah ibukota Indonesia (kurang baik).
Bagaimanakah digunakan tes subjektif?
Tes bentuk esai digunakan apabila:
- Kelompok yang akan tes kecil, dan tes itu tidak akan digunakan berulang-ulang.
- Tester (guru) ingin menggunakan berbagai cara untuk mengetahui kemampuan siswa dalam bentuk tertulis.
- Guru ingin mengetahui lebih banyak tentang sikap-sikap siswa daripada hasil yang telah dicapai.
- Memiliki waktu yang cukup banyak untuk menyusun tes.
Bilamanakah digunakan tes objektif?
- Kelompok yang akan dites banyak dan tesnya akan digunakan lagi berkali-kali.
- Skor yang diperoleh diperkirakan akan dapat dipercaya (mempunyai reliab ilitas yang tinggi).
- Guru lebih mampu menyusun tes bentuk objektif daripada tes bentuk esai (uraian).
- Hanya mempunyai waktu sedikit untuk koreksi dibandingkan dengan waktu yang digunakan untuk menyusun tes.
Pada umumnya, guru seyogianya menggunakan dua macam bentuk tes ini dalam perbandingan 3 : 1, yaitu 3 bagian untuk tes objektif, dan 1 bagian untuk tes uraian.
- Soal Jawaban Singkat
Soal bentuk jawaban singkat adalah yang menuntut peserta tes untuk memberikan jawaban singkat, berupa kata prase, nama tempat, nama tokoh, lambang, atau kalimat yang sudah pasti. Bentuk soal jawaban singkat baik untuk mengukur kemampuan peserta didik yang sangat sederhana. Beberapa kemampuan atau indikator berikut ini menunjukan penggunaan bentuk soal jawaban singkat yang sering digunakan guru kelas.
Kemampuan menyebutkan istilah
- Garis apakah yang menghubungkan daerah yang sama tekanannya pada peta cuaca?(isobar)
- Satuan apakah yang dipergunakan untuk menyatakan panjang sebuah benda?(meter atau centimeter)
- Dinamakan apakah perpindahan penduduk dari kota besar kedesa?(transmigrasi)
Kemampuan menyebutkan fakta
- Berapa tahun sekali anggota DPR dipilih?(5)
- Dibagi berapa bagian waktukah wilayah Indonesia?
Kemampuan menyebutkan prinsip
- Jika temperatur gas dibuat tetap sementara tekanannya dinaikkan, apa yang akan terjadi pada volume gas? (menurun)
- Jika beda potensial yang menghubungkan suatu rangkaian didua kalikan sedangkan hambatannya tetap, berapa kali naiknya arus listrik pada rangkaian tersebut? (2 kali)
- Jika gaya yang bekerja pada sebuah benda dinaikan sendangkan massa benda tidak berubah, apa yang akan terjadi pada percepatan benda tersebut? (meningkat)
Kemampuan menyebutkan metode atau prosedur
- Alat apakah yang digunakan untuk menentukan sebuah benda bermuatan negatif atau positif?(elektroskop)
- Alat apakah yang digunakan untuk mengukur suhu suatu benda?(termometer)
- Alat apakah yang digunakan untuk melihat benda-benda besar tetapi jauh jaraknya?(teleskop)
Kemampuan menginterprestasi data sederhana
- Berapa huruf n dalam kata kunci Indonesia?(2)
- Dalam bilangan 653, berapa nilai bilangan 6?(600)
- Berapa besarnya sudut segitiga?(600)
- Jika pesawat terbang pergi kearah utara lalu memutar 90o kekiri, kemanakah arah pesawat sekarang?(Timur)
Bentuk soal jawaban singkat seperti ditunjukan pada contoh kemampuan memanipulasi simbol matematika dan melengkapi persamaan merupakan kemampuan yang cukup tinggi. Untuk memeperoleh jawaban matematika dan melengkapi bilangan agar persamaan itu seimbang. Terkadang para pengembang soal berusaha untuk menggunakan kemampuan yang lebih tinggi. Namun demikian, dengan menggunakan soal jawaban singkat keinginan tersebut jarang sekali tercapai. Hal ini karena adanya keterbatasan bentuk soal jawaban singkat, yang lebih mengukur kemampuan mengemukakan fakta ketimbang problem solving misalnya.
Rangkuman
Tes merupakan himpunan pertanyaan yang harus dijawab, harus ditanggapi, atau tugas yang harus dilaksanakan oleh orang yang dites. Penyusunan dan pengembangan tes dimaksudkan untuk memperoleh tes yang valid, sehingga hasil ukurnya dapat mencerminkan secara tepat hasil belajar atau prestasi belajar yang dicapai oleh masing-masing individu peserta tes setelah mengikuti kegiatan belajar mengajar. Dilihat dari tujuan dan fungsinya tes dibagi menjadi empat, yaitu: (a) tes penempatan; (b) tes formatif; (c) tes diagnosis; dan (d) tes sumatif. Tes objektif yang sering digunakan dalam evaluasi pembelajaran adalah: (a) tes benar-salah; (b) tes pilihan ganda: tes pilihan ganda biasa dan tes pilihan ganda asosiasi; (c) soal menjodohkan; dan (d) tes isian.
Daftar Pustaka
Arikunto, Suharsimi, 2002. Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara.
Arikunto, Suharsimi. 1998. Penilaian Program Pendidikan. Jakarta: Proyek Pengembangan LPTK Ditjen Dikti Depdikbud.
Althanasou, J. dan Lamprianou, I. 2002. A Teacher’s Guide to Assessment. Australia: Social Science Press.
Cronbach, Lee J. 1984. Essentials of Psychological Testing. New York: Harper and Row Publisher.
Daryanto. 2001. Dasar-Dasar Evaluasi Pendidikan, Surabaya: Usaha Nasional.
Djaali, Pudji Mulyono, 2004. Pengukuran dalam Bidang Pendidikan, Jakarta: Program Pascasarjana Universitas Negeri Jakarta.
Gronlund, Norman E dan Linn, Robert L. 1985. Measurement and Evaluation in Teaching. New York: McMillan Publishing Company.
Linn, R.L., dan Gronlund, N.E. 1995. Measurement and Assessment in Teaching. New Jersey: Prentice Hall.
Mukhtar, Samsu. 2003. Evaluasi yang Sukses: Pedoman Mengukur Kinerja Pembelajaran, Jakarta: Sasama Mitra Suksesa.
Novrida, Lizza. 2010. “Pengaruh Strategi Pembelajaran dan Bentuk Tes Formatif Terhadap Hasil Belajar Matematika dengan Mengontrol Inteligensi Siswa” Jurnal Pendidikan dan Kebudayaan, Vol.16. Oktober 2010.
Nitko, Anthony J. 1990. “Equating Methods and Sampling Designs.” Applied Measurement in Education 3: p. 265.
______. 1996. Educational Test and Measurement An Introduction. New York: Harcourt Brace Jovanovich.
Osterlind, S.J. 1999. Test Item Bias. Beverly Hills: Sage Publication Inc.
Surapranata, Sumarna, 2004. Panduan Penulisan Tes Tertulis, Bandung: Remaja Rosdakarya.
Sudijono, Anas, 2003. Pengantar Evaluasi Pendidikan. Rajawali Press: Jakarta.
Suryabrata, Sumardi, 2002. Pengembangan Alat Ukur Psikologis. Penerbit Andi: Yogyakarta.
Winkel, W.S, 2004. Psikologi Pengajaran. Yogyakarta: Media Abadi.
William Wiersma dan Stephen G. Jurs. 1990. Educational Measurement and Testing, Boston: Allyn and Bacon.
Kesuksesan bukan kunci kebahagiaan, kebahagiaanlah kunci kesuksesan.
Jika Anda mencintai apa yang Anda kerjakan, maka Anda akan meraih kesuksesan
Herman Cain



