RELIABILITAS INSTRUMEN TES

Tanggung jawab adalah hal yang menakutkan bagi sebagian besar orang, tetapi tanggung jawab

juga merupakan salah satu hal yang ada di dunia ini yang membuat kita maju dan berkembang.

Frank Crane

Pembahasan Materi

Bab ini membahas tentang pengertian reliabilitas, reliabilitas tes hasil belajar, model umum reliabilitas, metode sederhana mengestimasi reliabilitas, metode tes ulang, metode paralel, metode belah dua, persamaan produk momen, persamaan Flanagan, persamaan Rulon, macam-macam koefisien reliabilitas, dan standar kesalahan pengukuran.

Pendahuluan

Pengembangan instrumen pengukuran dalam bidang psikologi dan pendidikan banyak mengasumsikan penggunaan pengukuran yang bersifat unidimensi, yang secara konseptual dirumuskan bahwa ada satu jenis faktor abilitas, kepribadian, sifat, maupun sikap yang diukur oleh satu instrumen pengukuran. Namun banyak penelitian menunjukkan bahwa asumsi unidimensi tersebut sulit dipenuhi dengan ditemukannya beberapa faktor baru yang turut dikur dalam satu instrumen. Dengan kata lain, instrumen psikologis dan pendidikan yang sering digunakan oleh peneliti cenderung bersifat multidimensi.

Tingginya kecenderungan instrumen pengukuran bersifat multidimensi disebabkan oleh beberapa hal, antara lain sebagai berikut (Widhiarso, 2009: 39): 1) karakteristik konstruk psikologi dan pendidikan; 2) adanya pelibatan aspek-aspek dalam penyusunan alat ukur; 3) jumlah butir di dalam instrument; 4) teknik penulisan butir instrument; dan 5) satuan pengukuran yang berbeda. Dapat disimpulkan bahwa pengukuran pendidikan, baik mengukur konstruk kemampuan maupun non kemampuan sangat rentan terhadap kemajemukan atribut yang diukur.

Hasil-hasil penelitian menunjukkan bahwa hasil analisis faktor terhadap pengukuran psikologi dan pendidikan menghasilkan faktor yang majemuk, misalnya: 1) dengan membandingkan indeks ketepatan model antara model efikasi diri satu faktor dan tiga faktor, Brouwers dan Tomic (2001) menemukan bahwa model tiga dimensi memiliki indeks ketepatan model yang lebih tinggi dibanding dengan satu dimensi; 2) Albo, et, al (2007) membandingkan model dimensi harga diri dan menemukan bahwa model empat dimensi lebih tepat menggambarkan harga diri dibanding satu dimensi; dan 3) Hwang, et, al (2000) menemukan enam dimensi dalam pengukuran dukungan sosial. Sebelum melakukan analisis untuk mengestimasi reliabilitas pengukuran yang dilakukan, peneliti diharapkan melakukan analisis faktor untuk mengidentifikasi berapa jumlah dimensi yang dihasilkan.

Reliabilitas InstrumenTes

Reliabilitas yang berasal dari kata reliability berarti sejauhmana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah kesalahan pengukuran. Kesalahan pengukuran sendiri menunjukkan sejauh mana inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan eror dalam pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.

Salah satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes tersebut harus mempunyai reliabilitas yang memadai. Dalam buku ini reliabilitas dibedakan atas dua macam, yaitu: (a) reliabilitas konsistensi tanggapan; dan (b) reliabilitas konsistensi gabungan item. Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes atau instrumen yaitu (Cronbach, 1984): (a) teknik test retest. Test retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang berbeda. Misalnya tes A diberikan kepada kelompok siswa K dalam waktu W1 dan W2. Kemudian skor siswa pada W1 dikorelasikan dengan skor siswa pada W2. Yang perlu diperhatikan di sini adalah jangan sampai hasil tes pada W2 dipengaruhi oleh tes pada W1, dan jangan sampai W2 terjadi pada keadaan obyek ukur sudah berubah dari W1. Kedua hal inilah yang merupakan kesulitan dalam penerapan test retest; (b) teknik belah dua.

Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok item yang setara pada saat yang sama. Karena setiap kelompok item merupakam separuh dari seluruh tes, maka biasanya kelompok item pertama diambil dari item-item tes yang bernomor ganjil, sedangkan kelompok item yang ke dua diambil dari item-item tes yang bernomor genap. Perlu diketahui bahwa reliabilitas dengan teknik ini sangat relatif, karena reliabilitas akan tergantung pada cara penomoran dan pengelompokan item yang diambil; dan (c) bentuk ekivalen. Di sini pengukuran dilakukan dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek ukur tes dalam waktu yang bersamaan. Skor dari kedua kelompok item tes tersebut dikorelasikan untuk mendapatkan reliabilitas tes.

Model Umum Reliabilitas

Pengukuran yang baik tentunya akan ajeg membedakan kemampuan peserta didik. Misalnya saja Cemara lebih pintar daripada Melati, skor yang diperoleh Cemara mestinya lebih tinggi dibandingkan dengan Melati. Dalam kenyataannya, pengukuran kita tidak pernah sempurna. Teori reliabilitas dikembangkan untuk menentukan ketidakajegan tersebut. Setiap pengukuran, baik dalam sains maupun dalam penilaian kelas selalu mengandung kesalahan pengukuran. Pengukuran meteran dengan skala mm misalnya memiliki kesalahan pengukuran sebesar 0.01 mm. Pengukuran dengan skala cm memiliki kesalahan pengukuran sebesar 0.1 cm. Konsep dasar reliabilitas juga menggunakan kesalahan pengukuran tersebut.

Menurut Sumarna (2004) setiap skor yang diperoleh seorang peserta tes terdiri atas tiga hal; skor amatan yang sering pula disebut sebagai skor perolehan (observed test score), skor yang sebenarnya (true score) yaitu skor yang sesuai dengan kemampuan peserta tes yang sebenarnya, dan kesalahan pengukuran, yaitu faktor-faktor yang mempengaruhi ketidakajegan suatu pengukuran adalah situasi yang mempengaruhi peroleh skor. Secara umum konsep dasar tersebut dinyatakan dalam persamaan matematis sebagai berikut:

Skor perolehan = Skor + Kesalahan pengukuran sebenarnya

Kesalahan pengukuran merupakan selisih antara skor amatan (perolehan) dengan skor sebenarnya. Atas dasar konsep ini reliabilitas tes dikembangan. Berbagai hasil telah diturunkan dari teori ini yang pada akhirnya mengandung beberapa implikasi terhadap pengukuran (penilaian berbasis kelas khususnya). Tabel 1 seperti yang telah kita bahas menunjukkan sumber-sumber kesalahan perlehan skor yang boleh jadi memberikan kontribusi terhadap ketidakajegan skor. Teori reliabilitas ditentukan berdasarkan varian antara skor perolehan yang merupakan penjumlahan dari varian skor sebenarnya dengan varian kesalahan pengukuran yaitu:

X2=T2+E2

Persamaan ini menunjukkan bahwa skor tes ditentukan oleh dua hal, yaitu variabilitas skor sebenarnya dan variabilitas kesalahan pengukuran. Jika kesalahan pengukuran itu memberikan kontribusi yang signifikan, maka tes menjadi tidak ajeg. Dengan kata lain, apabila varian kesalahan pengukuran relatif tidak berarti, maka pengukuran menjadi ajeg. Koefisien reliabilitas rxx menyajikan indeks relatif pengaruh skor sebenarnya dan skor kesalahan pengukuran terhadap skor yang diperoleh. Persamaan umum reliabilitas diturunkan dari perbandingan antara varian skor sebenarnya dengan varian skor perolehan:

rXX=T2X2 atau rXX=ST2SX2

rXX=T2T2+e2 atau rXX=ST2ST2–Se2

Metode Sederhana Mengestimasi Reliabilitas

Tujuan utama mengestimasi reliabilitas adalah untuk menentukan seberapa besar variabilitas yang terjadi akibat adanya kesalahan pengukuran dan seberapa besar variabilitas skor tes sebenarnya. Menurut teori klasik, sebagaimana telah diuraikan di atas, reliabilitas dihubungkan dengan pengertian adanya ketepatan suatu tes dalam pengukurannya. Nunnaly (1970), Allen dan Yen (1979), dan Anastasi (1986) menyatakan bahwa reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari satu pengukuran ke pengukuran lainnya. Jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi.

Reliabilitas memiliki dua keajegan. Keajegan yang pertama adalah keajegan internal, yakni tingkat sejauhmana butir soal itu homogen baik dari segi tingkat kesukaran maupun bentuk soalnya. Keajegan yang kedua yaitu keajegan eksternal yakni tingkat sejauhmana skor dihasilkan tetap sama sepanjang kemampuan orang yang diukur belum berubah. Perbedaan skor dari suatu pengukuran ke pengukuran lainnya dapat saja terjadi. Menurut Allen dan Yen (1979), perbedaan skor dari satu pengukuran ke pengukuran lain ini terjadi karena adanya standard error of measurement atau standar kesalahan pengukuran.

Oleh karena itu koefisien reliabilitas harus benar-benar diperhitungkan lebih dahulu standar kesalahan pengukurannya itu. Untuk itu dalam pengukuran perlu diidentifikasi sumber-sumber utama yang menyebabkan terjadinya kesalahan pengukuran tersebut. Nunnaly (1981) menyebutkan bahwa sumber kesalahan pengukuran itu antara lain: (a) variasi dalam tes itu sendiri; (b) struktur sampel yang dipilih; dan (c) variasi di antara tes yang sedang digunakan. Menurut Crocker dan Algina (1986) sumber utama kesalahan pengukuran disebabkan oleh: (a) perubahan dalam kelebihan waktu yang diuji; (b) isi bentuk ke bentuk; dan (c) sampel isi atau soal yang cacat. Sumber kesalahan pengukuran bisa juga terjadi karena pengaruh teknik pemilihan sampel dan situasi yang ada pada masing-masing individu yang dijadikan sampel.

Perbedaan pengertian reliabilitas sangat bergantung kepada bagaimana indeks reliabilitas dihitung. Paling tidak terdapat empat konsep reliabilitas yaitu: (a) paralel atau ekuivalen; (b) test-retest atau stabilitas; (c) split-half atau belah dua; dan (d) interval consistency. Sebagian orang berpendapat bahwa metode keajegan internal (internal consistency) sehingga pembagian metode menjadi tiga bagian yaitu: (a) ekuivalen; (b) stabilitas; dan (c) internal consistency. Kedua teknik ini pada prinsipnya sama. Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes dikatakan memiliki reliabilitas yang tinggi atau terdapat korelasi yang tinggi antara hasil tes pertama dengan hasil tes kedua. Kalau antara hasil tes pertama dan kedua tidak terdapat hubungan atau hubungannya rendah, maka tes itu dikatakan tidak reliabel (Sudjana, 2001).

Besar kecilnya reliabilitas suatu tes ditentukan oleh besar kecilnya nilai korelasi hasil tes yang dinamakan indeks reliabilitas. Untuk mengestimasi reliabilitas banyak formula yang dapat digunakan. Crocker dan Algina (1986) memberikan pendekatan untuk mengestimasi reliabilitas dengan memperhatikan sumber kesalahan utama melalui penggunaan koefisien reliabilitas, ekuivalensi, dan keajegan internal. Guilford (1954) memberikan beberapa modifikasi yang dilakukan oleh Tucker untuk memperbaiki dan menyederhanakan ketidakakuratan formula Kuder-Richardson dan penggunaan analisis varian serta formula khusus. Pada umumnya untuk menentukan estimasi reliabilitas khususnya dalam bidang pengukuran prestasi belajar digunakan internal keajegan seperti formula Cronbach alpha ataupun Kuder-Richardson. Akan tetapi dalam prakteknya penggunaan formula itu memungkinkan adanya usaha-usaha tertentu untuk meninggikan koefisien reliabilitasnya dengan cara mengubah pola susunan skor, sehingga untuk menghindari hal itu maka penggunaan analisis varian lebih dapat dipertanggungjawabkan.

Koefisien reliabilitas soal pilihan ganda lebih mudah dimanfaatkan dalam pengambilan keputusan prestasi belajar. Gronlund (1985) menyebutkan bahwa untuk pengambilan keputusan individu, koefisien reliabilitas harus tinggi. Tinggi rendahnya koefisien reliabilitas dipengaruhi oleh beberapa faktor. Crocker dan Algina (986) menyebutkan bahwa faktor itu antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. Menurut Alen dan Yen (1979) dan Crocker dan Algina (1986) tingkat kesukaran itu memegang peranan yang paling dominan. Hasil penelitian Aiken et. al (1978) menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan yang paling besar pada koefisien reliabilitas.

Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar pula reliabilitas tes tersebut. Sebaliknya, semakin rendah tingkat kesukaran suatu soal semakin kecil pula reliabilitasnya. Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang akan diujikan kepada mereka. Alen dan Yen (1979), Nunnally (1981) dan Gronlund (1985) menyatakan bahwa penambahan panjang tes akan menaikkan koefisien reliabilitas sepanjang soal yang digunakan untuk menambah tes itu memiliki kualitas yang sama baik dengan soal-soal lainnya.

Metode Tes Ulang (Test-Retest Method)

Metode tes ulang atau test-retest method sering pula dinamakan metode stabilitas merupakan pendekatan yang paling tua yang digunakan untuk mengestimasi reliabilitas. Pendekatan stabilitas sering pula dinamakan single-test-double-trial method. Seperangkat tes diadministrasikan pada sekelompok subjek, kemudian setelah jeda waktu tertentu seperangkat tes tersebut diadministrasikan ulang pada sekelompok subjek yang sama. Inilah teknik pengambilan data guna mengukur reliabilitas berdasarkan metode tes ulang. Ketika sebuah tes diberikan dua kali, tentunya perbedaan antara skor tes pertama dengan skor tes kedua terjadi hanya karena adanya kesalahan pengukuran. Sebagai gambaran, apabila kita mengukur panjang sebuah meja, lalu seminggu kemudian panjang meja tersebut diukur kembali, perbedaan panjang yang terjadi sesungguhnya karena kesalahan pengukuran. Tentu saja, argument semacam ini agak kurang berlaku untuk hal-hal psikologis seperti mengukur kemampuan bahasa Inggris, IQ, atau kemampuan lainnya (Wahidmurni, 2010).

Metode tersebut paling tepat diterapkan pada instrumen yang mengukur trait yang bersifat stabil di antara dua administrasi tes (misalnya nilai-nilai kerja dan kepribadian). Estimasi reliabilitas diperoleh dengan cara menghitung korelasi antara skor hasil administrasi pertama (X1) dan skor hasil administrasi kedua (X2), yang biasanya ditulis dengan r12. Tipe reliabilitas yang diperoleh dengan cara ini disebut dengan koefisien stabilitas, karena besarnya r12 merefleksikan sejauh mana stabilitas posisi masing-masing subjek, relatif pada kelompok tesnya, pada dua periode administrasi tes.

Faktor-faktor yang mempengaruhi perbedaan antara skor pertama dengan skor kedua, yaitu: (a) karakteristik yang diukur telah berubah dari tes pertama ke tes kedua. Sebagai contoh misalnya tes kemampuan membaca, menulis, dan berhitung kelas III SD diadakan pada bulan Agustus. Tes kedua, yaitu tes yang sama, diberikan kepada peserta didik yang sama pada bulan Oktober. Kita mengharapkan terdapat perubahan kemampuan membaca, menulis, dan berhitung pada periode dua bulan tersebut. Indeks reliabilitas yang rendah kita harapkan sebagai akibat perubahan tersebut; (b) pengalaman peserta didik dalam mengambil tes yang sama akan cukup berpengaruh terhadap perolehan skor sebenarnya. Hal ini dinamakan sebagai reactivity. Sebagai contoh misalnya peserta didik yang mengikuti ujian akhir nasional bahasa Indonesia, lalu ia memperoleh skor 3.9. Menurut standar kelulusan tahun 2004, ia tidak lulus dan harus ikut ujian ulangan. Apabila soal yang diberikan pada ujian ulangan sama dengan ujian utama, maka dapat dipastikan bahwa skor yang diperoleh peserta didik akan meningkat. Peningkatan ini terjadi salah satu sebabnya karena ia telah berpengalaman melihat soal sebelumnya. Untuk mengatasi supaya hal ini tidak terjadi, biasanya soal yang digunakan pada ujian susulan berbeda dengan soal yang digunakan pada ujian utama, namun masih mengukur kemampuan yang sama; dan (c) kita harus memperhatikan apa yang disebut practice effect atau carry over effect yaitu pengaruh pengalaman atau ingatan siswa terhadap perolehan skor pada tes kedua. Peserta didik bisa saja tidak dapat menjawab tes pertama, tetapi mereka dapat menjawabpada tes kedua karena adanya faktor ingatan (mengingat soal atau materi) yang telah mereka lihat pada tes pertama.

Metode Tes Paralel (Alternative form Method)

Estimasi reliabilitas menggunakan metode tes parallel ditujukan untuk mengukur tingkat konsistensi skor antar form yang dapat dibandingkan pada sekelompok individu yang sama. Usaha ini dimulai dengan mengusahakan dua skor yang bersifat parallel. Untuk memperoleh sekor yang paralel, subjek idealnya dikenai instrumen yang paralel pula. Instrumen yang paralel dihasilkan dengan cara mendesain dua form yang mengukur trait yang sama. Metode ekuivalen sering pula dinamakan alternate-forms methods atau double test-double trial method. Metode ini berkaitan dengan penggunaan dua buah tes yang sama atau relatif sama kepada peserta didik yang sama. Kesamaan yang dimaksud pada tes adalah kesamaan-kesamaan tujuan, tingkat kesukaran, dan susunan bahasa.

Metode ekuivalen atau paralel digunakan untuk mengatasi kelemahan yang terjadi pada metode tes ulang. Ketika dua tes yang digunakan ternyata berbeda, maka faktor carry over effect tidak menjadi masalah lagi, walaupun bisa saja faktor mengingat pada jawaban tes pertama sedikit berpengaruh pada tes kedua, khususnya apabila ditemukan soal yang benar-benar mirip atau bahkan sama. Pengaruh reaktivitas sebagaimana pada tes ulang juga kurang ditemukan pada bentuk ini sekalipun pengaruh tes pertama mungkin saja ada pada tes kedua. Namun sekali lagi, hal itu akan terjadi karena kemungkinan adanya soal-soal yang mirip sehingga peserta tes akan mudah mengingat jawaban tanpa memikirkannya terlebih dahulu.

Sekalipun bentuk paralel ini dapat mengatasi hampir semua kelemahan metode tes ulang, namun demikian masih saja memiliki beberapa kelemahan. Penggunaan tes paralel lebih mahal dant idak praktis dibandingkan dengan metode tes ulang. Kelemahan berikutnya adalah sangat sukar membuat dua buah tes yang benar-benar homogen. Hal yang paling utama adalah tidak adanya jaminan pakah kedua tes yang digunakan benar-benar mengukur hal yang sama. Dengan demikian, dua tes yang dirancang kurang baik akan menghasilkan reliabilitas yang rendah (Surapranata, 2004).

Kesulitan dalam metode ini adalah mengembangkan 2 form yang bersifat paralel tersebut, terutama pada tes yang mengukur atribut kepribadian. Di dalam praktek, sangat sulit mengembangkan dua form yang betul-betul paralel. Oleh karena itu metode ini jarang digunakan dalam tes yang mengukur kepribadian. Berkaitan dengan hal ini para ahli (Dimitrov, 2002; Nunnally, 1981) merekomendasikan untuk menerapkan administrasi tes pada dua form tersebut dengan cara: (a) form 1 diadministrasikan pada sekelompok subjek; (b) form 2 diadministrasikan pada hari yang sama untuk setengah kelompok subjek; (c) form 2 diadministrasikan dengan jeda waktu dua minggu dari administrasi form 1 untuk setengah kelompok subjek sisanya; dan (d) mengumpulkan skor form 1 dan form 2 di atas kemudian menghitung korelasinya.

Belah Dua (Split Half Methods)

Metode ini merupakan metode yang sangat sederhana yaitu: (a) menyelenggarakan satu kali tes; (b) membagi tes tersebut menjadi dua bagian yang sama (sama banyak soalnya); dan (c) mengkorelasikan skor kedua belahan ini untuk mengestimasi reliabilitas tes (Surapranata, 2004). Metode belah dua dapat mengatasi semua kelemahan yang terdapat pada metode tes ulang dan tes paralel. Metode ini memungkinkan mengestimasi reliabilitas tanpa harus menyelenggarakan tes dua kali. Dengan demikian beberapa kelamahan seperti carry-over effect, reactivity effect, dan khususnya pengaruh waktu terhadap peroleh skor sebenarnya dapat diminimalisasi. Dengan demikian ketidakajegan peroleh skor bukan karena penyelenggaraan tes tetapi karena dalam merespon tes itu sendiri.

Terdapat berbagai macam cara membagi dua sua suatu tes. Sebagai contoh 40 soal bahasa Indonesia dibagi menjadi dua bagian. Bagian pertama terdiri atas soal nomor 1 sampai dengan nomor 20. Bagian kedua terdiri atas soal nomor 21 sampai dengan nomor 40. Mungkin saja, skor pada belahan pertama sangat berbeda dengan skor pada belahan kedua, sehingga kedua belahan ini menghasilkan reliabilitas yang sangat rendah. Misalnya saja soal bahasa Indonesia nomor-nomor awal merupakan soal yang relatif mudah dibandingkan nomor-nomor akhir. Hal lainnya mungkin saja peserta tes mengalami kelamahan ketika mengerjakan soal-soal belahan kedua.

Persamaan produk momen

Tabel 16.1 berikut ini dapat digunakan untuk menentukan reliabilitas belah dua. Dari sepuluh soal yang disajikan, pembagian dapat dilakukan dengan cara membagi dua yaitu bagian awal dan bagian akhir.

Tabel 16.1. Perhitungan Reliabilitas Awal dan Akhir

No.	Nomor soal awal						Nomor soal akhir						X2	Y2	XY
No.	1	2	3	4	5	X	6	7	8	9	10	Y	X2	Y2	XY
1	1	1	1	1	1	5	1	1	1	0	0	3	25	9	15
2	1	1	1	1	1	5	1	1	1	0	0	3	25	9	15
3	1	1	1	1	1	5	1	1	1	0	0	3	25	9	15
4	1	1	1	1	0	4	1	1	1	0	0	3	16	9	12
5	1	1	1	1	0	4	1	1	1	0	0	3	16	9	12
6	1	1	1	1	0	4	1	1	1	0	0	3	16	9	12
7	1	1	1	1	0	4	1	1	1	0	0	3	16	9	12
8	1	1	1	1	0	4	1	1	1	0	0	3	16	9	12
9	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
10	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
11	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
12	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
13	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
14	1	1	1	1	0	4	1	1	0	0	0	2	16	4	8
15	1	1	1	1	0	4	1	0	0	0	0	1	16	1	4
16	1	1	1	1	0	4	1	0	0	0	0	1	16	1	4
17	1	1	1	1	0	4	1	0	0	0	0	1	16	1	4
18	1	1	1	1	0	4	1	0	0	0	0	1	16	1	4
19	1	0	1	0	1	3	0	0	1	1	0	2	9	4	6
20	1	0	1	0	1	3	0	0	1	1	0	2	9	4	6
21	1	1	0	1	1	4	0	0	0	1	0	1	16	1	4
22	1	0	1	0	1	3	0	0	1	1	0	2	9	4	6
23	1	0	1	0	1	3	0	0	1	1	0	2	9	4	6
24	1	0	0	0	1	2	0	0	1	1	0	2	4	4	4
25	1	0	0	0	1	2	0	0	1	1	0	2	4	4	4
26	1	0	0	0	1	2	0	0	1	1	0	2	4	4	4
27	1	0	0	1	1	3	0	0	0	1	0	1	9	1	3
28	1	0	1	0	1	3	0	0	0	1	0	1	9	1	3
29	1	0	0	0	0	1	0	1	1	1	0	3	1	9	3
30	1	0	0	0	1	2	0	0	0	1	0	1	4	1	2
31	1	0	0	0	1	2	0	0	0	1	0	1	4	1	2
32	1	0	0	0	1	2	0	0	0	1	0	1	4	1	2
33	1	0	0	0	1	2	0	0	0	1	0	1	4	1	2
34	1	0	0	0	0	1	0	0	0	1	0	1	1	1	1
35	1	0	0	0	0	1	0	0	0	1	0	1	1	1	1
36	1	0	0	0	0	1	0	0	0	1	0	1	1	1	1

Bagian awal yang dimaksud pada tabel 8.1 adalah lima soal belahan pertama (1, 2, 3, 4 dan 5) dan bagian akhir adalah lima soal belahan kedua (6, 7, 8, 9 dan 10). Untuk mengestimasi reliabilitas, dilakukan dengan mengikuti beberapa langkah berikut ini.

Menentukan jumlah skor total dari soal-soal bagian awal (1, 2, 3, 4, dan 5)

∑Xt= Jumlah skor total bagian awal

∑Xt=109

Menentukan jumlah skor total dari soal-soal bagian akhir (2, 4, 6, 8, dan 10).

∑Yt= Jumlah skor total akhir ∑Yt=73

Menentukan kuadrat jumlah skor total dari soal-soal bagian awal (1, 2, 3, 4, dan 5).

∑Xt2= Kuadrat dari jumlah skor total awal

∑Xt2=345

Menentukan kuadrat jumlah skor total dari soal-soal bagian akhir (6, 7, 8, 9 dan 10).

∑Yt2= Kuadrat dari jumlah skor total akhir

∑Yt2=231

Menentukan jumlah perkalian skor bagian awal (X) dengan skor bagian akhir Y.

∑XY=223

Menghitung nilai reliabilitas

r=N xy–x(y) Nx2–x2N y2–y2

r=36223–1097336345-109236231-732 = 0.449

Reliabilitas pada langkah ke enam baru merupakan reliabilitas setengah bagian tes. Untuk menentukan reliabilitas tes sesungguhnya digunakan persamaan:

r11=2r1+r =20.4491+0.449 = 0.6206

Persamaan Flanagan

Persamaan lain yang dapat digunakan untuk menentukan reliabilitas belah dua adalah persamaan Flanagan yaitu:

r11=21-S12+S22St2

r11= reliabilitas tes S12= Varian belahan pertama

S22= Varian belahan kedua ST2= Varian total

Varian dapat ditentukan dengan persamaan:

s2=X2–∑X2NN

Untuk mencari reliabilitas dengan persamaan Flanagan, dapat digunakan tabel 8.2 berikut ini.

Tabel 16.2. Perhitungan Reliabilitas Awal dan Akhir Persamaan Flanagan

No	Nomor soal										Total		Awal	Akhir	Selisih
No	1	2	3	4	5	6	7	8	9	10	Xt	Xt2	X1	X2	d	d2
1	1	1	1	1	1	1	1	1	0	0	8	64	5	3	2	4
2	1	1	1	1	1	1	1	1	0	0	8	64	5	3	2	4
3	1	1	1	1	1	1	1	1	0	0	8	64	5	3	2	4
4	1	1	1	1	0	1	1	1	0	0	7	49	4	3	1	1
5	1	1	1	1	0	1	1	1	0	0	7	49	4	3	1	1
6	1	1	1	1	0	1	1	1	0	0	7	49	4	3	1	1
7	1	1	1	1	0	1	1	1	0	0	7	49	4	3	1	1
8	1	1	1	1	0	1	1	1	0	0	7	49	4	3	1	1
9	1	1	1	1	0	1	1	0	0	0	6	36	4	2	2	4
10	1	1	1	1	0	1	1	0	0	0	6	36	4	2	2	4
11	1	1	1	1	0	1	1	0	0	0	6	36	4	2	2	4
12	1	1	1	1	0	1	1	0	0	0	6	36	4	2	2	4
13	1	1	1	1	0	1	1	0	0	0	6	36	4	2	2	4
14	1	1	1	1	0	1	1	0	0	0	6	36	4	1	2	4
15	1	1	1	1	0	1	0	0	0	0	5	25	4	1	3	9
16	1	1	1	1	0	1	0	0	0	0	5	25	4	1	3	9
17	1	1	1	1	0	1	0	0	0	0	5	25	4	1	3	9
18	1	1	1	1	0	1	0	0	0	0	5	25	4	1	3	9
19	1	0	1	0	1	0	0	1	1	0	5	25	3	2	1	1
20	1	0	1	0	1	0	0	1	1	0	5	25	3	2	1	1
21	1	1	0	1	1	0	0	0	1	0	5	25	4	1	3	9
22	1	0	1	0	1	0	0	1	1	0	5	25	3	2	1	1
23	1	0	1	0	1	0	0	1	1	0	5	25	3	2	1	1
24	1	0	0	0	1	0	0	1	1	0	4	16	2	2	0	0
25	1	0	0	0	1	0	0	1	1	0	4	16	2	2	0	0
26	1	0	0	0	1	0	0	1	1	0	4	16	2	2	0	0
27	1	0	0	1	1	0	0	0	1	0	4	16	3	1	2	4
28	1	0	1	0	1	0	0	0	1	0	4	16	3	1	2	4
29	1	0	0	0	0	0	1	1	1	0	4	16	1	3	2	4
30	1	0	0	0	1	0	0	0	1	0	3	9	2	1	1	1
31	1	0	0	0	1	0	0	0	1	0	3	9	2	1	1	1
32	1	0	0	0	1	0	0	0	1	0	3	9	2	1	1	1
33	1	0	0	0	1	0	0	0	1	0	3	9	2	1	1	1
34	1	0	0	0	0	0	0	0	1	0	2	4	1	1	0	0
35	1	0	0	0	0	0	0	0	1	0	2	4	1	1	0	0
36	1	0	0	0	0	0	0	0	1	0	2	4	1	1	0	0
										∑	182	1022	115	67	48	106

Langkah-langkah menentukan reliabilitas dengan persamaan Flanagan, yaitu:

Pilih ke sepuluh soal menjadi dua bagian. Bagian pertama adalah soal-soal nomor 1, 2, 3, 4 dan 5. Bagian kedua adalah nomor 6, 7, 8, 9, dan 10.
Tentukan jumlah skor dan kuadrat skor masing-masing belahan:

∑Xt=182 ∑Xt2=1022 ∑X1=115 ∑X2=67 ∑X22=147

Menentukan jumlah varian total

St2=Xt2 –∑Xt2NN=1042-18223636=1022-920.11136=2.830

Menentukan jumlah varian belahan pertama (soal 1, 2, 3, 4, dan 5).

S12=X12 –∑X12NN=417-11523636=417-367.361136=1.3789

Menentukan jumlah varian belahan kedua (soal 6, 7, 8, 9, 10)

S22=X22 –∑X22NN=147-6723636=147-124.694436=0.6196

Menentukan reliabilitas dengan memasukkan angka-angka yang diperoleh pada langkah ketiga sampai kelima.

r11=21-S12+S22St2=21-1.3789+0.61962.830=0.5877

Persamaan Rulon

Berangkat dari asumsi paralelisme dalam tes yang memiliki form lebih dari satu, Rulon (1939, dalam Crocker dan Algina, 1986) berpendapat bahwa variansi perbedaan skor merupakan estimasi variansi error. Oleh karena itu Rulon menawarkan persamaan guna memperoleh estimasi reliabilitas dengan persamaan berikut: r11=1-Sd2St2

r11= reliabilitas tes, St2= varian beda. d = perbedaan skor belahan pertama dan kedua

St2= varian total

Tabel 16.3. Perhitungan Reliabilitas Menggunakan Persamaan Rulon

No.	Nomor soal										Skor Total	Deviasi dari mean (x)	Deviasi dari mean kuadrat (x)
	1	2	3	4	5	6	7	8	9	10	Skor Total	Deviasi dari mean (x)	Deviasi dari mean kuadrat (x)
(1)	(2)	(3)	(4)	(5)	(6)	(7)	(8)	(9)	(10)	(11)	(12)	(13)	(14)
1	1	1	1	1	1	1	1	1	0	0	8	2.944	8.670
2	1	1	1	1	1	1	1	1	0	0	8	2.944	8.670
3	1	1	1	1	1	1	1	1	0	0	8	2.944	8.670
4	1	1	1	1	0	1	1	1	0	0	7	1.944	3.781
5	1	1	1	1	0	1	1	1	0	0	7	1.944	3.781
6	1	1	1	1	0	1	1	1	0	0	7	1.944	3.781
7	1	1	1	1	0	1	1	1	0	0	7	1.944	3.781
8	1	1	1	1	0	1	1	1	0	0	7	1.944	3.781
9	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
10	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
11	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
12	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
13	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
14	1	1	1	1	0	1	1	0	0	0	6	0.944	0.892
15	1	1	1	1	0	1	0	0	0	0	5	-0.056	0.003
16	1	1	1	1	0	1	0	0	0	0	5	-0.056	0.003
17	1	1	1	1	0	1	0	0	0	0	5	-0.056	0.003
18	1	1	1	1	0	1	0	0	0	0	5	-0.056	0.003
19	1	0	1	0	1	0	0	1	1	0	5	-0.056	0.003
20	1	0	1	0	1	0	0	1	1	0	5	-0.056	0.003
21	1	1	0	1	1	0	0	0	1	0	5	-0.056	0.003
22	1	0	1	0	1	0	0	1	1	0	5	-0.056	0.003
23	1	0	1	0	1	0	0	1	1	0	5	-0.056	0.003
24	1	0	0	0	1	0	0	1	1	0	4	-1.056	1.114
25	1	0	0	0	1	0	0	1	1	0	4	-1.056	1.114
26	1	0	0	0	1	0	0	1	1	0	4	-1.056	1.114
27	1	0	0	1	1	0	0	0	1	0	4	-1.056	1.114
28	1	0	1	0	1	0	0	0	1	0	4	-1.056	1.114
29	1	0	0	0	0	0	1	1	1	0	4	-1.056	1.114
30	1	0	0	0	1	0	0	0	1	0	3	-2.056	4.225
31	1	0	0	0	1	0	0	0	1	0	3	-2.056	4.225
32	1	0	0	0	1	0	0	0	1	0	3	-2.056	4.225
33	1	0	0	0	1	0	0	0	1	0	3	-2.056	4.225
34	1	0	0	0	0	0	0	0	1	0	2	-3.056	9.336
35	1	0	0	0	0	0	0	0	1	0	2	-3.056	9.336
36	1	0	0	0	0	0	0	0	1	0	2	-3.056	9.336
	36	19	23	20	17	18	15	16	18	0	182	0.000	101.889
p	1.000	0.528	0.639	0.556	0.472	0.500	0.417	0.444	0.500	0.000	0.000
q	0.000	0.472	0.361	0.444	0.528	0.500	0.583	0.556	0.500	1.000
pq	0.000	0.249	0.231	0.247	0.249	0.250	0.243	0.247	0.250	0.000	1.966

Terdapat beberapa langkah yang harus ditempuh dalam perhitungan reliabilitas dengan menggunakan persamaan Rulon, yaitu:

Pilih ke sepuluh soal menjadi dua bagian. Bagian pertama adalah soal-soal nomor 1, 2, 3, 4, dan 5. Bagian kedua adalah soal-soal nomor 6, 7, 8, 9, dan 10.
Menentukan jumlah skor dan kuadrat skor total:

∑Xt=182

∑Xt2=1022

Menentukan jumlah selisih belahan pertama dan kedua d

∑d=48

∑d2=106

Menentukan jumlah varian perbedaan

s12=x12 –∑x12NN=1022-18223636=1022-920.11136=2.830

Menentukan jumlah varian perbedaan

sd2=xd2 –∑xd2NN=106-4823636=106-6436=1.1667

Menentukan reliabilitas dengan memasukkan angka-angka yang diperoleh pada langkah ketiga dan keempat.

r11=1-Sd2St2=1-1.16672.830=0.5878

Kita tidak dapat sembarangan membelah tes menjadi dua bagian. Terdapat beberapa syarat yang harus dipenuhi ketika kita menggunakan belah dua yaitu: (1) jumlah soal harus genap sehingga jumlah soal belah pertama dengan jumlah soal belah kedua sama banyaknya, (2) soal-soalnya harus homogen, sehingga apabila dibagi dua akan terdapat keseimbangan antara belahan pertama dengan belahan kedua.

Macam-macam Koefisien Reliabilitas

Banyak ditemukan bahwa peneliti secara sepihak menggunakan koefisien alpha dalam mengestimasi reliabilitas hasil pengukuran yang dilakukannya, padahal koefisien alpha menghendaki adanya beberapa asumsi, misalnya, antara satu butir dengan butir lainnya dalam satu instrumen diharapkan memiliki unit pengukuran dan kecermatan yang sama dalam menjelaskan skor murni. Banyak diantara peneliti tidak memahami bahwa koefisien alpha memiliki kriteria tertentu agar hasil estimasinya memiliki ketepatan yang akurat, misalnya terpenuhinya asumsi kesetaraan skor murni yang diungkap dan unidimensionalitas data. Jika koefisien alpha diaplikasikan pada pengukuran yang multidimensi, maka akan didapatkan hasil yang underestimate. Oleh karena itu, peneliti yang ingin mengidentifikasi reliabilitas pengukuran yang multidimensi, dianjurkan untuk menggunakan koefisien reliabilitas yang dapat mengakomodasi model tersebut. Beberapa jenis koefisien reliabilitas yang dapat diaplikasikan pada model pengukuran multidimensi adalah (Widhiarso, 2009: 42-45):

Koefisien Reliabilitas Alpha Berstrata. Koefisien alpha terstratifikasi ini diperkenalkan oleh Cronbach, Schoneman, dan McKie (1965) yang berguna untuk mengestimasi reliabilitas instrumen yang terdiri dari beberapa subtes. Koefisien alpha berstrata adalah pengukuran internal konsistensi dengan melibatkan komponen-komponen tes. Koefisien ini tepat digunakan pada kasus skor komposit multidimensi.
Koefisien Reliabilitas Komposit Mosier. Pada tahun 1943, Mosier mengembangkan sebuah koefisien reliabilitas yang dapat dikenakan pada pengukuran yang terstruktur. Pengukuran yang memiliki struktur multidimensi didapatkan dari instrumen yang memiliki komponen tes yang independen dengan komponen lainnya. Misalnya, tes bakat atau tes potensi akademik yang terdiri dari beberapa subtes. Koefisien ini dinamai reliabilitas skor komposit (reliability of composite score) yang mampu mengakomodasi perbedaan pembobotan pada tiap subtes.
Koefisien Reliabilitas Komposit Wang. Wang (1998) menyusun sebuah koefisien reliabilitas yang dapat digunakan untuk pengukuran yang bersifat multidimensi serta mampu mengakomodasi pembobotan masing-masing dimensi tersebut. Untuk menghitung reliabilitas komposit dari Wang diperlukan informasi mengenai reliabilitas masing-masing dimensi, pembobotan masing-masing dimensi, dan korelasi antar skor dimensi. Misalnya sebuah skala nilai kerja terdiri dari dua dimensi, yaitu pengembangan diri dan transendensi diri.
Koefisien Reliabilitas Komposit Raykov. Raykov dan Shrout (2002) yang menyusun koefisien reliabilitas ini mengatakan bahwa reliabilitas komposit adalah varian skor murni dalam kaitannya dengan varian tes. Sampai saat ini belum ada program komputer yang dapat secara langsung mengeluarkan hasil komputasi reliabilitas komposit. Untuk menghitungnya diperlukan pengoperasian sintaks yang cukup rumit pada program berbasis SEM antara lain EQS dan LISREL (Raykov & Shrout, 2002).
Koefisien Reliabilitas Komposit McDonald. McDonald (1981) mengembangkan sebuah koefisien yang kemudian diberi nama koefisien reliabilitas konstruk. Koefisien reliabilitas ini berbasis pada analisis faktor konfirmatori yang merupakan bagian dari menu SEM.

Standar Kesalahan Pengukuran

Ada dua aspek penting dalam reliabilitas, yaitu reliabilitas harga tengah (means) dan reliabilitas ukuran individual. Ini berkait dengan galat standar harga tengah dan galat standar pengukuran. Dalam kajian penelitian, galat standar harga tengah dan statistik-statistik yang berkaitan dengannya misalnya galat standar perbedaan antar harga tengah dan galat standar suatu koefisien korelasi merupakan yang lebih penting jika dibandingkan dengan galat standar pengukuran (Kerlinger, 2002).

Indeks reliabilitas menyajikan informasi yang sangat berguna untuk mengevaluasi tes. Untuk mengetahui indikasi adanya pengaruh skor sebenarnya dalam skor kesalahan, indeks reliabilitas dapat digunakan dengan mengestimasi seberapa besar skor berfluktuasi sebagai adanya kesalahan pengukuran. Sebuah tes yang memiliki indeks 0.90 tentunya lebih reliabel dibandingkan dengan tes yang memiliki indeks reliabilitas 0.8. Namun demikian, indeks reliabilitas tidak menyajikan secara tepat hasil pengukuran. Sebagai contoh hasil pengukuran tes intelegensi menunjukkan skor 110. Sekalipun koefisien reliabilitas yang diperoleh sangat tinggi, misalnya 0.93, kita boleh saja berpendapat bahwa skor tersebut lebih baik dibandingkan dengan perolehan skor 100, atau boleh juga kita berasumsi bahwa kelebihan skor 10 tersebut karena kesalahan pengukuran. Indeks reliabilitas harus juga memperhitungkan besarnya variabilitas yang terjadi. Untuk mengetahui secara nyata skor, harus diperhitungkan standar kesalahan pengukuran (standar error of measurement). Standar kesalahan pengukuran merupakan fungsi reliabilitas tes dan variabilitas skor dengan persamaan:

SEM=SX1-rXX

Standar error of measurement menyajikan ukuran variabilitas dalam skor sebagai dasar dari adanya kesalahan pengukuran. Sebagai contoh misalnya Hafidz yang dites IQ-nya adalah 105. Apabila tes tidak cukup reliabel, maka ketika dites beberapa kali, skor IQ-nya tidak akan 100. Mungkin saja skor yang ia peroleh kurang dari 105 di lain waktu skornya lebih tinggi dari 105. Apabila dilakukan berkali-kali, hasilnya akan seperti distribusi normal. Standar kesalahan pengukuran menunjukkan berapa besar variabilitas yang terjadi. Standar kesalahan pengukuran dapat digunakan untuk menentukan interval, seberapa besar skor yang diperoleh sudah akurat.

Tes yang terdiri atas soal-soal yang banyak akan lebih reliabel dibandingkan dengan tes yang terdiri atas soal yang sedikit. Sebagai contoh kita ambil dalam tes fisika untuk kenaikan kelas misalnya, terdiri atas 40 soal akan memiliki reliabilitas yang berbeda dengan tes yang terdiri atas 60 soal. Cara menentukan reliabilitas yang banyaknya soal berbeda dapat digunakan persamaan Spearman dan Brown sebagai berikut:

rn=nr1+n–1r

rn= indeks reliabilitas setelah ditambahkan soal

n = perkalian penambahan soal

r = indeks reliabilitas awal

Sebagai contoh pada suatu tes yang terdiri atas 40 soal fisika dan indeks reliabilitasnya 0.6 ditambah 20 soal fisika lainnya sehingga menjadi 60 soal. Berapakah indeks reliabilitas sekarang? Penambahan 20 soal pada 40 soal, maka panjang tes sekarang menjadi 60 soal. Panjang tes sekarang adalah 1.5 tes awal. Dengan menggunakan persamaan 3.1 di atas maka

rn=1.50.601+1.5-10.60

rn=0.692

Penambahan 20 butir soal pada tes awal yang memiliki indeks reliabilitas 0.60 mengakibatkan kenaikan indeks reliabilitas sebesar 0.692. Para ahli psikometri sepakat bahwa tidak selamanya penambahan panjang tes akan mengakibatkan penambahan indeks reliabilitas.

Rangkuman

Reliabilitas yang berasal dari kata reliability berarti sejauhmana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Reliabilitas dibedakan atas dua macam, yaitu: (a) reliabilitas konsistensi tanggapan; dan (b) reliabilitas konsistensi gabungan item. Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes atau instrumen yaitu: (a) teknik test retest; (b) teknik belah dua; dan (c) bentuk ekivalen atau metode tes paralel. Teknik belah dua dihitung dengan: (a) persamaan produk momen; (b) persamaan Flanagan; dan (c) persamaan Rulon.

Beberapa jenis koefisien reliabilitas yang dapat diaplikasikan pada model pengukuran multidimensi, yaitu: 1) Koefisien Reliabilitas Alpha Berstrata. 2. Koefisien Reliabilitas Komposit Mosier. 3. Koefisien Reliabilitas Komposit Wang. 4. Koefisien Reliabilitas Komposit Raykov. 5. Koefisien Reliabilitas Komposit McDonald. Ada dua aspek penting dalam reliabilitas, yaitu reliabilitas harga tengah (means) dan reliabilitas ukuran individual. Ini berkait dengan galat standar harga tengah dan galat standar pengukuran. Dalam kajian penelitian, galat standar harga tengah dan statistik-statistik yang berkaitan dengannya misalnya galat standar perbedaan antar harga tengah dan galat standar suatu koefisien korelasi merupakan yang lebih penting jika dibandingkan dengan galat standar pengukuran.

Daftar Pustaka

Allen, Mary J. dan Wendy M Yen. 1979. Introduction to Measurement Theory. California: Cole Publishing Company.

Aiken, Lewis R. 1994. Psychological Testing and Assessment. Boston: Allyn and Bacon.

Anastasi, Anne dan Susan Urbina. 1986. Psychological Testing. New Jersey: Prentice-Hall, Inc Company.

Albo, J.M., Nunez, J. L., Navarro, J.G., & Grijalvo, F. 2007. “The Rosenberg Self-Esteem Scale: Translation and Validation in University Student.” The Spanish Journal of Psychology, Vol. 10, No. 2, pp. 458-467.

Bwouwers, A. & Tomic, W. 2001. “The Factorial Validity of Scores on the Teacher Interpersonal Self-Efficacy Scale.” Educational and Psychological Measurement, vol. 61, Tahun 2001, p. 433.

Crocker, Linda, dan James Algina. 1986. Introduction to Classical and Modern Test Theory. New York: Holt, Rinehart and Winston.

Cronbach, Lee J. 1984. Essentials of Psychological Testing. New York: Harper and Row Publisher.

Dimitrov, D. M. 2002. “Reliability: Arguments for Multiple Perspectives and Potential Problems with Generalization Across Studies”. Educational and Psychological Measurement, Vol.65. Nomor. 2.

Gronlund, Norman E dan Linn, Robert L. 1985. Measurement and Evaluation in Teaching. New York: McMillan Publishing Company.

Hwang, W. C., Chun, C., Kurasaki, K., & Takeuchi, D.T. 2000. “Factor Validity of Scores on a Social and Conflict Measure among Chinese Americans.” Educational and Psychological Measurement, Vol. 60, No. 5, Tahun 2000.

Kerlinger, Fred N. 2002. Azas-Azas Penelitian Behavioral. Terjemahan Landung R Simatupang, Yogyakarta: Gadjah Mada University Press.

McDonald, R.P. 1981. “The Dimensionality of Tests and Items.” British Journal of Mathematical and Statistical Psychology, Vol. 34, pp. 100-117.

Nunnaly, Jum C. 1981. Introduction to Psychological Measurement. New York: McGraw-Hill Book Company.

Raykov, T & Shrout, P. E. 2002. “Reliability of Scale with General Structure: Point and Interval Estimation Using a Structural Equation Modeling Approach.” Structural Equation Modeling, Vol. 9, No. 2, Tahun 2002, pp. 195-212.

Sekaran, Uma. 2006. Metodologi Penelitian untuk Bisnis, Terjemahan Kwan Men Yon, Jakarta: Salemba Empat.

Surapranata, Sumarna, 2004. Panduan Penulisan Tes Tertulis, Bandung: Remaja Rosdakarya.

Sudjana, Nana, 2001. Penilaian Hasil Proses Belajar Mengajar. Rosdakarya: Bandung.

Wahidmurni, Alfin Mustikawan, dan Ali Ridho, 2010. Evaluasi Pembelajaran: Kompetensi dan Praktek. Yogyakarta: Nuha Litera.

Wang, T. 1998. “Weights that Maximize Reliability Under a Congeneric Model.” Applied Psychological Measurement, Vol. 22, No. 2, Tahun 1998, pp. 179-187.

Widhiarso, Wahyu. 2009. “Koefisien Reliabilitas pada Pengukuran Kepribadian yang Bersifat Multidimensi.” Jurnal Psikobuana, Vol. 1, No. 1, pp. 39-48.

Orang yang suka sekali mengeluh, bahkan tukang kritik paling kejam, sering kali akan

menjadi lembut dan lunak di depan seorang pendengar yang sabar dan simpatik.

Dale Carnegie

Tanggung jawab adalah hal yang menakutkan bagi sebagian besar orang, tetapi tanggung jawab

juga merupakan salah satu hal yang ada di dunia ini yang membuat kita maju dan berkembang.

Frank Crane

VALIDITAS INSTRUMEN TES

AKREDITASI

Leave A Reply Batalkan balasan

Contact Us

Connect us

Tanggung jawab adalah hal yang menakutkan bagi sebagian besar orang, tetapi tanggung jawab

juga merupakan salah satu hal yang ada di dunia ini yang membuat kita maju dan berkembang.

Frank Crane

VALIDITAS INSTRUMEN TES

AKREDITASI

You may also like

Pelaksanaan Serdos Tahun 2026

Universitas Raharja Tangerang Perkuat Daya Saing Mahasiswa Lewat Seminar Internasional AI

Kemenkum Banten Serahkan Sertifikat Kekayaan Intelektual Komunal, Amankan Aset Budaya Masyarakat Banten

Leave A Reply Batalkan balasan

Contact Us

Connect us