TEKNIK PENGUJIAN RELIABILITAS TES HASIL BELAJAR
MAKALAH
PENGEMBANGAN EVALUASI PENDIDIKAN AGAMA ISLAM
Tentang
TEKNIK PENGUJIAN RELIABILITAS
TES HASIL BELAJAR
Oleh:
Zainal Masri
1920010030
Dosen Pembimbing:
Dr. Hadeli, M.A., M.Pd
KONSENTRASI PENDIDIKAN AGAMA ISLAM
PROGRAM STUDI PASCA SARJANA (S2)
UNIVERSITAS ISLAM NEGERI
IMAM BONJOL PADANG
1441 H/ 2020 M
BAB I
PENDAHULUAN
Latar Belakang Masalah
Reliabilitas sebuah tes dipengaruhi oleh perencanaan dan konsruksinya. Makin cermat perencanaannya dan konstruksi tes tersebut, secara rasional tes itu akan makin reliabel. Akan tetapi realibilitas rasional tersebut belum tentu dapat menjamin reliabilitas yang aktual. Untuk sampai kepada yang aktual itu, maka kita harus mengujinya secara empiris. Pengujian empiris itu dapat dilakukan dengan metode statistik, yang disebut metode korelasi. Dengan adanya metode yagn digunakan, seorang staf pengajar dapat menentukan apakah tes hasil belajar memiliki reliabilitas yang tinggi atau belum.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna untuk seluruh kejadian yang sejenis. Perkiraan semacam itu belum tentu benar, untuk menghindari hal-hal yang semacam itu maka kita harus melakukan reliabilitas, yang berguna untuk menunjukkaan kevalidan data dari hasil sebuah penelitian yang kita lakukan.
Dengan demikin, maka dalam penulisan makalah ini, kami selaku penulis akan membahasan mengenai apa sebenarnya realibilitas tes tesebut.
Rumusan Masalah
Apa yang dimaksud dengan reliabilitas?
Apa tujuan reliabilitas tes?
Apa faktor yang mempengaruhi reliabilitas tes?
Bagaimana cara menentukan reliabilitas tes?
Ada berapa teknik pengujian reliabilitas tes hasil belajar?
Bagaimana cara pengujian reliabilitas tes hasil belajar bentuk uraian?
Bagaimana cara pengujian reliabilitas tes hasil belajar bentuk obyektif?
Tujuan
Untuk mengetahui apa yang dimaksud dengan reliabilitas
Untuk mengetahui tujuan reliabilitas tes
Untuk mengetahui Faktor yang Mempengaruhi Realibilitas Tes
Untuk mengetahui cara menentukan reliabilitas tes
Untuk mengetahui Ada berapa teknik pengujian reliabilitas tes hasil belajar
Untuk mengetahui bagaimana cara pengujian reliabilitas tes hasil belajar bentuk uraian
Untuk mengetahui bagaimana cara pengujian reliabilitas tes hasil belajar bentuk obyektif
BAB II
PEMBAHASAN
Pengertian Reliabilitas
Reliabilitas berasal dari kata rely yang artinya percaya dan reliabel artinya dapat dipercaya. Reliabilitas dapat diartikan keterandalan, artinya suatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajengan atau stabilitas. Reliabilitas diartikan dengan keajengan bilamana tes tersebut di uji berkali-kali hasilnya tetap sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil korelasi yang signifikan.
Adapun pengertian reliabilitas menurut beberapa para ahli yaitu sebagai berikut:
Menurut Sugiyono Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuranyang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tesadalah tingkat keajegan (konsitensi) suatu tes yakni sejauh mana suatu tes dapatdipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda.
Menurut M. Chabib Thoha reliabilitas adalah ketetapan (konsistensi) dari nilai yang diperoleh sekelompok individu dalam kesempatan yang berbeda dengan tes yang sama atau yang itemnya ekuivalen.
Menurut Ngalim Purwanto Keandalan (Realibility) adalah ketepatan/ ketelitian suatu alat evaluasi. Suatu tes /alat evaluasi dikatakan andal jika ia dapat dipercaya, dan konsisten. Jadi yang dipentingkan disini adalah ketelitiannya, sejauh mana tes/alat tersebut dapat dipercaya kebenarannya.
Menurut Sukadji reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
Menurut Nursalam Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali-kali dalam waktu yang berlainan. alat dan cara mengukur atau mengamati sama-sama memegang peranan penting dalam waktu yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hasil yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relatif sesama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.
Tujuan Reliabilitas
Tujuan adanya realibilitas adalah mengkonsep satu variabel dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat menguragi intervensi informasi dari variabel lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang mungkin diperoleh. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indicator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literature-literatur yag berkaitan.
Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir untuk mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya, perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi peneliti untuk menghasilkan penelitian yang bisa dipertanggung jawabkan di kemudian hari.
Sehingga, jika realibilitas baik, akan menunjukkan kalahan varian yang minim. Jika tes mempunyai reabilitas tinggi maka pengaruh kesalahan pengukuran telah terkurangi.
Faktor yang Mempengaruhi Realibilitas Tes
Reliabilitas dapat dipengaruhi oleh waktu penyelenggaran tes-retes. interval penyelengaraan yang terlalu dekat atau jauh, akan mempengruhi koefisien reliabilitas. faktor-faktor lain yang mempengaruhi di antaranya;
Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test semakin mendekati kebenaran, dan dalam memgikuti test, semakin kecil siswa menebak. Berarti semakin tinggi koefisien reliabilitas.
Penyebaran skor koefisien reliabiltas secara langsung dipengeruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran semakin tingi estimasi koefisien reliabilitas. Hal ini tejadi karena posisi skor siswa, secara individual mempunyai kedudukan sama pada tes retest lain,sebagai acuan.
Kesulitan tes, test normative yang terlalu mudah atau terlalu sulitskor untuk siswa cenderung menghasilkan reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk test yang terlalu mudah skor jawaban siswa akan mengumpul ada sisi atas, untuk tes terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung bawah. Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara individu adalah kecil dan cenderung tidak relevan.
Objektivitas, yang di maksud objekif yaitu derajat dimana siswa dengan kompetensi sama mencapai hasil sama. Ketika prosedur test evaluasi memiliki objektivitas tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik penskoran. Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan atau opini seorang evaluator.
Cara Menentukan Reliabilitas Tes
Test-retest
Reliabilitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan melakukan tes retes tersebut seorang guru akan mengetahui seberapa jauh konsistensi suatu tes apa yang ingin diukur.
Reliabilitas tes retes ini penting, khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu berubah ubah secara signifikan saat diberikan kepada responden.
Reliabilitas tes retes dapat dilakukan dengan cara seperti berikut:
Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana
Setelah selang waktu tertentu, misalnya 1 minggu atau 2 minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
Korelasikan kedua tes tersebut.
Jika hasil koefesien korelasi menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah maka untuk mencari korelasi antara skor-skor hasil tes pertama dengan skor-skor hasil tes kedua, dapaat dipergunakan teknik korelasi rank-order (teknik korelasi tata-jenjang) dari Spearman.
Reliabilitas bentuk Ekuivalensi
Tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan. Tetapi, butir-butir soalnya berbeda. Dalam menggunakan tes ini pengetes harus menyiapkan dua buah tes dan masing-masing dicobakan pada kelompok peserta didik yang sama. Oleh karena itu, ada orang yang menyebutkan double tes double trial method. Penggunaan metode ini baik karena peserta didik dihadapkan pada dua buah macam tes, sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice effect dan Carry over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. kelemahan tes ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes.
Tes yang ekuivalen yang akan diukur reliabilitasnya dibuat identik dengan tes acuan setiap tampilannya, kecuali subtansi item yang ada. Kedua tes tersebut sebaiknya mempunyai karakteristik sama. Karaktersitik yang dimaksud misalnya mengukur variabel yang sama mempunyai jumlah item yang sama, struktur yang sama, mempunyai tingkat kesulitan yang memounyai petunjuk, penskoran, dan interpretasi yang sama.
Reliabilitas ekuivalen pada umumnya juga menggambarkan bentuk konsistensi alternatif yang dapat menunjukkan variasi skor yang terjadi dari bentuk tes evaluasi satu dengan bentuk tes lainnya. Adapun langkah-langkah yang ditempuh adalah sebagai berikut:
Menyusun dua buah tes yang ekuivalen
Mengujikan kedua tes tersebut (dalam waktu yang bersamaan dan beriringan)
Memberikan hasil skor tes yang diujikan disusun dengan memisahkan antara tes A dengan tes B
Mencari koefesien stabilitas kedua tes dengan jalan mencari korelasinya dengan rumus korelasi product moment.
Reliabilitas dengan Belah Dua (Split-Half)
Split berarti membelah sedangkan half adalah separo. Tes dibelah menjadi dua bagian. Jadi kita akan membagi tes kedalam dua bagian yang sama, masing-masing bagian berisi jumlah item yang sama dan setiap tes memiliki proporsi item yang sama (jumlah item, isi, dan corak dan corak yang sama) tingkat kesukaran dan daya beda yang sama.
Reliabilitas belah dua ini pada pelaksanaannya hanya memerlukan waktu satu kali. Ada beberapa kemungkinan dengan cara ini termasuk perbedaan kondisi tes yang terjadi ketika menggunakan metode tes retes dapat dihilangkan, realibiltas belah dua juga tepat digunakan, ketika tes evaluasi yang ada terlalu panjang. Cara melakukan pembelahan hasil tes tersebut adalah sebagai berikut:
Prosedur ganjil genap, artinya seluruh item yang bernomor ganjil dikumpulkan menjadi satu kelompok, dan seluruh item yang bernomor genap menjadi satu kelompok yang lain.
Prosedur dengan cara random, misalnya dengan jalan lotre, atau dengan jalan tebal bilangan random.
Kuder-Richarson
Metode ini digunakan perhitungan statistik pada setiap item dan hasil-hasil koefesien kuder richarson. Item-tem tes yang baik harus dibedakan diantara orang yang ada, misalnya sangat baik, rata-rata kurang dalam mengeja. Jika setiap peserta didik berhasil pada setiap item atau gagal pada setiap item tes, maka tidaklah dapat dibedakan antara peserta didik dan tidaklah dapat diukur reliabilitas atau ketepatannya.
Jika tes itu memiliki 100 item kita bisa memperkirakan peserta didik rata-rata yang memperoleh 50 item dengan tepat, diatas rata-rata dapat menjawab 70 dan superior dapat menjawab 90 item. Lebih lanjut, kita aka memperkirakan sebagian besar akan berhasil menjawab item-item soal yang mudah, kita juga mengharapkan kemampuan mengeja pada kemampuan item yang sangat sukar.
Adapun perhitungan reliabilitas dilakukan dengan langkah-langkah sebagai berikut:
Menyusun tabel persiapan perhitungan
Menghitung varians total
Menghitung reliabilitas.
Teknik Pengujian Realibilitas Tes Hasil Belajar
Ada dua bentuk teknik pengujian reliabilitas tes hasil belajar, yaitu bentuk uraian dan bentuk obyektif
Teknik pengujian realibilitas tes hasil belajar bentuk uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum pada umumnya orang menggunakan sebuah rumus yang di kenal dengan nama Rumus Alpha.
Adapun rumus alpha yang di maksud adalah :
Dimana :
r11 = Koefisien reliabilitas tes
n = Banyaknya butiran item yang dikeluarkan dalam tes
= Bilangan konstan
∑Si2 = Jumlah varian skor dari tiap-tiap butir item
St2 = Varian total
Dengan penjelasan lebih lanjut, bahwa :
∑Si2 dapat diperoleh demgan menggunakan rumus seperti tertera dibawah ini. Misalkan tes uraian yang akan ditentukan reliabilitasnya terdiri atas lima item, maka ∑Si2 dapat diperoleh dengan jalan menjumlahkan varian dari item no 1 sampai dengan item no 5 :
Sedangkan Si12, Si22, Si32, Si42, dan Si52, itu sendiri, dapat diperoleh dengan menggunakan rumus sebagai berikut :
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes (r11) pada umumnya digunakan patokan sebagai berikut:
Apabila r11 sama dengan atau lebih besar dari pada 0,70 berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi (= reliable)
Apabial r11 lebih kecil daripada 0,70 berarti bahwa tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi (un-reliable)
Berikut ini dkemukakan sebuah contoh, misalkan tes hasi belajar bentuk uraian diikuti oleh 5 orang siswa dalam tes mana dikeluarkan 5 butir item dengan ketentuan bahwa rentangan bobot skor adalah 0 sampai dengan 10. Setelah tes berakhir diperoleh skor-skor hasil tes seperti tertera pada tabel.
Tabel 1.1. Skor-skor tes hasil belajar bentuk subyektif yang diikuti oleh 5 orang testee, dengan menyajikan 5 butir item:
Tabel. 1.1
Testee
Skor untuk butir item nomor
1
2
3
4
5
A
8
6
7
7
6
B
7
6
6
5
6
C
4
4
3
5
4
D
6
5
5
5
6
E
5
5
4
5
4
Dalam rangka penentuan reliabilitas tes hasil belajar bentuk subyektif tersebut, langkah-langkah yang perlu ditempuh adalah sebagai berikut:
Langkah Pertama : menjumlahkan skor-skor yang dicapai oleh masing-masing testee, yaitu ∑Xi1, ∑Xi2, ∑Xi3, ∑Xi4, dan ∑Xi5 dan mencari skor total yang dicapai oleh masing-masing testee untuk kelima butir item tersebut (Xt), serta mencari (menghitung) kuadrat dari skor total (Xt2) hasilnya adalah seperti dapat dilihat pada tabel 6.2.
Tabel 2.2 Tabel analisis dalam rangka mencari (mengitung) skor total untuk masing-masing item, skor total untuk masing-masing testee, dan kuadrat dari skor total yang dcapai oleh testee.
Tabel 2.2
Testee
Skor untuk butir item nomor :
Xt
Xt2
1
2
3
4
5
A
8
6
7
7
6
34
1156
B
7
6
6
5
6
30
900
C
4
4
3
5
4
20
400
D
6
5
5
5
6
27
729
E
5
5
4
5
4
23
529
5=N
30 =
∑Xi1
26 =
∑Xi2
25 = ∑Xi3
27 = ∑Xi4
26 = ∑Xi1
134 = ∑Xt
3714 = ∑Xt2
Dari tabel 2.2 telah berhasil diketahui :
∑Xi1 = 30 ; ∑Xi2 = 26 ; ∑Xi3 = 25 ; ∑Xi4 = 27 ; ∑Xi5 = 26
∑Xt = 134; ∑Xt2 = 3714; sedangkan N = 5.
Langkah kedua : Mencari (menghitung) jumlah kuadrat item 1, 2, 3, 4 dan 5:
JK item1 = 82 + 72 + 42 + 62 + 52 = 64 + 49 + 16 + 36 + 25 = 190
JK item2 = 62 + 62 + 42 + 52 + 52 = 36 + 36 + 16 + 25 + 25 = 138
JK item3 = 72 + 62 + 32 + 52 + 42 = 49 + 36 + 9 + 25 + 16 = 135
JK item4 = 72 + 52 + 52 + 52 + 52 = 49 + 25 + 25 + 25 + 25 = 149
JK item5 = 62 + 62 + 42 + 62 + 42 = 36 + 36 + 16 + 36 + 16 = 140
Langkah ketiga : Mencari (menghitung) varian dari skor 1, 2, 3, 4, 5:
Langkah Keempat: Mencari jumlah varian skor item secara keseluruhan:
= 2,00 + 0,56 + 2,00 + 0,64 + 0,96
= 6,16
Langkah kelima : Mencari varian total ( St2) dengan menggunakan rumus:
Dari Tabel 2.2. Telah diketahui : ∑Xt2 = 3714 ; ∑Xt = 134 dan N=5
Langkah keenam : mencari koefisien reliabilitas tes, dengan menggunakan rumus alpha :
Dari perhitung-perhitungan di atas, telah kita ketahui: n (yaitu jumlah butir item) = 5; ∑Si2 = 6,16 dan St2 = 24,56
Jadi :
= 1,25 x 0,749
= 0,93625
= 0,94
Dengan koefisien reliabilitas (r11) sebenarnya 0,94 itu pada akhirnya dapat kita nyatakan bahwa tes hasil belajar bentuk uraian dengan menyajikan lima butir item yang diikuti oleh lima testee tersebut sudah memiliki reliabiltas tes yang tinggi (r11) jauh lebih besar dari 0,70), sehingga kita dapat menyatakan pula bahwa tes hasil belajar itu sudah memiliki kualitas yang baik.
Teknik pengujian realibilitas tes hasil belajar bentuk objektif
Berbeda dengan tes hasil belajar bentuk uraian, maka pada tes hasil belajar bentuk obyektif, penentuan reliabilitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan, yaitu:
Pendekatan single test – single trial (single test – single trial method)
Dalam rangka menentukan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan single test – single trial, maka penentuan reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran terhadap satu kelompok subyek, dimana pengukuran itu dilakukan dengan hanya menggunakan satu jenis alat pengukur dan bahwa pelaksanaan pengukuran itu hanya dilakukan sebanyak satu kali saja. Dengan kata lain single test – single trial merupakan pendekatan “serba single” atau pendekatan “serba satu” yaitu satu kelompok subyek, satu jenis alat pengukur, dan satu kali pengukuran.
Ada 5 jenis formula untuk menentukan reliabilitas dengan menggunakan single test- single trial.
Pendekatan Single Test-Single Trial dengan Formula Spearman Brown
Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
rtt=
Keterangan:
rtt = Koefisien relibilitas tes secara total (tt = total tes).
rhh = Koefisien kolerasi product moment antara separuh tes pertama dan separuh tes kedua (hh = half-half).
1 & 2 = Bilangan konstan
Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Gasal Genap
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single test single trial dengan menggunakan formula spearmanbrown model gasal genap adalah sebagai berikut:
Menjumlahkan skor-skor dari butir-butir item yang benomor gasal yang dimiliki oleh masing-masing individu testee.
Menjumlahkan skor-skor dari butir-butir item yang benomor genap yang dimiliki oleh masing-masing individu testee.
Mencari (menghitung) koefisien kolerasi “r” product moment (rxy = rhh =). Dalam hal ini jumlah skor-skor dari butir-butir item yang bernomor gasal kita anggap sebagai variabel X, sedangkan jumlah skorskor dari butir-butir item yang bernomor genap kita anggap variabel Y, dengan menggunakan rumus:
rtt = rhh=
Mencari (menghitung) koefisien reliabilitas tes (r11 = rtt=) dengan menggunakan rumus:
r11 = rtt =
Memberikan interprestasi terhadap r11.
Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Belahan Kiri dan Kanan
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single testsingle trial dengan menggunakan formula spearmanbrown model belahan kiri dan kanan adalah sebagai berikut:
Menjumlahkan skor-skor dari butir-butir item yang terletak diseparuh bagian kiri yang dimiliki oleh masing-masing individu testee.
Menjumlahkan skor-skor dari butir-butir item yan terletak diseparuh bagian kanan yang dimiliki oleh masing-masing individu testee.
Mencari (menghitung) koefisien kolerasi “r” product mement (rxy = rhh =). Dalam hal ini jumlah skorskor dari butir-butir item yang terletak diseparuh bagian kiri kita anggap sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item yang terletak diseparuh bagian kanan kita anggap variabel Y, dengan menggunakan rumus.
rtt = rhh=
Mencari (menhitung) koefisien reliabilitas tes (r11=rtt) dengan menggunakan rumus:
r11 = rtt =
Memberikan interprestasi terhadap r11.
Kelemahan-Kelemahan Formula Spearman-Brown
Formula ini menghendaki agar belahan yang dicari kolerasinya, yaitu belahan gasal-genap dan belahan kiri-kanan haruslah sebanding.
Formula ini juga menuntun agar jumlah butir-butir item yang akandiuji reliabilitasnya haruslah genap.
Dengan dua buah model perhitungan tersebut, dapat terjadi bahwa koefisien reliabilitas menunjukan bilangan yang tidak sama.
Ketepatan Penggunaan formula Spearman-Brown
Tes yang diajukan cukup banyak
Butir-butir item termasuk kategori item yang sukar
Materi tes bersifat menyeluruh, agar penyusun dapat membuat dua item untuk satu permasalahan yang sama.
Pendekatan single test-single trial dengan menggunakan formula Flanagan
Formula: r11=2(1-)
Dimana:
r11 = Koefisien reliabilitas tes secara total
2 & 1 = Bilangan Konstan
= Jumlah varian dari skor-skor hasil tes yang termasuk belahan I
= Jumlah varian dari skor-skor hasil tes yang termasuk belahan II
= Jumlah varian total dari skor hasil tes belahan I dan II
Rumus:
= , deviasi x =X-Mx
= , deviasi y= Y-My
=
Pendekatan dengan menggunakan Formula Flanagan dengan menerapkan Model gasal-genap.
Adapun langkah-langkahnya:
Menghitung kuadrat dari deviasi X y () dan jumlah kuadrat dari deviasi total X dan Y ()).
Menghitung varian skor item gasal dan genap.
Rumus: dan =
Mencari varian total, dengan rumus: =
Mencari koefisien reliabilitas (r11) lalu memberikan interpretasi.
r11=2(1-)
Pendekatan dengan menggunakan Formula Flanagan dengan menerapkan Model kiri-kanan.
Adapun langkah-langkahnya:
Menghitung kuadrat dari deviasi X y () dan jumlah kuadrat dari deviasi total X dan Y ()).
Menghitung varian skor item kiri dan kanan dengan rumus: dan =
Mencari varian total dengan rumus: =
Mencari koefisien reliabilitas (r11) lalu memberikan interpretasi.
r11=2(1-)
Pendekatan single tes-single trial dengan formula Rulon
Rumus: r11= 1- dimana = varian perbedaan testee belahan I dan II
Langkah-langkahnya:
Menghitung d = (X-Y), menjumlahkan d= lalu mengkuadratkan
Menghitung jumlah kuadrat perbedaan () dan mencari varian perbedaan (skor belahan I dan II = - lalu
Mencari skor total Xt = (X+Y) lalu dijumlahkan Xt = ΣXt
Mengkuadratkan X2t dan menjumlahkan menjadi ΣXt2
Mencari X2t = ΣXt2 - lalu mencari
Lalu mencari koefisien reliabilitas. r11= 1-
Pendekatan formula rulon dengan menggunakan model gasal-genap dan belahan kiri-kanan menggunakan formula yang sama hanya membedakan skor item yang dipilih.
Pendekatan single tes-single trial dengan formula Kuder-Richardsen
Formula Kuder-Richardsen yaitu KR20 dan KR21
KR20= () ()
Dimana:
N = banyaknya butir item
St2 = varian total
Pi = Proporsi testee yang menjawab dengan betul butir item tersebut
qi = Proporsi testee yang menjawab salah, qi= 1- p
Σpiqi = Jumlah hasil perkalian pi dan qi
KR21= () ()
Dimana:
Mt =Mean total (rata-rata hitung dari skor total)
KR20 dalam perhitungannya lebih teliti namun perhitungannya lebih rumit. Sedangkan KR21 perhitungannya lebih sederhana namun kurang teliti.
Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan test-reetest (single test – double trial)
Dikenal dengan pendekatan bentuk ulangan dimana tester hanya menggunakan satu seri tes tetapi percobaannya dilakukan dua kali. Misalkan seorang guru memberikan satu seri tes dalam dua kesempatan. Setelah tes selesai skor hasil tes pertama dikorelasikan dengan skor hasil tes kedua. Jika terdapat korelasi positif maka tes hasil belajar dapat dinyatakan reliable karena skor hasil tes belajar memperlihatkan kestabilan atau keajegan.
Untuk mencari korelasi tersebut terdapat teknik korelasi rank-order (tata jenjang) dari Spearman:
ρ = 1-
Dimana:
ρ = Koefisien korelasi antara variabel I (skor) dan II
D = Difference. D= RI - RII, N = Banyaknya subyek
Langkah-langkah:
Merumuskan hipotesis nihil: “Tidak terdapat korelasi positif yang signifikan antara hasil tes I daengan hasil tes II
Mencari koefisien korelasi rho: ρ = 1-
Memberikan interpretasi terhadap ρ
Melihat nilai rho dengan menggunakan derajat kebebasan (db) Misalkan N =20 diperoleh ρtabel pada taraf signifikansi 5% sebesar 0,450. Jika ρobservasi ≥ ρ tabel baik pada taraf 1% maupun 5% hipotesis nihil ditolak. Berarti tes pertama dan kedua terdapat korelasi posiif yang signifikan.
Menarik kesimpulan.
Bahwa tes hasil belajar sudah memiliki reliabilitas yang tinggi (reliabel). Pengujian ulang tidak hanya sebatas satu kali saja, boleh lebih sampai penyusun tes sudah yakin dengan keajegan hasil pengukuranya.
Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan alternate form (double test – double trial)
Mempergunakan dua tes yang diberikan tanpa adanya tenggang waktu dengan ketentuan tes harus sejenis, mengukur hal yang sama maupun tingkat kesukaran yang sama.
Alasan bahwa pendekatan alternate form (bentuk pararel) lebih baik daripada pendekatan yang sebelumnya:
Terhindar dari kemungkinan testee latihan atau menghafal karena butir item yang diberikan tidak sama
Terhindar akan timbulnya perbedaan situasi dan kondisi baik yang bersifat sosial maupun alami.
Apabila terdapat korelasi positif signifikan maka dapat dikatakan tes tersebut reliabel. Teknik korelasi yang digunakan antara teknik product moment dari Pearson atau teknik rank order dari Spearman(khusus untuk N ≤ 30).
rxy
Langkah-langkah:
Merumuskan hipotesis nihil
Menghitung rxy
Memberikan interpretasi terhadap rxy atau robservasi. Db = N-nr. Misalkan data 30 berarti db = 30 – 2 = 28, mencari r tabel. Jika rtabel pada taraf 5% lebih besar robservasi maka hipotesis nihil ditolak. Namun jika rtabel pada taraf 1% lebih kecil daripada robservasi maka hipotesis nihil disetujui.
Jika salah satu hipotesis nihil disetujui berarti hasil tes belajar memiliki reliabilitas sedang.
BAB III
PENUTUP
Kesimpulan
Reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hasil yang tetap sama (konsisten, ajeg).
Tujuan adanya realibilitas adalah mengkonsep satu variabel dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel.. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail.
Faktor yang mempengaruhi reliabilitas tes adalah panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi pembelajaran diukur. Kesulitan tes, test normative yang terlalu mudah atau terlalu sulitskor untuk siswa cenderung menghasilkan reliabilitas rendah. Objektivitas, yang di maksud objekif yaitu derajat dimana siswa dengan kompetensi sama mencapai hasil sama.
Ada dua bentuk teknik pengujian reliabilitas tes hasil belajar, yaitu bentuk uraian yaitu dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum Bentuk obyektif yaitu penentuan reliabilitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan.
Saran
Dalam makalah ini, pemakalah menyadari banyak kesalahan baik dari materi maupun perinciannya. Untuk itu, pemakalah meminta saran dan kritik terutama dari dosen pembimbing mata kuliah Evaluasi pendidikan Islam serta rekan-rekan semua yang bersifat membangun demi kesempurnaan makalah ini.
DAFTAR KEPUSTAKAAN
M. Sukardi. Evaluasi Pendidikan. Jakarta: Bumi Aksara. 2011
Pramana, I Nyoman Doni. Evaluasi Pendidikan. Bandung: Alfabetah. 2015
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi Pengajaran, Jakarta: Remaja Rosdakarya. 2008
Purwanto. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Setia. 2010
Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers, 2015
Sugiyono. Metode Penelitian Kombinasi. Bandung: Alfabeta. 2013
Sukardi, M. Evaluasi Pendidikan Prinsip & Operasionalnya. Jakarta: PT Bumi Aksara. 2008
Sukardi, Dewa Ketut. Analisis Tes Psikologi. Jakarta: Rineka Cipta. 1990
Thoha, M. Chabib. Teknik Evaluasi Pendidikan. Jakarta: RajaGrafindo Persada, 1991
PENGEMBANGAN EVALUASI PENDIDIKAN AGAMA ISLAM
Tentang
TEKNIK PENGUJIAN RELIABILITAS
TES HASIL BELAJAR
Oleh:
Zainal Masri
1920010030
Dosen Pembimbing:
Dr. Hadeli, M.A., M.Pd
KONSENTRASI PENDIDIKAN AGAMA ISLAM
PROGRAM STUDI PASCA SARJANA (S2)
UNIVERSITAS ISLAM NEGERI
IMAM BONJOL PADANG
1441 H/ 2020 M
BAB I
PENDAHULUAN
Latar Belakang Masalah
Reliabilitas sebuah tes dipengaruhi oleh perencanaan dan konsruksinya. Makin cermat perencanaannya dan konstruksi tes tersebut, secara rasional tes itu akan makin reliabel. Akan tetapi realibilitas rasional tersebut belum tentu dapat menjamin reliabilitas yang aktual. Untuk sampai kepada yang aktual itu, maka kita harus mengujinya secara empiris. Pengujian empiris itu dapat dilakukan dengan metode statistik, yang disebut metode korelasi. Dengan adanya metode yagn digunakan, seorang staf pengajar dapat menentukan apakah tes hasil belajar memiliki reliabilitas yang tinggi atau belum.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna untuk seluruh kejadian yang sejenis. Perkiraan semacam itu belum tentu benar, untuk menghindari hal-hal yang semacam itu maka kita harus melakukan reliabilitas, yang berguna untuk menunjukkaan kevalidan data dari hasil sebuah penelitian yang kita lakukan.
Dengan demikin, maka dalam penulisan makalah ini, kami selaku penulis akan membahasan mengenai apa sebenarnya realibilitas tes tesebut.
Rumusan Masalah
Apa yang dimaksud dengan reliabilitas?
Apa tujuan reliabilitas tes?
Apa faktor yang mempengaruhi reliabilitas tes?
Bagaimana cara menentukan reliabilitas tes?
Ada berapa teknik pengujian reliabilitas tes hasil belajar?
Bagaimana cara pengujian reliabilitas tes hasil belajar bentuk uraian?
Bagaimana cara pengujian reliabilitas tes hasil belajar bentuk obyektif?
Tujuan
Untuk mengetahui apa yang dimaksud dengan reliabilitas
Untuk mengetahui tujuan reliabilitas tes
Untuk mengetahui Faktor yang Mempengaruhi Realibilitas Tes
Untuk mengetahui cara menentukan reliabilitas tes
Untuk mengetahui Ada berapa teknik pengujian reliabilitas tes hasil belajar
Untuk mengetahui bagaimana cara pengujian reliabilitas tes hasil belajar bentuk uraian
Untuk mengetahui bagaimana cara pengujian reliabilitas tes hasil belajar bentuk obyektif
BAB II
PEMBAHASAN
Pengertian Reliabilitas
Reliabilitas berasal dari kata rely yang artinya percaya dan reliabel artinya dapat dipercaya. Reliabilitas dapat diartikan keterandalan, artinya suatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajengan atau stabilitas. Reliabilitas diartikan dengan keajengan bilamana tes tersebut di uji berkali-kali hasilnya tetap sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil korelasi yang signifikan.
Adapun pengertian reliabilitas menurut beberapa para ahli yaitu sebagai berikut:
Menurut Sugiyono Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuranyang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tesadalah tingkat keajegan (konsitensi) suatu tes yakni sejauh mana suatu tes dapatdipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda.
Menurut M. Chabib Thoha reliabilitas adalah ketetapan (konsistensi) dari nilai yang diperoleh sekelompok individu dalam kesempatan yang berbeda dengan tes yang sama atau yang itemnya ekuivalen.
Menurut Ngalim Purwanto Keandalan (Realibility) adalah ketepatan/ ketelitian suatu alat evaluasi. Suatu tes /alat evaluasi dikatakan andal jika ia dapat dipercaya, dan konsisten. Jadi yang dipentingkan disini adalah ketelitiannya, sejauh mana tes/alat tersebut dapat dipercaya kebenarannya.
Menurut Sukadji reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
Menurut Nursalam Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali-kali dalam waktu yang berlainan. alat dan cara mengukur atau mengamati sama-sama memegang peranan penting dalam waktu yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hasil yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relatif sesama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.
Tujuan Reliabilitas
Tujuan adanya realibilitas adalah mengkonsep satu variabel dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat menguragi intervensi informasi dari variabel lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang mungkin diperoleh. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indicator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literature-literatur yag berkaitan.
Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir untuk mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya, perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi peneliti untuk menghasilkan penelitian yang bisa dipertanggung jawabkan di kemudian hari.
Sehingga, jika realibilitas baik, akan menunjukkan kalahan varian yang minim. Jika tes mempunyai reabilitas tinggi maka pengaruh kesalahan pengukuran telah terkurangi.
Faktor yang Mempengaruhi Realibilitas Tes
Reliabilitas dapat dipengaruhi oleh waktu penyelenggaran tes-retes. interval penyelengaraan yang terlalu dekat atau jauh, akan mempengruhi koefisien reliabilitas. faktor-faktor lain yang mempengaruhi di antaranya;
Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test semakin mendekati kebenaran, dan dalam memgikuti test, semakin kecil siswa menebak. Berarti semakin tinggi koefisien reliabilitas.
Penyebaran skor koefisien reliabiltas secara langsung dipengeruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran semakin tingi estimasi koefisien reliabilitas. Hal ini tejadi karena posisi skor siswa, secara individual mempunyai kedudukan sama pada tes retest lain,sebagai acuan.
Kesulitan tes, test normative yang terlalu mudah atau terlalu sulitskor untuk siswa cenderung menghasilkan reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk test yang terlalu mudah skor jawaban siswa akan mengumpul ada sisi atas, untuk tes terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung bawah. Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara individu adalah kecil dan cenderung tidak relevan.
Objektivitas, yang di maksud objekif yaitu derajat dimana siswa dengan kompetensi sama mencapai hasil sama. Ketika prosedur test evaluasi memiliki objektivitas tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik penskoran. Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan atau opini seorang evaluator.
Cara Menentukan Reliabilitas Tes
Test-retest
Reliabilitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan melakukan tes retes tersebut seorang guru akan mengetahui seberapa jauh konsistensi suatu tes apa yang ingin diukur.
Reliabilitas tes retes ini penting, khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu berubah ubah secara signifikan saat diberikan kepada responden.
Reliabilitas tes retes dapat dilakukan dengan cara seperti berikut:
Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana
Setelah selang waktu tertentu, misalnya 1 minggu atau 2 minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
Korelasikan kedua tes tersebut.
Jika hasil koefesien korelasi menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah maka untuk mencari korelasi antara skor-skor hasil tes pertama dengan skor-skor hasil tes kedua, dapaat dipergunakan teknik korelasi rank-order (teknik korelasi tata-jenjang) dari Spearman.
Reliabilitas bentuk Ekuivalensi
Tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan. Tetapi, butir-butir soalnya berbeda. Dalam menggunakan tes ini pengetes harus menyiapkan dua buah tes dan masing-masing dicobakan pada kelompok peserta didik yang sama. Oleh karena itu, ada orang yang menyebutkan double tes double trial method. Penggunaan metode ini baik karena peserta didik dihadapkan pada dua buah macam tes, sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice effect dan Carry over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. kelemahan tes ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes.
Tes yang ekuivalen yang akan diukur reliabilitasnya dibuat identik dengan tes acuan setiap tampilannya, kecuali subtansi item yang ada. Kedua tes tersebut sebaiknya mempunyai karakteristik sama. Karaktersitik yang dimaksud misalnya mengukur variabel yang sama mempunyai jumlah item yang sama, struktur yang sama, mempunyai tingkat kesulitan yang memounyai petunjuk, penskoran, dan interpretasi yang sama.
Reliabilitas ekuivalen pada umumnya juga menggambarkan bentuk konsistensi alternatif yang dapat menunjukkan variasi skor yang terjadi dari bentuk tes evaluasi satu dengan bentuk tes lainnya. Adapun langkah-langkah yang ditempuh adalah sebagai berikut:
Menyusun dua buah tes yang ekuivalen
Mengujikan kedua tes tersebut (dalam waktu yang bersamaan dan beriringan)
Memberikan hasil skor tes yang diujikan disusun dengan memisahkan antara tes A dengan tes B
Mencari koefesien stabilitas kedua tes dengan jalan mencari korelasinya dengan rumus korelasi product moment.
Reliabilitas dengan Belah Dua (Split-Half)
Split berarti membelah sedangkan half adalah separo. Tes dibelah menjadi dua bagian. Jadi kita akan membagi tes kedalam dua bagian yang sama, masing-masing bagian berisi jumlah item yang sama dan setiap tes memiliki proporsi item yang sama (jumlah item, isi, dan corak dan corak yang sama) tingkat kesukaran dan daya beda yang sama.
Reliabilitas belah dua ini pada pelaksanaannya hanya memerlukan waktu satu kali. Ada beberapa kemungkinan dengan cara ini termasuk perbedaan kondisi tes yang terjadi ketika menggunakan metode tes retes dapat dihilangkan, realibiltas belah dua juga tepat digunakan, ketika tes evaluasi yang ada terlalu panjang. Cara melakukan pembelahan hasil tes tersebut adalah sebagai berikut:
Prosedur ganjil genap, artinya seluruh item yang bernomor ganjil dikumpulkan menjadi satu kelompok, dan seluruh item yang bernomor genap menjadi satu kelompok yang lain.
Prosedur dengan cara random, misalnya dengan jalan lotre, atau dengan jalan tebal bilangan random.
Kuder-Richarson
Metode ini digunakan perhitungan statistik pada setiap item dan hasil-hasil koefesien kuder richarson. Item-tem tes yang baik harus dibedakan diantara orang yang ada, misalnya sangat baik, rata-rata kurang dalam mengeja. Jika setiap peserta didik berhasil pada setiap item atau gagal pada setiap item tes, maka tidaklah dapat dibedakan antara peserta didik dan tidaklah dapat diukur reliabilitas atau ketepatannya.
Jika tes itu memiliki 100 item kita bisa memperkirakan peserta didik rata-rata yang memperoleh 50 item dengan tepat, diatas rata-rata dapat menjawab 70 dan superior dapat menjawab 90 item. Lebih lanjut, kita aka memperkirakan sebagian besar akan berhasil menjawab item-item soal yang mudah, kita juga mengharapkan kemampuan mengeja pada kemampuan item yang sangat sukar.
Adapun perhitungan reliabilitas dilakukan dengan langkah-langkah sebagai berikut:
Menyusun tabel persiapan perhitungan
Menghitung varians total
Menghitung reliabilitas.
Teknik Pengujian Realibilitas Tes Hasil Belajar
Ada dua bentuk teknik pengujian reliabilitas tes hasil belajar, yaitu bentuk uraian dan bentuk obyektif
Teknik pengujian realibilitas tes hasil belajar bentuk uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum pada umumnya orang menggunakan sebuah rumus yang di kenal dengan nama Rumus Alpha.
Adapun rumus alpha yang di maksud adalah :
Dimana :
r11 = Koefisien reliabilitas tes
n = Banyaknya butiran item yang dikeluarkan dalam tes
= Bilangan konstan
∑Si2 = Jumlah varian skor dari tiap-tiap butir item
St2 = Varian total
Dengan penjelasan lebih lanjut, bahwa :
∑Si2 dapat diperoleh demgan menggunakan rumus seperti tertera dibawah ini. Misalkan tes uraian yang akan ditentukan reliabilitasnya terdiri atas lima item, maka ∑Si2 dapat diperoleh dengan jalan menjumlahkan varian dari item no 1 sampai dengan item no 5 :
Sedangkan Si12, Si22, Si32, Si42, dan Si52, itu sendiri, dapat diperoleh dengan menggunakan rumus sebagai berikut :
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes (r11) pada umumnya digunakan patokan sebagai berikut:
Apabila r11 sama dengan atau lebih besar dari pada 0,70 berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi (= reliable)
Apabial r11 lebih kecil daripada 0,70 berarti bahwa tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi (un-reliable)
Berikut ini dkemukakan sebuah contoh, misalkan tes hasi belajar bentuk uraian diikuti oleh 5 orang siswa dalam tes mana dikeluarkan 5 butir item dengan ketentuan bahwa rentangan bobot skor adalah 0 sampai dengan 10. Setelah tes berakhir diperoleh skor-skor hasil tes seperti tertera pada tabel.
Tabel 1.1. Skor-skor tes hasil belajar bentuk subyektif yang diikuti oleh 5 orang testee, dengan menyajikan 5 butir item:
Tabel. 1.1
Testee
Skor untuk butir item nomor
1
2
3
4
5
A
8
6
7
7
6
B
7
6
6
5
6
C
4
4
3
5
4
D
6
5
5
5
6
E
5
5
4
5
4
Dalam rangka penentuan reliabilitas tes hasil belajar bentuk subyektif tersebut, langkah-langkah yang perlu ditempuh adalah sebagai berikut:
Langkah Pertama : menjumlahkan skor-skor yang dicapai oleh masing-masing testee, yaitu ∑Xi1, ∑Xi2, ∑Xi3, ∑Xi4, dan ∑Xi5 dan mencari skor total yang dicapai oleh masing-masing testee untuk kelima butir item tersebut (Xt), serta mencari (menghitung) kuadrat dari skor total (Xt2) hasilnya adalah seperti dapat dilihat pada tabel 6.2.
Tabel 2.2 Tabel analisis dalam rangka mencari (mengitung) skor total untuk masing-masing item, skor total untuk masing-masing testee, dan kuadrat dari skor total yang dcapai oleh testee.
Tabel 2.2
Testee
Skor untuk butir item nomor :
Xt
Xt2
1
2
3
4
5
A
8
6
7
7
6
34
1156
B
7
6
6
5
6
30
900
C
4
4
3
5
4
20
400
D
6
5
5
5
6
27
729
E
5
5
4
5
4
23
529
5=N
30 =
∑Xi1
26 =
∑Xi2
25 = ∑Xi3
27 = ∑Xi4
26 = ∑Xi1
134 = ∑Xt
3714 = ∑Xt2
Dari tabel 2.2 telah berhasil diketahui :
∑Xi1 = 30 ; ∑Xi2 = 26 ; ∑Xi3 = 25 ; ∑Xi4 = 27 ; ∑Xi5 = 26
∑Xt = 134; ∑Xt2 = 3714; sedangkan N = 5.
Langkah kedua : Mencari (menghitung) jumlah kuadrat item 1, 2, 3, 4 dan 5:
JK item1 = 82 + 72 + 42 + 62 + 52 = 64 + 49 + 16 + 36 + 25 = 190
JK item2 = 62 + 62 + 42 + 52 + 52 = 36 + 36 + 16 + 25 + 25 = 138
JK item3 = 72 + 62 + 32 + 52 + 42 = 49 + 36 + 9 + 25 + 16 = 135
JK item4 = 72 + 52 + 52 + 52 + 52 = 49 + 25 + 25 + 25 + 25 = 149
JK item5 = 62 + 62 + 42 + 62 + 42 = 36 + 36 + 16 + 36 + 16 = 140
Langkah ketiga : Mencari (menghitung) varian dari skor 1, 2, 3, 4, 5:
Langkah Keempat: Mencari jumlah varian skor item secara keseluruhan:
= 2,00 + 0,56 + 2,00 + 0,64 + 0,96
= 6,16
Langkah kelima : Mencari varian total ( St2) dengan menggunakan rumus:
Dari Tabel 2.2. Telah diketahui : ∑Xt2 = 3714 ; ∑Xt = 134 dan N=5
Langkah keenam : mencari koefisien reliabilitas tes, dengan menggunakan rumus alpha :
Dari perhitung-perhitungan di atas, telah kita ketahui: n (yaitu jumlah butir item) = 5; ∑Si2 = 6,16 dan St2 = 24,56
Jadi :
= 1,25 x 0,749
= 0,93625
= 0,94
Dengan koefisien reliabilitas (r11) sebenarnya 0,94 itu pada akhirnya dapat kita nyatakan bahwa tes hasil belajar bentuk uraian dengan menyajikan lima butir item yang diikuti oleh lima testee tersebut sudah memiliki reliabiltas tes yang tinggi (r11) jauh lebih besar dari 0,70), sehingga kita dapat menyatakan pula bahwa tes hasil belajar itu sudah memiliki kualitas yang baik.
Teknik pengujian realibilitas tes hasil belajar bentuk objektif
Berbeda dengan tes hasil belajar bentuk uraian, maka pada tes hasil belajar bentuk obyektif, penentuan reliabilitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan, yaitu:
Pendekatan single test – single trial (single test – single trial method)
Dalam rangka menentukan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan single test – single trial, maka penentuan reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran terhadap satu kelompok subyek, dimana pengukuran itu dilakukan dengan hanya menggunakan satu jenis alat pengukur dan bahwa pelaksanaan pengukuran itu hanya dilakukan sebanyak satu kali saja. Dengan kata lain single test – single trial merupakan pendekatan “serba single” atau pendekatan “serba satu” yaitu satu kelompok subyek, satu jenis alat pengukur, dan satu kali pengukuran.
Ada 5 jenis formula untuk menentukan reliabilitas dengan menggunakan single test- single trial.
Pendekatan Single Test-Single Trial dengan Formula Spearman Brown
Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
rtt=
Keterangan:
rtt = Koefisien relibilitas tes secara total (tt = total tes).
rhh = Koefisien kolerasi product moment antara separuh tes pertama dan separuh tes kedua (hh = half-half).
1 & 2 = Bilangan konstan
Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Gasal Genap
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single test single trial dengan menggunakan formula spearmanbrown model gasal genap adalah sebagai berikut:
Menjumlahkan skor-skor dari butir-butir item yang benomor gasal yang dimiliki oleh masing-masing individu testee.
Menjumlahkan skor-skor dari butir-butir item yang benomor genap yang dimiliki oleh masing-masing individu testee.
Mencari (menghitung) koefisien kolerasi “r” product moment (rxy = rhh =). Dalam hal ini jumlah skor-skor dari butir-butir item yang bernomor gasal kita anggap sebagai variabel X, sedangkan jumlah skorskor dari butir-butir item yang bernomor genap kita anggap variabel Y, dengan menggunakan rumus:
rtt = rhh=
Mencari (menghitung) koefisien reliabilitas tes (r11 = rtt=) dengan menggunakan rumus:
r11 = rtt =
Memberikan interprestasi terhadap r11.
Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Belahan Kiri dan Kanan
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single testsingle trial dengan menggunakan formula spearmanbrown model belahan kiri dan kanan adalah sebagai berikut:
Menjumlahkan skor-skor dari butir-butir item yang terletak diseparuh bagian kiri yang dimiliki oleh masing-masing individu testee.
Menjumlahkan skor-skor dari butir-butir item yan terletak diseparuh bagian kanan yang dimiliki oleh masing-masing individu testee.
Mencari (menghitung) koefisien kolerasi “r” product mement (rxy = rhh =). Dalam hal ini jumlah skorskor dari butir-butir item yang terletak diseparuh bagian kiri kita anggap sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item yang terletak diseparuh bagian kanan kita anggap variabel Y, dengan menggunakan rumus.
rtt = rhh=
Mencari (menhitung) koefisien reliabilitas tes (r11=rtt) dengan menggunakan rumus:
r11 = rtt =
Memberikan interprestasi terhadap r11.
Kelemahan-Kelemahan Formula Spearman-Brown
Formula ini menghendaki agar belahan yang dicari kolerasinya, yaitu belahan gasal-genap dan belahan kiri-kanan haruslah sebanding.
Formula ini juga menuntun agar jumlah butir-butir item yang akandiuji reliabilitasnya haruslah genap.
Dengan dua buah model perhitungan tersebut, dapat terjadi bahwa koefisien reliabilitas menunjukan bilangan yang tidak sama.
Ketepatan Penggunaan formula Spearman-Brown
Tes yang diajukan cukup banyak
Butir-butir item termasuk kategori item yang sukar
Materi tes bersifat menyeluruh, agar penyusun dapat membuat dua item untuk satu permasalahan yang sama.
Pendekatan single test-single trial dengan menggunakan formula Flanagan
Formula: r11=2(1-)
Dimana:
r11 = Koefisien reliabilitas tes secara total
2 & 1 = Bilangan Konstan
= Jumlah varian dari skor-skor hasil tes yang termasuk belahan I
= Jumlah varian dari skor-skor hasil tes yang termasuk belahan II
= Jumlah varian total dari skor hasil tes belahan I dan II
Rumus:
= , deviasi x =X-Mx
= , deviasi y= Y-My
=
Pendekatan dengan menggunakan Formula Flanagan dengan menerapkan Model gasal-genap.
Adapun langkah-langkahnya:
Menghitung kuadrat dari deviasi X y () dan jumlah kuadrat dari deviasi total X dan Y ()).
Menghitung varian skor item gasal dan genap.
Rumus: dan =
Mencari varian total, dengan rumus: =
Mencari koefisien reliabilitas (r11) lalu memberikan interpretasi.
r11=2(1-)
Pendekatan dengan menggunakan Formula Flanagan dengan menerapkan Model kiri-kanan.
Adapun langkah-langkahnya:
Menghitung kuadrat dari deviasi X y () dan jumlah kuadrat dari deviasi total X dan Y ()).
Menghitung varian skor item kiri dan kanan dengan rumus: dan =
Mencari varian total dengan rumus: =
Mencari koefisien reliabilitas (r11) lalu memberikan interpretasi.
r11=2(1-)
Pendekatan single tes-single trial dengan formula Rulon
Rumus: r11= 1- dimana = varian perbedaan testee belahan I dan II
Langkah-langkahnya:
Menghitung d = (X-Y), menjumlahkan d= lalu mengkuadratkan
Menghitung jumlah kuadrat perbedaan () dan mencari varian perbedaan (skor belahan I dan II = - lalu
Mencari skor total Xt = (X+Y) lalu dijumlahkan Xt = ΣXt
Mengkuadratkan X2t dan menjumlahkan menjadi ΣXt2
Mencari X2t = ΣXt2 - lalu mencari
Lalu mencari koefisien reliabilitas. r11= 1-
Pendekatan formula rulon dengan menggunakan model gasal-genap dan belahan kiri-kanan menggunakan formula yang sama hanya membedakan skor item yang dipilih.
Pendekatan single tes-single trial dengan formula Kuder-Richardsen
Formula Kuder-Richardsen yaitu KR20 dan KR21
KR20= () ()
Dimana:
N = banyaknya butir item
St2 = varian total
Pi = Proporsi testee yang menjawab dengan betul butir item tersebut
qi = Proporsi testee yang menjawab salah, qi= 1- p
Σpiqi = Jumlah hasil perkalian pi dan qi
KR21= () ()
Dimana:
Mt =Mean total (rata-rata hitung dari skor total)
KR20 dalam perhitungannya lebih teliti namun perhitungannya lebih rumit. Sedangkan KR21 perhitungannya lebih sederhana namun kurang teliti.
Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan test-reetest (single test – double trial)
Dikenal dengan pendekatan bentuk ulangan dimana tester hanya menggunakan satu seri tes tetapi percobaannya dilakukan dua kali. Misalkan seorang guru memberikan satu seri tes dalam dua kesempatan. Setelah tes selesai skor hasil tes pertama dikorelasikan dengan skor hasil tes kedua. Jika terdapat korelasi positif maka tes hasil belajar dapat dinyatakan reliable karena skor hasil tes belajar memperlihatkan kestabilan atau keajegan.
Untuk mencari korelasi tersebut terdapat teknik korelasi rank-order (tata jenjang) dari Spearman:
ρ = 1-
Dimana:
ρ = Koefisien korelasi antara variabel I (skor) dan II
D = Difference. D= RI - RII, N = Banyaknya subyek
Langkah-langkah:
Merumuskan hipotesis nihil: “Tidak terdapat korelasi positif yang signifikan antara hasil tes I daengan hasil tes II
Mencari koefisien korelasi rho: ρ = 1-
Memberikan interpretasi terhadap ρ
Melihat nilai rho dengan menggunakan derajat kebebasan (db) Misalkan N =20 diperoleh ρtabel pada taraf signifikansi 5% sebesar 0,450. Jika ρobservasi ≥ ρ tabel baik pada taraf 1% maupun 5% hipotesis nihil ditolak. Berarti tes pertama dan kedua terdapat korelasi posiif yang signifikan.
Menarik kesimpulan.
Bahwa tes hasil belajar sudah memiliki reliabilitas yang tinggi (reliabel). Pengujian ulang tidak hanya sebatas satu kali saja, boleh lebih sampai penyusun tes sudah yakin dengan keajegan hasil pengukuranya.
Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan alternate form (double test – double trial)
Mempergunakan dua tes yang diberikan tanpa adanya tenggang waktu dengan ketentuan tes harus sejenis, mengukur hal yang sama maupun tingkat kesukaran yang sama.
Alasan bahwa pendekatan alternate form (bentuk pararel) lebih baik daripada pendekatan yang sebelumnya:
Terhindar dari kemungkinan testee latihan atau menghafal karena butir item yang diberikan tidak sama
Terhindar akan timbulnya perbedaan situasi dan kondisi baik yang bersifat sosial maupun alami.
Apabila terdapat korelasi positif signifikan maka dapat dikatakan tes tersebut reliabel. Teknik korelasi yang digunakan antara teknik product moment dari Pearson atau teknik rank order dari Spearman(khusus untuk N ≤ 30).
rxy
Langkah-langkah:
Merumuskan hipotesis nihil
Menghitung rxy
Memberikan interpretasi terhadap rxy atau robservasi. Db = N-nr. Misalkan data 30 berarti db = 30 – 2 = 28, mencari r tabel. Jika rtabel pada taraf 5% lebih besar robservasi maka hipotesis nihil ditolak. Namun jika rtabel pada taraf 1% lebih kecil daripada robservasi maka hipotesis nihil disetujui.
Jika salah satu hipotesis nihil disetujui berarti hasil tes belajar memiliki reliabilitas sedang.
BAB III
PENUTUP
Kesimpulan
Reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hasil yang tetap sama (konsisten, ajeg).
Tujuan adanya realibilitas adalah mengkonsep satu variabel dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel.. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail.
Faktor yang mempengaruhi reliabilitas tes adalah panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi pembelajaran diukur. Kesulitan tes, test normative yang terlalu mudah atau terlalu sulitskor untuk siswa cenderung menghasilkan reliabilitas rendah. Objektivitas, yang di maksud objekif yaitu derajat dimana siswa dengan kompetensi sama mencapai hasil sama.
Ada dua bentuk teknik pengujian reliabilitas tes hasil belajar, yaitu bentuk uraian yaitu dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum Bentuk obyektif yaitu penentuan reliabilitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan.
Saran
Dalam makalah ini, pemakalah menyadari banyak kesalahan baik dari materi maupun perinciannya. Untuk itu, pemakalah meminta saran dan kritik terutama dari dosen pembimbing mata kuliah Evaluasi pendidikan Islam serta rekan-rekan semua yang bersifat membangun demi kesempurnaan makalah ini.
DAFTAR KEPUSTAKAAN
M. Sukardi. Evaluasi Pendidikan. Jakarta: Bumi Aksara. 2011
Pramana, I Nyoman Doni. Evaluasi Pendidikan. Bandung: Alfabetah. 2015
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi Pengajaran, Jakarta: Remaja Rosdakarya. 2008
Purwanto. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Setia. 2010
Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers, 2015
Sugiyono. Metode Penelitian Kombinasi. Bandung: Alfabeta. 2013
Sukardi, M. Evaluasi Pendidikan Prinsip & Operasionalnya. Jakarta: PT Bumi Aksara. 2008
Sukardi, Dewa Ketut. Analisis Tes Psikologi. Jakarta: Rineka Cipta. 1990
Thoha, M. Chabib. Teknik Evaluasi Pendidikan. Jakarta: RajaGrafindo Persada, 1991
Komentar
Posting Komentar