Latest News

Validitas dan Reliabilitas




Validitas dan Reliabilitas 


Fitriani, S.Pd

Sumber       :Perkuliahan Metodologi Penelitian Pendidikan oleh Dr. Heri Retnowati. Pada  pertemuan ke-7 Pascasarjana Pendidikan Matematika Kelas A di hari selasa tanggal 27 Oktober 2015 pukul 07.30 s.d. 10.00 di ruang PPG 1 lt. 2 Lab Matematika FMIPA UNY.

A. Validitas 

Menurut Sudaryono (2012) validitas atau kesahihan berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Dengan kata lain, validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya diukur. Sedangkan Linn & Gronlund dalam Heri menjelaskan validitas mengacu pada kecukupan dan kelayakan interpretasi yang dibuat dari penilaian, berkenaan dengan penggunaan khusus. Pendapat ini diperkuat oleh Messick dalam Heri bahwa validitas merupakan kebijakan evaluatif yang terintegrasi tentang sejauhmana fakta empiris dan alasan teoretis mendukung kecukupan dan kesesuaian inferensi dan tindakan berdasarkan skor tes. Dengan demikian dapat disimpulkan bahwa validitas adalah suatu konsep yang mengacu pada kecukupan atau kelayakan yang terintegrasi tentang sejauh mana fakta empiris mendukung kecukupan dan kesesuaian tindakan berdasarkan skor tes.
Menurut Heri dalam Nunnally validitas dapat dikelompokkan menjadi tiga tipe yaitu validitas kriteria (criterion-related), validitas isi, dan validitas konstruk. Penjelasan lebih lanjut dari ketiga tipe tersebut akan diuraikan sebagai berikut:

1.  Validitas isi

Validitas isi suatu instrumen (Kartowagiran, 2009) adalah sejauhmana butir-butir dalam instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan isi obyek yang hendak diukur (aspek representasi) dan sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur (aspek relevansi). Dipertegas kembali oleh Nunanly dalam Heri mengungkapkan bahwa validitas isi suatu instrumen adalah sejauhmana butir-butir dalam instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan isi objek yang hendak diukur dan sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur. Sedangkan validitas isi (Truckman dalam Wagiran, 2015) merujuk kepada sejauh mana instrumen tersebut mencerminkan isi yang dikehendaki. Sehingga dapat ditarik kesimpulan bahwa validitas isi adalah sejauhmana butir-butir dalam instrumen itu mewakili komponen yang mencerminkan isi yang dikehendaki.
Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli bidang studi atau sering disebut dengan domain yang diukur menentukan tingkatan validitas isi (content related). Hal ini dikarenakan instrumen pengukuran, misalnya berupa tes atau angket dibuktikan valid jika ahli (expert) meyakini bahwa bahwa istrumen tersebut mengukur penguasaan kemampuan yang didefinisikan dalam domain ataupun juga konstruk psikologi yang diukur. Untuk mengetahui kesepakatan ini, dapat digunakan indeks validitas, diantaranya dengan indeks yang diusulkan oleh Aiken (dalam Heri). Indeks validitas butir yang diusulkan Aiken ini dirumuskan sebagai berikut:
dengan V adalah indeks validitas butir; s skor yang ditetapkan setiap rater dikurangi skor terendah dalam kategori yang dipakai (s = r – lo, dengan r =skor kategori pilihan rater dan lo skor terendah dalam kategori penyekoran); n banyaknya rater; dan c banyaknya kategori yang dapat dipilih rater.

2.  Validitas konstruk

Validitas konstruk (Kartowagiran, 2009) adalah validitas yang menunjukkan sejauhmana instrumen mengungkap suatu trait atau konstruk teoritik yang hendak diukurnya. Menurut Heri pengujian validitas konstruk adalah dengan dilakuakan setelah proses validasi isi. Prosedur validasi konstruk diawali dari suatu identifikasi dan batasan mengenai variabel yang hendak diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu dianggap memiliki validitas konstruk yang baik.
Menurut Heri, Analisis yang banyak digunakan dalam validitas konstruk antara lain dengan analisis faktor eksploratori (exploratory factor analysis, EFA) maupun konfirmatori (confirmatory factor analysis, CFA)

3.  Validitas kriteria

Pengertian validitas kriteria (criterion validity) dalam Murti merujuk kepada kesesuaian antara hasil pengukuran sebuah alat ukur dengan alat ukur ideal (standar emas), tentang variabel yang diteliti. Sedangkan menurut Fernandes dalam Heri mengatakan validitas berdasarkan kriteria dimaksudkan untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang (predictive validity) atau mengestimasi kemampuan dengan alat ukur lain dengan tenggang waktu yang hampir bersamaan (concurrent validity). Sehingga dapat disimpulkan bahwa validitas kriteria adalah kesesuaian antara kesesuaian antara hasil pengukuran dengan alat ukur untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang atau mengestimasi alat ukur.
Membuktikan validitas kriteria (Popham dalam Heri) menyebutkan  menggunakan pendekatan dalam bentuk criterion-related validation. Pendekatan analisisnya sering menggunakan yakni analisis dengan korelasi, misalnya korelasi product-moment. Ada dua macam regresi yang dapat digunakan. Model yang pertama yakni regresi sederhana atau regresi tunggal, dengan prediktor hanya satu variabel saja (Pedhazur dalam Heri). Model ini dituliskan sebagai berikut
dengan Yˆ merupakan hasil prediksi, 0 b konstanta, 1 b koefisien prediktor, dan X merupakan prediktor. Model yang kedua yakni regresi ganda, dengan prediktor lebih dari satu variabel. Pada kasus kedua ini, digunakan jika tes terdiri dari beberapa subtes, dan prediktor merupakan jumlahan skor dari subtes-subtes yang berada dalam seperangkat tes. Model regresi ganda dengan dua prediktor disajikan pada persamaan berikut:


dengan Yˆ merupakan hasil prediksi, 0 b konstanta, 1 b koefisien prediktor pertama, X1 prediktor pertama, 2 b koefisien prediktor kedua, dan X2 merupakan prediktor kedua. Kedua model ini belum dibandingkan yang paling akurat, untuk memprediksikan skor kriteria kemampuan peserta tes. 

B. Reliabilitas

Reliabilitas yang berasal dari kata reliability berarti sejauhmana hasil suatu pengukuran dapat dipercaya (Sudaryono, 2012). Sedangkan dalam Tockman rabilitas merujuk kepada sejauhmana suatu alat ukur secara ajeg (konsisten) mengukur apa yang seharusnya di ukur (Wagiran, 2015). Maka dapat disimpulkan bahwa reliabilitas adalah sejauh mana alat ukur dapat mengukur apa yang seharusnya di ukur.
Reliabilitas suatu tes menurut Heri pada umumnya diekspresikan secara numerik dalam bentuk koefisien yang besarnya -1>0>+1. Koefisien tinggi menunjukkan reliabilitas tinggi. Sebaliknya, jika koefisien suatu tes rendah maka reliabilitas tes rendah. Jika suatu reliabilitas sempurna, berarti tes tersebut mempunyai koefisien +1 atau -1.
Allen dan Yen (dalam Kartowagiran), mengemukakan tiga metode yang umum digunakan untuk menaksir koefisien reliablitas yaitu: (1) metode tes ulang, (2) metode tes parelel, dan (3) metode konsistensi internal. Secara umum masing-masing dari ketiga metode tersebut akan menghasilkan taksiran koefisien reliabilitas (rx), yang berbeda. Jadi yang dihasilkan hanyalah taksiran, karena nilai sebenarnya koefisien ini adalah tidak dapat diamati.
Penghitungan reliabilitas disebut dengan estimasi. Estimasi reliabilitas tes menurut Heri dapat dilakukan dengan dua cara, baik konsistensi eksternal dan maupun konsistensi internalnya.

1.  Pengukuran Konsistensi Eksternal

a.  Pengukuran Test Ulang (Test-Retest-Method)

Reliabilitas tes retes ini penting ketika kita menafsirkan koefisisen tes-retes untuk mengetahui: 1) jangka waktu antara kedua pengambilan penilaian, 2) stabilitas yang diharapkan dari kinerja yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang berulang, semakin rendah tingkat reliabilitasnya. Estimasi reliabilitas dengan pendekatan tes-retes akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes-retes dapat dilakukan dengan menghitung koefisien korelasi linier antara distribusi skor subjek pada pemberian tes pertama dengan skor subjek pada pemberian skor kedua.


b.  Metode Bentuk Paralel (Equivalent)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah bahasa Inggris disebut alternate-forms method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa yang sama, kemudian dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat dan pengetes yang terandalkan.
Dalam menggunakan metode tes paralel pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan kepada sekelompok siswa yang sama. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada factor “ masih ingat-ingat soalnya” yang dalam evaluasi disebut adanya practice-effect- dan carry-over-effect. Artinya ada factor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua kali tes. Mengenai pertanyaan bagaimana proses melaksanakan tes reliabilitas secara ekivalen? Berikut ini akan ditunjukkan beberapa langkah-langkah tersebut diantaranya adalah sebagai berikut:
1)  Menentukan subjek sasaran yang hendak di tes
2)  Melakukan tes yang dimaksud kepada sasaran subjek yang dimaksud
3)  Diadministrasi dengan baik
4)  Dalam waktu yang tidak begitu lama melakukan tes yang kedua pada kelompok tersebut.
5)  Mengkorelasikan antara kedua skor tes tersebut.
Jika hasil koefisien ekivalen tinggi, berarti tes memiliki reliabilitas ekivalen baik. Sebaliknya, jika ternyata koefesien rendah maka reliabilitas ekivalen tes adalah rendah. Reliabilitas ekivalen merupakn salah satu bentuk yang diterima dan umum dipakai penelitian terutama penelitian pendidikan.

2.  Pengukuran Konsistensi Internal

Reliabilitas internal diperoleh dengan cara menganalisis data dari satu kali pengetesan. Pemilihan suatu teknik didasarkan atas bentuk instrument atau selera peneliti. Kadang-kadang penggunaan teknik yang berbeda menghasilkan indeks reliabilitas yang berbeda pula. Hal ini wajar saja karena kadang-kadang dipengaruhi oleh sifat atau karakteristik datanya sehingga dalam perhitungan diperoleh angka berbeda sebagai akibat pembulatan angka. Namun demikian, untuk beberapa teknik diperlukan persyaratan-persyaratan tertentu sehingga peneliti tidak begitu saja memilih teknik-teknik tersebut.
Beberapa metode yang dapat digunakan untuk mencari besarnya reliabilitas antara lain adalah :

a.  Metode Belah Dua (Split Half Method)

Dalam teknik belah dua ini, dalam pengetesan hanya menggunakan satu tes yang dicobakan satu kali kepada sejumlah subjek (sample). Item-item pada tes dibagi dua. Skor dari setengah item-item tes pada bagian yang pertama dikorelasikan dengan skor setengah item-item tes pada bagian yang kedua. Mencari reliabilitas dengan menggunakan teknik belah dua sekurangkurangnya ada dua persyaratan yang harus dipenuhi, yaitu :
1)  Banyaknya butir pertanyaan atau butir soal dalam instrument harus genap agar dapat dibelah
2)  Antara belahan pertama dengan belahan kedua harus seimbang.
Belahan instrument dikatakan seimbang jika jumlah butir pertanyaannya sama dan pertanyaan tersebut mengungkap aspek yang sama. Untuk memperoleh belahan yang seimbang, peneliti harus membuat pertanyaan dalam jumlah genap untuk setiap aspek atau factor. Dengan demikian, letak butir dapat disebar sedemikian rupa agar kalau dalam analisis data akan melakukan pembelahan sudah diketahui dengan pasti manakah pasangan-pasangan butir pertanyaannya. Itulah sebabnya perencanaan penelitian harus terpadu dalam memperhatikan tabel, pembuatan instrument, uji coba, pengujian reliabilitas, analisis data, dsb.
Cara pembelahan ini dapat menghindari kemungkinan terjadinya pengelompokan item-item tertentu kedalam salah satu belahan saja. Ada beberapa pengujian reliabilitas dengan metode belah dua, antara lain:
a)    Rumus Spearman-Brown
Adapun rumus yang digunakann adalah:

Keterangan:
 ri     = Rabilitas Internal Seluruh instrumen
rb    = Korelasi product moment antara belahan pertama dan kedua
b)   Rumus Flanagan
Keterangan:
r11      = Rabilitas Instrumen
v1    = Varians belahan pertama
v2    = Varians belahan kedua
vt     = Varians skor total
c)    Rumus Rulon

r11      = Reabilitas Instrumen
vd    = varians beda
d     = skor belahan awal dikurang skor pada belahan akhir
vt        = varians skor total
d)   Rumus KR.20 (Kuder-Richdarson 20)

Keterangan:
r11    = Reabilitas Instrumen
p1       = Proporsional banyaknya subjek yang menjawab pada item 1
k     = jumlah item dalam instrumen
s2t   = varians skor total
qi     = 1-pi
e)    Rumus Kr 21
Keterangan:
r11    = Reabilitas Instrumen
M    = mean skor total
k     = jumlah item dalam instrumen
s2t   = varians skor total

b.  Metode Non Belah Dua

Metode non belah dua dapat dilakukan denga menggunakan rumus Kaidah Cronbach Alpa. Rumusnya sebagai berikut:
Keterangan:
r11         = Reliabilitas Isntrumen
k          = jumlah item dalam instrumen/banyaknya soal
∑δb2     = jumlah varians butir
Δt2       = varians total

Sumber:
Kartowagiran, Badrun. 2009. Penyusunan Instrumen Kinerja Smk-Sbi. Makalah disampaikan dalam workshop Evaluasi Kinerja SMK-SBI pada tanggal 14 November 2009 di P4TK Matematika Yogyakarta. Pascasarjana Universitas Negeri Yogyakarta.
Murti, Bhisma. (2011). Validitas Dan Reliabilitas Pengukuran. Matrikulasi Program Studi Doktoral. Fakultas Kedokteran, Universitas Sebelas Maret
Retnawati, Heri. Reliabilitas. Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta
-------------------. Membuktikan Validitas Instrumen dalam Pengukuran. Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta
Sudaryono. (2012). Dasar-dasar Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu
Wagiran, (2014), Metodologi Penelitian Pendidikan (teori dan implementasi), Yogyakarta: Deepublish


0 Response to "Validitas dan Reliabilitas "