Validitas
dan Reliabilitas
Fitriani, S.Pd
Sumber :Perkuliahan Metodologi Penelitian
Pendidikan oleh Dr. Heri Retnowati. Pada
pertemuan ke-7 Pascasarjana Pendidikan Matematika Kelas A di hari selasa
tanggal 27 Oktober 2015 pukul 07.30 s.d. 10.00 di ruang PPG 1 lt. 2 Lab Matematika
FMIPA UNY.
A.
Validitas
Menurut Sudaryono (2012) validitas
atau kesahihan berasal dari kata validity
yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya. Dengan kata lain, validitas adalah suatu konsep yang
berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya diukur. Sedangkan
Linn & Gronlund dalam Heri menjelaskan validitas mengacu pada kecukupan dan
kelayakan interpretasi yang dibuat dari penilaian, berkenaan dengan penggunaan
khusus. Pendapat ini diperkuat oleh Messick dalam Heri bahwa validitas
merupakan kebijakan evaluatif yang terintegrasi tentang sejauhmana fakta
empiris dan alasan teoretis mendukung kecukupan dan kesesuaian inferensi dan
tindakan berdasarkan skor tes. Dengan demikian dapat disimpulkan bahwa
validitas adalah suatu konsep yang mengacu pada kecukupan atau kelayakan yang
terintegrasi tentang sejauh mana fakta empiris mendukung kecukupan dan kesesuaian
tindakan berdasarkan skor tes.
Menurut Heri dalam Nunnally validitas
dapat dikelompokkan menjadi tiga tipe yaitu validitas kriteria (criterion-related),
validitas isi, dan validitas konstruk. Penjelasan lebih lanjut dari ketiga tipe
tersebut akan diuraikan sebagai berikut:
1. Validitas isi
Validitas isi suatu instrumen (Kartowagiran, 2009) adalah sejauhmana
butir-butir dalam instrumen itu mewakili komponen-komponen dalam keseluruhan
kawasan isi obyek yang hendak diukur (aspek representasi) dan sejauh mana
butir-butir itu mencerminkan ciri perilaku yang hendak diukur (aspek
relevansi). Dipertegas kembali oleh Nunanly dalam Heri mengungkapkan bahwa validitas
isi suatu instrumen adalah sejauhmana butir-butir dalam instrumen itu mewakili
komponen-komponen dalam keseluruhan kawasan isi objek yang hendak diukur dan
sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur. Sedangkan
validitas isi (Truckman dalam Wagiran, 2015) merujuk kepada sejauh mana
instrumen tersebut mencerminkan isi yang dikehendaki. Sehingga dapat ditarik
kesimpulan bahwa validitas isi adalah sejauhmana butir-butir dalam instrumen
itu mewakili komponen yang mencerminkan isi yang dikehendaki.
Validitas isi ditentukan menggunakan
kesepakatan ahli. Kesepakatan ahli bidang studi atau sering disebut dengan domain
yang diukur menentukan tingkatan validitas isi (content related).
Hal ini dikarenakan instrumen pengukuran, misalnya berupa tes atau angket dibuktikan
valid jika ahli (expert) meyakini bahwa bahwa istrumen tersebut mengukur
penguasaan kemampuan yang didefinisikan dalam domain ataupun juga konstruk
psikologi yang diukur. Untuk mengetahui kesepakatan ini, dapat digunakan indeks
validitas, diantaranya dengan indeks yang diusulkan oleh Aiken (dalam Heri).
Indeks validitas butir yang diusulkan Aiken ini dirumuskan sebagai berikut:
dengan V adalah indeks validitas butir; s skor yang ditetapkan
setiap rater dikurangi skor terendah dalam kategori yang dipakai (s = r – lo,
dengan r =skor kategori pilihan rater dan lo skor terendah dalam
kategori penyekoran); n banyaknya rater; dan c banyaknya kategori yang dapat dipilih
rater.
2. Validitas konstruk
Validitas konstruk (Kartowagiran, 2009) adalah validitas
yang menunjukkan sejauhmana instrumen mengungkap suatu trait atau konstruk
teoritik yang hendak diukurnya. Menurut Heri pengujian validitas konstruk adalah
dengan dilakuakan setelah proses validasi isi. Prosedur validasi konstruk
diawali dari suatu identifikasi dan batasan mengenai variabel yang hendak
diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai
variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai
hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan diuji.
Apabila hasilnya sesuai dengan harapan maka instrumen itu dianggap memiliki
validitas konstruk yang baik.
Menurut Heri, Analisis yang banyak digunakan
dalam validitas konstruk antara lain dengan analisis faktor eksploratori (exploratory
factor analysis, EFA) maupun konfirmatori (confirmatory factor analysis,
CFA)
3. Validitas kriteria
Pengertian validitas kriteria (criterion validity) dalam Murti merujuk
kepada kesesuaian antara hasil pengukuran sebuah alat ukur dengan alat ukur
ideal (standar emas), tentang variabel yang diteliti. Sedangkan menurut Fernandes
dalam Heri mengatakan validitas berdasarkan kriteria dimaksudkan untuk menjawab
pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang (predictive
validity) atau mengestimasi kemampuan dengan alat ukur lain dengan tenggang
waktu yang hampir bersamaan (concurrent validity). Sehingga dapat disimpulkan bahwa validitas
kriteria adalah kesesuaian antara kesesuaian antara hasil pengukuran dengan
alat ukur untuk menjawab pertanyaan sejauh mana tes memprediksi
kemampuan peserta di masa mendatang atau mengestimasi alat ukur.
Membuktikan validitas kriteria (Popham
dalam Heri) menyebutkan menggunakan
pendekatan dalam bentuk criterion-related validation. Pendekatan
analisisnya sering menggunakan yakni analisis dengan korelasi, misalnya
korelasi product-moment. Ada dua macam
regresi yang dapat digunakan. Model yang pertama yakni regresi sederhana atau
regresi tunggal, dengan prediktor hanya satu variabel saja (Pedhazur dalam Heri).
Model ini dituliskan sebagai berikut
dengan Yˆ merupakan hasil prediksi, 0 b konstanta,
1 b koefisien prediktor, dan X merupakan prediktor. Model yang
kedua yakni regresi ganda, dengan prediktor lebih dari satu variabel. Pada kasus
kedua ini, digunakan jika tes terdiri dari beberapa subtes, dan prediktor merupakan
jumlahan skor dari subtes-subtes yang berada dalam seperangkat tes. Model
regresi ganda dengan dua prediktor disajikan pada persamaan berikut:
dengan Yˆ merupakan hasil prediksi, 0 b konstanta,
1 b koefisien prediktor pertama, X1 prediktor pertama,
2 b koefisien prediktor kedua, dan X2 merupakan
prediktor kedua. Kedua model ini belum dibandingkan yang paling akurat, untuk
memprediksikan skor kriteria kemampuan peserta tes.
B.
Reliabilitas
Reliabilitas yang
berasal dari kata reliability berarti
sejauhmana hasil suatu pengukuran dapat dipercaya (Sudaryono, 2012). Sedangkan dalam
Tockman rabilitas merujuk kepada sejauhmana suatu alat ukur secara ajeg
(konsisten) mengukur apa yang seharusnya di ukur (Wagiran, 2015). Maka dapat
disimpulkan bahwa reliabilitas adalah sejauh mana alat ukur dapat mengukur apa
yang seharusnya di ukur.
Reliabilitas suatu tes menurut
Heri pada umumnya diekspresikan secara numerik dalam bentuk koefisien yang
besarnya -1>0>+1. Koefisien tinggi menunjukkan reliabilitas tinggi. Sebaliknya,
jika koefisien suatu tes rendah maka reliabilitas tes rendah. Jika suatu reliabilitas
sempurna, berarti tes tersebut mempunyai koefisien +1 atau -1.
Allen dan Yen (dalam Kartowagiran), mengemukakan tiga
metode yang umum digunakan untuk menaksir koefisien reliablitas yaitu: (1)
metode tes ulang, (2) metode tes parelel, dan (3) metode konsistensi internal.
Secara umum masing-masing dari ketiga metode tersebut akan menghasilkan
taksiran koefisien reliabilitas (rx), yang berbeda. Jadi yang dihasilkan
hanyalah taksiran, karena nilai sebenarnya koefisien ini adalah tidak dapat
diamati.
Penghitungan
reliabilitas disebut dengan estimasi. Estimasi reliabilitas tes menurut Heri dapat
dilakukan dengan dua cara, baik konsistensi eksternal dan maupun konsistensi internalnya.
1. Pengukuran Konsistensi Eksternal
a.
Pengukuran Test Ulang (Test-Retest-Method)
Reliabilitas tes retes ini penting
ketika kita menafsirkan koefisisen tes-retes untuk mengetahui: 1) jangka waktu
antara kedua pengambilan penilaian, 2) stabilitas yang diharapkan dari kinerja
yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang
berulang, semakin rendah tingkat reliabilitasnya. Estimasi reliabilitas dengan
pendekatan tes-retes akan menghasilkan koefisien stabilitas. Untuk memperoleh
koefisien reliabilitas melalui pendekatan tes-retes dapat dilakukan dengan
menghitung koefisien korelasi linier antara distribusi skor subjek pada
pemberian tes pertama dengan skor subjek pada pemberian skor kedua.
b.
Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes equivalent
adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan
susunan tetapi butir-butir soalnya berbeda, dalam istilah bahasa Inggris
disebut alternate-forms method (parallel forms).
Dengan metode bentuk
paralel ini, dua buah tes yang paralel, misalnya tes Matematika seri A yang
akan dicari reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa
yang sama, kemudian dikorelasikan. Koefisien korelasi dari kedua hasil tes
inilah yang menunjukkan koefisien reliabilitas tes seri A. Jika koefisiennya tinggi
maka tes tersebut sudah reliable dan dapat digunakan sebagai alat dan pengetes yang
terandalkan.
Dalam menggunakan metode
tes paralel pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan
kepada sekelompok siswa yang sama. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada factor “ masih ingat-ingat
soalnya” yang dalam evaluasi disebut adanya practice-effect- dan carry-over-effect.
Artinya ada factor yang dibawa oleh pengikut tes karena sudah mengerjakan soal
tersebut.
Kelemahan dari metode
ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri
tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
Mengenai pertanyaan bagaimana proses melaksanakan tes reliabilitas secara
ekivalen? Berikut ini akan ditunjukkan beberapa langkah-langkah tersebut
diantaranya adalah sebagai berikut:
1)
Menentukan subjek sasaran yang hendak di tes
2)
Melakukan tes yang dimaksud kepada sasaran subjek yang
dimaksud
3)
Diadministrasi dengan baik
4)
Dalam waktu yang tidak begitu lama melakukan tes yang kedua
pada kelompok tersebut.
5)
Mengkorelasikan antara kedua skor tes tersebut.
Jika hasil koefisien
ekivalen tinggi, berarti tes memiliki reliabilitas ekivalen baik. Sebaliknya,
jika ternyata koefesien rendah maka reliabilitas ekivalen tes adalah rendah. Reliabilitas
ekivalen merupakn salah satu bentuk yang diterima dan umum dipakai penelitian
terutama penelitian pendidikan.
2. Pengukuran Konsistensi Internal
Reliabilitas internal
diperoleh dengan cara menganalisis data dari satu kali pengetesan. Pemilihan suatu teknik didasarkan atas
bentuk instrument atau selera peneliti. Kadang-kadang penggunaan teknik yang berbeda menghasilkan indeks reliabilitas
yang berbeda pula. Hal ini wajar
saja karena kadang-kadang dipengaruhi oleh sifat atau karakteristik datanya sehingga dalam perhitungan
diperoleh angka berbeda sebagai akibat pembulatan angka. Namun demikian, untuk beberapa teknik diperlukan
persyaratan-persyaratan tertentu
sehingga peneliti tidak begitu saja memilih teknik-teknik tersebut.
Beberapa metode yang
dapat digunakan untuk mencari besarnya reliabilitas antara lain adalah :
a.
Metode Belah Dua (Split
Half Method)
Dalam teknik belah dua
ini, dalam pengetesan hanya menggunakan satu tes yang dicobakan satu kali
kepada sejumlah subjek (sample). Item-item pada tes dibagi dua. Skor
dari setengah item-item tes pada bagian yang pertama dikorelasikan dengan skor
setengah item-item tes pada bagian yang kedua. Mencari reliabilitas dengan
menggunakan teknik belah dua sekurangkurangnya ada dua persyaratan yang harus
dipenuhi, yaitu :
1)
Banyaknya butir pertanyaan atau butir soal dalam instrument
harus genap agar dapat dibelah
2)
Antara belahan pertama dengan belahan kedua harus seimbang.
Belahan instrument dikatakan seimbang jika jumlah
butir pertanyaannya sama dan pertanyaan tersebut mengungkap aspek yang sama.
Untuk memperoleh belahan yang seimbang, peneliti harus membuat pertanyaan dalam
jumlah genap untuk setiap aspek atau factor. Dengan demikian, letak butir dapat
disebar sedemikian rupa agar kalau dalam analisis data akan melakukan
pembelahan sudah diketahui dengan pasti manakah pasangan-pasangan butir
pertanyaannya. Itulah sebabnya perencanaan penelitian harus terpadu dalam
memperhatikan tabel, pembuatan instrument, uji coba, pengujian reliabilitas,
analisis data, dsb.
Cara pembelahan ini dapat menghindari
kemungkinan terjadinya pengelompokan item-item tertentu kedalam salah satu
belahan saja. Ada beberapa pengujian reliabilitas dengan metode belah dua,
antara lain:
a)
Rumus Spearman-Brown
Adapun rumus yang digunakann adalah:
Keterangan:
ri = Rabilitas Internal Seluruh instrumen
rb =
Korelasi product moment antara belahan pertama dan kedua
b)
Rumus Flanagan
Keterangan:
r11 =
Rabilitas Instrumen
v1 =
Varians belahan pertama
v2 =
Varians belahan kedua
vt =
Varians skor total
c)
Rumus Rulon
r11 =
Reabilitas Instrumen
vd =
varians beda
d = skor belahan
awal dikurang skor pada belahan akhir
vt =
varians skor total
d)
Rumus KR.20 (Kuder-Richdarson
20)
Keterangan:
r11 =
Reabilitas Instrumen
p1 =
Proporsional banyaknya subjek yang menjawab pada item 1
k = jumlah item
dalam instrumen
s2t =
varians skor total
qi =
1-pi
e)
Rumus Kr 21
Keterangan:
r11 = Reabilitas
Instrumen
M = mean skor total
k = jumlah item
dalam instrumen
s2t =
varians skor total
b.
Metode Non Belah Dua
Metode non belah dua dapat dilakukan
denga menggunakan rumus Kaidah Cronbach Alpa. Rumusnya sebagai berikut:
Keterangan:
r11 =
Reliabilitas Isntrumen
k = jumlah
item dalam instrumen/banyaknya soal
∑δb2 =
jumlah varians butir
Δt2 =
varians total
Sumber:
Kartowagiran, Badrun. 2009. Penyusunan Instrumen Kinerja Smk-Sbi. Makalah
disampaikan dalam workshop Evaluasi Kinerja SMK-SBI pada tanggal 14 November
2009 di P4TK Matematika Yogyakarta. Pascasarjana
Universitas Negeri Yogyakarta.
Murti, Bhisma. (2011). Validitas Dan
Reliabilitas Pengukuran. Matrikulasi
Program Studi Doktoral. Fakultas Kedokteran, Universitas Sebelas Maret
Retnawati, Heri. Reliabilitas.
Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta
-------------------. Membuktikan Validitas Instrumen
dalam Pengukuran. Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta
Sudaryono. (2012). Dasar-dasar
Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu
Wagiran, (2014), Metodologi Penelitian Pendidikan (teori
dan implementasi), Yogyakarta: Deepublish
0 Response to "Validitas dan Reliabilitas "