Instrumen
penelitian memegang peran penting dalam penelitian kuantitatif karena kualitas
data yang digunakan dalam banyak hal ditentukan oleh kualitas instrument yang
dipergunakan. Artinya, data yang bersangkutan dapat mewakili dan atau
mencerminkan keadaan sesuatu yang diukur pada diri subjek penelitian dan si
pemilik data.
Untuk itu peneliti kuantitatif harus
berfikir bagaimana memperoleh data seakurat mungkin dari subjek penelitian
sehingga data-data itu dapat dipertangung jawabkan dari pada berfikir teknik
statistic apa yang akan dipergunakan untuk mengolahnya. Intrumen tersebut
haruslah memiliki kualifikasi tertwntu yang memenuhi persyaratan ilmiah. Untuk
instrument seperti berbagai alat tes keberhasilan belajar, misalnya yang
berkaitan dengan ranah kognitif dan pertanyaan-pertanyaan untuk angket,
misalnya yang berhubungan dengan masalah afeksi, nilai-nilai, dan
kecenderungan-kecenderungan, persyaratan kualifikasi itu paling tidak meliputi
aspek validitas, reliabilitas dan efektivitas butir pertanyaan.
A. Validitas
Validitas adalah suatu ukuran yang
menunjukkan tingkat kesahihan suatu tes. Suatu
tes dikatakan valid
apabila tes tersebut
mengukur apa yang hendak
diukur. Tes memiliki
validitas yang tinggi
jika hasilnya sesuai dengan
kriteria, dalam arti
memiliki kesejajaran antara
tes dan kriteria. Untuk
menguji validitas setiap
butir soal maka skor-skor yang ada p ada butir yang
dimaksud dikorelasikan dengan
skor totalnya. Skor
tiap butir soal dinyatakan
skor X
dan skor total dinyatakan
sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat
diketahui butir-butir soal
manakah yang memenuhi
syarat dilihat dari
indeks validitasnya
Ada
sejumlah cara mempertimbangkan kadar validitas sebuah instrumen yang secara
garis besar dap[at dibedakan kedalam dua kategori. Kategori pertama yang
pertimbangannya lewat analisis rasional yaitu content validity (validitas
isi) dan construct validity (validitas
konstruk). Sedangkan validitas
kategori kedua misalnya adalah validitas sejalan, validitas kriteria dan
validitas ramalan.
Validitas
isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat
ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi
ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup
keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?"
atau berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian
"mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat
ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi
yang relevan dan tidak keluar dari batasan tujuan ukur. Walaupun isi atau
kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula
item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan
ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri
validitas yang sesungguhnya.
Apakah
validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur,
sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi
validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan
analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan
sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Validitas
konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap
suatu trait atau konstruk teoritis yang hendak diukurnya. Pengujian validitas konstruk merupakan
proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait
yang diukur.
Walaupun
pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang
lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris
lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk
koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada
alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.
Jenis validitas kedua yang bersifat
empiric memerlukan data-data di lapangan dari hasil uji coba yang berwujud data
kuantitatif. Jadi untuk keperluan analsis validitas itu diperlukan jasa
statistic. Validitas sejalan mempertanyakan apakah kemampuan apresiasi sastra
sejalan dengan kemampuan membaca. Untu itu, perlu dilakukan dua kali pengukuran
dalam dua bidang yang sejenis tersebut kpada subjek penelitian yang sama.
Hasilmnua Dianalisis dngan teknik korelasi product
moment.
B. Reliabilitas
Reabilitas
tes adalah tingkat
keajegan (konsitensi) suatu
tes, yakni sejauh mana
suatu tes dapat
dipercaya untuk menghasilkan
skor yang relatif tidak
berubah walaupun diteskan
pada situasi yang
berbeda-beda. Reliabilitas suatu
tes adalah taraf
sampai dimana suatu
tes mampu menunjukkan konsisten
hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan
ketelitian hasil. Reliabel
tes berhubungan dengan
ketetapan hasil tes.
Secara garis besar
terdapat 3 macam cara atau prosedur mempertimbangkan kualifikasi instrument
penelitian yang dimaksud yaitu dengan teknik 1. Stabilitas, 2. Konsistensi
instrument, 3. Equivalensi.
1. Teknik
Stabilitas
Suatu penelitian yang
menggunakan data primer, setidaknya berkaitan dengan emoat hal: 1. Subyek
penelitian, 2. Construct yang diukur, 3. Instrument pengukur dan 4. Saat
pengukuran. Penelitian kemungkinan bermaksud ubtuk menggunakan instrument
pengukur construct yang sama terhadap subyek penelitian tertentu sebanyak dua
kali pada saa yang berbeda. Perbedan waktu antara pengukuran yang satu dengan
pengukuran yang lain dapat berupa bilangan hari, minggu, bulan atau bahkan
tahun. Penelitian ini bermaksud untuk menguji stabilitas jawaban responden dari
suatu waktu ke waktu berikutnya dngan cara menghitung koefisien korelasi dan
skor jawaban responden yang dikur dengan instrument yang sama pada saat
berbeda. Proses pengujian stabilitas yang dikenal juga dengan test-retesr reability
pada dasarnya untuk mrngetahi realibilitas data berdasarkan stabilitas
responden. Salah satu metode statistic yang diugunkan koefisien stabilitas
adalah Pearson correlation.
2. Teknik
Ekuivalensi
Pengukuran
realibilitas dapat juga dilakukan dengan menggunakan instrument pengukur yang
berbeda untuk mengukur suatu custruct terhadap subyek penelitian tertentu pada
saat yang sama. Pendekatan yang juga disebut dengan alternative form
reliability ini lebih menekankan pada perbedaan bentuk instrument, sedang subyek
penelitian, construct dan saaat pengukurannya adalah sama. Penelitian melalui
penekatan ini menguji korelasi skr jawaban responden untuk mengetahui koefisien
ekuivalensi antara skor jawaban dengan menggunakan instrument pengukuran yang
berbeda.
3. Tekhnik
Konsistensi Internal
Pengujian terhadap
konsistensi internal yang dimiliki oleh suatu instrument merupakan alternative
lain yang dapat dilakukan oleh penelitian untuk menguji reliabilitas, disamping
pengukuran koefisien stabilitas dan ekuivalensi,. Konsep reliablitas menurut
pendekatan ini adalah konsistensi diantara butir-butir pertanyaan suatu
instrument. Tingkat keterkaitan antara butir pertanyaan atau pernyataan dalam
suatu instrument untuk mengukur construct tertentu menunjukkan tingkat
reliabilitas konsistensi internal instrume yang berangkutan. Untuk mengukur
konsistensi internal, peneliti hanya memerlukan sekali pengujian dengan
menggunakan teknik statistic tertentu terhadap skor jawaban responden yang
dihasilkan dari penggunaan instrument yang bersangkutan. Ada 3 teknik yang
dapat digunakan untuk mengukur konsistensi internal yaitu: (1) Split-half reliability, (2) Kuder-Richardson #20 dan (3) Cronbach’s alpa.
a. Split-half reliability (Belah Dua)
Sebuah tes diberikan dan dibagi menjadi dua bagian dan mencetak secara
terpisah, maka nilai satu setengah dari uji dibandingkan dengan skor tersisa
separuhnya untuk menguji keandalan.
Split-Setengah Keandalan adalah ukuran berguna ketika
tidak praktis atau tidak diinginkan untuk menilai reliabilitas dengan dua tes
atau memiliki administrasi menguji dua (karena keterbatasan waktu atau uang).
Rumus Spearman-Brown
Keterangan :
R 11 :
nilai reliabilitas
R b :
nilai koefisien korelasi
b.
Kuder-Richardson
Formula 20
Cara lain untuk mengevaluasi internal tes akan menggunakan Kuder-Richardson 20. Ini hanya
disarankan jika Anda memiliki item dikotomi dalam tes (biasanya untuk jawaban
benar atau salah).
r =
(1 -
)
r = Koefisien reliabilitas yang dicari
k = jumlah butir pertanyaan
c.
Alpha Cronbach / Koefisien Alpha
Cronbach Alpha /
Koefisien Alpha formula adalah rumus umum untuk memperkirakan keandalan tes
yang terdiri dari item yang bobot penilaian yang berbeda dapat ditugaskan untuk
respon yang berbeda
r =
Koefisien reliabilitas yang dicari
k = jumlah item pertanyaan
σi2 = varians butir pertanyaan
σ2 = varians skor tes
d. Kesalahan
Baku Pengukuran
Besarnya kesalahan
baku pengukuran akan tergantung oleh besarnya indeks reliabilitas juga akan
mempengaruhi kecermatan alat ukur yang bersangkutan untuk mengukur cirri laten
tertentu peserta uji
Rumusnya sebagai
berikut:
SEM = σ
C. Analisis Butir Pertanyaan
Untuk
mengetahui kualitas dan efektifitas tiap
butir pertanyaan yang dimaksud, diperlukan kerja analisis butir pertanyaan atau
soal. Analisis butir pertanyaan pada umumnya dimaksudkan untuk menetahui besar
kecilnya indeks tingkat kesulitan. Indeks daya beda dan efektifitas distraktor
butir-butir soal yang bersangkutan. Baik dalam teori klasik maupun teori respon
butir yang merupakan teori pengukuran modern yang dimaksudkan untuk memperbaiki
kelemahan-kelemahan dalam teori pengukuran klasik, analisis butir soal sangat
diperlukan dalam rangka meningkatkan kualitas alat pengukuran. Pembicaraan
berikut difokuskan pada analisis butir pertanyaan untuk menghitung indeks
tingkat kesulitan, daya beda dan distraktor.
1. Tingkat
Kesulitan Butir Pertanyaan
Tingkat
kesulitan merupakan suatu pernyataan tentang seberapa sulit atau seberapa mudah
sebuah butir pertanyaan bagi peserta uji. Dalam teori pengukuran klasik, indeks
tingkat kesulitan (ITK) sering berubah tergantung tingkat kemampuan peserta uji
yang diukur. ITK dalam model pengukuran klasik dapat diperoleh dengan
menghitung proporsi jawaban betul peserta tersebut. Indeks besarnya daya untuk
membedakan kemampuan itu dinyatakan dengan indeks sehingga secara lengkap
disebut sebagai indeks daya beda (IDB) butir soal. Ntuk menghitung IDB dapat
dilakukan dengan rumus:
IDB = FKT-FKR
n
IDB = Indeks daya beda
yang dicari
FKT = Frekuensi
jawaban benar kelompok tinggi
FKR = frekuensi
jawaban benar kelompok rendah
n =
Jumlah peserta kelompok tinggi atau
rendah
Namun
menganalisis jawaban per siswa per butir untuk N soal, jika jumlah dan jumlah
butir soal relatif banyak, akan sangat merepotkan dan bisa jadi juga kurang efisien. Untuk menghindari pemborosan yang tidak perlu,
analisis butir dapat dilakukan dengan mengambil sebagian dari lembar jawaban
peserta. Jika cara ini ditempuh, akan
dibagi 2 kelompok yaitu, kelompok tinggi (KT) dan peserta kelompok rendah (KR). Indeks tingkat kesulitan tetap dihitung
berdasarkan proporsi jawaban benar, yaitu yang diperoleh dari kedua kelompok
tersebut. Rumusnya adalah sebagai berikut.
ITK= FKT-FKR
n
ITK = Indeks tingkat kesulitan yang dicari
FKT = Frekuensi
jawaban benar kelompok tinggi
FKR = Frekuensi
jawaban benar kelompok rendah
N =
Jumlah peserta kedua kelompok
2. Indeks
Daya Beda Butir Pertanyaan
Daya
beda butir pertanyaan merupakan suatu pernyataan tentang seberapa besar daya
sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan
kelompok rendah. Secara teoritis peserta uji kelompok tinggi haruslah menjawab
dengan benar butir-butir soal yang dikerjakan secara lebih banyak daripada
jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar peserta
kelompok rendah lebih besar, hal ini menyalahi logika dan tidak memiliki
konsistensi internal sehingga butir soal yang bersangkutan dinyatakan tidak
baik.
3. Perhitungan
Indeks Tingkat Kesulitan dan Daya Beda dengan Tabel
Perhitungan indeks tingkat kesulitan dan daya beda
dilakukan dengan menghitung langsung dari data yang diperoleh. Perhitungan ITK
lewat skala delta dilakukan dengan menghitung proporsi jawaban benar dan
kemudian hasilnya ditansformasikan ke dalam distribusi normal baku. Sedangkan
perhitungan ITK lewat proporsi, indeks skala delta yang semakin besar
menunjukkan bahwa butir soal yang bersangkutan semakin sulit, sedangkan indeks
skala delta yang semakin kecil menunjukkan bahwa butir soal itu semakin mudah.
4. Analisis
Distraktor
Analisis Distraktor
adalah analisis jawaban peserta uji terhadap opsi yang salah. Model ini
berangggapan bahwa semua opsi harus efektif. Artinya, walau opsi salah, opsi
tersebut tetap saja harus ada sejumlah peserta uji yang memilihnya. Ada
beberapa criteria untuk menetapkan efektifitas distraktor yaitu (1) semua
distraktor (opsi salah) harus ada yang memilih, (2) jumlah pemilih opsi-salah
dari pesertta kelompok tinggi harus lebih sedikit dari pada kelompok rendah dan
(3) jika pemilih opsi-salah hanya satu, ia harus dari kelompok rendah.
5. Analisis
Butir Soal dengan Program Komputer
Analisis butir soal dapat
juga dilakukan dengan cara penghitungan lewat program computer di samping dengancara manual. Analisis butir untuk model
pengukuran klasik dengan mempergunakan program Iteman, sedangkan teori respon butir mempergunakan program Rascal atau Ascal tergantung brapa parameter yang akan dianalisis. Perhitumngan
lewat program computer yang dicontohkan di bawah ini dibatasi hanya yang
mempergunakan program Iteman unutk
analisis butir model pengukuran klasik.
Tidak ada komentar:
Posting Komentar