Prakosoisme: UJI INSTRUMEN PENELITIAN

Instrumen penelitian memegang peran penting dalam penelitian kuantitatif karena kualitas data yang digunakan dalam banyak hal ditentukan oleh kualitas instrument yang dipergunakan. Artinya, data yang bersangkutan dapat mewakili dan atau mencerminkan keadaan sesuatu yang diukur pada diri subjek penelitian dan si pemilik data.

Untuk itu peneliti kuantitatif harus berfikir bagaimana memperoleh data seakurat mungkin dari subjek penelitian sehingga data-data itu dapat dipertangung jawabkan dari pada berfikir teknik statistic apa yang akan dipergunakan untuk mengolahnya. Intrumen tersebut haruslah memiliki kualifikasi tertwntu yang memenuhi persyaratan ilmiah. Untuk instrument seperti berbagai alat tes keberhasilan belajar, misalnya yang berkaitan dengan ranah kognitif dan pertanyaan-pertanyaan untuk angket, misalnya yang berhubungan dengan masalah afeksi, nilai-nilai, dan kecenderungan-kecenderungan, persyaratan kualifikasi itu paling tidak meliputi aspek validitas, reliabilitas dan efektivitas butir pertanyaan.

A. Validitas

Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan kriteria. Untuk menguji validitas setiap butir soal maka skor-skor yang ada p ada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya

Ada sejumlah cara mempertimbangkan kadar validitas sebuah instrumen yang secara garis besar dap[at dibedakan kedalam dua kategori. Kategori pertama yang pertimbangannya lewat analisis rasional yaitu content validity (validitas isi) dan construct validity (validitas konstruk). Sedangkan validitas kategori kedua misalnya adalah validitas sejalan, validitas kriteria dan validitas ramalan.

Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.

Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur. Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.

Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.

Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.

Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.

Jenis validitas kedua yang bersifat empiric memerlukan data-data di lapangan dari hasil uji coba yang berwujud data kuantitatif. Jadi untuk keperluan analsis validitas itu diperlukan jasa statistic. Validitas sejalan mempertanyakan apakah kemampuan apresiasi sastra sejalan dengan kemampuan membaca. Untu itu, perlu dilakukan dua kali pengukuran dalam dua bidang yang sejenis tersebut kpada subjek penelitian yang sama. Hasilmnua Dianalisis dngan teknik korelasi product moment.

B. Reliabilitas

Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Reliabilitas suatu tes adalah taraf sampai dimana suatu tes mampu menunjukkan konsisten hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan ketelitian hasil. Reliabel tes berhubungan dengan ketetapan hasil tes.

Secara garis besar terdapat 3 macam cara atau prosedur mempertimbangkan kualifikasi instrument penelitian yang dimaksud yaitu dengan teknik 1. Stabilitas, 2. Konsistensi instrument, 3. Equivalensi.

1. Teknik Stabilitas

Suatu penelitian yang menggunakan data primer, setidaknya berkaitan dengan emoat hal: 1. Subyek penelitian, 2. Construct yang diukur, 3. Instrument pengukur dan 4. Saat pengukuran. Penelitian kemungkinan bermaksud ubtuk menggunakan instrument pengukur construct yang sama terhadap subyek penelitian tertentu sebanyak dua kali pada saa yang berbeda. Perbedan waktu antara pengukuran yang satu dengan pengukuran yang lain dapat berupa bilangan hari, minggu, bulan atau bahkan tahun. Penelitian ini bermaksud untuk menguji stabilitas jawaban responden dari suatu waktu ke waktu berikutnya dngan cara menghitung koefisien korelasi dan skor jawaban responden yang dikur dengan instrument yang sama pada saat berbeda. Proses pengujian stabilitas yang dikenal juga dengan test-retesr reability pada dasarnya untuk mrngetahi realibilitas data berdasarkan stabilitas responden. Salah satu metode statistic yang diugunkan koefisien stabilitas adalah Pearson correlation.

2. Teknik Ekuivalensi

Pengukuran realibilitas dapat juga dilakukan dengan menggunakan instrument pengukur yang berbeda untuk mengukur suatu custruct terhadap subyek penelitian tertentu pada saat yang sama. Pendekatan yang juga disebut dengan alternative form reliability ini lebih menekankan pada perbedaan bentuk instrument, sedang subyek penelitian, construct dan saaat pengukurannya adalah sama. Penelitian melalui penekatan ini menguji korelasi skr jawaban responden untuk mengetahui koefisien ekuivalensi antara skor jawaban dengan menggunakan instrument pengukuran yang berbeda.

3. Tekhnik Konsistensi Internal

Pengujian terhadap konsistensi internal yang dimiliki oleh suatu instrument merupakan alternative lain yang dapat dilakukan oleh penelitian untuk menguji reliabilitas, disamping pengukuran koefisien stabilitas dan ekuivalensi,. Konsep reliablitas menurut pendekatan ini adalah konsistensi diantara butir-butir pertanyaan suatu instrument. Tingkat keterkaitan antara butir pertanyaan atau pernyataan dalam suatu instrument untuk mengukur construct tertentu menunjukkan tingkat reliabilitas konsistensi internal instrume yang berangkutan. Untuk mengukur konsistensi internal, peneliti hanya memerlukan sekali pengujian dengan menggunakan teknik statistic tertentu terhadap skor jawaban responden yang dihasilkan dari penggunaan instrument yang bersangkutan. Ada 3 teknik yang dapat digunakan untuk mengukur konsistensi internal yaitu: (1) Split-half reliability, (2) Kuder-Richardson #20 dan (3) Cronbach’s alpa.

a. Split-half reliability (Belah Dua)

Sebuah tes diberikan dan dibagi menjadi dua bagian dan mencetak secara terpisah, maka nilai satu setengah dari uji dibandingkan dengan skor tersisa separuhnya untuk menguji keandalan. Split-Setengah Keandalan adalah ukuran berguna ketika tidak praktis atau tidak diinginkan untuk menilai reliabilitas dengan dua tes atau memiliki administrasi menguji dua (karena keterbatasan waktu atau uang).

Rumus Spearman-Brown

Keterangan :

R 11 : nilai reliabilitas

R b : nilai koefisien korelasi

b. Kuder-Richardson Formula 20

Cara lain untuk mengevaluasi internal tes akan menggunakan Kuder-Richardson 20. Ini hanya disarankan jika Anda memiliki item dikotomi dalam tes (biasanya untuk jawaban benar atau salah).

r =

(1 -

)

r = Koefisien reliabilitas yang dicari

k = jumlah butir pertanyaan

= jumlah proporsi jawaban benar kali salah per butir pertanyaan

= Varian skor test

c. Alpha Cronbach / Koefisien Alpha

Cronbach Alpha / Koefisien Alpha formula adalah rumus umum untuk memperkirakan keandalan tes yang terdiri dari item yang bobot penilaian yang berbeda dapat ditugaskan untuk respon yang berbeda

r = Koefisien reliabilitas yang dicari

k = jumlah item pertanyaan

σi² = varians butir pertanyaan

σ² = varians skor tes

d. Kesalahan Baku Pengukuran

Besarnya kesalahan baku pengukuran akan tergantung oleh besarnya indeks reliabilitas juga akan mempengaruhi kecermatan alat ukur yang bersangkutan untuk mengukur cirri laten tertentu peserta uji

Rumusnya sebagai berikut:

SEM = σ

C. Analisis Butir Pertanyaan

Untuk mengetahui kualitas dan efektifitas tiap butir pertanyaan yang dimaksud, diperlukan kerja analisis butir pertanyaan atau soal. Analisis butir pertanyaan pada umumnya dimaksudkan untuk menetahui besar kecilnya indeks tingkat kesulitan. Indeks daya beda dan efektifitas distraktor butir-butir soal yang bersangkutan. Baik dalam teori klasik maupun teori respon butir yang merupakan teori pengukuran modern yang dimaksudkan untuk memperbaiki kelemahan-kelemahan dalam teori pengukuran klasik, analisis butir soal sangat diperlukan dalam rangka meningkatkan kualitas alat pengukuran. Pembicaraan berikut difokuskan pada analisis butir pertanyaan untuk menghitung indeks tingkat kesulitan, daya beda dan distraktor.

1. Tingkat Kesulitan Butir Pertanyaan

Tingkat kesulitan merupakan suatu pernyataan tentang seberapa sulit atau seberapa mudah sebuah butir pertanyaan bagi peserta uji. Dalam teori pengukuran klasik, indeks tingkat kesulitan (ITK) sering berubah tergantung tingkat kemampuan peserta uji yang diukur. ITK dalam model pengukuran klasik dapat diperoleh dengan menghitung proporsi jawaban betul peserta tersebut. Indeks besarnya daya untuk membedakan kemampuan itu dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya beda (IDB) butir soal. Ntuk menghitung IDB dapat dilakukan dengan rumus:

IDB = FKT-FKR

IDB = Indeks daya beda yang dicari

FKT = Frekuensi jawaban benar kelompok tinggi

FKR = frekuensi jawaban benar kelompok rendah

n = Jumlah peserta kelompok tinggi atau rendah

Namun menganalisis jawaban per siswa per butir untuk N soal, jika jumlah dan jumlah butir soal relatif banyak, akan sangat merepotkan dan bisa jadi juga kurang efisien. Untuk menghindari pemborosan yang tidak perlu, analisis butir dapat dilakukan dengan mengambil sebagian dari lembar jawaban peserta. Jika cara ini ditempuh, akan dibagi 2 kelompok yaitu, kelompok tinggi (KT) dan peserta kelompok rendah (KR). Indeks tingkat kesulitan tetap dihitung berdasarkan proporsi jawaban benar, yaitu yang diperoleh dari kedua kelompok tersebut. Rumusnya adalah sebagai berikut.

ITK= FKT-FKR

ITK = Indeks tingkat kesulitan yang dicari

FKT = Frekuensi jawaban benar kelompok tinggi

FKR = Frekuensi jawaban benar kelompok rendah

N = Jumlah peserta kedua kelompok

2. Indeks Daya Beda Butir Pertanyaan

Daya beda butir pertanyaan merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Secara teoritis peserta uji kelompok tinggi haruslah menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar peserta kelompok rendah lebih besar, hal ini menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal yang bersangkutan dinyatakan tidak baik.

3. Perhitungan Indeks Tingkat Kesulitan dan Daya Beda dengan Tabel

Perhitungan indeks tingkat kesulitan dan daya beda dilakukan dengan menghitung langsung dari data yang diperoleh. Perhitungan ITK lewat skala delta dilakukan dengan menghitung proporsi jawaban benar dan kemudian hasilnya ditansformasikan ke dalam distribusi normal baku. Sedangkan perhitungan ITK lewat proporsi, indeks skala delta yang semakin besar menunjukkan bahwa butir soal yang bersangkutan semakin sulit, sedangkan indeks skala delta yang semakin kecil menunjukkan bahwa butir soal itu semakin mudah.

4. Analisis Distraktor

Analisis Distraktor adalah analisis jawaban peserta uji terhadap opsi yang salah. Model ini berangggapan bahwa semua opsi harus efektif. Artinya, walau opsi salah, opsi tersebut tetap saja harus ada sejumlah peserta uji yang memilihnya. Ada beberapa criteria untuk menetapkan efektifitas distraktor yaitu (1) semua distraktor (opsi salah) harus ada yang memilih, (2) jumlah pemilih opsi-salah dari pesertta kelompok tinggi harus lebih sedikit dari pada kelompok rendah dan (3) jika pemilih opsi-salah hanya satu, ia harus dari kelompok rendah.

5. Analisis Butir Soal dengan Program Komputer

Analisis butir soal dapat juga dilakukan dengan cara penghitungan lewat program computer di samping dengancara manual. Analisis butir untuk model pengukuran klasik dengan mempergunakan program Iteman, sedangkan teori respon butir mempergunakan program Rascal atau Ascal tergantung brapa parameter yang akan dianalisis. Perhitumngan lewat program computer yang dicontohkan di bawah ini dibatasi hanya yang mempergunakan program Iteman unutk analisis butir model pengukuran klasik.

Prakosoisme

Jumat, 28 Oktober 2011

UJI INSTRUMEN PENELITIAN

Tidak ada komentar:

Posting Komentar