Jumat, 28 Oktober 2011

UJI INSTRUMEN PENELITIAN


Instrumen penelitian memegang peran penting dalam penelitian kuantitatif karena kualitas data yang digunakan dalam banyak hal ditentukan oleh kualitas instrument yang dipergunakan. Artinya, data yang bersangkutan dapat mewakili dan atau mencerminkan keadaan sesuatu yang diukur pada diri subjek penelitian dan si pemilik data.
            Untuk itu peneliti kuantitatif harus berfikir bagaimana memperoleh data seakurat mungkin dari subjek penelitian sehingga data-data itu dapat dipertangung jawabkan dari pada berfikir teknik statistic apa yang akan dipergunakan untuk mengolahnya. Intrumen tersebut haruslah memiliki kualifikasi tertwntu yang memenuhi persyaratan ilmiah. Untuk instrument seperti berbagai alat tes keberhasilan belajar, misalnya yang berkaitan dengan ranah kognitif dan pertanyaan-pertanyaan untuk angket, misalnya yang berhubungan dengan masalah afeksi, nilai-nilai, dan kecenderungan-kecenderungan, persyaratan kualifikasi itu paling tidak meliputi aspek validitas, reliabilitas dan efektivitas butir pertanyaan.
A.  Validitas
Validitas adalah suatu ukuran yang menunjukkan  tingkat  kesahihan suatu tes.  Suatu  tes  dikatakan  valid  apabila  tes  tersebut  mengukur  apa  yang hendak  diukur.  Tes  memiliki  validitas  yang   tinggi  jika  hasilnya  sesuai dengan  kriteria,  dalam  arti  memiliki  kesejajaran  antara  tes  dan  kriteria. Untuk  menguji    validitas  setiap  butir soal  maka  skor-skor yang ada p ada butir  yang  dimaksud  dikorelasikan  dengan  skor  totalnya.  Skor  tiap  butir soal dinyatakan skor  X  dan skor  total dinyatakan sebagai  skor Y, dengan diperolehnya  indeks validitas setiap butir soal,  dapat  diketahui butir-butir soal  manakah  yang  memenuhi  syarat  dilihat  dari  indeks  validitasnya


Ada sejumlah cara mempertimbangkan kadar validitas sebuah instrumen yang secara garis besar dap[at dibedakan kedalam dua kategori. Kategori pertama yang pertimbangannya lewat analisis rasional yaitu content validity (validitas isi) dan construct validity (validitas konstruk). Sedangkan validitas kategori kedua misalnya adalah validitas sejalan, validitas kriteria dan validitas ramalan.
Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur. Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.
Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.
Jenis validitas kedua yang bersifat empiric memerlukan data-data di lapangan dari hasil uji coba yang berwujud data kuantitatif. Jadi untuk keperluan analsis validitas itu diperlukan jasa statistic. Validitas sejalan mempertanyakan apakah kemampuan apresiasi sastra sejalan dengan kemampuan membaca. Untu itu, perlu dilakukan dua kali pengukuran dalam dua bidang yang sejenis tersebut kpada subjek penelitian yang sama. Hasilmnua Dianalisis dngan teknik korelasi product moment.
B.  Reliabilitas
Reabilitas  tes  adalah  tingkat  keajegan  (konsitensi)  suatu  tes,  yakni  sejauh mana  suatu  tes  dapat  dipercaya  untuk  menghasilkan  skor  yang  relatif tidak  berubah  walaupun  diteskan  pada  situasi  yang  berbeda-beda. Reliabilitas  suatu  tes  adalah  taraf  sampai  dimana  suatu  tes  mampu menunjukkan konsisten hasil pengukurannya yang diperlihatkan dalam taraf ketetapan  dan  ketelitian  hasil.  Reliabel  tes  berhubungan  dengan  ketetapan hasil tes. 
        Secara garis besar terdapat 3 macam cara atau prosedur mempertimbangkan kualifikasi instrument penelitian yang dimaksud yaitu dengan teknik 1. Stabilitas, 2. Konsistensi instrument, 3. Equivalensi.
1.      Teknik Stabilitas
Suatu penelitian yang menggunakan data primer, setidaknya berkaitan dengan emoat hal: 1. Subyek penelitian, 2. Construct yang diukur, 3. Instrument pengukur dan 4. Saat pengukuran. Penelitian kemungkinan bermaksud ubtuk menggunakan instrument pengukur construct yang sama terhadap subyek penelitian tertentu sebanyak dua kali pada saa yang berbeda. Perbedan waktu antara pengukuran yang satu dengan pengukuran yang lain dapat berupa bilangan hari, minggu, bulan atau bahkan tahun. Penelitian ini bermaksud untuk menguji stabilitas jawaban responden dari suatu waktu ke waktu berikutnya dngan cara menghitung koefisien korelasi dan skor jawaban responden yang dikur dengan instrument yang sama pada saat berbeda. Proses pengujian stabilitas yang dikenal juga dengan test-retesr reability pada dasarnya untuk mrngetahi realibilitas data berdasarkan stabilitas responden. Salah satu metode statistic yang diugunkan koefisien stabilitas adalah Pearson correlation.
2.      Teknik Ekuivalensi
Pengukuran realibilitas dapat juga dilakukan dengan menggunakan instrument pengukur yang berbeda untuk mengukur suatu custruct terhadap subyek penelitian tertentu pada saat yang sama. Pendekatan yang juga disebut dengan alternative form reliability ini lebih menekankan pada perbedaan bentuk instrument, sedang subyek penelitian, construct dan saaat pengukurannya adalah sama. Penelitian melalui penekatan ini menguji korelasi skr jawaban responden untuk mengetahui koefisien ekuivalensi antara skor jawaban dengan menggunakan instrument pengukuran yang berbeda.
3.      Tekhnik Konsistensi Internal
Pengujian terhadap konsistensi internal yang dimiliki oleh suatu instrument merupakan alternative lain yang dapat dilakukan oleh penelitian untuk menguji reliabilitas, disamping pengukuran koefisien stabilitas dan ekuivalensi,. Konsep reliablitas menurut pendekatan ini adalah konsistensi diantara butir-butir pertanyaan suatu instrument. Tingkat keterkaitan antara butir pertanyaan atau pernyataan dalam suatu instrument untuk mengukur construct tertentu menunjukkan tingkat reliabilitas konsistensi internal instrume yang berangkutan. Untuk mengukur konsistensi internal, peneliti hanya memerlukan sekali pengujian dengan menggunakan teknik statistic tertentu terhadap skor jawaban responden yang dihasilkan dari penggunaan instrument yang bersangkutan. Ada 3 teknik yang dapat digunakan untuk mengukur konsistensi internal yaitu: (1) Split-half reliability, (2) Kuder-Richardson #20 dan (3) Cronbach’s alpa.
a.       Split-half reliability (Belah Dua)
Sebuah tes diberikan dan dibagi menjadi dua bagian dan mencetak secara terpisah, maka nilai satu setengah dari uji dibandingkan dengan skor tersisa separuhnya untuk menguji keandalan. Split-Setengah Keandalan adalah ukuran berguna ketika tidak praktis atau tidak diinginkan untuk menilai reliabilitas dengan dua tes atau memiliki administrasi menguji dua (karena keterbatasan waktu atau uang).
Rumus Spearman-Brown



Keterangan :
R 11            : nilai reliabilitas
R b              : nilai koefisien korelasi

b.      Kuder-Richardson Formula 20
Cara lain untuk mengevaluasi internal tes akan menggunakan Kuder-Richardson 20. Ini hanya disarankan jika Anda memiliki item dikotomi dalam tes (biasanya untuk jawaban benar atau salah).
        r = (1 - )
r                = Koefisien reliabilitas yang dicari
k                = jumlah butir pertanyaan
           = jumlah proporsi jawaban benar kali salah per butir pertanyaan
               = Varian skor test




c.        Alpha Cronbach / Koefisien Alpha
Cronbach Alpha / Koefisien Alpha formula adalah rumus umum untuk memperkirakan keandalan tes yang terdiri dari item yang bobot penilaian yang berbeda dapat ditugaskan untuk respon yang berbeda



r     = Koefisien reliabilitas yang dicari
k    = jumlah item pertanyaan
σi2 = varians butir pertanyaan
σ2   = varians skor tes
d.      Kesalahan Baku Pengukuran
Besarnya kesalahan baku pengukuran akan tergantung oleh besarnya indeks reliabilitas juga akan mempengaruhi kecermatan alat ukur yang bersangkutan untuk mengukur cirri laten tertentu peserta uji
Rumusnya sebagai berikut:
SEM = σ

C.  Analisis Butir Pertanyaan
Untuk mengetahui  kualitas dan efektifitas tiap butir pertanyaan yang dimaksud, diperlukan kerja analisis butir pertanyaan atau soal. Analisis butir pertanyaan pada umumnya dimaksudkan untuk menetahui besar kecilnya indeks tingkat kesulitan. Indeks daya beda dan efektifitas distraktor butir-butir soal yang bersangkutan. Baik dalam teori klasik maupun teori respon butir yang merupakan teori pengukuran modern yang dimaksudkan untuk memperbaiki kelemahan-kelemahan dalam teori pengukuran klasik, analisis butir soal sangat diperlukan dalam rangka meningkatkan kualitas alat pengukuran. Pembicaraan berikut difokuskan pada analisis butir pertanyaan untuk menghitung indeks tingkat kesulitan, daya beda dan distraktor.
1.      Tingkat Kesulitan Butir Pertanyaan
Tingkat kesulitan merupakan suatu pernyataan tentang seberapa sulit atau seberapa mudah sebuah butir pertanyaan bagi peserta uji. Dalam teori pengukuran klasik, indeks tingkat kesulitan (ITK) sering berubah tergantung tingkat kemampuan peserta uji yang diukur. ITK dalam model pengukuran klasik dapat diperoleh dengan menghitung proporsi jawaban betul peserta tersebut. Indeks besarnya daya untuk membedakan kemampuan itu dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya beda (IDB) butir soal. Ntuk menghitung IDB dapat dilakukan dengan rumus:

IDB = FKT-FKR
                 n
IDB = Indeks daya beda yang dicari
FKT = Frekuensi jawaban benar kelompok tinggi
FKR = frekuensi jawaban benar kelompok rendah
n       = Jumlah peserta kelompok  tinggi atau rendah

Namun menganalisis jawaban per siswa per butir untuk N soal, jika jumlah dan jumlah butir soal relatif banyak, akan sangat merepotkan dan bisa jadi  juga kurang efisien. Untuk  menghindari pemborosan yang tidak perlu, analisis butir dapat dilakukan dengan mengambil sebagian dari lembar jawaban peserta. Jika cara ini  ditempuh, akan dibagi 2 kelompok yaitu, kelompok tinggi (KT) dan peserta kelompok rendah (KR).  Indeks tingkat kesulitan tetap dihitung berdasarkan proporsi jawaban benar, yaitu yang diperoleh dari kedua kelompok tersebut. Rumusnya adalah sebagai berikut.


ITK= FKT-FKR
                 n
ITK =  Indeks tingkat kesulitan yang dicari
FKT = Frekuensi jawaban benar kelompok tinggi
FKR = Frekuensi jawaban benar kelompok rendah
N     = Jumlah peserta kedua kelompok

2.      Indeks Daya Beda Butir Pertanyaan
Daya beda butir pertanyaan merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Secara teoritis peserta uji kelompok tinggi haruslah menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar peserta kelompok rendah lebih besar, hal ini menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal yang bersangkutan dinyatakan tidak baik.

3.      Perhitungan Indeks Tingkat Kesulitan dan Daya Beda dengan Tabel
Perhitungan indeks tingkat kesulitan dan daya beda dilakukan dengan menghitung langsung dari data yang diperoleh. Perhitungan ITK lewat skala delta dilakukan dengan menghitung proporsi jawaban benar dan kemudian hasilnya ditansformasikan ke dalam distribusi normal baku. Sedangkan perhitungan ITK lewat proporsi, indeks skala delta yang semakin besar menunjukkan bahwa butir soal yang bersangkutan semakin sulit, sedangkan indeks skala delta yang semakin kecil menunjukkan bahwa butir soal itu semakin mudah.


4.      Analisis Distraktor
Analisis Distraktor adalah analisis jawaban peserta uji terhadap opsi yang salah. Model ini berangggapan bahwa semua opsi harus efektif. Artinya, walau opsi salah, opsi tersebut tetap saja harus ada sejumlah peserta uji yang memilihnya. Ada beberapa criteria untuk menetapkan efektifitas distraktor yaitu (1) semua distraktor (opsi salah) harus ada yang memilih, (2) jumlah pemilih opsi-salah dari pesertta kelompok tinggi harus lebih sedikit dari pada kelompok rendah dan (3) jika pemilih opsi-salah hanya satu, ia harus dari kelompok rendah.

5.      Analisis Butir Soal dengan Program Komputer
Analisis butir soal dapat juga dilakukan dengan cara penghitungan lewat program computer di samping  dengancara manual. Analisis butir untuk model pengukuran klasik dengan mempergunakan program Iteman, sedangkan teori respon butir mempergunakan program Rascal atau Ascal tergantung brapa parameter yang akan dianalisis. Perhitumngan lewat program computer yang dicontohkan di bawah ini dibatasi hanya yang mempergunakan program Iteman unutk analisis butir model pengukuran klasik.

Tidak ada komentar:

Posting Komentar