KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah
SWT Tuhan Semesta Alam karena atas izin dan kehendakNya sehingga makalah sederhana ini
dapat kami rampungkan tepat pada waktunya.
Penulisan dan pembuatan
makalah ini bertujuan untuk memenuhi salah satu tugas mata kuliah Evaluasi Pembelajaran. Adapun yang kami bahas dalam makalah sederhana ini
tentang Memahami
Konsep dan Penerapan Dasar-dasar Pengukuran dan Penilaian (Jenis dan Bentuk
Evaluasi Hasil Belajar, Syarat-syarat Alat Penilaian Yang Baik, Validitas dan
Realibilitas).
Dalam penulisan makalah ini kami menemui berbagai
hambatan yang dikarenakan terbatasnya Ilmu Pengetahuan kami mengenai hal yang
berkenaan dengan penulisan makalah ini. Oleh karena itu sudah
sepatutnya kami berterima kasih kepada dosen kami yang telah memberikan
limpahan ilmu berguna kepada kami.
Kami menyadari akan kemampuan kami yang masih amatir.
Dalam makalah ini kami sudah berusaha semaksimal mungkin.Tapi kami yakin
makalah ini masih banyak kekurangan disana-sini. Oleh karena itu kami
mengharapkan saran dan juga kritik membangun agar lebih maju di masa yang akan
datang.
Pamekasan,
02 April 2014
Penulis
Kelompok II
DAFTAR ISI
Halaman Judul
Kata
Pengantar..................................................................................................... i
Daftar
Isi............................................................................................................. ii
BAB
I PENDAHULUAN................................................................................ 1
1.1
Latar Belakang...................................................................................... 1
1.2 Rumusan Masalah.................................................................................. 1
1.3 Tujuan..................................................................................................... 1
BAB II
PEMBAHASAN
2.1 Jenis dan Bentuk Evaluasi Hasil Belajar................................................ 2
2.2 Syarat-syarat Alat Penilaian Yang Baik................................................. 3
2.3 Validitas dan Realibilitas r..................................................................... 4
BAB III
PENUTUP
3.1
Kesimpulan........................................................................................... 12
Daftar
Pustaka................................................................................................... 13
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Salah
satu cara yang dapat dilakukan untuk mengetahui hasil yang telah dicapai oleh
pendidik dalam proses pembelajaran adalah melalui evaluasi. Evaluasi merupakan
subsistem yang sangat penting dan sangat di butuhkan dalam setiap sistem
pendidikan, karena evaluasi dapat mencerminkan seberapa jauh perkembangan atau
kemajuan hasil pendidikan.
Dalam
setiap pembelajaran, pendidik harus berusaha mengetahui hasil dari proses
pembelajaran yang ia lakukan. Pentingnya diketahui hasil ini karena dapat
menjadi salah satu patokan bagi pendidik untuk mengetahui sejauh mana proses
pembelajran yang dia lakukan dapat mengembangkan potensi peserta didik.
1.2 Rumusan Masalah
a) Apa Jenis dan bentuk Evaluasi Belajar?
b) Apa Syarat-syarat alat Penilaian yang
baik?
c) Apa yang dimaksud Validitas dan
Realibilitas?
1.3 Tujuan
a) Untuk mengetahui Jenis dan bentuk
Evaluasi Belajar.
b) Untuk mengetahui Syarat-syarat alat
Penilaian yang baik.
c) Untuk mengetahui apa yang dimaksud
Validitas dan Realibilitas
BAB II
PEMBAHASAN
2.1
Jenis dan Bentuk Evaluasi Hasil Belajar
A.
Jenis-Jenis Evaluasi Pendidikan
1)
Evaluasi Formatif
Evaluasi
yang dilaksanakan pada setiap kali satuan program pelajaran atau subpokok
bahasan dapat diselesaikan, dengan tujuan untuk mengetahui sejauhmana peserta
didik telah mampu menguasai (memiliki kompetensi) sesuai dengan tujuan
pengajaran yang telah ditentukan.
2)
Evaluasi Summatif
Evaluasi
yang dilaksanakan setelah sekumpulan program pelajaran selesai diberikan
(berakhir), tujuan utama dari evaluasi summatif ini adalah untuk menentukan
keberhasilan peserta didik, setelah mereka menempuh program pengajaran.
Jenis
evalusi berdasarkan lingkup kegiatan pembelajaran :
1. Evaluasi
program pembelajaran
Evaluais yang mencakup terhadap tujuan pembelajaran, isi program
pembelajaran, strategi belajar mengajar, aspe-aspek program pembelajaran yang
lain.
2. Evaluasi
proses pembelajaran
Evaluasi yang mencakup kesesuaian antara peoses pembelajaran dengan
garis-garis besar program pembelajaran yang di tetapkan, kemampuan guru dalam
melaksanakan proses pembelajaran, kemampuan siswa dalam mengikuti proses
pembelajaran.
melaksanakan proses pembelajaran, kemampuan siswa dalam mengikuti proses
pembelajaran.
3. Evaluasi hasil pembelajaran
Evaluasi hasil belajar mencakup tingkat penguasaan siswa terhadap tujuan
pembelajaran yang ditetapkan, baik umum maupun khusus, ditinjau dalam aspek
kognitif, afektif, psikomotorik. [1]
B. Bentuk
Evaluasi
1) Evaluasi Formatif
Evaluasi
yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan/topic, dan di
maksudkan untuk mengetahui sejauh manakah proses pembelajaran telah berjalan
sebagaimna yang direncanakan.
Winkel
menyatakan evaluasi formatif adalah penggunaan tes-tes selama proses
pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi
mengenai kemajuan yang telah di capai
Sementara
Tesmer menyatakan evaluasi formatif adalah untuk mengontrol sampai
sejauh mana siswa menguasai materi yang di ajarkan pada pokok pembahasan
tersebut.[2]
2)
Evaluasi Sumatif
Evaluasi
sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang
didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk
mengetahui sejauh mana peserta didik telah dapat berpindah dari satu unit ke
unit yang berikutnya.
3)
Evaluasi Diagnostic
Evaluasi
diagnostic adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan
dan kelemahan yang ada pada siswa sehingga dapat di berikan perlakuan yang
tepat.
2.2 Syarat-syarat Alat Penilaian Yang Baik
Sebuah
instrumen evaluasi hasil belajar hendaknya memenuhi syarat sebelum di gunakan
untuk mengevaluasi atau mengadakan penilaian agar terhindar dari kesalahan dan
hasil yang tidak valid (tidak sesuai kenyataan sebenarnya). Alat evaluasi yang
kurang baik dapat mengakibatkan hasil penilaian menjadi bias atau tidak
sesuainya hasil penilaian dengan kenyataan yang sebenarnya, seperti contoh anak
yang pintar dinilai tidak mampu atau sebaliknya.
Jika
terjadi demikian perlu ditanyakan apakah persyaratan instrumen yang digunakan
menilai sudah sesuai dengan kaidah-kaidah penyusunan instrumen.
Instrumen
Evaluasi yang baik memiliki ciri-ciri dan harus memenuhi beberapa kaidah antara
lain:
·
Validitas
·
Reliabilitas
2.3
Validitas dan Reliabilitas
A. Validitas
1. Pengertian Validitas
Menurut
Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh
mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Suatu
skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi
apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes
yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran.
Terkandung
di sini pengertian bahwa ketepatan validitas pada suatu alat ukur tergantung
pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki
dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian
memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur
yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A
akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B, dikatakan
sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan
tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar 1986).
Sisi
lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat
ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga
harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat
berarti bahwa pengukuran itu dapat memberikan gambran mengenai perbedaan yang
sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain. Sebagai contoh,
dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah
cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil
penimbangannya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan
memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat
cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak
akan terlihat pada alat ukur berat badan.
Menggunakan
alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi
tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan
kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang
kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang
sebenarnya atau angka yang mendekati keadaan yang sebenarnya (Azwar 1986).
Pengertian
validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu,
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat
ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang
spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam “alat ukur
ini valid” adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh
keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta
valid bagi kelompok subjek yang mana? (Azwar 1986)
Pengertian
validitas menurut Walizer (1987) adalah tingkaat kesesuaian antara suatu
batasan konseptual yang diberikan dengan bantuan operasional yang telah
dikembangkan.
Menurut
Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan
instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang
dimaksudkan untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap
konsumen terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap
yang memang menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan sampai
hasil yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan
itu.
Validitas
suatu instrumen banyak dijelaskan dalam konteks penelitian sosial yang
variabelnya tidak dapat diamati secara langsung, seperti sikap, minat,
persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian
sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena
karakteristik yang akan diukur dari variabel yang demikian tidak dapat
diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak
langsung) tertentu. (Aritonang R. 2007)
Menurut
Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu
mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu
benda, maka dia harus menggunakan timbangan. Timbangan adalah alat pengukur
yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur
berat. Bila panjang sesuatu benda yang ingin diukur, maka dia harus menggunakan
meteran. Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur
panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat
pengukur yang valid bilamana digunakan untuk mengukur panjang.
Sekiranya
penelliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka
kuesioner yang disusunnya harus mengukur apa yang ingin diukurnya. Setelah
kuesioner tersebut tersusun dan teruji validitasnya, dalam praktek belum tentu
data yang dikumpulkan adalah data yang valid. Banyak hal-hal lain yang akan
mengurangi validitas data; misalnya apakah si pewawancara yang mengumpulkan
data betul-betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner.
(Masri Singarimbun)
Menurut
Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat
instrumen bersangkutan yang mampu mengukur apa yang akan diukur.[3]
Menurut
Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes
mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja
melekat pada tes itu sendiri, tapi tergantung penggunaan dan subyeknya.
B. Reliabilitas
Menurut
Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana
suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur
dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang
diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata
lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur
gejala yang sama.
Menurut
Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang
tes ataupun bentuk tes.
Menurut
Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil
pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus
reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.
Dalam
pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang
diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran
berulang-ulang.
Dengan
demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu
kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut
masing-masing memiliki kelebihan dan keterbatasan (Feldt & Brennan, 1989:
105)
Reliabilitas,
atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian
alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes
dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang
lebih subjektif, apakah dua orang penilai memberikan skor yang mirip
(reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya
pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum
tentu mengukur apa yang seharusnya diukur.
Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.
Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.
Pengukuran
reliabilitas dapat dilakukan dengan menggunakan berbagai alat statistik (Feldt
& Brennan, 1989: 105)
Berdasarkan
sejarah, reliabilitas sebuah instrumen dapat dihitung melalui dua cara yaitu
kesalahan baku pengukuran dan koefisien reliabilitas (Feldt & Brennan:
105). Kedua statistik di atas memiliki keterbatasannya masing-masing. Kesalahan
pengukuran merupakan rangkuman inkonsistensi peserta tes dalam unit-unit skala
skor sedangkan koefisien reliabilitas merupakan kuantifikasi reliabilitas
dengan merangkum konsistensi (atau inkonsistensi) diantara beberapa kesalahan
pengukuran. Dalam kerangka teori tes klasik, suatu tes dapat dikatakan memiliki
reliabilitas yang tinggi apabila skor tampak tes tersebut berkorelasi tinggi
dengan skor murninya sendiri. Interpretasi lainnya adalah seberapa tinggi
korelasi antara skor tampak pada dua tes yang pararel. (Saifuddin Azwar, 2006:
29). Reliabilitas menurut Ross E. Traub (1994: 38) yang disimbolkan oleh dapat
didefinisikan sebagai rasio antara varian skor murni dan varian skor tampak Secara
matematis teori di atas dapat ditulis : Reliabilitas alat ukur tidak dapat
diketahui dengan pasti tetapi dapat diperkirakan. Dalam mengestimasi
reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu (1)
pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3) pendekatan satu
kali pengukuran.
Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.
Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.
Misalnya
seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah
melakukan dua kali pengukuran didapatkan skor tes sebagai berikut:
Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut:
Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut:
Dengan
demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup
tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over
effect. Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua
dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan
soal-soal dan bahkan jawaban ketika dilakukan test pertama. Hal ini dapat
meningkatkan korelasi serta overestimasi terhadap PXX’. Ross E. Traub (1994:
38)
2.
Jenis-jenis Reliabilitas
Walizer
(1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1.
Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa
untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya.
Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi
operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada
waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali
unit diukur skornya haruslah sama atau hampir sama.
2.
Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama
dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang
dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan
operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.[4]
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.[4]
3.
Metode pengujian reliabilitas
Tiga
tehnik pengujian realibilitas instrument antara lain :
a.
Teknik Paralel (Paralel Form atau Alternate Form) Teknik paralel disebut juga
tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua
perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang
satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua
instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka
hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product
moment (korelasi Pearson).
b.
Teknik Ulang (Test Re-test) Disebut juga teknik ”single test double trial”.
Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama
dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks
reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada
teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat
derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan
menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok
yang sama, pada waktu yang berbeda. Metode pengujian reliabilitas stabilitas
yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest).
Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable
tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara
lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai,
adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari
kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality
Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya
dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari
kuesioner yang panjang.
Kesulitan
terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa
sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang
waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang
tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah
pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini
selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar
pijakan yang obyektif.
BAB
III
PENUTUP
3.1 Kesimpulan
Dari pembahasan tentang evaluasi, maka dapat
ditarik kesimpulan bahwa :
Dalam menggunakan konsep evaluasi dalam
kaitannya dengan segala aspek, maka ada beberapa pokok yang harus dipegang yaitu :
Jenis dan bentuk evaluasi, alat penilaian
yang baik, validitas dan relibialitas.
DAFTAR PUSTAKA
·
Daryanto. 1997. Evaluasi Pendidikan.
Solo: Rineka Cipta.
·
Purwanto, Ngalim. 1984. Prinsip-prinsip
dan Teknik Evaluasi Pengajaran. Bandung : PT Remaja Rosdakarya.
·
Sanjaya, Wina. 2008. Kurikulum dan
Pembelajaran. Bandung: Kencana Prenada Media Group.
·
Sukardi. 2008. Evaluasi Pendidikan.
Yogyakarta. Bumi Aksara.
[1] Daryanto. 1997. Evaluasi Pendidikan. Solo: Rineka
Cipta.
[2]
Purwanto, Ngalim. 1984. Prinsip-prinsip dan
Teknik Evaluasi Pengajaran. Bandung : PT Remaja Rosdakarya
[3]
Sanjaya, Wina. 2008. Kurikulum
dan Pembelajaran. Bandung: Kencana Prenada Media Group.
[4]
Sukardi. 2008. Evaluasi Pendidikan.
Yogyakarta. Bumi Aksara.
Tidak ada komentar:
Posting Komentar