BAB I
PENDAHULUAN
A.
Latar Belakang
Bertitik tolak dari pendapat Galton, bahwa dalam suatu kelompok
individu (siswa) yang tidak dipilih secara khusus memiliki karakteristik
tertentu yang frekuensinya berdistribusi normal. Begitu pula kepandaiannya
dalam suatu mata pelajaran tertentu. Dengan demikian suatu alat evaluasi yang
baik akan mencerminkan kemampuan sebenarnya dari testi yang dievaluasi dan bisa
membedakan siswa yang pandai (di atas rata-rata), siswa yang kemampuannya
sedang (pada kelompok rata-rata), dan siswa yang kemampuannya kurang (di bawah
rata-rata). Sehingga penyebaran skor atau nilai hasil evaluasi tersebut
berdistribusi normal.
untuk mendapatkan hasil
eavaluasi yang baik tentunya diperlukan alat evaluasi yang kualitasnya baik
pula. Alat evaluasi yang baik dapat ditinjau dari hal-hal berikut ini, yaitu:
validitas, reliabilitas, daya pembeda, derajat kesukaran, efektifitas option,
obyektifitas, dan praktikabilitas
B.
Rumusan Masalah
1. Sebutkan dan jelaskan ciri-ciri evaluasi yang baik?
2. Bagaimana cara menghitung validitas suatu tes?
3. Jelaskan
faktor-faktor yang mempengaruhi Validitas dan Reabilitasi ?
4. Jelaskan
kelemahan-kelemahan yan dikandung oleh tes?
BAB II
PEMBAHASAN
A.
Kualitas Alat Evaluasi
Untuk
mendapatkan hasil eavaluasi yang baik tentunya diperlukan alat evaluasi yang
kualitasnya baik pula. Alat evaluasi yang baik dapat ditinjau dari hal-hal
berikut ini, yaitu: validitas, reliabilitas, daya pembeda, derajat kesukaran,
efektifitas option, obyektifitas, dan praktikabilitas.
1.
Validitas
Suatu alat evaluasi disebut valid (absah atau sahih) apabila alat
tersebut mampu mengevaluasi apa yang seharusnya dievaluasi. Oleh karena itu
keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam
melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika
ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi itu.
Validitas
berdasarkan pelaksanaannya dapat dikelompokkan ke dalam dua jenis, yaitu:
a.
Validitas Teoritik
Validitas teoritik atau validitas logik adalah validitas alat
evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik
atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Ada
tiga macam validitas yang termasuk ke dalam validitas teoritik ini, yaitu:
1)
Validitas Isi
Validitas isi suatu alat evaluasi artinya ketepatan alat tersebut
ditinjau dari segi materi yang dievaluasikan, yaitu materi (bahan) yangdipakai
sebagai alat evaluasi tersebut yang merupakan sampel representative dari pengetahuan
yang harus dikuasai.
2)
Validitas Muka
Validitas muka suatu alat evaluasi disebut
pula validitas bentuk soal (pertanyaan, pernyataan, suruhan) atau validitas
tampilan, yaitu keabsahan susunan kalimat atau kata-kata dalam soal sehingga
jelas pengertiannya atau tidak menimbulkan tafsiran lain.
3)
Validitas Konstruksi Psikologik
Pada umumnya alat evaluasi yang sering
menyangkut validitas konstruksi ini
berkenaan dengan aspek sikap, kepribadian, motivasi, minat, dan bakat.
b.
Validitas Kriterium
Validitas ini diperoleh dengan melalui
observasi atau pengalaman yang bersifat empirik, kriterium itu dipergunakan
untuk menentukan tinggi-rendahnya koefisien validitas alat evaluasi yang dibuat
melalui perhitungan korelasi. Ada dua macam validitas yang termasuk ke dalam
validitas kriterium ini, yaitu:
1)
Validitas Banding
Validitas banding seringkali disebut
validitas bersama. Misalnya alat evaluasi yang diselidiki validitasnya adalah
tes matematika buatan guru (kita) dengan menggunakan kriterium nilai rata-rata
harian atau nilai tes sumatif yang telah ada, dengan asumsi hasil evaluasi yang
digunakan untuk kriterium itu telah mencerminkan kemampuan siswa sebenarnya.
Kedua tes tersebut diberikan kepada subyek (siswa) yang sama. Apabila kedua
nilai atau skor itu berkorelasi tinggi, maka tes yang kita buat itu memiliki
validitas yang tinggi pula.
2)
Validitas Ramal
Sebuah alat evaluasi dikatakan memiliki
validitas ramal yang baik jika ia mempunyai kemampuan untuk meramalkan hal-hal
yang akan terjadi di masa yang akan datang.
Cara menentukan tingkat (indeks) validitas
kriterium adalah dengan menghitung koefisien korelasi antara alat evaluasi yang
akan diketahui validitasnya dengan alat ukur lain yang telah dilaksanakan dan
diasumsikan telah memiliki validitas yang tinggi (baik). Cara mencari koefisien
validitas dapat digunakan 3 macam cara, yaitu: korelasi produk moment memakai
simpangan, korelasi produk moment memakai angka kasar, dan korelasi metode
rank.
2.
Reliabilitas
Reliabilitas suatu alat ukur atau alat evaluasi dimaksudkan sebagai
suatu alat yang memberikan hasil yang tetap sama (konsisten, ajeg). Hasil
pengukuran itu harus tetap sama (relatif sama) jika pengukurannya diberikan
pada subyek yang sama meskipun dilakukan oleh orang yang berbeda, waktu yang
berbeda, dan tempat yang berbeda pula. Relatif di sini dimaksudkan tidak tepat
sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan) dan bisa
diabaikan, Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari
peserta tes dan kondisi lainnya.
Untuk soal objektif, menentukan derajat reliabilitas bisa dicari
dengan teknik belah dua atau teknik non belah dua. Dengan teknik belah dua ada
tiga macam perhitungan, yaitu: Formula Spearman-Brown, Formula Flanagan, dan
Formula Rulon. Sedangkan dengan teknik non belah dua ada dua macam perhitungan,
yaitu: Kuder Richardson (KR-20 dan KR-21) dan Anava Hoyt. Untuk soal bentuk
uraian, menentukan derajat reliabilitas bisa dicari dengan menggunakan rumus
Alpha.
3.
Daya Pembeda
Pengertian
Daya Pembeda (DP) dari sebuah butir soal menyatakan seberapa jauh kemampuan
butir soal tersebut mampu membedakan antara testi yang mengetahui jawabannya
dengan benar dengan testi yang tidak dapat menjawab soal tersebut (atau testi
yang menjawab salah). Dengan perkataan lain daya pembeda sebuah butir soal
adalah kemampuan butir soal itu untuk membedakan antara testi (siswa) yang
pandai atau berkemampuan tinggi dengan siswa yang bodoh.
4.
Derajat Kesukaran
Sejalan dengan asumsi Galton mengenai kemampuan tertentu
(karakteristik), dalam hal ini kemampuan matematika, dari sekelompok siswa yang
dipilih secara random (acak) akan berdistribusi normal, maka hasil evaluasi
dari suatu perangkat tes yang baik akan menghasilkan skor atau nilai yang
membentuk distribusi normal. Hal ini mempunyai implikasi bahwa soal yang baik
akan menghasilkan skor yang berdistribusi normal pula.
5.
Efektifitas Option
Option adalah kemungkinan jawaban yang disediakan pada butir soal (tes)
tipe obyektif bentuk pilihan ganda atau memasangkan untuk dipilih oleh peserta
tes, sesuai dengan petunjuk yang diberikan. Suatu option disebut efektif jika
memenuhi fungsinya atau tujuan disajikannya option tersebut tercapai. Hal ini
berarti bahwa setiap option yang disajikan masing-masing mempunyai kemungkinan
yang sama untuk dipilih, jika testi menjawab soal itu dengan menerka-nerka
(spekulasi).
Option yang merupakan jawaban yang benar disebut option kunci,
sedangkan option lainnya disebut option pengecoh. Agar suatu option yang
disajikan efektif harus diusahakan homogen (serupa), baik dari segi isi
(materi), notasi, maupun panjang-pendeknya kalimat pada option tersebut.
Berdasarkan distribusi pilihan pada setiap option untuk siswa kelompok
atas dan kelompok bawah, dapat ditentukan option yang berfungsi efektif atau
tidak. Kriteria option yang berfungsi efektif adalah:
a.
Untuk option kunci
1)
Jumlah pemilih kelompok atas
harus lebih banyak daripada jumlah pemilih kelompok bawah.
2)
Jumlah pemilih kelompok atas
dan kelompok bawah lebih dari 0,25 tetapi tidak lebih dari 0,75 dari seluruh
siswa kelompok atas dan kelompok bawah.
b.
Untuk option pengecoh
1)
Jumlah pemilih kelompok atas lebih sedikit
daripada jumlah pemilih kelompok bawah.
2)
Jumlah pemilih kelompok atas
dan kelompok bawah minimal sebanyak 0,25 dari seperdua jumlah option pengecoh
kali jumlah kelompok atas dan kelompok bawah.
3)
Jika peserta tes mengabaikan
semua option (tidak memilih) disebut omit. Option disebut efektif jika omit ini
jumlahnya tidak lebih dari 10% jumlah siswa pada kelompok atas dan kelompok
bawah.
6.
Obyektifitas
Sebuah tes hendaknya bersifat obyektif. Hal ini maksudnya adalah
hasil tes tersebut harus selalu sama, meskipun diperiksa oleh orang yang
berlainan. Tentu saja, agar harapan tersebut terpenuhi tes yang kita buat harus
mempunyai jawaban yang jelas, tidak kabur, jawabannya tertentu, dan tidak
terlalu memberikan jawaban yang
beranekaragam.
Kuallitas objektivitas suatu tes dapat dibedakan
menjadi tiga tingkatan yaitu :
a.
Objektivitas
tinggi ialah jika hasil tes-tes itu menunjukkan tingkat kesamaan yang tinggi.
Contohnya : tes yang sudah distandardisasi, hasil penskorannya sangat objektif.
b.
Objektivitas
sedang ialah seperti tes yang sudah distardisasi tetapi, pandangan subyektif
skor masih mungkin muncul dalam penilaiannya dan interpretasinya.
c.
Objektivitas
fleksible ialah seperti beberapa jenis tes yang digunakan oleh LBP(Lembaga
Bimbingan dan Penyuluhan) untuk keperluan counseling, misalnya tes yang
bersifat open-end item (open-end questionaires).
7.
Praktikabilitas
Tes
yang baik harus bersifat praktis, dalam arti mudah dilaksanakan dan efisien
dari segi biaya dan tenaga. Dalam penyusunan tes hendaknya biaya yang
diperlukan tidak terlampau tinggi, namun masih memenuhi persyaratan sebuah tes
yang baik. Sebuah tes juga disebut praktis bila pemeriksaannya mudah dan dapat
dianalisis dalam waktu relatif singkat.
B.
Cara Menghitung Validitas Suatu Tes
1. Menggunakan
simpangan adalah :
![](file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image002.gif)
2. Cara
kedua dengan menggunakan rumus korelasi produk moment memakai angka dasar (row
Skor) rumusnya adalah
![](file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif)
3. Cara
ketiga adalah dengan menggunakan korelasi rank dari Spearman-Brown, rumusnya
adalah
![](file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image006.gif)
Dengan d = selisih rank antara X dan Y
Dalam
menggunakan cara ini, terlebih dahulu kita buat rank (peringkat) dari skor tiap
subyek untuk data X dan data Y . pertama sekali kita urutkan setiap skor
tersebut dari yang tertinggi ke terendah. Subyek yang mempunyai skor tertinggi
diberi rank 1 dan seterusnya sampai skor terendah. Jika ada skor yang sama maka
ranknya harus sama pula.
C.
Faktor-Faktor Yang Mempengaruhi Validitas Dan Reabilitas
1.
Faktor yang
mempengaruhi validitas
Banyak yang dapat mempengaruhi hasil suatu evaluasi
sehingga menjadi bisa, menyimpan dari keadaan yang sebenarnya untuk suatu
penggunaan yang dimaksudkan. Beberapa diantaranya adalah berasal dari dalam
alat evaluasi diri sendiri. Pemeriksaaan secara cermat tentang pokok-pokok uji
(materi) akan menunjukkan apakah alat evaluasi itu dapat mengukur isi materi
pelajaran dan fungsi-fungsi intelektual yang ingin diketahui. faktor-faktor yang
mempengaruhi antara lain:
a. Petunjuk
yang tidak jelas.
Petunjuk
yang tidak jelas tentang apa yang harus dilakukan oleh peserta ujian (testi)
cenderung akan mengurangi validitas.
b. Perbendaharaan
kata dan struktur kalimat yang sukar.
Terlalu
banyak menggunakan kata-kata yang kurang dikenal dan struktur kalimat yang
berbelit-belit akan lebih mengukur kemampuan berbahasa atau aspek intelegensi
daripada tingkah laku murid (testi) dalam aspek tertentu misalnya matematika
atau materi mata pelajaran lain oleh karena itu dapat mengurangi validitasnya
c. Penyusunan
soal yang kurang baik.
Terutama
dalam penyajian soal tipe obyektif , seringkali kalimat yang disajikan memberi
petunjuk pada jawaban yang benar atau yang tidak benar, sehingga jawaban mudah
ditebak tanpa harus memahami konsep yang terkadung dalam soal itu.
d. Kekaburan.
Pertanyaan
yang kurang jelas maknanya atau bisa ditafsirkan dengan makna lain dapat
membingungkan peserta tes, sehingga dia menjawab salah bukan karena tidak
memahami konsep dalam soal tersebut. Kekaburan sering kali membigungkan siswa
yang pandai daripada siswa yang kurang pandai.
e. Derajat
kesukaran soal yang tidak cocok
Penyajian
soal-soal yang sangat sukar akan mengakibatkan hasil yang jelek bagi kebanyakan
atau bahkan semua peserta tes.
f. Materi
tes tidak representatif
Jika
kita menyajikan soal tes sedikit maka materi yang tersajikan dalam tes itu tidak
akan mewakili bahan pelajaran yang telah disajikan dan dipelajari siswa,
sehingga faktor keberuntungan akan berperan.
g. Pengaturan
soal yang kurang tepat.
Penyajian
soal hendaknya disusun dari yang mudah menuju pada soal-soal yang sukar.
Penempatan soal-soal yang sukar pada nomor awal akan menyebabkan siswa
menghabiskan banyak waktu dan energi untuk menjawab soal itu saja. Sehingga
untuk mengerjakan soal lainnya sudah lelah dan waktunya bisa kepepet dan gugup.
h. Pola
jawaban yang dapat diidentifikasi
Penempatan
jawaban dalam soal tipe obyektif menurut pola tertentu akan mendorong siswa
untuk menebak jawaban, sehingga konsep dalam soal tidak dipikirkan lagi.
2.
Faktor yang
mempengaruhi reabilitas.
a. Panjang
Tes
Pada umumnya makin panjang tes (butir soal makin banyak),
makin tinggi pula reliabilitasnya. Hal ini disebakan karena tes yang butir
soalnya lebih banyak akan memuat cukup banyak kemampuan kognitif siswa yang
dapat diungkapkan. Untuk soal berbentuk pilihan, jika soalnya lebih banyak
faktor tebakan (sepekulasi) makin sedikit pengaruhnya sehingga lebih
mencerminkan kemampuan siswa yang sebenarnya. Hubungan dengan koefisien
reliabilitas yang baru, yaitu seteh butir soal ditambah dengan n kali banyak
butir soal asal,
b. Kondisi
Tes
Suatu tes yang dicobakan kepada kelompok testi
(tester, peserta tes ) yang beraneka ragam kemampuannya akan menghasilkan skor
yang heterogen, sehingga varians skor yang diperoleh akan besar.
c.
Kesukaran Tes
Materi tes yang terlalu mudah atau terlalu sulit
cenderung akan merendahkan reliabilitas. Hal ini disebabkan karena skor yang
diperoleh siswa untuk soal yang terlalu sulit atau terlalu mudah berkempok pada
skor tinggi atau skor rendah.
d. Pelaksanaan
Tes
Faktor yang bersifat administratif
dalam melaksanakan tes akan mempengaruhi hasil tes, sehingga secara langsung
akan mempengaruhi pula derajat reliabilitas tes tersebut.
D.
Kelemahan-Kelemahan Suatu Tes
1.
Adakalanya tes
(secara psikologis terpaksa) menyinggung pribadi seseorang (walaupun tidak
disengaja demikian), misalnya dalam rumusan soal, pelaksanaan maupun pengumuman
hasil. Dalam kompetisi merebut suatu kesempatan yang pemilihannnya melalui tes,
mau tidak mau tentu ada pihak-pihak yang dikalahkan, dan merka itu tentu merasa
tersinggung pribadinya.
2.
Tes menimbulkan
kecemasan sehingga mempengaruhi hasil belajar yang murni. Tidak dapat
dipungkiri bahwa tes akan menimbulkan suasana khusus yang mengkibatkan hal-hal
yang tidak sama antara oran yang satu denan yang lainnya.
3.
Tes mengategorikan
siswa secara tetap dengan mengikuti hasil tes pertama kadang-kadang orang
membedakan cap kepada siswa menurut kelompok atau kategorinya. Misalnya A
termasuk pandai, sedang, atau kurang.
4.
Tes tidak mendukung
kecemerlangan dan daya kreasi siswa, dengan rumusan soal tes yang kompleks
kadang-kadang siswa yang kurang pandai hanya melihat pada kalimat secara
sepintas.
5.
Tes hanya menggukur
aspek tingkah laku yang sangat terbatas, manusia mempunyai seperangkat sifat
(traits) yang tidak semuanya dapat diukur melalui tes. Tingkah laku sebagai
cermin dari sifat manusia adakalanya lebih cocok diketahui melalui pengalaman
secara cermat.
BAB
III
PENUTUP
A.
Kesimpulan
Berdasarkan
pemaparan di atas dapat ditarik kesimpulan
bahwa dalam upayah memperoleh hasil evaluasi
yang memuaskan, mestinya kita harus memiliki
alat evaluasi yang berkualitas. Kriteria yang harus dipenuhi untuk memperoleh
kualitas alat evaluasi yang baik yaitu:
Validitas, realiabilitas, objektivitas, praktibilitas, derajat kesukaran, daya pembeda, efektifitas option dan efesiensi. Kesemua
tentu ada bagian dan syarat yang masti di penuhi dan dilakukan. Ada beberapa
faktor yang harus diperhatikan dalam memilih dan menggunakan alat evaluasi
sebagai bentuk upaya mencapai hasil evaluasi yang maksimal.
B.
Saran
Dalam penyusunan makalah ini
banyak hal yang pada inti memuat penyampaian dalam bentuk tulisan. Penyampaian
tidak hanya ditunjukkan kepada Mahasiswa yang pada giliran nantinya sebagai
calon guru akan tetapi diharapkan ilmu yang didapatkan bisa di jadikan bahan
pembicaraan ditengah-tengah kalangan
para pengajar sebagai bahan acuan dalam melakukan evaluasi setiap melakukan tes pada suatu
obyek. Adapun dalam penulisan makalah ini
masih terdapat kekurangan, saran maupun kritik yang bersifat konstruktif sangat
kami butuhkan untuk merevisi makala ini demi kesempurnaan dan pelajaran dalam
pembuatan makalah selanjutnya..
DAFTAR PUSTAKA
Purwanto, 1990.Prinsip-Prinsip Dan Teknik
Evaluasi Pengajaran. Jakarta:
Remaja Rosdakarya
Arikunto.Suharsini.2003.Dasar-Dasar Evaluasi Pendidikan.Jakarta;Bumi
aksara
Tidak ada komentar:
Posting Komentar