Follower

Rabu, 18 Juli 2012

Evaluasi dalam pembelajran matematika


BAB I
PENDAHULUAN
A.           Latar Belakang
Bertitik tolak dari pendapat Galton, bahwa dalam suatu kelompok individu (siswa) yang tidak dipilih secara khusus memiliki karakteristik tertentu yang frekuensinya berdistribusi normal. Begitu pula kepandaiannya dalam suatu mata pelajaran tertentu. Dengan demikian suatu alat evaluasi yang baik akan mencerminkan kemampuan sebenarnya dari testi yang dievaluasi dan bisa membedakan siswa yang pandai (di atas rata-rata), siswa yang kemampuannya sedang (pada kelompok rata-rata), dan siswa yang kemampuannya kurang (di bawah rata-rata). Sehingga penyebaran skor atau nilai hasil evaluasi tersebut berdistribusi normal.
untuk mendapatkan hasil eavaluasi yang baik tentunya diperlukan alat evaluasi yang kualitasnya baik pula. Alat evaluasi yang baik dapat ditinjau dari hal-hal berikut ini, yaitu: validitas, reliabilitas, daya pembeda, derajat kesukaran, efektifitas option, obyektifitas, dan praktikabilitas
                   
B.            Rumusan Masalah
1.      Sebutkan dan jelaskan ciri-ciri evaluasi yang baik?
2.      Bagaimana cara menghitung validitas suatu tes?
3.      Jelaskan faktor-faktor yang mempengaruhi Validitas dan Reabilitasi ?
4.      Jelaskan kelemahan-kelemahan yan dikandung oleh tes?


 
BAB II
PEMBAHASAN
A.      Kualitas Alat Evaluasi
Untuk mendapatkan hasil eavaluasi yang baik tentunya diperlukan alat evaluasi yang kualitasnya baik pula. Alat evaluasi yang baik dapat ditinjau dari hal-hal berikut ini, yaitu: validitas, reliabilitas, daya pembeda, derajat kesukaran, efektifitas option, obyektifitas, dan praktikabilitas.
1.      Validitas
Suatu alat evaluasi disebut valid (absah atau sahih) apabila alat tersebut mampu mengevaluasi apa yang seharusnya dievaluasi. Oleh karena itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi itu.
Validitas berdasarkan pelaksanaannya dapat dikelompokkan ke dalam dua jenis, yaitu:

a.       Validitas Teoritik
Validitas teoritik atau validitas logik adalah validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Ada tiga macam validitas yang termasuk ke dalam validitas teoritik ini, yaitu:  
1)      Validitas Isi
Validitas isi suatu alat evaluasi artinya ketepatan alat tersebut ditinjau dari segi materi yang dievaluasikan, yaitu materi (bahan) yangdipakai sebagai alat evaluasi tersebut yang merupakan sampel representative dari pengetahuan yang harus dikuasai.



2)      Validitas Muka
Validitas muka suatu alat evaluasi disebut pula validitas bentuk soal (pertanyaan, pernyataan, suruhan) atau validitas tampilan, yaitu keabsahan susunan kalimat atau kata-kata dalam soal sehingga jelas pengertiannya atau tidak menimbulkan tafsiran lain.

3)      Validitas Konstruksi Psikologik
Pada umumnya alat evaluasi yang sering menyangkut validitas konstruksi  ini berkenaan dengan aspek sikap, kepribadian, motivasi, minat, dan bakat.

b.      Validitas Kriterium
Validitas ini diperoleh dengan melalui observasi atau pengalaman yang bersifat empirik, kriterium itu dipergunakan untuk menentukan tinggi-rendahnya koefisien validitas alat evaluasi yang dibuat melalui perhitungan korelasi. Ada dua macam validitas yang termasuk ke dalam validitas kriterium ini, yaitu:
1)      Validitas Banding
Validitas banding seringkali disebut validitas bersama. Misalnya alat evaluasi yang diselidiki validitasnya adalah tes matematika buatan guru (kita) dengan menggunakan kriterium nilai rata-rata harian atau nilai tes sumatif yang telah ada, dengan asumsi hasil evaluasi yang digunakan untuk kriterium itu telah mencerminkan kemampuan siswa sebenarnya. Kedua tes tersebut diberikan kepada subyek (siswa) yang sama. Apabila kedua nilai atau skor itu berkorelasi tinggi, maka tes yang kita buat itu memiliki validitas yang tinggi pula.
2)      Validitas Ramal
Sebuah alat evaluasi dikatakan memiliki validitas ramal yang baik jika ia mempunyai kemampuan untuk meramalkan hal-hal yang akan terjadi di masa yang akan datang.
Cara menentukan tingkat (indeks) validitas kriterium adalah dengan menghitung koefisien korelasi antara alat evaluasi yang akan diketahui validitasnya dengan alat ukur lain yang telah dilaksanakan dan diasumsikan telah memiliki validitas yang tinggi (baik). Cara mencari koefisien validitas dapat digunakan 3 macam cara, yaitu: korelasi produk moment memakai simpangan, korelasi produk moment memakai angka kasar, dan korelasi metode rank.

2.      Reliabilitas
Reliabilitas suatu alat ukur atau alat evaluasi dimaksudkan sebagai suatu alat yang memberikan hasil yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relatif sama) jika pengukurannya diberikan pada subyek yang sama meskipun dilakukan oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Relatif di sini dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan) dan bisa diabaikan, Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Untuk soal objektif, menentukan derajat reliabilitas bisa dicari dengan teknik belah dua atau teknik non belah dua. Dengan teknik belah dua ada tiga macam perhitungan, yaitu: Formula Spearman-Brown, Formula Flanagan, dan Formula Rulon. Sedangkan dengan teknik non belah dua ada dua macam perhitungan, yaitu: Kuder Richardson (KR-20 dan KR-21) dan Anava Hoyt. Untuk soal bentuk uraian, menentukan derajat reliabilitas bisa dicari dengan menggunakan rumus Alpha.

3.      Daya Pembeda
Pengertian Daya Pembeda (DP) dari sebuah butir soal menyatakan seberapa jauh kemampuan butir soal tersebut mampu membedakan antara testi yang mengetahui jawabannya dengan benar dengan testi yang tidak dapat menjawab soal tersebut (atau testi yang menjawab salah). Dengan perkataan lain daya pembeda sebuah butir soal adalah kemampuan butir soal itu untuk membedakan antara testi (siswa) yang pandai atau berkemampuan tinggi dengan siswa yang bodoh.


4.      Derajat Kesukaran
Sejalan dengan asumsi Galton mengenai kemampuan tertentu (karakteristik), dalam hal ini kemampuan matematika, dari sekelompok siswa yang dipilih secara random (acak) akan berdistribusi normal, maka hasil evaluasi dari suatu perangkat tes yang baik akan menghasilkan skor atau nilai yang membentuk distribusi normal. Hal ini mempunyai implikasi bahwa soal yang baik akan menghasilkan skor yang berdistribusi normal pula.

5.      Efektifitas Option
Option adalah kemungkinan jawaban yang disediakan pada butir soal (tes) tipe obyektif bentuk pilihan ganda atau memasangkan untuk dipilih oleh peserta tes, sesuai dengan petunjuk yang diberikan. Suatu option disebut efektif jika memenuhi fungsinya atau tujuan disajikannya option tersebut tercapai. Hal ini berarti bahwa setiap option yang disajikan masing-masing mempunyai kemungkinan yang sama untuk dipilih, jika testi menjawab soal itu dengan menerka-nerka (spekulasi).
Option yang merupakan jawaban yang benar disebut option kunci, sedangkan option lainnya disebut option pengecoh. Agar suatu option yang disajikan efektif harus diusahakan homogen (serupa), baik dari segi isi (materi), notasi, maupun panjang-pendeknya kalimat pada option tersebut.
Berdasarkan distribusi pilihan pada setiap option untuk siswa kelompok atas dan kelompok bawah, dapat ditentukan option yang berfungsi efektif atau tidak. Kriteria option yang berfungsi efektif adalah:
a.       Untuk option kunci
1)      Jumlah pemilih kelompok atas harus lebih banyak daripada jumlah pemilih kelompok bawah.
2)      Jumlah pemilih kelompok atas dan kelompok bawah lebih dari 0,25 tetapi tidak lebih dari 0,75 dari seluruh siswa kelompok atas dan kelompok bawah.
b.      Untuk option pengecoh
1)       Jumlah pemilih kelompok atas lebih sedikit daripada jumlah pemilih kelompok bawah.
2)      Jumlah pemilih kelompok atas dan kelompok bawah minimal sebanyak 0,25 dari seperdua jumlah option pengecoh kali jumlah kelompok atas dan kelompok bawah.
3)      Jika peserta tes mengabaikan semua option (tidak memilih) disebut omit. Option disebut efektif jika omit ini jumlahnya tidak lebih dari 10% jumlah siswa pada kelompok atas dan kelompok bawah.

6.      Obyektifitas
Sebuah tes hendaknya bersifat obyektif. Hal ini maksudnya adalah hasil tes tersebut harus selalu sama, meskipun diperiksa oleh orang yang berlainan. Tentu saja, agar harapan tersebut terpenuhi tes yang kita buat harus mempunyai jawaban yang jelas, tidak kabur, jawabannya tertentu, dan tidak terlalu memberikan  jawaban yang beranekaragam.
Kuallitas objektivitas suatu tes dapat dibedakan menjadi tiga tingkatan yaitu :
a.       Objektivitas tinggi ialah jika hasil tes-tes itu menunjukkan tingkat kesamaan yang tinggi. Contohnya : tes yang sudah distandardisasi, hasil penskorannya sangat objektif.
b.      Objektivitas sedang ialah seperti tes yang sudah distardisasi tetapi, pandangan subyektif skor masih mungkin muncul dalam penilaiannya dan interpretasinya.
c.       Objektivitas fleksible ialah seperti beberapa jenis tes yang digunakan oleh LBP(Lembaga Bimbingan dan Penyuluhan) untuk keperluan counseling, misalnya tes yang bersifat open-end item (open-end questionaires).


7.      Praktikabilitas
Tes yang baik harus bersifat praktis, dalam arti mudah dilaksanakan dan efisien dari segi biaya dan tenaga. Dalam penyusunan tes hendaknya biaya yang diperlukan tidak terlampau tinggi, namun masih memenuhi persyaratan sebuah tes yang baik. Sebuah tes juga disebut praktis bila pemeriksaannya mudah dan dapat dianalisis dalam waktu relatif singkat.
B.       Cara Menghitung Validitas Suatu Tes
1.    Menggunakan simpangan adalah :
2.    Cara kedua dengan menggunakan rumus korelasi produk moment memakai angka dasar (row Skor) rumusnya adalah


3.    Cara ketiga adalah dengan menggunakan korelasi rank dari Spearman-Brown, rumusnya adalah
Dengan d = selisih rank antara X dan Y
Dalam menggunakan cara ini, terlebih dahulu kita buat rank (peringkat) dari skor tiap subyek untuk data X dan data Y . pertama sekali kita urutkan setiap skor tersebut dari yang tertinggi ke terendah. Subyek yang mempunyai skor tertinggi diberi rank 1 dan seterusnya sampai skor terendah. Jika ada skor yang sama maka ranknya harus sama pula.
C.    Faktor-Faktor Yang Mempengaruhi Validitas Dan Reabilitas
1.      Faktor yang mempengaruhi validitas
Banyak yang dapat mempengaruhi hasil suatu evaluasi sehingga menjadi bisa, menyimpan dari keadaan yang sebenarnya untuk suatu penggunaan yang dimaksudkan. Beberapa diantaranya adalah berasal dari dalam alat evaluasi diri sendiri. Pemeriksaaan secara cermat tentang pokok-pokok uji (materi) akan menunjukkan apakah alat evaluasi itu dapat mengukur isi materi pelajaran dan fungsi-fungsi intelektual yang ingin diketahui. faktor-faktor yang mempengaruhi antara lain:
a.       Petunjuk yang tidak jelas.
Petunjuk yang tidak jelas tentang apa yang harus dilakukan oleh peserta ujian (testi) cenderung akan mengurangi validitas.
b.      Perbendaharaan kata dan struktur kalimat yang sukar.
Terlalu banyak menggunakan kata-kata yang kurang dikenal dan struktur kalimat yang berbelit-belit akan lebih mengukur kemampuan berbahasa atau aspek intelegensi daripada tingkah laku murid (testi) dalam aspek tertentu misalnya matematika atau materi mata pelajaran lain oleh karena itu dapat mengurangi validitasnya
c.       Penyusunan soal yang kurang baik.
Terutama dalam penyajian soal tipe obyektif , seringkali kalimat yang disajikan memberi petunjuk pada jawaban yang benar atau yang tidak benar, sehingga jawaban mudah ditebak tanpa harus memahami konsep yang terkadung dalam soal itu.
d.      Kekaburan.
Pertanyaan yang kurang jelas maknanya atau bisa ditafsirkan dengan makna lain dapat membingungkan peserta tes, sehingga dia menjawab salah bukan karena tidak memahami konsep dalam soal tersebut. Kekaburan sering kali membigungkan siswa yang pandai daripada siswa yang kurang pandai.
e.       Derajat kesukaran soal yang tidak cocok
Penyajian soal-soal yang sangat sukar akan mengakibatkan hasil yang jelek bagi kebanyakan atau bahkan semua peserta tes.
f.       Materi tes tidak representatif
Jika kita menyajikan soal tes sedikit maka materi yang tersajikan dalam tes itu tidak akan mewakili bahan pelajaran yang telah disajikan dan dipelajari siswa, sehingga faktor keberuntungan akan berperan.
g.      Pengaturan soal yang kurang tepat.
Penyajian soal hendaknya disusun dari yang mudah menuju pada soal-soal yang sukar. Penempatan soal-soal yang sukar pada nomor awal akan menyebabkan siswa menghabiskan banyak waktu dan energi untuk menjawab soal itu saja. Sehingga untuk mengerjakan soal lainnya sudah lelah dan waktunya bisa kepepet dan gugup.
h.      Pola jawaban yang dapat diidentifikasi
Penempatan jawaban dalam soal tipe obyektif menurut pola tertentu akan mendorong siswa untuk menebak jawaban, sehingga konsep dalam soal tidak dipikirkan lagi.
2.      Faktor yang mempengaruhi reabilitas.
a.       Panjang Tes
Pada umumnya makin panjang tes (butir soal makin banyak), makin tinggi pula reliabilitasnya. Hal ini disebakan karena tes yang butir soalnya lebih banyak akan memuat cukup banyak kemampuan kognitif siswa yang dapat diungkapkan. Untuk soal berbentuk pilihan, jika soalnya lebih banyak faktor tebakan (sepekulasi) makin sedikit pengaruhnya sehingga lebih mencerminkan kemampuan siswa yang sebenarnya. Hubungan dengan koefisien reliabilitas yang baru, yaitu seteh butir soal ditambah dengan n kali banyak butir soal asal, 

b.      Kondisi Tes
Suatu tes yang dicobakan kepada kelompok testi (tester, peserta tes ) yang beraneka ragam kemampuannya akan menghasilkan skor yang heterogen, sehingga varians skor yang diperoleh akan besar.
c.       Kesukaran Tes
Materi tes yang terlalu mudah atau terlalu sulit cenderung akan merendahkan reliabilitas. Hal ini disebabkan karena skor yang diperoleh siswa untuk soal yang terlalu sulit atau terlalu mudah berkempok pada skor tinggi atau skor rendah.
d.      Pelaksanaan Tes
            Faktor yang bersifat administratif dalam melaksanakan tes akan mempengaruhi hasil tes, sehingga secara langsung akan mempengaruhi pula derajat reliabilitas tes tersebut.

D.    Kelemahan-Kelemahan Suatu Tes
1.      Adakalanya tes (secara psikologis terpaksa) menyinggung pribadi seseorang (walaupun tidak disengaja demikian), misalnya dalam rumusan soal, pelaksanaan maupun pengumuman hasil. Dalam kompetisi merebut suatu kesempatan yang pemilihannnya melalui tes, mau tidak mau tentu ada pihak-pihak yang dikalahkan, dan merka itu tentu merasa tersinggung pribadinya.
2.      Tes menimbulkan kecemasan sehingga mempengaruhi hasil belajar yang murni. Tidak dapat dipungkiri bahwa tes akan menimbulkan suasana khusus yang mengkibatkan hal-hal yang tidak sama antara oran yang satu denan yang lainnya.
3.      Tes mengategorikan siswa secara tetap dengan mengikuti hasil tes pertama kadang-kadang orang membedakan cap kepada siswa menurut kelompok atau kategorinya. Misalnya A termasuk pandai, sedang, atau kurang.
4.      Tes tidak mendukung kecemerlangan dan daya kreasi siswa, dengan rumusan soal tes yang kompleks kadang-kadang siswa yang kurang pandai hanya melihat pada kalimat secara sepintas.
5.      Tes hanya menggukur aspek tingkah laku yang sangat terbatas, manusia mempunyai seperangkat sifat (traits) yang tidak semuanya dapat diukur melalui tes. Tingkah laku sebagai cermin dari sifat manusia adakalanya lebih cocok diketahui melalui pengalaman secara cermat.











BAB III
PENUTUP
A.    Kesimpulan
Berdasarkan pemaparan di atas dapat ditarik kesimpulan bahwa dalam upayah memperoleh hasil evaluasi yang memuaskan, mestinya kita harus memiliki alat evaluasi yang berkualitas. Kriteria yang harus dipenuhi untuk memperoleh kualitas alat evaluasi yang baik yaitu: Validitas, realiabilitas, objektivitas, praktibilitas, derajat kesukaran, daya pembeda, efektifitas option dan efesiensi. Kesemua tentu ada bagian dan syarat yang masti di penuhi dan dilakukan. Ada beberapa faktor yang harus diperhatikan dalam memilih dan menggunakan alat evaluasi sebagai bentuk upaya mencapai hasil evaluasi yang maksimal.

B.     Saran
Dalam penyusunan makalah ini banyak hal yang pada inti memuat penyampaian dalam bentuk tulisan. Penyampaian tidak hanya ditunjukkan kepada Mahasiswa yang pada giliran nantinya sebagai calon guru akan tetapi diharapkan ilmu yang didapatkan bisa di jadikan bahan pembicaraan ditengah-tengah kalangan para pengajar sebagai bahan acuan dalam melakukan evaluasi setiap melakukan tes pada suatu obyek. Adapun dalam penulisan makalah ini masih terdapat kekurangan, saran maupun kritik yang bersifat konstruktif sangat kami butuhkan untuk merevisi makala ini demi kesempurnaan dan pelajaran dalam pembuatan makalah selanjutnya..







DAFTAR PUSTAKA

Purwanto, 1990.Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran. Jakarta: Remaja Rosdakarya
Arikunto.Suharsini.2003.Dasar-Dasar Evaluasi Pendidikan.Jakarta;Bumi aksara








Tidak ada komentar:

Posting Komentar