Evaluasi
Hasil Belajar
KONSEP DASAR EVALUASI HASIL BELAJAR
A.
Pengertian Pengukuran, Penilaian dan Evaluasi
Wiersma dan Jurs membedakan antara
evaluasi, pengukuran dan testing. Mereka berpendapat bahwa evaluasi adalah
suatu proses yang mencakup pengukuran dan mungkin juga testing, yang juga
berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan dengan
pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan mengukur
dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa evaluasi
memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Ralph W. Tyler, yang dikutif oleh
Brinkerhoff dkk. Mendefinisikan evaluasi sedikit berbeda. Ia menyatakan bahwa
evaluation as the process of determining to what extent the educational objectives
are actually being realized. Sementara Daniel Stufflebeam (1971) yang dikutip
oleh Nana Syaodih S., menyatakan bahwa evaluation is the process of delinating,
obtaining and providing useful information for judging decision alternatif.
Demikian juga dengan Michael Scriven (1969) menyatakan evaluation is an
observed value compared to some standard. Beberapa definisi terakhir ini
menyoroti evaluasi sebagai sarana untuk mendapatkan informasi yang diperoleh
dari proses pengumpulan dan pengolahan data.
Sementara itu Asmawi Zainul dan Noehi
Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut
atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu
menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh
melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes.
Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara
pengukuran, penilaian, dan evaluasi. Arikunto menyatakan bahwa mengukur adalah
membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif.
Sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan
ukuran baik buruk. Penilaian bersifat kualitatif. Hasil pengukuran yang
bersifat kuantitatif juga dikemukakan oleh Norman E. Gronlund (1971) yang
menyatakan “Measurement is limited to quantitative descriptions of pupil
behavior”
Pengertian penilaian yang ditekankan
pada penentuan nilai suatu obyek juga dikemukakan oleh Nana Sudjana. Ia
menyatakan bahwa penilaian adalah proses menentukan nilai suatu obyek dengan
menggunakan ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek.
Seperti juga halnya yang dikemukakan oleh Richard H. Lindeman (1967) “The
assignment of one or a set of numbers to each of a set of person or objects
according to certain established rules”
B.
Tujuan Evaluasi
Sebagaimana diuraikan pada bagian
terdahulu bahwa evaluasi dilaksanakan dengan berbagai tujuan. Khusus terkait
dengan pembelajaran, evaluasi dilaksanakan dengan tujuan:
1. Mendeskripsikan kemampuan belajar
siswa.
2. mengetahui tingkat keberhasilan PBM
3. menentukan tindak lanjut hasil
penilaian
4. memberikan pertanggung jawaban
(accountability)
C.
Fungsi Evaluasi
Sejalan dengan tujuan evaluasi di atas,
evaluasi yang dilakukan juga memiliki banyak fungsi, diantaranya adalah fungsi:
1. Selektif
2. Diagnostik
3. Penempatan
4. Pengukur keberhasilan
Selain keempat fungsi di atas Asmawi
Zainul dan Noehi Nasution menyatakan masih ada fungsi-fungsi lain dari evaluasi
pembelajaran, yaitu fungsi:
1. Remedial
2. Umpan balik
3. Memotivasi dan membimbing anak
4. Perbaikan kurikulum dan program
pendidikan
5. Pengembangan ilmu
D.
Manfaat Evaluasi
Secara umum manfaat yang dapat diambil
dari kegiatan evaluasi dalam pembelajaran, yaitu :
1. Memahami sesuatu : mahasiswa (entry
behavior, motivasi, dll), sarana dan prasarana, dan kondisi dosen
2. Membuat keputusan : kelanjutan
program, penanganan “masalah”, dll
3. Meningkatkan kualitas PBM :
komponen-komponen PBM
Sementara secara lebih khusus evaluasi
akan memberi manfaat bagi pihak-pihak yang terkait dengan pembelajaran, seperti
siswa, guru, dan kepala sekolah.
Bagi Siswa
Bagi Siswa
Mengetahui tingkat pencapaian tujuan
pembelajaran : Memuaskan atau tidak memuaskan
Bagi Guru
1. mendeteksi siswa yang telah dan
belum menguasai tujuan : melanjutkan, remedial atau pengayaan
2. ketepatan materi yang diberikan :
jenis, lingkup, tingkat kesulitan, dll.
3. ketepatan metode yang digunakan
Bagi Sekolah
1. hasil belajar cermin kualitas
sekolah
2. membuat program sekolah
3. pemenuhan standar
E.
Macam-macam Evaluasi
1. Formatif
Evaluasi formatif adalah evaluasi yang
dilakukan pada setiap akhir pembahasan suatu pokok bahasan / topik, dan
dimaksudkan untuk mengetahui sejauh manakah suatu proses pembelajaran telah
berjalan sebagaimana yang direncanakan. Winkel menyatakan bahwa yang dimaksud
dengan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran
yang masih berlangsung, agar siswa dan guru memperoleh informasi (feedback)
mengenai kemajuan yang telah dicapai. Sementara Tesmer menyatakan formative
evaluation is a judgement of the strengths and weakness of instruction in its
developing stages, for purpose of revising the instruction to improve its
effectiveness and appeal. Evaluasi ini dimaksudkan untuk mengontrol sampai
seberapa jauh siswa telah menguasai materi yang diajarkan pada pokok bahasan
tersebut. Wiersma menyatakan formative testing is done to monitor student
progress over period of time. Ukuran keberhasilan atau kemajuan siswa dalam
evaluasi ini adalah penguasaan kemampuan yang telah dirumuskan dalam rumusan
tujuan (TIK) yang telah ditetapkan sebelumnya. TIK yang akan dicapai pada
setiap pembahasan suatu pokok bahasan, dirumuskan dengan mengacu pada tingkat
kematangan siswa. Artinya TIK dirumuskan dengan memperhatikan kemampuan awal
anak dan tingkat kesulitan yang wajar yang diperkiran masih sangat mungkin
dijangkau/ dikuasai dengan kemampuan yang dimiliki siswa. Dengan kata lain
evaluasi formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang telah
ditetapkan telah tercapai. Dari hasil evaluasi ini akan diperoleh gambaran
siapa saja yang telah berhasil dan siapa yang dianggap belum berhasil untuk selanjutnya
diambil tindakan-tindakan yang tepat. Tindak lanjut dari evaluasi ini adalah
bagi para siswa yang belum berhasil maka akan diberikan remedial, yaitu bantuan
khusus yang diberikan kepada siswa yang mengalami kesulitan memahami suatu
pokok bahasan tertentu. Sementara bagi siswa yang telah berhasil akan
melanjutkan pada topik berikutnya, bahkan bagi mereka yang memiliki kemampuan
yang lebih akan diberikan pengayaan, yaitu materi tambahan yang sifatnya
perluasan dan pendalaman dari topik yang telah dibahas.
2. Sumatif
Evaluasi sumatif adalah evaluasi yang
dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih
dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana peserta
didik telah dapat berpindah dari suatu unit ke unit berikutnya. Winkel
mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes pada akhir suatu
periode pengajaran tertentu, yang meliputi beberapa atau semua unit pelajaran
yang diajarkan dalam satu semester, bahkan setelah selesai pembahasan suatu bidang
studi.
3. Diagnostik
Evaluasi diagnostik adalah evaluasi
yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan
yang ada pada siswa sehingga dapat diberikan perlakuan yang tepat. Evaluasi
diagnostik dapat dilakukan dalam beberapa tahapan, baik pada tahap awal, selama
proses, maupun akhir pembelajaran. Pada tahap awal dilakukan terhadap calon
siswa sebagai input. Dalam hal ini evaluasi diagnostik dilakukan untuk
mengetahui kemampuan awal atau pengetahuan prasyarat yang harus dikuasai oleh
siswa. Pada tahap proses evaluasi ini diperlukan untuk mengetahui bahan-bahan
pelajaran mana yang masih belum dikuasai dengan baik, sehingga guru dapat
memberi bantuan secara dini agar siswa tidak tertinggal terlalu jauh. Sementara
pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat penguasaan
siswa atas seluruh materi yang telah dipelajarinya.
Perbandingan Tes Diagnostik, Tes
Formatif, dan Tes Sumatif
Ditinjau dari
Tes Diagnostik
Tes Formatif
Tes Sumatif
Fungsinya
*mengelompokkan siswa berdasarkan
kemampuannya
*menentukan kesulitan belajar yang
dialami
*Umpan balik bagi siswa, guru maupun
program untuk menilai pelaksanaan suatu unit program
*Memberi tanda telah mengikuti suatu
program, dan menentukan posisi kemampuan siswa dibandingkan dengan
anggota kelompoknya
cara memilih tujuan yang dievaluasi
*memilih tiap-tiap keterampilan
prasarat
*memilih tujuan setiap program
pembelajaran secara berimbang
*memilih yang berhubungan dengan
tingkah laku fisik, mental dan perasaan
Mengukur semua tujuan instruksional
khusus
Mengukur tujuan instruksional umum
Skoring (cara menyekor)
*menggunakan standar mutlak dan relatif
*menggunakan standar mutlak
*menggunakan standar relatif
F.
Prinsip Evaluasi
Terdapat beberapa prinsip yang harus
diperhatikan dalam melaksanakan evaluasi, agar mendapat informasi yang akurat,
diantaranya:
1. Dirancang secara jelas abilitas yang
harus dinilai, materi penilaian, alat penilaian, dan
interpretasi hasil penilaian. à patokan : Kurikulum/silabi.
2. Penilaian hasil belajar menjadi
bagian integral dalam proses belajar mengajar.
3. Agar hasil penilaian obyektif,
gunakan berbagai alat penilaian dan sifatnya
komprehensif.
4. Hasilnya hendaknya diikuti tindak
lanjut.
Prinsip lain yang dikemukakan oleh
Ngalim Purwanto adalah:
1. Penilaian hendaknya didasarkan pada
hasil pengukuran yang komprehensif.
2. Harus dibedakan antara penskoran
(scoring) dengan penilaian (grading)
3. Hendaknya disadari betul tujuan
penggunaan pendekatan penilaian (PAP dan PAN)
4. Penilaian hendaknya merupakan bagian
integral dalam proses belajar mengajar.
5. Penilaian harus bersifat komparabel.
6. Sistem penilaian yang digunakan
hendaknya jelas bagi siswa dan guru.
G.
Pendekatan Evaluasi
Ada dua jenis pendekatan penilaian yang
dapat digunakan untuk menafsirkan sekor menjadi nilai. Kedua pendekatan ini
memiliki tujuan, proses, standar dan juga akan menghasilkan nilai yang berbeda.
Karena itulah pemilihan dengan tepat pendekatan yang akan digunakan menjadi
penting. Kedua pendekatan itu adalah Pendekatan Acuan Norma (PAN) dan
Pendekatan Acuan Patokan (PAP).
Sejalan dengan uraian di atas, Glaser
(1963) yang dikutip oleh W. James Popham menyatakan bahwa terdapat dua strategi
pengukuran yang mengarah pada dua perbedaan tujuan substansial, yaitu
pengukuran acuan norma (NRM) yang berusaha menetapkan status relatif, dan
pengukuran acuan kriteria (CRM) yang berusaha menetapkan status absolut.
Sejalan dengan pendapat Glaser, Wiersma menyatakan norm-referenced
interpretation is a relative interpretation based on an individual’s position
with respect to some group. Glaser menggunakan konsep pengukuran acuan norma
(Norm Reference Measurement / NRM) untuk menggambarkan tes prestasi siswa
dengan menekankan pada tingkat ketajaman suatu pemahaman relatif siswa.
Sedangkan untuk mengukur tes yang mengidentifikasi ketuntasan / ketidaktuntasan
absolut siswa atas perilaku spesifik, menggunakan konsep pengukuran acuan
kriteria (Criterion Reference Measurement).
1. Penilaian Acuan Patokan (PAP),
Criterion Reference Test (CRT)
Tujuan penggunaan tes acuan patokan
berfokus pada kelompok perilaku siswa yang khusus. Joesmani menyebutnya dengan
didasarkan pada kriteria atau standard khusus. Dimaksudkan untuk mendapat
gambaran yang jelas tentang performan peserta tes dengan tanpa memperhatikan
bagaimana performan tersebut dibandingkan dengan performan yang lain. Dengan
kata lain tes acuan kriteria digunakan untuk menyeleksi (secara pasti) status
individual berkenaan dengan (mengenai) domain perilaku yang ditetapkan /
dirumuskan dengan baik.
Pada pendekatan acuan patokan, standar
performan yang digunakan adalah standar absolut. Semiawan menyebutnya sebagai
standar mutu yang mutlak. Criterion-referenced interpretation is an absolut
rather than relative interpetation, referenced to a defined body of learner
behaviors. Dalam standar ini penentuan tingkatan (grade) didasarkan pada
sekor-sekor yang telah ditetapkan sebelumnya dalam bentuk persentase. Untuk
mendapatkan nilai A atau B, seorang siswa harus mendapatkan sekor tertentu
sesuai dengan batas yang telah ditetapkan tanpa terpengaruh oleh performan
(sekor) yang diperoleh siswa lain dalam kelasnya. Salah satu kelemahan dalam
menggunakan standar absolut adalah sekor siswa bergantung pada tingkat
kesulitan tes yang mereka terima. Artinya apabila tes yang diterima siswa mudah
akan sangat mungkin para siswa mendapatkan nilai A atau B, dan sebaliknya
apabila tes tersebut terlalu sulit untuk diselesaikan, maka kemungkinan untuk
mendapat nilai A atau B menjadi sangat kecil. Namun kelemahan ini dapat diatasi
dengan memperhatikan secara ketat tujuan yang akan diukur tingkat
pencapaiannya.
Dalam menginterpretasi skor mentah
menjadi nilai dengan menggunakan pendekatan PAP, maka terlebih dahulu ditentukan
kriteria kelulusan dengan batas-batas nilai kelulusan. Umumnya kriteria nilai
yang digunakan dalam bentuk rentang skor berikut:
Rentang Skor Nilai
80% s.d. 100% A
70% s.d. 79% B
60% s.d. 69% C
45% s.d. 59% D
< 44% E / Tidak lulus
2. Penilaian Acuan Norma (PAN), Norm
Reference Test (NRT)
Tujuan penggunaan tes acuan norma
biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas
belajar yang besar. Tes acuan norma dimaksudkan untuk mengetahui status peserta
tes dalam hubungannya dengan performans kelompok peserta yang lain yang telah
mengikuti tes. Tes acuan kriteria Perbedaan lain yang mendasar antara
pendekatan acuan norma dan pendekatan acuan patokan adalah pada standar
performan yang digunakan.
Pada pendekatan acuan norma standar
performan yang digunakan bersifat relatif. Artinya tingkat performan seorang
siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya; Tinggi
rendahnya performan seorang siswa sangat bergantung pada kondisi performan
kelompoknya. Dengan kata lain standar pengukuran yang digunakan ialah norma
kelompok. Salah satu keuntungan dari standar relatif ini adalah penempatan
sekor (performan) siswa dilakukan tanpa memandang kesulitan suatu tes secara
teliti. Kekurangan dari penggunaan standar relatif diantaranya adalah (1)
dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki
sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk
mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi
beberapa siswa. (2) standar relatif membuat terjadinya persaingan yang kurang
sehat diantara para siswa, karena pada saat seorang atau sekelompok siswa
mendapat nilai A akan mengurangi kesempatan pada yang lain untuk
mendapatkannya.
H. Bila jumlah pesertanya ratusan, maka
untuk memberi nilainya menggunakan statistik sederhana untuk menentukan
besarnya skor rata-rata kelompok dan simpangan baku kelompok (mean dan standard
deviation) sehingga akan terjadi penyebaran kemampuan menurut kurva normal.
Catatan: mengacu pada kurikulum 1975
(Sumber : Prof. Nana Sudjana)
TAMBAHAN BAHASAN:
evaluasi bukan hanya untuk program pendidikan saja tapi pemakaiannya lebih luas dari pada itu. Contoh beberapa objek yang dapat dievaluasi di luar program pendidikan misalnya sistem manajemen, manajemen sistem informasi, sistem logistik, proses analisis kebutuhan, pelayanan konsultasi, program pengembangan staf, sisten failing, konfeerensi, simposium DeLeLe.
evaluasi bukan hanya untuk program pendidikan saja tapi pemakaiannya lebih luas dari pada itu. Contoh beberapa objek yang dapat dievaluasi di luar program pendidikan misalnya sistem manajemen, manajemen sistem informasi, sistem logistik, proses analisis kebutuhan, pelayanan konsultasi, program pengembangan staf, sisten failing, konfeerensi, simposium DeLeLe.
hgiygikjub
BalasHapus