Bab 1 Pengenalan
RINGKASAN
Bukti awal tentang ujian pendidikan telah dijalankan di China, digelar
Sistem Peperiksaan Imperial atau sistem keju.
Peperiksaan Imperial pada hakikatnya satu-satunya laluan untuk orang
kebanyakan untuk menikmati kehidupan mewah sekiranya mereka lulus.
Galton berhujah bahawa keupayaan mental manusia dan ciri-ciri peribadi
adalah diturunkan melalui baka.
Dalam tahun 1905 Alfred Binet telah menghasilkan skala Binet-Simon
(bersama Theodore Simon) yang mengkehendaki pelajar membuat 30 tugasan pendek
berkaitan pertimbangan.
Lewis Terman telah mengkaji semula ujianBinet-Simon dengan mengubah
beberapa item, menambah item yang lain dan membuat norma umur yang baru, dan
menambah had umur kepada "superior adults". Ujian ini telah menjadi
Ujian Stanford-Binet dikemaskini pada tahun 1916.
Sebuah ujian boleh dilihat sebagai sekumpulan tugasan atau soalan yang
bertujuan mendapatkan perlakuan tertentu dalam keadaan yang standard dan untuk
mendapatkan markah yang mempunyai kendungan psikometrik tertentu.
Pengukuran merupakan suatu proses di mana ciri-ciri seseorang diukur dan
diberikan nombor.
Pentaksiran dilihat sebagai suatu proses pengumpulan maklumat dengan
tujuan membuat keputusan tentang pelajar.
Pentaksiran bertujuan untuk membantu pelajar dan memperbaiki pengajaran.
Pentaksiran sumatif adalah bercorak menyeluruh; memberi kebertanggung
jawaban dan digunakan untuk menyemak tahap pembelajaran di akhir program.
Pentaksiran formatif selalunya dilakukan pada permulaan tahun persekolahan,
dengan itu memberi peluang untuk mendapatkan bukti segera tentang pembelajaran
pelajar dalam subjek tertentu atau pada suatu ketika dalam program.
Sebab utama ujian norm-referenced digunakan adalah untuk membahagikan
pelajar. Ujian-ujian ini adalah direka bentuk untuk menunjukkan perbezaan dalam
pencapaian di antara dan dalam kalangan pelajar untuk menghasilkan darjat
pelajar secara berurutan.
Ujian criterion-referenced memastikan apa pelajar boleh buat dan
sebaliknya, dan bukan bagaimana mereka berbeza di antara satu sama lain.
Bab 2 Apa Untuk Ditaksir
RINGKASAN
Pentaksiran hasil pembelajaran kognitif sentiasa menjadi fokus kebanyakan
sistem pentaksiran di seluruh dunia sebab ia lebih mudah dilihat dan diukur.
Setiap domain pembelajaran terdiri daripada banyak tahap perlakuan,
bermula daripada perlakuan yang paling mudah sehingga ke yang paling kompleks
sehingga membentuk suatu taksonomi hasil pembelajaran.
Apabila kita menilai atau mentaksir manusia, kita mentaksir atau menilai
perlakuan orang itu.
Setiap bidang mempunyai sekumpulan fakta, konsep, prinsip, andaian,
teori, peraturan, prosedur dan kaedah unik yang disampaikan kepada pelajar.
Terdapat enam tahap dalam taksonomi hasil pembelajaran kognitif Bloom
dengan tahap paling rendah dinamakan pengetahuan disusuli lima tahap keupayaan
mental yang semakin kompleks: pemahaman, aplisasi, analisis, sintesis dan
penilaian.
Ciri-ciri afektif melibatkan perasaan atau emosi seseorang. Sikap, nilai,
harga diri, lokus kawalan, tanggappan diri, minat, aspirasi dan keresahan
adalah contoh ciriciri afektif.
Lima kategori utama Domain Afektif daripada perlakuan yang paling mudah
kepada yang paling kompleks adalah menerima, bertindakbalas, menilai, menyusun
dan karakterisasi.
Domain Psikomotor termasuk pergerakan fizikal, koordinasi, dan penggunaan
kecekapan motor.
Tujuh kategori utama Domain Psikomotor daripada perlakuan yang paling
mudah sehingga yang paling kompleks adalah persepsi, set, tindakbalas terpandu,
mekanisma, tindakbalas overt kompleks, adaptasion dan originasi.
Objektif yang baik harus mempunyai empat bahagian: Penonton, Perlakuan,
Keadaan dan Darjah ketepatan.
Situasi yang terbaik adalah terdapatnya keselarian di antara objektif,
pengajaran dan pentaksiran.
Bab 3 Menggunakan Ujian Objektif
RINGKASAN
Ujian objektif adalah ujian bertulis yang terdiri daripada item atau
soalan yang memerlukan responden memilih daripada sebuah senarai jawaban yang
berkemungkinan.
Item atau soalan objektif adalah ‘tepat’ kerana ia tidak boleh
dipengaruhi oleh kecenderungan peribadi dan prejudis penanda.
Ujian objektif berbeza bergantung kepada bagaimana soalan ditulis. Tiga
jenis soalan yang biasa digunakan dalam kebanyakan ujian objektif adalah soalan
aneka pilihan, soalan memadankan dan soalan betul-salah.
Soalan aneka pilihan mempunyai dua bahagian: stem yang mengandungi soalan
dan 4 atau 5 pilihan yang mengandungi jawaban yang betul, dipanggil respon
kekunci dan pilihan yang salah dipanggil pengganggu.
Soalan aneka pilihan digunakan dengan meluas kerana ia boleh mengukur
hasil pembelajaran daripada yang mudah kepada yang kompleks selagi soalan
distruktur dengan baik dan tugasannya jelas dan menguji sample pencapaian yang
berbagai tahap.
Soalan aneka pilihan susah untuk dibina, selalunya mengukur hasil
pembelajaran tahap rendah, mengundang pelajar meneka dan tidak mengukur
kebolehan menulis.
Soalan betul-salah adalah soalan yang mempunyai pernyataan dan pelajar
mengindikasi samada pernyataan itu betul atau salah.
Soalan betul-salah boleh ditulis dengan cepat dan senang ditanda. Oleh
kerana ia diberi markah secara objektif, markahnya lebih tinggi
kebolehpercayaannya berbanding item yang bergantung kepada pertimbangan guru.
Elakkan mencedok terus daripada bahan bacaan, nota atau bahan kursus lain
yang membolehkan pelajar menjawab melalui penghafalan sahaja.
Soalan memadankan digunakan untuk mengukur keupayaan pelajar mengenal
pasti hubungan di antara dua senarai terma, frasa, pernyataan, takrifan,
tarikh, peristiwa, orang dan sebagainya.
Bagi mengurangkan kemungkinan pelajar meneka jawaban, senaraikan lebih
banyak respon daripada premis dan benarkan respondigunakan lebih daripada satu
kali.
Sebuah jadual spesifikasi dapat membantu memastikan agar ujian lebih
tinggi keesahannya, mewakili objektif pembelajaran dan kandungan yang diliputi
dalam ujian.
Semasa menulis item ujian, guru harus peka tentang panjangnya ujian atau
peperiksaan serta tahap pembacaan pelajar.
Bab 4 Mentaksir Hasil Pembelajaran Menggunakan Ujian Esei
RINGKASAN
Sebuah ujian esei adalah sebuah item ujian yang memerlukan respon
dikomposisi oleh pengambil ujian dan selalunya dalam bentuk satu atau lebih
ayat sehinggakan tidak ada satu respon atau corak respon boleh disenaraikan
sebagai jawaban yang betul, dan ketepatan serta mutu jawaban boleh
dipertimbangkan secara subjektif sahaja oleh seorang yang ahir atau tahu dalam
bidang.
Terdapat dua jenis esei berdasarkan fungsinya: esei kerja kursus dan esei
peperiksaan
Soalan esei memberikan cara yang berkesan mentaksir hasil pembelajaran
yang kompleks.
Soalan esei memberikan pengalaman autentik kerana membina respon adalah
lebih hampir kepada kehidupan sebenar daripada memilih respon.
Adalah mustahil mentaksir penguasaan pelajar tentang keseluruhan domain
sesuatu bidang dengan hanya beberapa soalan.
Soalan esei mempunyai dua elemen penting—sejauhmana tugasan distruktur
dan sejauhmana cakupan kandungan difokuskan.
Samada sebuah item esei mentaksir pemikiran tahap tinggi bergantung pada
reka bentuk soalan dan bagaimana respon pelajar diberi markah.
Menentukan had masa dapat membantu pelajar memperuntukkan masa menjawab
beberapa soalan esei.
Elakkan menggunakan soalan esei untuk mentaksir hasil pembelajaran yang
lebih baik ditaksir menggunakan jenis pentaksiran yang lain.
Pemarkahan analitikal adalah sistem yang paling selalu digunakan dalam
peperiksaan awam yang besar dan juga digunakan oleh guru dalam bilik darjah.
Ciri-ciri asasnya adalah skema pemarkahan dan peruntukan markah untuk element-elemen
dalam jawaban.
Pendekatan menyeluruh kepada pemeriksaan soalan esei melibatkan membaca
seluruh respon dan meletakkannya ke dalam kategori yang dikenal pasti mengikut
markah atau gred.
Bab 5 Menggunakan Projek Dan Amali
RINGKASAN
Sebuah projek adalah suatu aktiviti dimana kekangan masa telah dialihkan
dan boleh diambil secara individu atau berkumpulan, dan ia selalunya melibatkan
banyak kerja dibuat di rumah atau di luar sekolah.
Projek Berasaskan Kajian adalah lebih teoretikal sifatnya dan mungkin
melibatkan menyoal, merumus masalah atau membina hipotesis.
Projek berasaskan projek merupakan penghasilan suatu objek yang nyata,
suatu perkhidmatan, suatu persembahan tarian, sebuah filem, sebuah pameran,
sebuah teater, perisian komputer dan sebagainya.
Tugasan projek adalah pengalaman pembelajaran yang membolehkan
perkembangan pengetahuan, kemahiran dan sikap yang tertentu dan mempersiapkan
pelajar untuk pembelajaran sepanjang hayat dan cabaran hari muka: aplikasi
pengetahuan, kolaborasi, komunikasi dan pembelajaran mandiri.
Sebuah projek yang berkesan harus mengandungi element-elemen berikut:
situasi atau masalah, penjelasan tentang projek dan matlamat, spesifikasi
pelaksanaan, peraturan, peranan ahli dan pentaksiran.
Enam A dalam projek: kegigihan akademik, pembelajaran beraplikasi,
authenticity, pengembaraan aktif, hubungan dengan orang dewasa dan amalan
pentaksiran.
Bekerja dalam kumpulan sudah diterima sebagai sebahagian daripada
pembelajaran lantaran kesedaran tentang manafaat kerja kumpulan kolaboratif
kepada pembelajaran pelajar.
Memperuntukkan markah dalam tugasan projek: markah kumpulan berkongsi,
markah teragih, markah individu, markah individu (peperiksaan) dan kombinasi
purata kumpulan.
Pentaksiran kendiri adalah suatu proses di mana pelajar belajar tentang
diri mereka; contohnya, apa mereka telah pelajari tentang projek, bagaimana
mereka mempelajarinya dan bagaimana mereka bertindakbalas dalam situasi
tertentu semasa menjalankan projek.
Pentaksiran amali menumpu kepada persembahan masalah dan penyediaan
peluang kepada pelajar mencadangkan dan menjustifikasi penyelesaian masalah.
Keupayaan dan kemahiran yang ditaksir dalam kerja amali melibatkan
pelajar merancang, melaksanakan, menganalisis dan menilai.
Makmal menyediakan persekitaran yang optimal untuk memotivasi pelajar
sambil mereka mengalami apa itu sains.
Semangat sains diterapkan dalam pelajar yang menyertai aktiviti makmal
secara bermakna.
Bab 6 Menggunakan Pentaksiran Senarai Semak Pemerhatian Ujian Lisan dan
Portfolio
RINGKASAN
Pemerhatian secara umumnya merujuk kepada suatu proses mendapatkan
maklumat melalui deria seseorang khususnya, daripada melihat dan mendengar.
Dalam pemerhatian kualitatif, pemerhati bermula tanpa tanggapan awal
tentang apa yang akan diperhatikan dan menerangkan perlakuan yang nampak
penting.
Dalam pemerhatian kuantitatif, perlakuan yang akan diperhatikan
ditentukan melalui sebuah senarai semak.
Dalam pemerhatian obtrusif, pelajar sedar mereka sedang diperhatikan manakala
dalam pemerhatian tidak obtrusif, pelajar tidak sedar mereka sedang
diperhatikan.
Perlakuan mungkin diperhatikan dan diukur berdasarkan empat dimensi:
jangka masa, kelambatan, kekerapan dan kekuatan.
Pemerhatian digunakan untuk mengumpul data tentang perlakuan yang sukar
ditaksir menggunakan kaedah-kaedah lain, bagi memerhatikan dan merekod cara
pelajar menyelesaikan masalah dan menyiapkan tugasan, dan bagi menentukan
samada pelajar (secara individu atau dalam kumpulan) sedang mencapai objektif
yang diinginkan menggunakan alat-alat pemerhatian.
Ekspresi lisan merupakan “proses utama dalam memformulasi dan berkongsi
pengalaman manusia”.
Syarahan Lisan adalah lebih daripada sekadar bercakap tetapi juga
termasuk bercakap tentang sesuatu kandungan.
Pentaksiran lisan selalunya terbatas kepada seni bahasa.
Takrif pentaksiran lisan telah diperluaskan bagi memasukkan pentaksiran
kandungan.
Pentaksiran lisan boleh dilaksanakan dalam pentaksiran mata-mata
pelajaran seperti sains dan ekonomi.
Sebuah portfolio merupakan suatu koleksi kerja-kerja yang dihasilkan oleh
pelajar, yang mencerminkan usaha, kemajuan dan pencapaian mereka dalam
bahagian-bahagian berlainan dalam kurikulum.
Sebuah portfolio elektronik merupakan sebuah arkib digital tentang kerja
pelajar dengan menggunakan suara tulen pelajar.
Bab 7 Kebolehpercayaan dan Kesahan Teknik Pentaksiran
RINGKASAN
Markah sebenar merupakan konsep hipotetikal keupayaan, kecekapan dan
kemampuan individu sebenar.
Lebih tinggi kebolehpercayaan dan kesahan ujian anda, lebih kemungkinan
anda akan mengukur markah sebenar pelajar anda.
Kebolehpercayaan merujuk kepada konsistensi pengukuran. Sebuah ujian
dianggap utuh sekiranya kita mendapat markah yang sama secara berulang.
Dengan menggunakan teknik Uji-Uji Semula, ujian yang sama ditadbir sekali
lagi kepada pelajar yang sama.
Untuk teknik ini, dua ujian yang serupa (atau bentuk serupa) ditadbir
kepada kumpulan pelajar yang sama.
Konsistensi internal ditentukan menggunakan hanya satu ujian yang
ditadbir satu kali kepada pelajar.
Apabila dua atau lebih orang memeriksa soalan esei, sejauhmana terdapat
persetujuan dalam markah yang diperuntukkan dipanggil kutuhan inter-pemeriksa.
Sementara kebolehpercayaan inter-pemeriksa melibatkan dua atau lebih
individu, kebolehpercayaan intra-pemeriksa adalah konsistensi penggredan oleh
seorang pemeriksa.
Kesahan merupakan sejauhmana sebuah ujian mengukur apa yang ia sepatutnya
mengukur. Adalah penting bagi sesebuah ujian itu sah agar keputusan dapat
diaplikasikan dan diinterpretsi dengan tepat.
Kesahan konstruk berkait dengan samada ujian adalah cukup untuk mengukur
konstruk yang mendasari.
Kesahan kandungan adalah lebih terang dan berkemungkinan berkait dengan
kebolehpercayaan konstruk; ia berkait dengan kesesuaian dan perlunya kandungan
yang dicakupi.
Ada yang menganggap kebolehpercayaan dan kesahan merupakan dua konsep
yang berasingan. Hakikatnya, kebolehpercayaan dan kesahan adalah saling
berkaitan.
Bab 8 Penyediaan, Pentadbiran dan Analisis Item
RINGKASAN
Sebuah ujian yang baik adalah hasil daripada perancangan yang cermat dan
teliti.
Perancangan dilaksanakan melalui fasa-fasa berikut: memperjelaskan
tujuan, menyediakan jadual spesifikasi, menentukan format ujian, menyemak
semula, menghimpun, mereproduksi dan menyediakan garispanduan untuk
pentadbiran.
Analisis item merupakan suatu proses yang meneliti respon-respon setiap
item atau soalan ujian agar dapat mentaksir mutu item-item tersebut dan ujian
secara keseluruhan.
Analisis item dijalankan untuk mendapatkan maklumat tentang setiap item
atau soalan dalam ujian dan bagaimana ujian tersebut dapat diperbaiki.
Indeks Kepayahan merupakan suatu indikator kuantitatif tentang tahap kepayahan
sesebuah item atau soalan.
Indeks Diskriminasi merupakan suatu ukuran asas yang menunjukkan sejauh
mana sebuah soalan mengasingkan atau membezakan antara pelajar dalam kumpulan
‘Markah Tinggi’ dan kumpulan ‘Markah Rendah’.
Secara teori, lebih payah sebuah soalan (atau item) ataupun lebih senang
sebuah soalan (atau item), lebih rendah indeks diskriminasi.
Dengan menghitung proporsi pelajar yang memilih setiap pilihan jawaban,
guru dapat mengenal pasti pengganggu yang mana "bertugas" dan nampak
menarik kepada pelajar yang tidak tahu jawaban betul, dan pengganggu yang mana
sekadar mengisi ruang dan tidak dipilih oleh pelajar.
Umumnya, sebuah pengganggu yang baik dapat menarik lebih ramai pelajar
‘Markah Rendah’ untuk memilih respon tersebut atau mengganggu pelajar ‘Markah
Rendah’ agar memilih respon tersebut.
Sebuah Bank Item merupakan sebuah koleksi soalan-soalan atau item-item
yang telah ditadbir dalam masa yang lama.
Bab 9 Analisis dan Interpretasi Markah Pentaksiran & Melapor
Pentaksiran Pelajar
RINGKASAN
Statistik adalah suatu sains matematikal tentang analisis, interpretasi
dan persembahan data.
Data yang dikumpul tentang pelajar boleh dikenakan analisis statistik,
yang memenuhi dua tujuan: deskriptif dan inferens.
Terma ―tercondong pusat‖ merujuk kepada nilai ―pertengahan‖ dan diukur
menggunakan min, median dan mod. Ia merupakan suatu petunjuk tentang lokasi
markah-markah.
Min adalah jumlah semua nilai (markah) dibahagikan dengan jumlah bilangan
item (pelajar) dalam suatu set.
Julat markah dalam sebuah ujian merujuk kepada markah terendah dan
tertinggi yang diterima dalam ujian tersebut.
Sisihan piawai merujuk kepada banyak mana markah-markah yang diterima
oleh pelajar menyimpang atau terkeluar daripada min.
Pencongan merujuk kepada suatu simetri penyerakan.
Pencongan yang negative mempunyai ekor yang lebih panjang pada arah
negatif.
Pencongan positif mempunyai ekor pada arah positif.
Markah standard merujuk kepada markah mentah yang telah dialihkan
daripada satu skala kepada skala yang lain menggunakan min dan sisihan piawai.
Mata Z memberitahu berapa sisihan piawai jauhnya daripada min letaknya
sebuah markah.
Mata T adalah suatu markah standard dengan min 50 dan sisihan piawai 10.
Lengkungan normal (juga dipanggil ‗lengkungan loceng‘) merupakan suatu
lengkungan hipotetikal yang sepatutnya mewakili semua fenomena lazim yang
berlaku.
Dalam pentaksiran merujuk norma, prestasi seorang individu dinilai dengan
bandingan dengan prestasi orang lain.
Norma-norma adalah ciri-ciri suatu populasi yang dianggar dengan tepat
daripada ciri-ciri sebuah subset yang mewakili populasi (dipanggil sampel atau
sampel norma).
Penggunaan terancang dan aktif keputusan ujian merupakan sebahagian
penting proses pengajaran.
Matlamat laporan pentaksiran adalah untuk memperbaiki keputusan-keputusan
dan membantu sekolah atau institusi memperbaiki dan membantu pelajar belajar
dengan lebih lagi.
Pendidik harus mereka bentuk dan menyediakan laporan tentang keputusan
pentaksiran dengan cermat.
Semasa menyediakan laporan pentaksiran, kita harus peka tentang siapa
pembacanya.
Format laporan pentaksiran akan mempengaruhi motivasi pembaca untuk
membaca laporan tersebut serta persepsi yang pembaca perolehi daripada laporan
tersebut.
Orang yang menggunakan keputusan pentaksiran selalunya membuat rumusan
tentang domain kandungan yang lebih luas daripada yang sebenarnya tercakup
dalam pentaksiran.
Kerahsiaan adalah sangat penting dalam melapor keputusan pentaksiran.