Sunday, December 8, 2019

Perbandingan Penilaian, Asesmen, pengukuran, dan testing

“Perbandingan Penilaian, Asesmen, Pengukuran Dan Testing”


PENDAHULUAN

Pembelajaran merupakan suatu rangkaian proses dan kegiatan untuk memajukan serta meningkatkan kompetensi dari peserta didik sehingga nantinya peserta didik memiliki bekal dan skill dalam menghadapi persaingan pada dunia kerja atau setelah proses pembelajaran berakhir. Proses pembelajaran merupakan tonggak utama dalam pelaksanaan pendidikan. Dengan kata lain apabila dalam proses pembelajaran terjadi hambatan atau gangguan akan berdampak pada penurunan kualitas pendidikan. Pembelajaran tidak akan lengkap apabila tidak diikuti oleh perencanaan yang matang serta menggunakan teknik dan komponen penilaian yang tepat. Penyusunan  rencana penilaian merupakan rangkaian program pendidikan dan pembelajaran yang utuh dan merupakan  satu  kesatuan  yang  tidak  dapat dipisahkan  satu  dengan  yang  lainnya.
Dalam sebuah proses pembelajaran komponen yang turut menentukan keberhasilan sebuah proses adalah evaluasi. Melalui evaluasi orang akan mengetahui sampai sejauh mana penyampaian pembelajaran atau tujuan pendidikan atau sebuah program dapat dicapai sesuai dengan tujuan yang diinginkan. Evaluasi merupakan salah satu kegiatan utama yang harus dilakukan dalam kegiatan pendidikan dan pembelajaran. Melalui Evaluasi, kita akan mengetahui perkembangan hasil belajar, intelegensi, bakat khusus, minat, hubungan social, sikap dan kepribadian siswa atau peserta didik serta keberhasilan sebuah program.
Dalam dunia pendidikan dan pembelajaran ada beberapa istilah yang sering digunakan, baik secara bersamaan maupun secara terpisah. Istilah tersebut adalah pengukuran, penilaian, dan evaluasi. Ketiga istilah tersebut memiliki perbedaan. Mengacu pada asumsi bahwa pembelajaran merupakan sistem yang terdiri atas beberapa unsur (yaitu masukan, proses dan hasil), maka terdapat tiga jenis evaluasi sesuai dengan sasaran evaluasi pembelajaran, yaitu evaluasi masukan, proses dan hasil pembelajaran.
Terkait dengan ketiga jenis evaluasi pembelajaran tersebut, dalam praktek pembelajaran secara umum pelaksanaan evaluasi pembelajaran menekankan pada evaluasi proses pembelajaran dan evaluasi hasil belajar. Hal ini didasarkan pada pemikiran bahwa pelaksanaan kedua jenis evaluasi tersebut merupakan komponen sistem pembelajaran yang sangat penting. Evaluasi kedua jenis komponen yang dapat dipergunakan untuk mengetahui kekuatan dan kelemahan pelaksanaan dan hasil pembelajaran. Selanjutnya masukan tersebut pada gilirannya dipergunakan sebagai bahan dan dasar memperbaiki kualitas proses pembelajaran menuju keperbaikan kualitas hasil pembelajaran
Dalam undang-undang no 23 tahun 2003 tantang sistem pendidikan nasional telah dijelaskan bahwa “sistem pendidikan nasional adalah keseluruhan komponen pendidikan yang saling terkait secara terpadu untuk mencapai tujuan pendidikan nasional. Kemudian pada Peraturan Pemerintah no 19 tahun 2005 telah dijelaskan tentang Standar Nasional Pendidikan yaitu berjumlah delapan buah: standar isi, standar proses, standar kompetensi lulusan, standar pendidik dan tenaga pendidik, standar sarana dan prasarana, standar pengelolaan, standar pembiayaan, standar penilaian pendidikan. Dari delapan standar pendidikan nasional, standar pendidikan merupakan bagian tang tak terpisahkan dengan darstandar nasional pendidikan. Setiap pendidikan harus dapat memberikan pelayanan yang prima dan memperlakukan peserta didik secara adil, objektif, bertanggung jawab, tidak terkecuali dalam penilaian pendidikan.
Berlandaskan landasan yuridis di atas terlihat bahwa guru sebagai salah seorang pelaksana pendidikan memiliki peran penting dalam proses penilaian. Guru yang berkualitas akan mampu melakukan penilaian dengan baik, sehingga hasil belajar yang diukur akan terllihat dengan jelas, apakah pembelajaran yang dilakukan sudah mencapai standar kompetensi lulusan atau belum. Guru atau pendidik harus menguasai dan memahami mekanisme, prosedur, maupun instrument penialaian yang harus digunakan. Guru diharapkan mampu melaksanakan proses penialain secara berkesinambungan agar dapat memantau proses, kemajuan, dan perbaikan dan perbaikan hasil dalam bentuk ulangan harian, ulangan tengah semester, ulangan akhir semester, ulangan kenaikan kelas.
Selain dari istilah evaluasi (evaluation) dan asesmen (assessment) dikenal pula beberapa istilah lainnya yaitu pengukuran (measurement), tes (test) dan testing. Diantara ketiga istilah tersebut, tes merupakan istilah yang paling akrab dengan guru. Hal tersebut disebabkan karena Tes prestasi belajar (Achievement test) seringkali dijadikan sebagai satu-satunya alat untuk menilai hasil belajar siswa. Padahal tes sebenarnya hanya merupakan salah satu alat ukur hasil belajar. Tes prestasi belajar (Achievement test) seringkali dipertukarkan pemakaiannya oleh guru dengan konsep pengukuran hasil belajar (measurement). Dengan demikian, perlu adanya upaya untuk memperkenalkan kepada guru tentang pengertian dan esensi tentang konsep evaluasi, asesmen, tes dan pengukuran yang sesungguhnya. Oleh karena itu, dalam makalah ini penulis akan menjabarkan tentang beberapa hal yang harus diketahui oleh seorang guru diantaranya penilaian, asesmen, pengukuran dan testing serta perbandingannya dll.

Berdasarkan latar belakang yang teah diungkapkan, maka rumusan masalah pada makalah ini adalah
1.      Bagaimanakah analisis perbandingan Penilaian, Asesmen, Pengukuran, dan Testing?
2.      Bagaimanakah perbedaan Penilaian, Asesmen, Pengukuran, dan Testing?

Agar penulisan ini lebih terarah, maka penulis membatasi masalah : membedakan antara penilaian, asessmen, evaluasi, dan pengukuran dalam pembelajaran.

Adapun tujuan dalam pembuatan makalah ini adalah
1.      Untuk menganalisis perbandingan Penilaian, Asesmen, Pengukuran, dan Testing
2.      Untuk mengetahui perbedaan Penilaian, Asesmen, Pengukuran, dan Testing

Adapun manfaat dalam pembuatan makalah ini adalah :
1.      Sebagai bahan pertimbangan oleh guru dalam menjalankan proses pembelajaran dan penilaian dalam pembelajaran.
2.      Dapat dijadikan pengalaman dan bekal ilmu pengetahuan bagi pembaca khususnya untuk tenaga pendidik kedepannya.
3.      Membantu mahasiswa memahami tentang bagaimana pelaksanaan evaluasi dalam pendidikan.
4.      Memenuhi persyaratan untuk mengikuti mata kuliah Pengembangan Evaluasi dan Proses Pembelajaran Fisika


KAJIAN TEORI

a.      Penjelasan mengenai menuntut ilmu
Sebagaimana di dalam ayat al-quran Surat Al-Mujadalah ayat 11:

يَرْفَعِ اللهُ الَّذِينَ ءَامَنُوا مِنكُمْ وَالَّذِينَ أُوتُوا الْعِلْمَ دَرَجَاتٍ
Artinya :”Allah akan meninggikan orang-orang yang beriman di antaramu dan orang-orang yang diberi ilmu pengetahuan”.
Dalam Surat Thoha ayat 114:
وَقُل رَّبِّ زِدْنِي عِلْمًا
Artinya :”Dan katakanlah (olehmu muhammad),”ya tuhanku, tambahkan kepadaku ilmu pengetahuan.”
b.      Penjelasan mengenai Pengukuran
Al-Qur`an Surat Al-Qamar Ayat 49
Artinya: Sesungguhnya Kami menciptakan segala sesuatu menurut ukuran”.

Al-Qur`an Surat Al-Furqan Ayat 2
Artinya : “yang kepunyaan-Nya-lah kerajaan langit dan bumi, dan Dia tidak mempunyai anak, dan tidak ada sekutu bagi-Nya dalam kekuasaan(Nya), dan dia telah menciptakan segala sesuatu, dan Dia menetapkan ukuran-ukurannya dengan serapi-rapinya”.

c.       Penjelasan mengenai tes
Al-Qur`an Surat Al-Baqarah Ayat  214

Artinya: “Apakah kamu mengira bahwa kamu akan masuk surga, padahal belum datang kepadamu (cobaan) sebagaimana halnya orang-orang terdahulu sebelum kamu? Mereka ditimpa oleh malapetaka dan kesengsaraan, serta digoncangkan (dengan bermacam-macam cobaan) sehingga berkatalah Rasul dan orang-orang yang beriman bersamanya: "Bilakah datangnya pertolongan Allah?" Ingatlah, sesungguhnya pertolongan Allah itu amat dekat”.
d.      Penjelasan mengenai Evaluasi
Al-Qur`an Surat Al-ankabut ayat 2-3

Artinya: Apakah manusia itu mengira bahwa mereka dibiarkan (saja) mengatakan: “Kami telah beriman”, sedang mereka tidak diuji lagi? Dan Sesungguhnya Kami telah menguji orang-orang yang sebelum mereka, Maka Sesungguhnya Allah mengetahui orang-orang yang benar dan Sesungguhnya Dia mengetahui orang-orang yang dusta.” (QS Al-Ankabuut 2-3).
a.      PERMENDIKBUD RI No.23 Tahun 2016 tentang Standar Penilaian Pendidikan
Standar Penilaian Pendidikan adalah kriteria mengenai lingkup, tujuan, manfaat, prinsip, mekanisme, prosedur, dan instrumen penilaian hasil belajar peserta didik yang digunakan sebagai dasar dalam penilaian hasil belajar peserta didik pada pendidikan dasar dan pendidikan menengah.
Penilaian adalah proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil belajar peserta didik. Pembelajaran adalah proses interaksi antar peserta didik, antara peserta didik dengan pendidik dan sumber belajar pada suatu lingkungan belajar.

b.      UU No.20 tahun 2003 tentang Sistem Pendidikan Nasional
c.       PP No. 13 tahun 2015 tentang Standar Pendidikan Nasional
d.      PP No. 32 tahun 2013
Evaluasi pendidikan adalah kegiatan pengendalian, penjaminan dan penetapan mutu pendidikan terhadap berbagai komponen pendidikan pada setiap jalur, jenjang dan jenis pendidikan sebagai bentuk pertanggungjawaban penyelenggara pendidikan.

  1. EVALUASI
Evaluasi berasal dari kata evaluation yang berarti suatu tindakan atau suatu proses untuk menentukan nilai sesuatu, apakah sesuatu itu mempunyai nilai atau tidak. Menurut istilah evaluasi berarti kegiatan yang terencana untuk mengetahui keadaan suatu objek dengan menggunakan instrument dan hasilnya dibandingkan dengan tolak ukur tertentu guna memperoleh kesimpulan. Menurut Sujiono (1996) “ Evaluasi merupakan interprestasi yang bersumber pada data kuatitatif hasil pengukuran yang berakhir dengan pengambilan keputusan. Evaluasi merupakan hasil kegiatan yang terdiri dari mengukur (kuantitatif) dan menilai (kualitatif) (Arikunto, 2009).
Menurut Norman E. Grounloud evaluasi dalah suatu proses yang sistematik dan berkesinambungan untuk mengetahui efisien kegiatan belajar mengajar dan efektifitas dari pencapaian tujuan instruksi yang telah ditetapkan. Menurut Edwin Wond dan Gerold W.Brown evaluasi pendidikan atau proses untuk menentukan nilai dari segala sesuatu yang berkenaan dengan pendidikan. Evaluasi adalah proses pengukuran dan penilaian untuk mengetahui hasil belajar yang telah dicapai seseorang.
Dalam bidang pendidikan, evaluasi sebagaimana dikatakan Gronlund merupakan proses yang sistematis tentang mengumpulkan, menganalisis, dan menafsirkan informasi untuk menentukan sejauh mana tujuan pembelajaran telah dicapai oleh siswa. Menurut Djemari Mardapi, evaluasi adalah proses mengumpulkan informasi untuk mengetahui pencapaian belajar kelas atau kelompok.
Dari pendapat di atas, ada beberapa hal yang menjadi ciri khas dari evaluasi, yaitu:
  1. Sebagai kegiatan yang sistematis, pelaksanaan evaluasi haruslah dilakukan secara berkesinambungan. Sebuah program pembelajaran seharusnya dievaluasi disetiap akhir program tersebut,
  2. Dalam pelaksanaan evaluasi dibutuhkan data dan informasi yang akurat untuk menunjang keputusan yang akan diambil. Asumsi-asumsi ataupun prasangka. bukan merupakan landasan untuk mengambil keputusan dalam evaluasi, dan
  3. Kegiatan evaluasi dalam pendidikan tidak pernah terlepas dari tujuan-tujuan pembelajaran yang telah ditetapkan sebelumnya. Karena itulah pendekatan goal oriented merupakan pendekatan yang paling sesuai untuk evaluasi pembelajaran.
Ada beberapa prinsip dasar dalam evaluasi, diantaranya:
a.       Evaluasi bertujuan membantu pemerintah dalam mencapai tujuan pembelajaran bagi masyrakat/siswa.
b.      Evaluasi adalah seni, tidak ada evaluasi yang sempurna, meski dilakukan dengan metode yang berbeda. 
c.       Pelaku evaluasi atau evaluator tidak memberikan jawaban atas suatu pertanyaan tertentu. Evaluator tidak berwenang untuk memberikan rekomendasi terhadap keberlangsungan sebuah program. Evaluator hanya membantu memberikan alternatif. 
d.      Penelitian evaluasi adalah tanggung jawab tim bukan perorangan. 
e.       Evaluator tidak terikat pada satu sekolah demikian pula sebaliknya. 
f.        Evaluasi adalah proses, jika diperlukan revisi maka lakukanlah revisi. 
g.       Evaluasi memerlukan data yang akurat dan cukup, hingga perlu pengalaman untuk pendalaman metode penggalian informasi. 
h.       Evaluasi akan baik apabila dilakukan dengan instrumen dan teknik yang applicable. 
i.         Evaluator hendaknya mampu membedakan yang dimaksud dengan evaluasi formatif, evaluasi sumatif, dan evaluasi program. 
j.        Evaluasi memberikan gambaran deskriptif yang jelas mengenai hubungan sebab akibat, bukan terpaku pada angka soalan tes.
k.      Evaluasi hasil belajar dapat mengunakan tes untuk melakukan pengukuran hasil belajar.

Evaluasi dimaksudkan untuk memberikan umpan balik kepada peserta didik maupun kepada pembelajar sebagai pertimbangan untuk melakukan perbaikan serta jaminan terhadap pengguna lulusan sebagai tanggung jawab institusi yang telah meluluskan. Tes, pengukuran dan penilaian berguna untuk : seleksi, penempatan, diagnosis dan remedial, umpan balik, memotivasi dan membimbing belajar, perbaikan kurikulum dan program pendidikan serta pengembangan ilmu. Prinsip-prinsip umum evaluasi  adalah  kontinuitas, komprehensif, objektivitas, kooperatif, mendidik,  akuntabilitas, dan praktis. Di samping itu, evaluasi juga harus memperhatikan prinsip keterpaduan, prinsip berorientasi kepada kompetensi dan kecakapan  hidup, prinsip belajar aktif, prinsip koherensi, dan prinsip diskriminalitas.

  1. ASSESMEN/ PENILAIAN
Menilai merupakan suatu proses yang dilakukan setelah adanya kegiatan pengukuran. Menilai dapat diartikan sebagai pengambilan suatu keputusan terhadap sesuatu dengan ukuran baik atau buruk, serta menilai dapat dikategorikan bersifat kualitatif. Sedangkan mengukur adalah membandingkan sesuatu dengan satu ukuran, dan pengukuran bersifat kuantitatif. Mengukur dan menilai adalah suatu rangkaian kegiatan evaluasi.
Penilaian dalam makna lain didefiniskan sebagai penerapan berbagai cara dan penggunaan beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian kompetensi. Penilaian bertujuan untuk melihat sejauh mana hasil dari proses pembelajaran serta dengan adanya penilaian dapat menggambarkan bagaimana suatu proses pembelajaran itu berlangsung. Jika hasil belajar siswa cukup rendah, maka seorang guru akan melakukan pengkajian dan menelusuri dimana terjadinya kesalahan selama proses pembelajaran.
Dalam proses penilaian, guru akan mendapatkan informasi mengenai perkembangan peserta didik (siswa). Dengan melakukan penilaian, guru mampu membedakan mana siswa yang memiliki kemampuan yang cukup tinggi, sedang, dan menengah karena dapat menjadikan acuan hasil belajar sebagai suatu informasi tentang siswa. Hal ini sesuai dengan pendapat Anwar (2009:10) yang menyatakan bahwa: “Penilaian merupakan prosedur yang digunakan untuk memperoleh informasi tentang pembelajaran peserta didik”. Dalam melakukan penilaian, ada dua acuan yang digunakan yaitu acuan norma dan acuan criteria. Acuan norma berasumsi bahwa kemampuan seseorang berbeda serta dapat digambarkan menurut kurva distribusi normal. Acuan criteria berasumsi bahwa apapun bisa dipelajari seseorang, namun waktunya yang berbeda.
Beberapa definisi penilaian menurut para ahli:
a.    Menurut James Lounglhin, asesmen merupakan proses sistematika dalam mengumpulkan data seorang anak yang berfungsi untuk melihat kemampuan dan kesulitan yang dihadapi seorang anak saat itu, sebagai bahan untuk menentukan apa yang sesungguhnya dibutuhkan.
b.    Menurut Robert Smith, asesmen merupakan suatu penilaian yang komprehensif dan melibatkan anggota tim untuk mengetahui kelemahan dan kekuatan yang mana hasil keputusannya dapat digunakan untuk layanan pendidikan yang dibutuhkan anak sebagai dasar untuk menyusun suatu rancangan pembelajaran.
c.    Menurut Djemari Mardapi, penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran.
d.    Menurut Cangelosi, penilaian adalah keputusan tentang suatu nilai.
            Asesmen dalam pembelajaran adalah suatu proses atau upaya formal pengumpulan informasi yang berkaitan dengan variabel-variabel penting pembelajaran sebagai bahan dalam pengambilan keputusan oleh guru untuk memperbaiki proses dan hasil belajar siswa. Variabel-variabel penting yang dimaksud sekurang-kurangya meliputi pengetahuan, pemahaman, keterampilan dan sikap siswa dalam pembelajaran yang diperoleh guru dengan berbagai metode dan prosedur baik formal maupun informal sebagai berikut.
            “A general term enhancing all methods customarily used to appraise performance of an individual pupil or group. It may refer to a broad appraisal including many sources of evidence and many aspect of pupil’s knowledge, understanding, skills and attitudes; An assess-ment instrument may be any method and procedure, formal or in-formal, for producing information about pupil….”
e.  Pengertian asesmen dalam berbagai literatur asing tersebut di atas selaras dengan makna penilaian yang digariskan dalam Buku Pedoman Penilaian pada kurikulum pendidikan dasar. Dalam buku tersebut tertulis bahwa, penilaian adalah suatu kegiatan yang dilakukan oleh guru untuk memberikan berbagai informasi secara berkesinambungan dan menyeluruh tentang proses dan hasil belajar yang telah dicapai (Depdikbud). Ada pun yang dimaksud dengan asesmen alternatif (alternative assessment) adalah segala jenis bentuk asesmen diluar asesmen konvensional (selected respon test dan paper-pencil test) yang lebih autentik dan signifikan mengungkap secara langsung proses dan hasil belajar siswa. Herman (1997) memberikan semboyan khusus bagi asesmen alternatif dengan ungkapan “What You Get is What You Assess”. Dalam beberapa literatur, asesmen alternatif ini kadang-kadang disebut juga asesmen autentik (authentic assessment), asesmen portofolio (portfolio assessment) atau asesmen kinerja (performance assessment).
Penilaian merupakan proses pengumpulan, pelaporan dan penggunaan informasi tentang hasil belajar siswa yang diperoleh melalui pengukuran untuk menganalisis unjuk kerja atau prestasi siswa dalam mengerjakan tugas-tugas yang terkait. Penilaian berbasis kompetensi merupakan proses pengumpulan bukti-bukti seseorang yang telah mencapai kompetensi atau belum, yang dikumpulkan dari berbagai sumber dan dalam bentuk yang bervariasi. Bukti hasil belajar terdiri dari 3 bentuk:
a.    Bukti langsung, yaitu bukti yang dikumpulkan berdasarkan pengamatan langsung dari penilaian.
b.    Bukti tidak langsung, yaitu bukti yang diperoleh dari pihak ketiga, seperti guru, pembimbing, orang tua, teman sekelas dan lain-lain.
c.    Bukti tambahan lainnya, yaitu bukti yang diperoleh selain kedua sumber di atas, seperti kertas kerja, laporan, produk kerja, dll.
Penilaian mempunyai sejumlah manfaat di dalam proses belajar mengajar, yaitu:
a.    Sebagai alat guna mengetahui apakah siswa talah menguasai pengetahuan, nilai-nilai, norma-norma dan keterampilan yang telah diberikan oleh guru.
b.    Untuk mengetahui aspek-aspek kelemahan peserta didik dalam melakukan kegiatan belajar.
c.    Mengetahui tingkat ketercapaian siswa dalam kegiatan belajar.
d.    Sebagai sarana umpan balik bagi seorang guru, yang bersumber dari siswa.  
e.    Sebagai alat untuk mengetahui perkembangan belajar siswa.
f.      Sebagai materi utama laporan hasil belajar kepada para orang tua siswa.
Minimal terdapat 6 tujuan penilaian dalam kaitannya dengan belajar mengajar yaitu:
a.    Menilai ketercapaian tujuan. Ada keterkaitan antara tujuan belajar, metode penilaian, dan cara belajar siswa. Cara penilaian biasanya akan menentukan cara belajar siswa, sebaliknya tujuan evaluasi akan menentukan metode evaluasi yang digunakan oleh siswa.
b.    Mengukur macam-macam aspek belajar yang bervariasi. Belajar dikategorikan sebagai kognitif, psikomotoris, dan afektif. Batasan tersebut umumnya dieksplisitkan sebagai pengetahuan, keterampilan dan sikap/nilai. Semua tipe belajar sebaiknya dievaluasi dalam proporsi yang tepat.
c.    Sebagai sarana untuk mengetahui apa yang siswa telah ketahui. Setiap siswa masuk kelas dengan membawa pengalamannya masing-masing, serta karakteristiknya. Guru perlu mengetahui keadaan siswanya agar guru dapat berangkat dari pengalaman siswa yangberagam dalam memulai pembelajarannhya. Guru perlu mengetahui dan memperhatikan kekuatan,  kelemahan dan minat siswa sehingga mereka termotivasi untuk belajar atas dasar apa yang telah mereka miliki dan mereka butuhkan.
d.    Memotivasi belajar siswa. Penilaian juga harus dapat memotivasi belajar siswa. Guru harus menguasai bermacam-macam teknik memotivasi siswa.Hasil penilaian akan menstimulasi tindakan siswa. Dengan merencanakan secara sistematik sejak pretes sampai ke postes, guru dapat membangkitkan semangat siswa untuk tekun belajar secara kontinu.
e.    Menyediakan informasi untuk tujuan bimbingan dan konseling. Informasi diperlukan jika bimbingan dan konseling yang efektif diperlukan, informasi yang berkaitan dengan problem pribadi seperti data kemampuan, kualitas pribadi, kemampuan bersosialisasi dan skor hasil belajar.
f.      Menjadikan hasil evaluasi dan penilaian sebagai dasar perubahan kurikulum. Hasil evaluasi siswa, pengalaman kerja siswa, analisis kebutuhan masyarakat, dan analisis pekerjaan merupakan teknik konensional yang sering digunakan untuk mengubah kurikulum.
Tujuan penilaian hasil belajar secara umum:
1)      Menilai pencapaian kompetensi peserta didik
2)      Memperbaiki proses pembelajaran
3)      Sebagai bahan penyusunan laporan kemajuan hasil belajar siswa
Tujuan Khusus:
1)      Mengetahui kemajuan dan hasil belajar siswa
2)      Mendiagnosis kelemahan dan kesulitan hasil belajar siswa
3)      Memberikan umpan balik dalam upaya perbaikan proses pembelajaran
4)      Penentuan kenaikan kelas
5)      Memotivasi siswa dalam belajar karena dengan adanya penilaian dapat merangsang untuk melakukan usaha perbaikan
Kriteria yang perlu diperhatikan dalam penilaian, antara lain:
a.    Penilaian dapat dilakukan melalui tes dan atau non tes.
b.    Penilaian harus mencakup tiga aspek kemampuan, yaitu pengetahuan, ketrampilan dan sikap.
c.    Menggunakan berbagai cara penilaian pada waktu kegiatan belajar sedang berlangsung,misalnya observasi, memberikan tes, mengamati hasil ekrja siswa, dll.
d.    Pemilihan alat dan jenis penilaian berdasarkan rumusan tujuan pembelajaran.
e.    Mengacu pada tujuan dan fungsi penilaian, misalnya untuk kenaikan kelas.
f.      Alat penilaian harus mendorong kemampuan penalaran dan kreativitas siswa, misalnya tes uraian, dll.
g.    Mengacu pada prinsip diferensiasi, yakni memberikan peluang kepada siswa untuk menunjukkan apa yang diketahui, yang dipahami dan mampu dilakukannya.
h.    Tidak bersifat diskriminasi.
Dalam Arikunto (2008:10), dinyatakan bahwa tujuan atau fungsi dari penilaian itu sebagai berikut:
a.       Penilaian berfungsi selektif
Dengan cara mengadakan penilaian guru mempunyai cara untuk mengadakan seleksi atau penilaian terhadap siswa. Penilaian memiliki beberapa tujuan, diantaranya:
1)   Untuk memilih siswa yang dapat diterima disekolah tertentu
2)   Untuk memilih siswa yang dapat naik kelas atau ke tingkat berikutnya
3)   Untuk memilih siswa yang seharusnya dapat beasiswa
4)   Untuk memilih siswa yang sudah berhak meninggalkan sekolah atau dikatakan dapat lulus
b.      Penilaian berfungsi diagnostic
Dengan mengadakan penilaian, sebenarnya guru telah melakukan diagnosis kepada siswa tentang kebaikan dan kelemahannya. Dengan diketahuinya kelemahan siswa ini, maka akan dengan mudah dicarikan solusi untuk mengatasi kelemahannya.
c.       Penilaian berfungsi sebagai penempatan
Dalam melakukan penilaian, nantinya akan diketahui pada posisi mana seharusnya siswa ditempatkan. Penempatan disini maksudnya dalah kondisi dimana siswa layak untuk melanjutkan pendidikan ke jenang atau tingkat yang lebih tinggi serta layak untuk lulus dan naik kelas.
d.      Penilaian berfungsi sebagai pengukur keberhasilan
Dengan adanya penilaian diharapkan guru dapat mengetahui sejauh mana suatu program berhasil diterapkan.  Penilaian menuntut seorang guru untuk dapat melakukan penilaian terhadap seluruh aspek yang ada pada siswa dalam setiap kegiatan dan proses pembelajaran. Aspek tersebut dapat saja meliputi kegiatan siswa selama berdiskusi meliputi penilaian terhadap sikap, kegiatan siswa dalam melakukan eksperimen atau percobaan meliputi penilaian keterampilan, serta kegiatan pembelajaran di kelas yang meliputi penilaian aspek pengetahuan siswa. Penilaian merupakan suatu hal yang dirasa sangat penting dalam proses pembelajaran. Tanpa adanya kegiatan atau proses penilaian, maka akan dirasa mustahil terjadinya kemajuan dalam proses pembelajaran, karena dengan adanya penilaian dapat digunakan sebagai umpan balik dalam memperbaiki proses pembelajaran.
Ada beberapa ciri-ciri penilaian dalam pendidikan menurut Arikunto (2008:11), antara lain sebagai berikut:
a.       Penilaian dilakukan secara tidak langsung
b.      Penilaian pendidikan yaitu penggunaan ukuran kuantitatif, dimana penilaian menggunakan symbol bilangan dalam menyatakan hasil pengukuran
c.       Penilaian pendidikan menggunakan unit-unit satuan yang tetap
d.      Penilaian dalam pendidikan bersifat relative, artinya tidak sama atau tidak selalu tetap dari satu waktu ke waktu yang lain
e.       Dalam penilaian pendidikan sering terjadi beberapa kesalahan-kesalahan
7.      Jenis-Jenis Penilaian
Dengan diberlakukannya Kurikulum 2013 maka proses penilaian mengacu kepada penilaian menyeluruh. Ada tiga jenis penilaian yang dilakukan oleh seorang guru yang sesuai dengan ketentuan pada kurikulum 2013. Penilaian tersebut meliputi penilaian kompetensi sikap, penilaian kompetensi pengetahuan dan penilaian kompetensi keterampilan. Hal ini tidak terlalu jauh berbeda dengan penilaian yang dilakukan pada Kurikulum Tingkat Satuan Pendidikan (KTSP), dimana guru juga dituntut untuk melakukan penilaian dalam bidang atau ranah afektif, psikomotor dan kognitif.
a.       Penilaian Kompetensi Sikap
Penilaian kompetensi sikap dalam pembelajaran merupakan serangkaian kegiatan yang dirancang untuk mengukur sikap peserta didik sebagai hasil dari suatu program pembelajaran. Penilaian sikap juga merupakan aplikasi suatu standar atau sistem pengambilan keputusan terhadap sikap. Kegunaan utama penilaian sikap sebagai bagian dari pembelajaran adalah refleksi (cerminan) pemahaman dan kemajuan sikap peserta didik secara individual.
1)   Cakupan
Kurikulum 2013 membagi kompetensi sikap menjadi dua, yaitu sikap spiritual yang terkait dengan pembentukan peserta didik yang beriman dan bertakwa, dan sikap sosial yang terkait dengan pembentukan peserta didik yang berakhlak mulia, mandiri, demokratis, dan bertanggung jawab. Sikap spiritual sebagai perwujudan dari menguatnya interaksi vertikal dengan Tuhan Yang Maha Esa, sedangkan sikap sosial sebagai perwujudan eksistensi kesadaran dalam upaya mewujudkan harmoni kehidupan.
Tabel 1. Cakupan Penilaian Sikap
Penilaian sikap spiritual
Menghargai dan menghayati ajaran agama yang dianut
Penilaian sikap social
1.      jujur
2.      disiplin
3.      tanggung jawab
4.      toleransi
5.      gotong royong
6.      santun
7.      percaya diri

2)   Perumusan Indikator dan Contoh Indikator
Acuan penilaian adalah indikator, karena indikator merupakan tanda tercapainya suatu kompetensi. Indikator harus terukur. Dalam konteks penilaian sikap, indikator merupakan tanda-tanda yang dimunculkan oleh peserta didik, yang dapat diamati atau diobservasi oleh guru sebagai representasi dari sikap yang dinilai. Berikut ini dideskripsikan beberapa contoh indikator dari sikap-sikap yang tersurat dalam KI-1 dan KI-2 jenjang SMP/MTs
Tabel 2. Daftar Deskripsi Indikator
Sikap dan pengertian
Contoh Indikator
Sikap spiritual

Menghargai dan menghayati ajaran agama yang dianut
·      Berdoa sebelum dan sesudah menjalankan sesuatu.
·      Menjalankan ibadah tepat waktu.
·      Memberi salam pada saat awal dan akhir presentasi sesuai agama yang dianut.
·      Bersyukur atas nikmat dan karunia Tuhan Yang Maha Esa;
·      Mensyukuri kemampuan manusia dalam mengendalikan diri
·      Mengucapkan syukur ketika berhasil mengerjakan sesuatu.
·      Berserah diri (tawakal) kepada Tuhan setelah berikhtiar atau melakukan usaha.
·      Menjaga lingkungan hidup di sekitar rumah tempat tinggal, sekolah dan masyarakat
·      Memelihara hubungan baik dengan sesama umat ciptaan Tuhan Yang Maha Esa
·      Bersyukur kepada Tuhan Yang Maha Esa sebagai bangsa Indonesia.
Menghormati orang lain menjalankan ibadah sesuai dengan agamanya.
Sikap social

1.    Jujur
adalah perilaku dapat dipercaya dalam perkataan, tindakan, dan pekerjaan.
·      Tidak menyontek dalam mengerjakan ujian/ulangan
·      Tidak menjadi plagiat (mengambil/menyalin karya orang lain tanpa menyebutkan sumber)
·      Mengungkapkan perasaan apa adanya
·      Menyerahkan kepada yang berwenang barang yang ditemukan
·      Membuat laporan berdasarkan data atau informasi apa adanya
·      Mengakui kesalahan atau kekurangan yang dimiliki
2.    Disiplin
adalah tindakan yang menunjukkan perilaku tertib dan patuh pada berbagai ketentuan dan peraturan.
·      Datang tepat waktu
·      Patuh pada tata tertib atau aturan bersama/ sekolah
·      Mengerjakan/mengumpulkan tugas sesuai  dengan waktu yang ditentukan
·      Mengikuti kaidah berbahasa tulis yang baik dan benar
3. Tanggungjawab
adalah sikap dan perilaku seseorang untuk melaksanakan tugas dan kewajibannya, yang seharusnya dia lakukan, terhadap diri sendiri, masyarakat, lingkungan (alam, sosial dan budaya), negara dan Tuhan Yang Maha Esa
·      Melaksanakan tugas individu dengan baik
·      Menerima resiko dari tindakan yang dilakukan
·      Tidak menyalahkan/menuduh orang lain tanpa bukti yang akurat
·      Mengembalikan barang yang dipinjam
·      Mengakui dan meminta maaf atas kesalahan yang dilakukan
·      Menepati janji
·      Tidak menyalahkan orang lain utk  kesalahan tindakan kita sendiri
·      Melaksanakan apa yang pernah dikatakan tanpa disuruh/diminta
4. Toleransi
adalah sikap dan tindakan yang menghargai keberagaman latar belakang, pandangan, dan keyakinan
·      Tidak mengganggu teman yang berbeda pendapat
·      Menerima kesepakatan meskipun berbeda dengan pendapatnya
·      Dapat menerima kekurangan orang lain
·      Dapat mememaafkan kesalahan orang lain
·      Mampu dan mau bekerja sama dengan siapa pun yang memiliki keberagaman latar belakang, pandangan, dan keyakinan
·      Tidak memaksakan pendapat atau keyakinan diri pada orang lain
·      Kesediaan untuk belajar dari  (terbuka terhadap) keyakinan dan gagasan orang lain agar dapat memahami orang lain lebih baik
·      Terbuka terhadap atau kesediaan untuk menerima sesuatu yang baru
3)   Teknik Penilaian
a)    Teknik Observasi
Observasi merupakan teknik penilaian yang dilakukan secara berkesinambungan dengan menggunakan indera, baik secara langsung maupun tidak langsung dengan menggunakan instrumen  yang berisi sejumlah indikator perilaku yang diamati. Observasi langsung dilaksanakan oleh guru secara langsung tanpa perantara orang lain. Sedangkan observasi tidak langsung dengan bantuan orang lain, seperti guru lain, orang tua, peserta didik, dan karyawan sekolah.
Bentuk instrumen yang digunakan untuk observasi adalah pedoman observasi yang berupa daftar cek atau skala penilaian (rating scale) yang disertai rubrik. Daftar cek digunakan untuk mengamati ada tidaknya suatu sikap atau perilaku. Sedangkan skala penilaian menentukan posisi sikap atau perilaku peserta didik dalam suatu rentangan sikap. Pedoman observasi secara umum memuat pernyataan sikap atau perilaku yang diamati dan hasil pengamatan sikap atau perilaku sesuai kenyataan. Pernyataan memuat sikap atau perilaku yang positif atau negatif sesuai indikator penjabaran sikap dalam kompetensi inti dan kompetensi dasar. Rentang skala hasil pengamatan antara lain berupa:
1)    Selalu, sering, kadang-kadang, tidak pernah
2)    Sangat baik, baik, cukup baik, kurang baik
Pedoman observasi dilengkapi juga dengan rubrik dan petunjuk penskoran. Rubrik memuat petunjuk/uraian dalam penilaian skala atau daftar cek. Sedangkan petunjuk penskoran memuat cara memberikan skor dan mengolah skor menjadi nilai akhir. Agar observasi lebih efektif dan terarah hendaknya :
1)   Dilakukan dengan tujuan jelas dan direncanakan sebelumnya. Perencanaan mencakup indikator atau aspek yang akan diamati dari suatu proses.
2)   Menggunakan pedoman observasi berupa daftar cek atau skala penilaian.
3)   Pencatatan dilakukan selekas mungkin.
4)   Kesimpulan dibuat setelah program observasi selesai dilaksanakan.

b)   Penilaian Diri
Penilaian diri merupakan teknik penilaian dengan cara meminta peserta didik untuk mengemukakan kelebihan dan kekurangan dirinya dalam konteks pencapaian kompetensi. Instrumen yang digunakan berupa lembar penilaian diri menggunakan daftar cek atau skala penilaian (rating scale) yang disertai rubrik. Skala penilaian dapat disusun dalam bentuk skala Likert atau skala semantic differential. Skala Likert adalah skala yang dapat dipergunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau sekelompok orang mengenai suatu gejala atau fenomena.  Sedangkan skala semantic differential yaitu skala untuk mengukur sikap, tetapi bentuknya bukan pilihan ganda maupun checklist, tetapi tersusun dalam satu garis kontinum di mana jawaban yang sangat positif terletak dibagian kanan garis, dan jawaban yang sangat negatif terletak di bagian kiri garis, atau sebaliknya. Data yang diperoleh melalui pengukuran dengan skala semantic differential adalah data interval. Skala bentuk ini biasanya digunakan untuk mengukur sikap atau karakteristik tertentu yang dimiliki seseorang.
Kriteria penyusunan lembar penilaian diri:
·        Gunakan kata-kata yang sederhana dan mudah dimengerti oleh responden.
·        Usahakan pertanyaan yang jelas dan khusus
·        Hindarkan pertanyaan yang mempunyai lebih dari satu pengertian
·        Hindarkan pertanyaan yang mengandung sugesti
·        Pertanyaan harus berlaku bagi semua responden
c)     Penilaian Antar Peserta Didik
Penilaian antarpeserta didik merupakan teknik penilaian dengan cara meminta peserta didik untuk saling menilai terkait dengan pencapaian kompetensi. Instrumen yang digunakan untuk penilaian antarpeserta didik adalah daftar cek dan skala penilaian (rating scale) dengan teknik sosiometri berbasis kelas. Guru dapat menggunakan salah satu dari keduanya atau menggunakan dua-duanya.
d)    Jurnal
Jurnal merupakan catatan pendidik di dalam dan di luar kelas yang berisi informasi hasil pengamatan tentang kekuatan dan kelemahan peserta didik yang berkaitan dengan sikap dan perilaku. Kelebihan yang ada pada jurnal adalah peristiwa/kejadian dicatat dengan segera. Dengan demikian, jurnal bersifat asli dan objektif dan dapat digunakan untuk memahami peserta didik dengan lebih tepat. sementara itu, kelemahan yang ada pada jurnal adalah reliabilitas yang dimiliki rendah, menuntut waktu yang banyak, perlu kesabaran dalam menanti munculnya peristiwa sehingga dapat mengganggu perhatian dan tugas guru, apabila pencatatan tidak dilakukan dengan segera, maka objektivitasnya berkurang.
Terkait dengan pencatatan jurnal, maka guru perlu mengenal dan memperhatikan perilaku peserta didik baik di dalam kelas maupun di luar kelas. Aspek-aspek pengamatan ditentukan terlebih dahulu oleh guru sesuai dengan karakteristik mata pelajaran yang diajar. Aspek-aspek pengamatan yang sudah ditentukan tersebut kemudian dikomunikasikan terlebih dahulu dengan peserta didik di awal semester.
Beberapa hal yang perlu diperhatikan dalam membuat jurnal adalah:
·        Catatan atas pengamatan guru harus objektif
·        Pengamatan dilaksanakan secara selektif, artinya yang dicatat hanyalah kejadian / peristiwa yang berkaitan dengan Kompetensi Inti.
·        Pencatatan segera dilakukan (jangan ditunda-tunda)
Pedoman umum penskoran jurnal:
·        Penyekoran pada jurnal dapat dilakukan dengan menggunakan skala likert. Sebagai contoh skala 1 sampai dengan 4.
·        Guru menentukan aspek-aspek yang akan diamati.
·        Pada masing-masing aspek, guru menentukan indikator yang diamati.
·        Setiap aspek yang sesuai dengan indikator yang muncul pada diri peserta didik diberi skor 1, sedangkan yang tidak muncul diberi skor 0.
·        Jumlahkan skor pada masing-masing aspek.
·        Skor yang diperoleh pada masing-masing aspek kemudian direratakan
·        Nilai  Sangat Baik (SB), Baik (B), Cukup (C), dan Kurang (K) ditentukan dengan cara menghitung rata-rata skor dan membandingkan dengan kriteria penilaian
e)   Penilaian Kompetensi Pengetahuan
Penilaian pencapaian kompetensi pengetahuan merupakan bagian dari penilaian pendidikan. Dalam lampiran Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan dijelaskan bahwa penilaian pendidikan merupakan proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian pencapaian kompetensi peserta didik yang mencakup: penilaian otentik, penilaian diri, penilaian berbasis portofolio, ulangan, ulangan harian, ulangan tengah semester, ulangan akhir semester, ujian tingkat kompetensi, ujian mutu tingkat kompetensi, ujian nasional, dan ujian sekolah/madrasah. Penilaian pencapaian kompetensi peserta didik mencakup kompetensi sikap, pengetahuan, dan keterampilan yang dilakukan secara berimbang sehingga dapat digunakan untuk menentukan posisi relatif setiap peserta didik terhadap standar yang telah ditetapkan.
Adapun penilaian pengetahuan dapat diartikan sebagai penilain potensi intelektual yang terdiri dari tahapan mengetahui, memahami, menerapkan, menganalisis, mensintesis, dan mengevaluasi (Anderson & Krathwohl, 2001). Seorang pendidik perlu melakukan penilaian untuk mengetahui pencapaian kompetensi pengetahuan peserta didik. Penilaian terhadap pengetahuan peserta didik dapat dilakukan melalui tes tulis, tes lisan, dan penugasan. Kegiatan penilaian terhadap pengetahuan tersebut dapat juga digunakan sebagai pemetaan kesulitan belajar peserta didik dan perbaikan proses pembelajaran. Pedoman penilaian kompetensi pengetahuan ini dikembangkan sebagai rujukan teknis bagi pendidik untuk melakukan penilaian sebagaimana dikehendaki dalam Permendikbud Nomor 66 Tahun 2013.
b.      Cakupan Penilaian Pengetahuan
a)    Pengetahuan Faktual
Pengetahuan faktual berisi konvensi (kesepakatan) dari elemen-elemen dasar berupa istilah atau simbol (notasi) dalam rangka memperlancar pembicaraan dalam suatu bidang disiplin ilmu atau mata pelajaran. Pengetahuan faktual meliputi aspek-aspek pengetahuan istilah, pengetahuan khusus dan elemen-elemennya berkenaan dengan pengetahuan tentang peristiwa, lokasi, orang, tanggal, sumber informasi, dan sebagainya.
b)   Pengetahuan Konseptual
Pengetahuan konseptual memuat ide (gagasan) dalam suatu disiplin ilmu yang memungkinkan orang untuk mengklasifikasikan sesuatu objek itu contoh atau bukan contoh, juga mengelompokkan (mengkategorikan) berbagai objek. Pengetahuan konseptual meliputi prinsip (kaidah), hukum, teorema, atau rumus yang saling berkaitan dan terstruktur dengan baik. Pengetahuan konseptual meliputi pengetahuan klasifikasi dan kategori, pengetahuan dasar dan umum, pengetahuan teori, model, dan struktur.
c)    Pengetahuan Prosedural
Pengetahuan prosedural adalah pengetahuan tentang bagaimana urutan langkah-langkah dalam melakukan sesuatu. Pengetahuan prosedural meliputi pengetahuan dari umum ke khusus dan algoritma, pengetahuan metode dan teknik khusus dan pengetahuan kriteria untuk menentukan penggunaan prosedur yang tepat.
c.    Perumusan Indikator dan Contoh Indikator
Indikator pencapaian kompetensi pengetahuan dijabarkan dari Kompetensi Dasar (KD) yang merupakan jabaran dari Kompetensi Inti (KI) di setiap mata pelajaran. Penyusunan instrumen penilaian ditentukan oleh kata kerja operasional yang ada di dalam KD dan indikator pencapaian kompetensi yang dirumuskan. Kata kerja operasional pada indikator juga dapat digunakan untuk penentuan item tes (pertanyaan/soal), seperti dicontohkan pada tabel berikut:
Tabel 3. Kata Kerja Operasional pada Indikator
Tujuan yang Diukur
Kata Kerja yang Biasa Digunakan
Kemampuan mengingat

·        Sebutkan
·        berilah label
·        cocokkanlah
·        berilah nama
·        buatlah urutan
·        apa
·        kapan
·        di manakah
·        berilah contoh
·        tirukanlah
·        pasangkanlah
Kemampuan memahami
·        buatlah penggolongan
·        gambarkan
·        buatlah ulasan
·        jelaskan
·        ekspresikan
·        kenalilah ciri
·        tunjukkan
·        temukan
·        buatlah laporan
·        kemukakan
·        buatlah tinjauan
·        pilihlah
·        ceritakan
Kemampuan menerapkan pengetahuan (aplikasi)
·        terapkan
·        pilihlah
·        demonstrasikan
·        peragakan
·        tuliskan penjelasan
·        buatlah penafsiran
·        tuliskan operasi
·        praktikkan
·        tulislah rancangan persiapan
·        buatlah jadwal
·        buatlah sketsa
·        buatlah pemecahan masalah
·        gunakanlah
Kemampuan menganalisis
·        tuliskan penilaianmu
·        buatlah suatu perhitungan
·        buatlah suatu pengelompokan
·        tentukan kategori yang dipakai
·        bandingkan
·        bedakan
·        buatlah suatu diagram
·        buatlah inventarisasi
·        periksalah
·        lakukan pengujian
Kemampuan mengevaluasi
·        buatlah suatu penilaian
·        tuliskan argumentasi atau alasan
·        jelaskan apa alasan memilih
·        buatlah suatu perbandingan
·        jelaskan alasan pembelaan
·        tuliskan prakiraan
·        ramalkan apa yang akan terjadi
·        bagaimanakah laju peristiwa
Kemampuan merancang
·        kumpulkan
·        susunlah
·        buatlah disain (rancangan)
·        rumuskan
·        buatlah usulan bagaimana mengelola
·        aturlah
·                rencanakan
·        buatlah suatu persiapan
·        buatlah suatu usulan
·        tulislah ulasan
Selanjutnya disajikan contoh-contoh indikator yang dapat dikembangkan berdasarkan kompetensi dasar dalam kurikulum 2013.
Tabel 4. Pengembangan Indikator dari KD
No.
Mata Pelajaran
Kompetensi Dasar
Indikator
1.       
Ilmu Pengetahuan Alam
3.1 Memahami konsep pengukuran berbagai besaran yang ada pada diri, makhluk hidup, dan lingkungan fisik sekitar sebagai bagian dari observasi, serta pentingnya perumusan satuan terstandar (baku) dalam pengukuran.

3.1.1Menjelaskan langkah-langkah pengukuran panjang dengan menggunakan jangka sorong.

3.1.2Menyebutkan tingkat ketelitian hasil pengukuran dengan menggunakan meteran/penggaris dan jangka sorong.
d.    Teknik Penilaian
Teknik penilaian kompetensi pengetahuan dilakukan dengan tes tulis, tes lisan, dan penugasan. Tiap-tiap teknik tersebut dilakukan melalui instrumen tertentu yang relevan. Teknik dan bentuk instrumen penilaian kompetensi pengetahuan dapat dilihat pada tabel berikut:
Tabel 5. Teknik dan Bentuk Instrumen Penilaian
Teknik Penilaian
Bentuk Instrumen
Tes tulis
Pilihan ganda, isian, jawaban singkat, benar-salah, menjodohkan, dan uraian.
Tes lisan
Daftar pertanyaan.
Penugasan
Pekerjaan rumah dan/atau tugas yang dikerjakan secara individu atau kelompok sesuai dengan karakteristik tugas.
Instrumen tes tulis uraian yang dikembangkan haruslah disertai kunci jawaban dan pedoman penskoran. Pelaksanaan penilaian melalui penugasan setidaknya memenuhi beberapa syarat, yaitu mengkomunikasikan tugas yang dikerjakan oleh peserta didik,  menyampaikan indikator dan rubrik penilaian untuk tampilan tugas yang baik. Tampilan kualitas hasil tugas yang diharapkan disampaikan secara jelas dan penugasan mencantumkan rentang waktu pengerjaan tugas. Berikut ini akan disajikan contoh bentuk instrumen terkait dengan teknik penilaian tes tulis, tes lisan, maupun penugasan.

f)     Penilaian Kompetensi Keterampilan
Penilaian pencapaian kompetensi keterampilan merupakan penilaian yang dilakukan terhadap peserta didik untuk menilaisejauh mana pencapaian SKL, KI, dan KD khusus dalam dimensi keterampilan. SKL ini merupakan tagihan kompetensi minimal setelah peserta didik menempuh pendidikan selama 3 tahun atau lebih dan dinyatakan lulus.
1)   Cakupan Penilaian
          Cakupan penilaian dimensi keterampilan meliputi keterampilan peserta didik yang dipelajari di sekolah dan sumber lain yang sama dalam sudut pandang/teori. Keterampilan ini meliputi: keterampilan mencoba, mengolah, menyaji, dan menalar.  Dalam ranah konkret keterampilan ini mencakup aktivitas menggunakan, mengurai, merangkai, memodifikasi, dan membuat. Sedangkan dalam ranah abstrak, keterampilan ini mencakup aktivitas menulis, membaca, menghitung, menggambar, dan mengarang.
2)   Perumusan dan Contoh Indikator
            Indikator pencapaian kompetensi keterampilan merupakan ukuran, karakteristik, ciri-ciri, pembuatan atau proses yang berkontribusi/ menunjukkan ketercapaian suatu kompetensi dasar tertentu yang menjadi acuan penilaian mata pelajaran. Indikator pencapaian kompetensi keterampilan dikembangkan oleh guru dari KI dan KD dengan memperhatikan perkembangan dan kemampuan setiap peserta didik. Setiap kompetensi dasar dapat dikembangkan menjadi dua atau lebih indikator pencapaian kompetensi keterampilan, hal ini sesuai dengan keluasan dan kedalaman kompetensi dasar tersebut. Indikator-indikator pencapaian kompetensi belajar dari setiap kompetensi dasar merupakan acuan yang digunakan untuk melakukan penilaian. Indikator pencapaian kompetensi keterampilan dirumuskan dengan menggunakan kata kerja operasional yang dapat diamati dan diukur, antara lain: mengidentifikasi, menghitung, membedakan, menyimpulkan, menceritakan kembali, mempraktekkan, mendemonstrasikan, mendeskripsikan, dsb.
Berikut ini contoh perumusan indikator dari beberapa mata pelajaran.
Tabel 6. Kompetensi Dasar dan Indikator Pencapaian Kompetensi
Mapel/ Kelas/ Semester
KI-4
Kompetensi Dasar
Indikator Pencapaian Kompetensi
(A-5)
IPA/
VII/
1
Mencoba, mengolah, dan menyaji dalam ranah konkret (menggunakan, mengurai, merangkai, memodifikasi, dan membuat) dan ranah abstrak (menulis, membaca, menghitung, menggambar, dan mengarang) sesuai dengan yang dipelajari di sekolah dan sumber lain yang sama dalam sudut pandang/teori.

4.1. Menyajikan hasil pengukuran terhadap besaran-besaran pada diri, makhluk hidup, dan lingkungan fisik dengan menggunakan satuan tak baku dan satuan baku.
1.      Menyajikan hasil pengamatan, inferensi, dan mengomunikasikan hasilnya.
2.      Melakukan pengukuran besaran-besaran panjang, massa, waktu dengan alat ukur yang sering dijumpai dalam kehidupan sehari-hari.
3.      Melakukan pengukuran besaran-besaran turunan sederhana yang sering dijumpai dalam kehidupan sehari-hari.
4.      Menerapkan pengamatan (termasuk pengukuran) untuk memecahkan masalah yang relevan.
5.      Melakukan pengukuran besaran-besaran panjang, massa, waktu dengan alat ukur yang sering dijumpai dalam kehidupan sehari-hari.
3)   Teknik Penilaian
b)   Tes Praktik, merupakan penilaian yang menuntut respon berupa keterampilan melakukan suatu aktivitas atau perilaku sesuaidengan tuntutan kompetensi.Tes praktik dilakukan dengan mengamati kegiatan peserta didik dalam melakukan sesuatu. Penilaian digunakan untuk menilai ketercapaian kompetensi yang menuntut peserta didik melakukan tugas tertentu seperti: praktik di laboratorium, praktik salat, praktik olahraga, bermain peran, memainkan alat musik, bernyanyi, membaca puisi/deklamasi, dan sebagainya. Untuk dapat memenuhi kualitas perencanaan dan pelaksanaan tes praktik, berikut ini adalah petunjuk teknis dan acuan dalam merencanakan dan melaksanakan penilaian melalui tes praktik.
c)    Projek, adalah tugas-tugas belajar (learning tasks) yang meliputikegiatan perancangan, pelaksanaan, dan pelaporan secaratertulis maupun lisan dalam waktu tertentu. Penilaian projek merupakan kegiatan penilaian terhadap suatu tugas yang harus diselesaikan dalam periode atau waktu tertentu.Tugas tersebut berupa suatu investigasi sejak dari perencanaan, pengumpulan, pengorganisasian, pengolahan dan penyajian data.Penilaian projek dapat digunakan untuk mengetahui pemahaman, kemampuan mengaplikasikan, penyelidikan dan menginformasikan peserta didik pada mata pelajaran dan indikator/topik tertentu secara jelas. Pada penilaian projek, setidaknya ada 3 (tiga) hal yang perlu dipertimbangkan: (a) kemampuan pengelolaan: kemampuan peserta didik dalam memilih indikator/topik, mencari informasi dan mengelola waktu pengumpulan data serta penulisan laporan, (b) relevansi, kesesuaian dengan mata pelajaran dan indikator/topik, dengan mempertimbangkan tahap pengetahuan, pemahaman dan keterampilan dalam pembelajaran, dan (c) keaslian: proyek yang dilakukan peserta didik harus merupakan hasil karyanya, dengan mempertimbangkan kontribusi guru berupa petunjuk dan dukungan terhadap projek peserta didik.
d)   Penilaian portofolio adalah penilaian yang dilakukan dengan cara menilai kumpulan seluruh karya peserta didik dalambidang tertentu yang bersifat reflektif-integratif untukmengetahui minat, perkembangan, prestasi, dan/atau kreativitas peserta didik dalam kurun waktu tertentu. Karya tersebut dapat berbentuk tindakan nyata yang mencerminkan kepedulian peserta didik terhadap lingkungannya. Penilaian portofolio merupakan penilaian berkelanjutan yang didasarkan pada kumpulan informasi yang menunjukkan perkembangan kemampuan peserta didik dalam satu periode tertentu. Informasi tersebut dapat berupa karya peserta didik atau hasil ulangan dari proses pembelajaran yang dianggap terbaik oleh peserta didik. Akhir suatu periode hasil karya tersebut dikumpulkan dan dinilai oleh guru.Berdasarkan informasi perkembangan tersebut, guru dan peserta didik sendiri dapat menilai perkembangan kemampuan peserta didik dan terus melakukan perbaikan.

Secara umum, asesmen dapat diartikan sebagai proses untuk mendapatkan informasi dalam bentuk apapun yang dapat digunakan untuk dasar pengambilan keputusan tentang siswa baik yang menyangkut kurikulumnya, program pembelajarannya, iklim sekolah maupun kebijakan-kebijakan sekolah.
1.    Mekanisme dan Prosedur Assesmen
Dalam menerapkan asesmen ada beberapa mekanisme atau prosedur asesmen yang harus diperhatikan:
a.    Penilaian oleh pendidik
            Dilakukan secara berkesinambungan, bertujuan untuk memantau proses dan kemajuan belajar peserta didik serta untuk meningkatkan efektivitas kegiatan pembelajaran. Instrumen penilaian hasil belajar yang digunakan pendidik memenuhi persyaratan:
1)   Substansi adalah merepresentasikan kompetensi yang dinilai,
2)   Konstruksi adalah memenuhi persyaratan teknis sesuai dengan bentuk instrumen yang digunakan, dan
3)   Bahasa adalah menggunakan bahasa yang baik dan benar serta komunikatif sesuai dengan taraf perkembangan peserta didik.
b.    Penilaian oleh satuan pendidikan
Penilaian hasil belajar oleh satuan pendidikan dilakukan untuk menilai pencapaian kompetensi peserta didik pada semua mata pelajaran. Instrumen penilaian yang digunakan oleh satuan pendidikan dalam bentuk ujian sekolah/madrasah memenuhi persyaratan substansi, konstruksi, dan bahasa, serta memiliki bukti validitas empirik.
c.    Penilaian oleh pemerintah
Penilaian hasil belajar oleh pemerintah dilakukan dalam bentuk UN yang bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi. Instrumen penilaian yang digunakan oleh pemerintah dalam bentuk UN memenuhi persyaratan substansi, konstruksi, bahasa, dan memiliki bukti validitas empirik serta menghasilkan skor yang dapat diperbandingkan antarsekolah, antardaerah, dan antartahun.
2.    Langkah-langkah Assesmen
Apapun bentuk dan jenis asesmen yang dilakukan, hal ini tetap menuntut suatu perencanaan, termasuk pada saat melakukan analisis. Dengan demikian maka akan diperoleh alat ukur atau instrumen yang benar-benar dapat diandalkan (valid) dan  dapat dipercaya (reliabel) dalam mengukur apa yang seharusnya diukur. Berikut ini adalah langkah-langkah yang perlu dilakukan dalam melakukan asesmen:
a.    Perencanaan
Aspek yang harus ada dalam perencanaan asesmen adalah:
1)   Memilih fokus asesmen pada aspek tertentu dari diri konselee
2)   Memilih instrumen yang akan digunakan.
Setelah ditentukan fokus area asesmen, Anda dapat merencanakan instrumen yang akan digunakan dalam asesmen. Banyak instrumen yang dapat digunakan dalam asesmen seperti tes psikologis, observasi, inventori, dan sebagainya. Tetapi untuk menentukan instrumen sangat  tergantung pada aspek apa yang akan diasesmen. Hal-hal yang perlu diperhatikan dalam memilih instrumen dalam asesmen diantaranya yaitu:
a)    Kemampuan guru sendiri,
b)   Kewenangan guru (baik dalam mengadministrasikan maupun dalam interpretasi hasilnya),
c)    Ketersediaan instrumen,
d)   Waktu yang tersedia, dan
e)    Dana yang tersedia.
3)   Penetapan waktu
Perencanaan waktu yang dimaksud adalah kapan asesmen akan dilakukan. Penetapan waktu ini sangat erat berhubungan engan persiapan pelaksanaan asesmen. Persiapan akan banyak menentukan keberhasilan suatu asesmen, misalnya mempersiapkan  instrumen, tempat, dan peralatan lain yang diperlukan dalam pelaksanaan asesmen.
4)   Validitas dan reliabilitas
Apabila instrumen yang kita gunakan adalah buatan sendiri atau dikembangkan sendiri, maka instrumen itu  perlu diuji validitas dan reliabilitasnya. Karena validitas dan reliabilitas merupakan suatu syarat mutlak  suatu instrumen asesmen. Namun apabila kita menggunakan instrumen yang sudah terstandar, Anda tidak perlu mencari validitas dan reliabilitas karena instrumen tersebut sudah jelas  memenuhi persyaratan sebagai suatu instrumen.
b.    Pelaksanaan         
Setelah perencanaan asesmen selesai, selanjutnya adalah bagaimana melaksanakan rencana yang telah dibuat tersebut. Hal-hal yang perlu diperhatikan dalam melaksanakan asesmen adalah pelaksanaannya harus sesuai dengan manual masing-masing instrumen. Manual suatu instrumen biasanya memuat:
1)   Cara mengerjakan,
2)   Waktu yang digunakan untuk mengerjakan asesmen,
3)   Kunci  jawaban,
4)   Cara analisis, dan
5)   Interpretasi.
c.    Analisis data
Langkah selanjutnya adalah analisis data, yaitu melakukan analisis terhadap data yang diperoleh melalui instrumen yang digunakan untuk mengambil data. Analisis dilakukan dengan mengikuti petunjuk yang ada dalam manual masing-masing  instrumen.  Saat melakukan analisis data kualitatif, perlu dilakukan beberapa langkah sebagai berikut:
1)   Yakinkan semua data telah tersedia,
2)   Buatlah salinan data untuk berjaga-jaga kalau ada yang hilang,
3)   Aturlah data dalam judul dan masukkan dalam file,
4)   Gunakan sistem kartu-kartu dalam map,
5)   Periksa kebenaran hasil asesmen.
Apabila data bersifat kuantitatif maka analisis data dilakukan dengan menggunakan statistik. Dewasa ini, program statistik dapat dengan mudah dilakukan dengan bantuan komputer, seperti program excel, LISREL, SPSS, dan sebagainya.
d.    Interpretasi data
Interpretasi diartikan sebagai  upaya mengatur dan menilai fakta, menafsirkan pandangan, dan merumuskan kesimpulan yang mendukung. Penafsiran harus dirumuskan dengan hati-hati, jujur, dan terbuka. Berikut ini adalah hal-hal yang harus ada dalam interpretasi, yaitu:
1)   Komponen untuk menafsirkan atau interpretasi hasil analisis data
Interpretasi berarti menilai objek asesmen  dan menentukandampakasesmen tersebut.
2)   Petunjuk untuk menafsirkan analisis data
e.    Tindak lanjut
Tindak lanjut adalah menindak lanjuti hasil asesmen.

3.    Jenis-jenis Assesmen
Asesmen dapat dikategorikan menjadi 2 jenis yaitu :
a.    Asesmen Konvensional
Biasanya menggunakan paper and pencil test atau disebut dengan asesmen formal atau asesmen konvensional. Disebut demikian karena metode inilah yang biasa digunakan oleh guru. Metode paper and pencil test hanya dapat mengukur kemampuan kognitif peserta didik namun belum dapat mengukur hasil belajar peserta didik secara holistik. Soal-soal tes tradisional dibagi menjadi 2 tipe yaitu selected response items (soal pilihan ganda dan benar-salah, memungkinkan siswa memilih jawaban di antara alternatif yang tersedia) dan constructed-response item (esai atau jawaban pendek mengisi titik-titik, mengharuskan siswa memberikan jawabannya sendiri).
b.    Asesmen Berbasis Kinerja
Asesmen ini menginginkan siswa dapat mengerjakan tugas tertentu seperti menulis esai, melakukan eksperimen, menginterpretasi solusi untuk masalah atau menggambarkan sesuatu. Siswa mengerjakan beragam tugas selama beberapa hari, bukan tugas yang dapat diakses beberapa menit. Hal ini merupakan upaya mengukur berbagai macam keterampilan dan proses intelektual yang kompleks. Asesmen kinerja bisa dalam bentuk portofolio siswa atau penilaian dalam proses belajar mengajar misalkan dalam kerja kelompok, eksperimen, atau diskusi kelompok.

  1. PENGUKURAN
1.    Definisi Pengukuran
Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana disampaikan Cangelosi adalah proses pengumpulan data melalui pengamatan empiris. Proses pengumpulan ini dilakukan untuk menaksir apa yang telah diperoleh siswa setelah mengikuti pelajaran selama waktu tertentu. Proses ini dapat dilakukan dengan mengamati kinerja mereka, mendengarkan apa yang mereka katakan serta mengumpulkan informasi yang sesuai dengan tujuan melalui apa yang telah dilakukan siswa.
Menurut Mardapi pengukuran pada dasarnya adalah kegiatan penentuan angka terhadap suatu obyek secara sistematis. Karakteristik yang terdapat dalam obyek yang diukur ditransfer menjadi bentuk angka sehingga lebih mudah untuk dinilai. aspek-aspek yang terdapat dalam diri manusia seperti kognitif, afektif dan psikomotor dirubah menjadi angka. Karenanya, kesalahan dalam mengangkakan aspek-aspek ini harus sekecil mungkin. Kesalahan yang mungkin muncul dalam melakukan pengukuran khususnya dibidang ilmu-ilmu sosial dapat berasal dari alat ukur, cara mengukur dan obyek yang diukur.
Pengukuran dalam bidang pendidikan erat kaitannya dengan tes. Hal ini dikarenakan salah satu cara yang sering dipakai untuk mengukur hasil yang telah dicapai siswa adalah dengan tes. Selain dengan tes, terkadang juga dipergunakan nontes. Jika tes dapat memberikan informasi tentang karakteristik kognitif dan psikomotor, maka nontes dapat memberikan informasi tentang karakteristik afektif obyek.
2.    Objek Pengukuran dalam Bidang Pendidikan
Objek-objek pengukuran dalam bidang pendidikan ialah:
a.    Prestasi hasil belajar siswa
b.    Sikap
c.    Motivasi
d.    Intelegensi
e.    Bakat
f.      Kecerdasan emosional
g.    Minat
h.    Kepribadian
Dalam bidang pendidikan, pengukuran memegang peranan yang sangat penting. Data hasil pengukuran dalam bidang pendidikan memiliki arti penting baik bagi sekolah atau lembaga pendidikan, guru maupun bagi siswa dan masyarakat. Bagi guru misalnya hasil pengukuran berfungsi untuk membandingkan tingkat kemampuan siswa dengan siswa-siswa lain dalam kelompok yang diajarnya. Di sekolah  pengukuran dilakukan guru untuk menaksir prestasi siswa. Alat yang digunakan untuk mengukur prestasi siswa pada umumnya  adalah tes yang disebut tes hasil belajar.
3.    Jenis Instrumen Pengukuran
Secara umum yang dimaksud instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai alat mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel. Pada dasarnya instrumen dapat dibagi dua yaitu tes dan nontes. Yang termasuk kelompok tes adalah tes prestasi belajar, tes intelegensia, tes bakat, dan tes kemampuan akademik, sedangkan yang termasuk dalam kelompok nontes ialah skala sikap, skala penilaian, pedoman observasi pedoman wawancara, angket, pemeriksaan dokumen dan sebagainya.
4.    Bentuk Skala Pengukuran
Dilihat dari bentuk instrumen dan pernyataan yang dikembangkan dalam instrumen, skala yang dapat digunakan dalam pengukuran bidang pendidikan yaitu:
a.    Skala Likert
Skala likert dalah skala yang dapat dipergunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau kelompok orang tentang suatu gejala atau fenomena pendidikan. Bentuk jawaban skala Likert ialah sangat setuju, ragu-ragu, tidak setuju, dan sangat tidak setuju.
Contoh: pertanyaan positif diberi skor 5, 4, 3, 2, dan 1; pertanyaan negatif diberi skor 1, 2, 3, 4, 5 atau -2, -1, 0, 1, 2.
b.    Skala Guttman
Skala guttman yaitu skala yang menginginkan tipe jawaban tegas, seperti jawaban benar-salah, ya-tidak, pernah-tidak pernah, positif-negatif dan seterusnya. Pada skala Guttman hanya ada dua interval yaitu setuju dan tidak setuju. Selain dapat dibuat dalam bentuk pertanyaan pilihan ganda, skala Guttman juga dapat dibuat dalam bentuk daftar checklist.
c.    Semantik differensial
Semantik differensial yaitu skala untuk mengukur sikap yang tersusun dalam satu garis kontinum, dimana jawaban yang sangat positif terletak pada bagian kanan garis, sedangkan jawaban yang sangat negatif terletak di bagian kiri garis, atau sebaliknya.
d.    Rating Scale
Pada rating scale, data yang dihasilkan adalah data kuantitatif (angka) yang kemudian ditafsirkan dalam pengertian kualitatif. Dalam rating scale, responden akan memilih salah satu jawaban kuantitatif yang telah tersedia. Rating scale dapat digunakan untuk mengukur status sosial ekonomi, pengetahuan, kemampuan dan lain-lain. Yang paling penting dalam rating scale adalah kemampuan menterjemahkan alternatif jawaban yang dipilih responden.
e.    Skala Thurstone
Skala thurstone yaitu skala yang disusun dengan memilih butir yang berbentuk skala interval. Setiap butir memiliki kunci skor dan jika diurut, kunci skor menghasilkan nilai dengan jarak yang sama. Skala Thurstone dibuat dalam bentuk sejumlah (40-50) pernyataan yang relevan dengan variabel yang hendak diukur kemudian sejumlah ahli (20-40) orang menilai relevansi pernyataan itu dengan konten atau konstruk variabel yang hendak diukur.

  1. TESTING
Tes (test) merupakan suatu alat penilaian dalam bentuk tulisan untuk mencatat atau mengamati prestasi siswa yang sejalan dengan target penilaian. Jawaban yang diharapkan dalam tes menurut Sudjana dan Ibrahim (2001) dapat secara tertulis, lisan, atau perbuatan. Menurut Zainul dan Nasution (2001) tes didefinisikan sebagai pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang suatu atribut pendidikan atau suatu atribut psikologis tertentu. Setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Dengan demikian apabila suatu tugas atau pertanyaan menuntut harus dikerjakan oleh seseorang, tetapi tidak ada jawaban atau cara pengerjaan yang benar dan salah maka tugas atau pertanyaan tersebut bukanlah tes.
Tes merupakan salah satu upaya pengukuran terencana yang digunakan oleh guru untuk mencoba menciptakan kesempatan bagi siswa dalam memperlihatkan prestasi mereka yang berkaitan dengan tujuan yang telah ditentukan. Tes terdiri atas sejumlah soal yang harus dikerjakan siswa. Setiap soal dalam tes menghadapkan siswa pada suatu tugas dan menyediakan kondisi bagi siswa untuk menanggapi tugas atau soal tersebut.
Menurut Arikunto dan Jabar (2004) tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dengan menggunakan cara atau aturan yang telah ditentukan. Dalam hal ini harus dibedakan pengertian antara tes, testing, testee, tester, adapun pengertian masing-masingnya adalah:
  • Tes merupakan tes masih merupakan alat evaluasi yang umum digunakan untuk mengukur keberhasilan siswa dalam mencapai tujuan pendidikan dan pembelajaran.
  • Testing adalah saat pada waktu tes tersebut dilaksanakan (saat pengambilan tes).
  • Testee adalah responden yang mengerjakan tes. Mereka inilah yang akan dinilai atau diukur kemampuannya.
  • Tester adalah seseorang yang diserahi tugas untuk melaksanakan pengambilan tes kepada responden.
Seringkali skor tes ini dipergunakan sebagai satu-satunya indicator dalam menilai penguasaan konsep, efektivitas metode belajar, guru serta aspek lainnya terhadap siswa di dalam praktek pendidikan. Padahal dengan mempergunakan tes, aspek kemampuan afektif siswa kurang terukur, sehingga sangatlah penting untuk tidak membuat generalisasi kemampuan siswa hanya melalui tes saja.
Tes yang baik harus tersusun dari item-item yang baik, oleh karenanya disamping ada ukuran validitas dan reliabilitas tes, dikenal pula validitas item. Ukuran validitas item pada umumnya menggunakan tingkat kesukaran item, daya beda item dan tingkat tebakan menjawab benar(gueesing).
Ditinjau dari tujuannya, ada empat macam tes, yaitu:
·        Tes penempatan adalah tes yang diperlukan untuk menempatkan siswa dalam kelompok siswa sesuai dengan kemampuannya
·        Tes diagnostik adalah tes hasil belajar yang digunakan untuk mengetahui  kelemahan dan kekurangan, sebagai dasar perbaikan.
·        Tes formatif dimaksudkan sebagai tes yang digunakan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti proses belajar mengajar.
·        Tes sumatif adalah tes yang digunakan untuk mengetahui penguasaan kompetensi siswa dalam satuan waktu tertentu seperti catur wulan atau semester..
Sedangkan berdasarkan bentuk pertanyaannya, tes dapat dibedakan menjadi :

1.      Tes objektif
Tes objektif adalah tes dimana keseluruhan informasi yang diperlukan untuk menjawab tes telah tersedia dan peserta harus memilih salah satu alternatif yang disediakan tersebut. Terdapat beberapa bentuk tes objektif, yaitu:
a.       Tes benar salah
Tes benar salah adalah tes yang memuat pernyataan benar atau salah. Peserta bertugas menandai masing-masing pernyataan itu dengan melingkari huruf “B” jika pernyataan benar, dan “S” jika pernyataan salah.
b.      Tes pilihan ganda
Tes pilihan ganda adalah tes yang memuat serangkaian informasi yang belum lengkap, dan untuk melengkapinya dilakukan dengan memilih berbagai alternatif pilihan yang disediakan. Ada empat variasi tes pilihan ganda, yaitu: tes pilihan ganda biasa, asosiasi, hubungan antar hal, dan menjodohkan.
·        Tes pilihan ganda, adalah soal yang disertai beberapa alternatif jawaban dimana hanya tersedia 1 pilihan benar, dan siswa tugasnya adalah memilih mana dari alternatif-alternatif tersebut yang benar.
·        Tes asosiasi, merupakan modifikasi dari tes pilihan ganda biasa. Bentuk asosiasi juga terdiri dari satu pernyataan dan beberapa alternatif jawaban, hanya saja terdapat lebih dari satu jawaban yang benar.
·        Tes hubungan antar hal, adalah soal yang memuat pernyataan dan alasan, dengan pola memuat pernyataan dan memuat alasan. Petunjuk pilihan:
(a) Jika pernyataan benar, alasan benar, dan ada hubungan sebab akibat
(b) Jika pernyataan benar, alasan benar, dan tidak ada hubungan sebab akibat
(c) Jika pernyataan benar, alasan salah
(d) Jika pernyataan salah, dan alasan salah
(e) Baik pernyataan maupun alasan salah
Tes ini jarang digunakan, padahal tes hubungan antar hal ini sangat baik digunakan untuk mengukur banyak dimensi belajar matematika, antara lain: kemampuan bernalar siswa, pemahaman konsep, hubungan antar konsep, kemampuan berpikir matematis, dan lain-lain.
·        Tes menjodohkan, dalam bentuk tradisional item tes menjodohkan terdiri dari dua kolom yang pararel. Tiap kata, bilangan, atau simbol dijodohkan dengan kalimat, frase, atau kata dalam kolom yang lain. Item pada kolom di mana penjodohan dicari disebut premis, sedangkan kolom di mana pilihan dicari disebut respon. Tugas siswa adalah memasangkan antara presmis dan respon berdasarkan aturan yang ditentukan.
Tes menjodohkan ini juga relatif jarang digunakan dalam penilaian pembelajaran matematika. Padahal seperti halnya tes hubungan antar hal, tes bentuk ini juga dapat digunakan untuk mengukur banyak dimensi belajar matematika, antara lain: mengukur kemampuan bernalar siswa, pemahaman konsep, hubungan antar konsep, kemampuan berpikir matematis, dan lain-lain.



Keunggulan dan Kelemahan Tipe Soal Objektif (Pilihan Ganda)
2.         Tes esay
Tes esay adalah suatu bentuk tes yang terdiri dari pertanyaan atau perintah yang menghendaki jawaban yang berupa uraian-uraian yang relatif panjang. Tes ini dirancang untuk mengukur hasil belajar di mana unsur yang diperlukan untuk menjawab soal dicari, diciptakan dan disusun sendiri siswa. Siswa harus menyusun sendiri kata dan kalimat untuk menjawabannya. Tes esay diklasifikasikan menjadi beberapa bentuk, yiatu: uraian bebas (non objektif), uraian terstruktur (objektif), jawaban singkat, dan isian (melengkapi).
a.       Uraian non objektif
Bentuk uraian bebas memberikan kebebasan untuk memberikan opini serta alas an yang diperlukan. Jawaban siswa tidak dibatasi oleh persyaratan tertentu.
b.      Uraian objektif
Bentuk uraian terstruktur atau uraian terbatas meminta siswa untuk memberikan jawaban terhadap soal dengan persyaratan tertentu
c.       Jawaban singkat
Tes jawaban singkat merupakan tipe item tes yang dapat dijawab dengan kata, frasa, bilangan, atau simbol. Tes jawaban singkat menggunakan pertanyaan langsung, dan siswa diminta memberi jawaban singkat, tepat dan jelas.
d.      Bentuk melengkapi (isian)
Item tes melengkapi hampir sama dengan jawaban singkat, yaitu merupakan tipe item tes yang dapat dijawab dengan kata, frasa, bilangan atau simbol. Bedanya, item tes melengkapi merupakan pernyataan yang tidak lengkap, dan siswa diminta untuk melengkapi pernyataan tersebut. Tes esay perlu lebih dikembangkan penggunaanya dalam penilaian pembelajaran matematika. Penggunaan tes esay selama ini agak kurang karena lebih dominan digunakan tes objektif. Padahal tes esay ini sangat baik untuk penilaian pembelajaran
Keunggulan dan Kelemahan Tipe Soal Tipe Esai (Karangan)



BAB III

PEMBAHASAN

A.     MATRIKS PERBANDINGAN PENILAIAN, ASSESMENT, PENGUKURAN, TESTING


Istilah
Pengertian Menurut Para Ahli
Kesimpulan
Penilaian (Evaluasi)
Sudiono, Anas (2005) mengemukakan bahwa secara harfiah kata evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Akar katanya adalah value yang artinya nilai. Jadi istilah evaluasi menunjuk pada suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu.
·        Evaluasi berasal dari akar kata bahasa Inggris value yang berarti nilai, jadi istilah evaluasi sinonim dengan penilaian.
·        Evaluasi merupakan proses sistematis dari mengumpulkan, menganalisis, hingga interpretasi (menafsirkan) data atau informasi yang diperoleh.
·        Data atau informasi diperoleh melalui pengukuran (measurement) hasil belajar.melalui tes atau nontes.
·        Evaluasi bersifat kualitatif
Frey, Barbara A., and Susan W. Alman. (2003): Evaluation The systematic process of collecting, analyzing, and interpreting information to determine the extent to which pupils are achieving instructional objectives. (Artinya: Evaluasi adalah proses sistematis pengumpulan, analisis, dan interpretasi informasi untuk menentukan sejauh mana siswa yang mencapai tujuan instruksional).
Mardapi, Djemari (2003), penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran.
Zainul, Asmawi dan Noehi Nasution (2001), mengartikan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes.
Arikunto (2009), penilaian adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Untuk dapat melakukan penilaian perlu melakukan pengukuran terlebih dahulu, sedangkan pengukuran tidak akan mempunyai makna yang berarti tanpa dilakukan penilaian.
Sudijono (2006), penilaian berarti menilai sesuatu. Sedangkan menilai itu mengandung arti: mengambil keputusan terhadap sesuatu dengan mendasarkan diri atau berpegang pada ukuran baik atau buruk, sehat atau sakit, pandai atau bodoh das sebagainya. Jadi penilaian itu sifatnya adalah kualitatif.
Black dan William (Rasyid, 2007) mendefinisikan penilaian sebagai semua aktifitas yang dilakukan oleh guru dan siswa untuk menilai diri mereka sendiri, yang memberikan informasi untuk digunakan sebagai umpan balik untuk memodifikasi aktivitas belajar dan mengajar.
Rasyid dan Mansur (2007) penilaian adalah proses pengumpulan informasi atau data yang digunakan untuk membuat keputusan tentang pembelajaran. Pembelajaran yang dimaksud mencakup siswa, kurikulum, program, dan kebijakan. Proses penilaian meliputi pengumpulan bukti-bukti tentang pencapaian belajar peserta didik. Bukti ini tidak selalu diperoleh melaui tes saja, tetapi juga bisa dikumpulkan melalui pengamatan atau laporan diri.
Linn & Gronlund (Koyan, 2011) penilaian (assesment) adalah istilah umum yang melibatkan semua rangkaian prosedur yang digunakan untuk mendapatkan informasi tentang hasil belajar peserta didik (misalnya: observasi, skala bertingkat tentang kinerja, tes tertulis) dan pelaksanaan penilaian mengenai kemajuan belajar peserta didik.
Permendiknas No 20 tahun 2007 tentang standar penilaian dijelaskan bahwa penilaian adalah proses pengumpulan dan pengolahan informasi untuk menentukan pencapaian hasil belajar siswa. Penilaian tidak sekedar pengumpulan data siswa, tetapi juga pengolahannya untuk memperoleh gambaran proses dan hasil belajar siswa. Penilaian tidak sekedar memberi soal siswa kemudian selesai, tetapi guru harus menindaklanjutinya untuk kepentingan pembelajaran.
Kumano (2001) evaluasi merupakan penilaian terhadap data yang dikumpulkan melalui kegiatan asesmen.
Calongesi (1995) evaluasi adalah suatu keputusan tentang nilai berdasarkan hasil pengukuran
Purwanto (2002) Evaluasi merupakan suatu proses yang sistematis untuk menentukan atau membuat keputusan sampai sejauhmana tujuan-tujuan pengajaran telah dicapai oleh siswa.
Cronbach (Harris, 1985) menyatakan bahwa evaluasi merupakan pemeriksaan yang sistematis terhadap segala peristiwa yang terjadi sebagai akibat dilaksanakannya suatu program.
Pengukuran (Measurement)

Alwasilah et al.(1996), measurement (pengukuran) merupakan proses yang mendeskripsikan performa siswa dengan menggunakan suatu skala kuantitatif (sistem angka) sedemikian rupa sehingga sifat kualitatif dari performa siswa tersebut dinyatakan dengan angka-angka
·        Kegiatan pengukuran dilakukan dengan membandingkan hasil belajar dengan suatu ukuran tertentu. 
·        Dilakukan dengan proses sistematis. 
·        Hasil pengukuran berupa besaran kuantitatif (sistem angka). 
·        Pengukuran menggunakan alat ukur yang baku.
Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif.
Cangelosi, James S. (1995), pengukuran adalah proses pengumpulan data secara empiris yang digunakan untuk mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan.
Sridadi (2007) pengukuran adalah suatu prose yang dilakukan secara sistematis untuk memperoleh besaran kuantitatif dari suatu obyek tertentu dengan menggunakan alat ukur yang baku.
Kerlinger (1996:687) Pengukuran (measurement) adalah membandingkan sesuatu yang diukur dengan alat ukurnya dan kemudian menerakan angka menurut sistem aturan tertentu
Hopkins dan Antes (1979:10) mendefinisikan pengukuran sebagai pemberian angka pada atribut dari objek, orang atau kejadian yang dilakukan untuk menunjukkan perbedaan dalam jumlah.
Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas.
Norman E. Gronlund (1971) yang menyatakan “Measurement is limited to quantitative descriptions of pupil behavior”.
Zainul dan Nasution (2001) pengukuran memiliki dua karakteristik utama yaitu: 1) penggunaan angka atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.
Assesment
Angelo T.A.(1991): Classroom Assessment is a simple method faculty can use to collect feedback, early and often, on how well their students are learning what they are being taught. (Artinya: asesmen Kelas adalah suatu metode yang sederhana dapat digunakan untuk mengumpulkan umpan balik, baik di awal maupun setelah pembelajaran tentang seberapa baik siswa mempelajari apa yang telah diajarkan kepada mereka.)
·        Asesmen merupakan metode dan proses yang digunakan untuk mengumpulkan umpan balik tentang seberapa baik siswa belajar.
·        Dapat dilakukan di awal, di akhir (sesudah), maupun saat pembelajaran sedang berlangsung.
·        Asesmen dapat berupa tes atau nontes.
·        Asesmen berupa nontes misalnya penggunaan metode observasi, wawancara, monitoring tingkah laku, dsb.
·        Hasilnya dapat digunakan untuk pengambilan keputusan.
·        Bertujuan meningkatkan belajar (pembelajaran) dan perkembangan siswa.

Kizlik, Bob (2009): Assessment is a process by which information is obtained relative to some known objective or goal. Assessment is a broad term that includes testing. A test is a special form of assessment. Tests are assessments made under contrived circumstances especially so that they may be administered. In other words, all tests are assessments, but not all assessments are tests. (Artinya : asesmen adalah suatu proses dimana informasi diperoleh berkaitan dengan tujuan pembelajaran. Asesmen adalah istilah yang luas yang mencakup tes (pengujian). Tes adalah bentuk khusus dari asesmen. Tes adalah salah satu bentuk asesmen. Dengan kata lain, semua tes merupakan asesmen, namun tidak semua asesmen berupa tes)
Overton, Terry (2008): Assesment is a process of gathering information to monitor progress and make educational decisions if necessary. As noted in my definition of test, an assesment may include a test, but also include methods such as observations, interview, behavior monitoring, etc. (Artinya: sesmen adalah suatu proses pengumpulan informasi untuk memonitor kemajuan dan bila diperlukan pengambilan keputusan dalam bidang pendidikan. Sebagaimana disebutkan dalam definisi saya tentang tes, suatu asesmen bisa saja terdiri dari tes, atau bisa juga terdiri dari berbagai metode seperti observasi, wawancara, monitoring tingkah laku, dan sebagainya).
Palomba and Banta(1999), Assessment is the systematic collection , review , and use of information about educational programs undertaken for the purpose of improving student learning and development (Artinya: asesmen adalah pengumpulan, reviu, dan penggunaan informasi secara sistematik tentang program pendidikan dengan tujuan meningkatkan belajar dan perkembangan siswa).
Stiggins (1994) assesment sebagai penilaian proses, kemajuan, dan hasil belajar siswa (outcomes).
Kumano (2001) menyatakan bahwa assesment sebagai “The process of collengting data which shows the development of learning”.
Wiggins (1984) menyatakan bahwa asesmen merupakan sarana yang secara kronologis membantu guru dalam memonitor siswa.
Popham (1995) menyatakan bahwa asesmen sudah seharusnya merupakan bagian dari pembelajaran, bukan merupakan hal yang terpisahkan.
Resnick (1985) menyatakan bahwa asesmen menitikberatkan penilaian pada proses belajar siswa.
Marzano et al. (1994) menyatakan bahwa dalam mengungkap konsep yang telah dicapai, akan tetapi juga tentang proses perkembangan bagaimana suatu konsep tersebut diperoleh. Dalam hal ini asesmen tidak hanya dapat menilai hasil dan proses belajar siswa, akan tetapi juga kemajuan belajarnya.
Gabel (1993:388-390) mengkategorikan asesmen kedalam dua kelompok besar, yaitu asesmen tradisional dan asesmen alternatif. Adapun asesmen yang tergolong tradisional adalah tes benar-salah, tes pilihan ganda, tes melengkapi, dan tes jawaban terbatas. Sementara itu, yang tergolong kedalam asesmen alternatif (non-tes) adalah essay/uraian, penilaian praktek, penilaian proyek, kuesioner, inventori, daftar Cek, penilaian oleh teman sebaya/sejawat, penilaian diri (self assessment), pertofolio, observasi, diskusi dan interviu (wawancara).
Tes

Wayan Nurkencana (1993), tes adalah suatu cara untuk mengadakan penilaian yang berbentuk suatu tugas yang harus dikerjakan anak atau sekelompok anak sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak tersebut yang kemudian dapat dibandingkan dengan nilai yang dicapai oleh anak-anak lain atau standar yang telah ditetapkan
·        Tes adalah cara atau metode untuk menentukan kemampuan siswa menyelesaikan tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan.
·        Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan.
·        Tes adalah salah satu bentuk asesmen

Overton, Terry (2008): test is a method to determine a student’s ability to complete certain tasks or demontstrate mastery of a skill or knowledge of content. Some types would be multiple choice tests or a weekly spelling test. While it commonly used interchangeably with assesment, or even evaluation, it can be distinguished by the fact  that a test is one form of an assesment. (Tes adalah suatu metode untuk menentukan kemampuan siswa menyelesaikan sejumlah tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan pada suatu materi pelajaran. Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan. Seringkali penggunaannya tertukar dengan asesmen, atau bahkan evaluasi (penilaian), yang mana sebenarnya tes dapat dengan mudah dibedakan berdasarkan kenyataan bahwa tes adalah salah satu bentuk asesmen.)
Djemari (2008:67) menyatakan bahwa tes merupakan salah satu cara untuk menaksir besarnya kemampuan seseorang secara tidak langsung, yaitu melalui respons seseorang terhadap stimulus atau pertanyaan.
(Jacobs & Chase, 1992; Alwasilah, 1996) Tes (test) merupakan suatu alat penilaian dalam bentuk tulisan untuk mencatat atau mengamati prestasi siswa yang sejalan dengan target penilaian.
Zainul dan Nasution (2001) tes didefinisikan sebagai pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang suatu atribut pendidikan atau suatu atribut psikologis tertentu.
Calongesi (1995) Tes merupakan salah satu upaya pengukuran terencana yang digunakan oleh guru untuk mencoba menciptakan kesempatan bagi siswa dalam memperlihatkan prestasi mereka yang berkaitan dengan tujuan yang telah ditentukan.
Arikunto dan Jabar (2004) tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dengan menggunakan cara atau aturan yang telah ditentukan.
Subekti & Firman (1989) tes merupakan alat evaluasi yang umum digunakan untuk mengukur keberhasilan siswa dalam mencapai tujuan pendidikan dan pengajaran.



Diagram Kedudukan Istilah Evaluasi, Penilaian, Pengukuran, Asesmen, dan Tes


Perhatikan Gambar berikut, yang merupakan diagram kedudukan istilah evaluasi, penilaian, pengukuran, asesmen, dan tes yang seringkali membingungkan. Diagram dibuat berdasarkan induksi dari pengertian evaluasi (penilaian), penegertian pengukuran, pengertian asesmen, dan pengertian tesmenurut para ahli di atas.
Description: kedudukan istilah evaluasi di antara istilah sejenis
Diagram yang menunjukkan kedudukan istilah-istilah "Evaluasi", "Penilaian", "Pengukuran", "Asesmen", dan "Tes"

B.     MATRIKS PERBEDAAN JENIS-JENIS VALIDITAS


Pengertian
Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang telah dikembangkan.
Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur.
Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur.
Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur.
Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur.
Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes.
Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep
yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.
Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya lanyak mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu (Thoha, 1990).
Grondlund (Ibrahim & Wahyuni, 2012) validitas mengarah kepada ketepatan interpretasi hasil penggunan suatu prosedur evaluasi sesuai dengan tujuan pengukurannya.
Jenis-Jenis Validitas
Ebel (dalam Nazirz 1988) membagi validitas menjadi :
1.      Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
2.      Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat menyebabkan kinerja yang baik dalam pengukuran.
3.      Face Validity adalah validitas yang berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
4.      Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, di mana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
5.      Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
6.      Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang seharusny diukur.
7.      Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj seorang di msa mendatang.
8.      Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
9.      Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
Kerlinger (1990) membagi validitas menjadi tiga yaitu:
1.      Content validity (Validitas isi) adalah validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validitas ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan dengan representasi dari keseluruhan kawasan.
Validitas isi suatu instrumen berkaitan dengan kesesuaian antara karakteristik dari variaabel yang dirumuskan pada definisi konseptual dan operasionalnya. Apabila semua karakteristik variabel yang dirumuskan pada definisi konseptualnya dapat diungkap melalui butir-butir suatu instrument, maka instrument itu dinyatakan memiliki validitas isi yang baik. Sayangnya, hal itu mungkin tidak akan pernah tercapai karena sulitnya untuk mendefinisikan keseluruhan karakteristik itu. Selain itu, dari seluruh karakteristik yang dirumuskan pada definisi konseptual suatu variabel seringkali sulit untuk mengembangkan butir-butir yang valid untuk mengungkap atau mengukurnya.
Validitas isi dapat dianalisis dengan cara memperhatikan penampakan luar dari instrument dan dengan menganalisis kesesuaian butir-butirnya dengan karakteristik yang dirumuskan pada definisi konseptual variabel yang diukur. Validitas yang dianalisis dengan memperhatikan penampilan luar instrument itu disebut validitas tampang (face validity). Validitas tampang dievaluasi dengan membaca dan menyelidiki butir-butir instrument serta sekaligus membandingkannya dengan definisi konseptual mengenai variabel yang akan diukur. Validitas yang dianalisis dengan memperhatikan kerepresentativan butir-butir instrument disebut validitas penyampelan (sampling validity) atau kuikulum (curriculum validity). Validitas tampang maupun penyampelan disebut juga sebagai validitas teoritis karena penganalisisannya lazim dilakukan tanpa didasarkan pada data empiris. Alat yang digunakan untuk menganalisis validitas itu adalah logika dari orang yang menganalisisnya.
Menurut Saifuddin Azwar, validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validitas ini adalah ”sejauh mana item-item dalam tes mencakup keseluruhan kawasan ini (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur” atau ”sejauh mana isi tes mencerminkan ciri atribut yang hendak diukur”.
a.       Selanjutnya, validitas isi terbagi lagi menjadi dua tipe (Saifuddin Azwar), yaitu:
Face Validity (Validitas Muka) adalah tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan maka validitas muka telah terpenuhi.
b.      Logical Validity (Validitas Logis) disebut juga sebagai Validitas Sampling (Sampling Validity) adalah validitas yang menunjuk pada sejauh mana isi alat ukur merupakan representasi dari aspek yang hendak diukur.
Validitas logis sangat penting peranannya dalam penyusunan prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atu table spesifikasi.
2.      Construct validity (Validitas konstruk) adalah tipe validitas yang menunjukkan sejauh mana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. (Allen & Yen, dalam Azwar 1986).
Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Menurut Saifuddin Azwar, validitas konstruk adalah seberapa besar derajat tes mengukur hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.
3.      Criterion-related validity (Validitas berdasar kriteria). Validitas ini menghendaki tersedianya criteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksi oleh skor alat ukur.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas (Saifuddinn Azwar), yaitu:
1.      Validitas Prediktif. Validitas Prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai predictor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya. Menurut Saifuddin Azwar, validitas prediktif adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkapkan hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.
2.      Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Menurut Saifuddin Azwar, validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan criteria lain yang valid yang diperoleh pada saat yang sama.
Asosiasi Psikologi Amerika (APA) (1974; dalam Anastasia, 1982) membedakan tiga tipe validitas, yaitu validitas isi, yang dikaitkan dengan criteria, dan konnstrak.
Penilaian Validitas
Untuk mencari tingkat validitas digunakan rumus product moment metoda Pearson sebagai berikut:
           dimana x = X – Xrata-rata dan y = Y – Yrata-rata                 (1) 

Keterangan:
x  =    Deviasi penilaian akhir
y  =    Deviasi penilaian awal
r   = Korelasi antara x dan y (dua variabel yang akan  dikorelasikan)
Dari nilai r yang telah didapatkan maka perlu interpretasi dari nilai tersebut untuk menunjukkan kevalidan suatu penilaian. Kriteria nilai r yang digunakan untuk menentukan suatu penilaian valid dapat dilihat pada Tabel 1 berikut:
                       Tabel 1. Kriteria Korelasi Koefisien Validitas
No
Nilai r antara
Klasifikasi
1.
0,000 – 0,200
Korelasi sangat rendah
2.
0,200 – 0,400
Korelasi rendah
3.
0,400 – 0,600
Korelasi cukup
4.
0,600 – 0,800
Korelasi tinggi
5.
0,800 – 1,000
Korelasi sangat tinggi
             Sumber:  Suharsimi (2008: 221)

C.     MATRIKS PERBEDAAN JENIS-JENIS RELIABILITAS


Pengertian
Walizer (1987) menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan pengukuran.
John M. Echols dan Hasan Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya
Popham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error measurement"
Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan
Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya.
Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang.
Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes yang ekivalen.
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama instrumen pengukuran yang baik.
Arifin (1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.
Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama
Suharsimi (2009) “Reliabilitas adalah suatu ukuran yang berhubungan dengan indikasi tetap dan konsisten dari hasil sebuah penilaian”.
Jenis-Jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1.      Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2.      Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat. Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian terseb itu dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.
Teknik Pengujian Realibilitas Instrument
Tiga tehnik pengujian realibilitas instrument antara lain :
1.      Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
2.      Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda. Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang. Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
3.      Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian. Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
Penilaian Reliabilitas
Salah satu cara yang bisa dipakai untuk menentukan reliabilitas adalah dengan cara ekuivalen. Metode ekuivalen sering pula dinamakan alternate-forms methods atau doble-test-trial method. Menurut Sumarna (2005: 97), metode ini berkaitan dengan penggunaan dua buah penilaian tertulis yang sama atau relatif sama kepada peserta didik yang sama. Kesamaan yang dimaksud adalah kesamaan tujuan, tingkat kesukaran, dan susunan. Persamaan yang dipakai untuk menentukan reliabilitas penilaian tertulis dengan metode ekuivalen adalah sebagai berikut :
            (2)    
Keterangan :
r                  =  Reliabilitas secara keseluruhan 
N                =  Jumlah peserta 
X1          =  Nilai awal
X2               =  Nilai akhir
Tabel 2. Klasifikasi Indeks Reliabilitas
No
Indeks
Klasifikasi
1.
0,00 – 0,20
Sangat rendah
2.
0,20 – 0,40
Rendah
3.
0,40 – 0,60
Sedang
4.
0,60 – 0,80
Tinggi
5.
0,80 – 1,00
Sangat tinggi
Sumber:  Suharsimi (2008: 221)


BAB IV

PENUTUP

Testing merupakan alat atau prosedur sistematis dalam evaluasi untuk mengukur contoh perilaku, tes yangdikembangkan dengan baik merupakan suatu alat penting dalam peningkatan kompetensi siswa, menilai  merupakan suatu proses yang dilakukan setelah adanya kegiatan pengukuran. Menilai dapat diartikan sebagai pengambilan suatu keputusan terhadap sesuatu dengan ukuran baik atau buruk, serta menilai dapat dikategorikan bersifat kualitatif. Sedangkan mengukur adalah membandingkan sesuatu dengan satu ukuran, dan pengukuran bersifat kuantitatif. Mengukur dan menilai adalah suatu rangkaian kegiatan evaluasi.
Dalam pembuatan soal sebaiknya hal-hal yang harus diperhatikan guru antara lain: menetapkan tujuan pembelajaran, memahami tata cara pembuatan soal yang baik dan benar serta memahami analisis butir soal untuk mengetahui kualitas soal yang dibuat.
Diharapkan sebelum melakukan penilaian guru sebaiknya memahami pembuatan tes secara benar sehingga data yang diperoleh valid dan reliable. 





DAFTAR PUSTAKA


----. Permendikbud No. 23 tahun 2016 tentang Standar Penilaian Pendidikan. Jakarta: Depdiknas
Arikunto, Suharsimi. 2007. Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: Bumi Aksara.
Arikunto, Suharsimi. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Eko Putro Widoyoko. 2011. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar.
Koyan, Wayan. 2011. Asesmen dalam Pendidikan. Singaraja: Universitas Pendidikan Ganesha Press.
Purwanto. 2011. Evaluasi Hasil Belajar. Surakarta: Pustaka Pelajar.
Rasyid, Harun dan Mansur. 2007. Penilaian Hasil Belajar. Bandung: CV. Wacana Prima.
Sudijono, Anas. 2006. Pengantar Evalusi Pendidikan. Jakarta: PT RajaGrafindo Persada.
Zainul & Nasution. (2001). Penilaian Hasil belajar. Jakarta: Dirjen Dikti.




Previous Post
Next Post

0 comments: