You are on page 1of 41

TES STANDAR DAN TES NONSTANDAR

A.

Pengertian Tes
Secara harfiah, kata tes berasal dari bahasa Perancis kuno: testum dengan arti: piring untuk menyisihkan
logam-logam mulia (maksudnya dengan menggunakan alat berupa piring itu akan diperoleh jenis-jenis logam mulia
yang nilainya sangat tinggi), dalam bahasa Inggris ditulis dengan test yang dalam bahasa Indonesianya
diterjemahkan dengan makana tes, ujian atau percobaan. Dalam bahasa Arab Imtihan.[1]
Sedangkan Sumadi Suryabrata, mengartikan tes adalah: pertanyaan-pertanyaan yang harus dijawab dan
atau perintah-perintah yang harus dijalankan, yang mendasarkan harus bagaimana testee menjawab pertanyaanpertanyaan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkan
dengan standar atau testee lainnya.[2]
Dari kedua pengertian diatas, diambil pengertian, tes adalah alat pengukuran berupa pertanyaan, perintah
dan petunjuk yang dutujukan kepada testee unruk mendapatkan respon sesuai dengan petunjuk itu. Atas dasar respon
tersebut ditentukan tinggi rendahnya skor dalam bentuk kuantitatif, selanjutnya dibandingkan dengan standar yang
telah ditentukan untuk ditarik kesimpulan yang bersifat kualitatif.
B.
1.

Tes Standar
Pengertian Tes Standar
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh
lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes
yang baik. Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup
wilayah yang luas.
Istilah standar dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama
dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang
sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar
penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok
standar tersebut.
Istilah standar tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan
pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat
mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada)
yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam
pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.[3]
2.

Kegunaan Tes Standar


Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
a.
Jika ingin membuat perbandingan.
b. Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.
Secara garis besar kegunaan tes standar adalah:
a.
Membandingkan prestasi belajar dengan pembawaan individual atau kelompok.
b. Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individual atau
kelompok.
c.
Membandingkan prestasi siswa berbagai sekolah atau kelas.
d. Mempelajari perkembangan siswa dalam suatu periode atau waktu tertentu.
3.

Kelengkapan Tes Standar


Sebuah tes yang sudah distandarisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi
dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunju-petunjuk yang perlu terutama yang
menjelaskan tentang pelaksanaan, mengskor, dan mengadakan interpretasi.
Secara garis besar manual tes standar ini memuat:

a. Ciri-ciri mengenai tes.


Misalnya menyebutkan tingkat validitas. Tingkat reliabilitas dan sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes.
Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.
c. Proses standarisasi tes.
Misalnya mengenai hal-hal yang berhubungan dengan sampel.
-Besarnya sampel,
-Teknik sampling,
-Kelompok mana yang diambil sebagai sampel(sifat sampel).
d. Petunjuk-petunjuk tentang cara melaksanakan tes.
Misalnya: dilaksanakan dengan lisan atau tertulis, watu yang digunakan untuk mengerjakan setiap bagian, boleh
tidaknya tercoba keluar jika sudah selesai mengerjaan soal itu dan sebagainya.
e. Petunjuk-petunjuk bagaimana cara menskor.
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara
menghitung nilai akhir dan sebagainya.
f.
Petunjuk-petunjuk untuk menginterpretasikan hasil.
Misalnya:
-Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
-Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g. Saran-saran lain.
Misalnya: siapa pun harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu
dan sebagainya.[4]

4. Jenis-jenis Tes Standar


Tes standar diklasifikasikan menjadi 7 jenis utama dan beberapa contoh dari setiap jenis yang sering
digunakan dalam penelitian:
1)

Tes kecerdasan
Tes kecerdasan memberikan perkiraan tingkat intelektual umum dengan sampling kinerja seseorang pada
berbagai tugas. Tugas-tugas ini dapat mencakup definisi kata, pemecahan masalah matematika, pengetahuan umum,
dan memori jangka pendek.
Tes kecerdasan sangat dijunjung tinggi oleh para peneliti pendidikan dan personil sekolah karena
keberhasilan mereka dalam memprediksi prestasi sekolah. Bahkan sering disebut tes bakat skolastik karena
mayoritas dari tes tersebut mengukur spek-aspek kecerdasan yang tampaknya diperlukan untuk suksesd alam belajar
di sekolah.
2) Tes bakat
Tes bakat ditujukan untuk prediksi kinerja siswa dalam perilaku spesifik. Tes yang tersedia untuk mengukur
bakat bagi banyak mata pelajaran tertentu seperti bahasa asing, seni, musik, dan matematika. Sebuah kecenderungan
utama dalam pengujian pendidikan adalah perkembangan dari pengujian yang mengukur berbagai macam bakat
yang berkaitan dengan keberhasilan kejuruan dan skolastik.
3) Tes prestasi
Tes prestasi banyak tersedia. Beberapa tes dimaksudkan untuk mengukur pengetahuan siswa
mengenai fakta yang spesifik, pemahaman siswa dan penguasaan prinsip-prinsip dasar. Meskipun tes prestasi telah
dikritik atas dasar sosial, tes tersebut mungkin yang paling valid, dapat diandalkan, dan berguna untuk peneliti
pendidikan.
Administrasi waktu untuk tes prestasi yang berbeda sangat bervariasi, beberapa tes mengambil
sedikitnya 30 menit, sedangkan yang lain memerlukan dua hari pengujian. Tes prestasi juga berbeda dalam subjekmateri cakupan. Dalam memilih suatu tes prestasi untuk proyek penelitian, harus terlebih dahulu memutuskan

bidang prestasi yang akan diukur dan kemudian mengevaluasi tes yang dimaksudkan untuk mengukur prestasi di
bidang ini.
4) Tes diagnostic
Tes diagnostik adalah bentuk tes prestasi. Namun, tes prestasi biasanya menghasilkan skor tunggal
menunjukkan tingkat umum prestasi siswa dalam mata pelajaran tertentu. Beberapa tes diagnostik digunakan umum
adalah Stanford Diagnostic Reading Test, Stanford Diagnostic Mathematics Test, dan Diagnostic Skreening Test.
Ada beberapa keuntungan untuk administrasi tes diagnostik dalam program penelitian atau perbaikan.
Pertama, siswa yang memiliki kekurangan tertentu dalam subjek dapat diidentifikasi. Kedua, penggunaan tes
diagnostik sangat membantu dalam perencanaan perbaikan instruksi individual, pendekatan yang dianjurkan oleh
banyak pendidik. Kerugian dari beberapa tes diagnostik adalah bahwa sub scores memiliki reliabilitas yang rendah
dan sangat saling berkorelasi dengan satu sama lain.
5) Mengukur kreatifitas
Cara untuk mengidentifikasi dan melatih kreatifitas seseorang merupakan masalah utama dalam penelitian
pendidikan selama dua dekade ini. Sangat mengejutkan bahwa ternyata telah banyak berkembang pula cara untk
mengukur kreatifitas pada waktu yang dua dekade ini. Alasan mendasar dalam melakukan penelitian dalam
kreativitas adalah meningkatnya ketertarikan para pendidik terhadap factor-faktor non-intelektual, seperti kreatifitas
dan personalitas, dalam pencapaian siswa di sekolah.
Kebanyakan pengukuran tentang kreativitas ditekankan pada penilaian terhadap kemampuan belajar siswa
dan sifat-sifat siswa yang dapat berkontribusi pada pencapaian kreatif siswa. Hal tersebut tidak mengukur secara
langsung tingkat krativitas siswa.
6) Self-report dalam pengukuran kepribadian
Pengukuran ini digunakan secara berkelanjutan dalam penelitian pendidikan untuk menggambarkan
karakteristik kepribadian kelompok yang sesuai dengan kebutuhan peneliti; seperti kelompok minoritas, kelompok
anak-anak kurang beruntung dsb. Mereka juga menggunakan cara tersebut dalam penelitian yang dilakukannya
untuk melihat keterkaitan antara karakteristik seseorang dengan faktor-faktor lainnya, seperti tingkat kecerdasan,
prestasi dalam kelompoknya atau popularitas.
Keuntungan dari tes tersebut adalah murah dan mudah untuk diatur dan dinilai. Pertanyaan yang
dikemukakan pada tes tersebut sebagian besar berupa pertanyaan objektif; seperti pertanyaan ya-tidak atau
pertanyaan berbentuk pilihan ganda.
Kekurangan dari tes ini adalah tes ini biasanya merupakan self-report dari individu yang dites. Seperti selfreport pada umumnya, tes tersebut akan akurat apabila persepsi diri dari individu tersebut juga akurat dan juga
terkait dengan kejujuran individu tersebut dalam mengisi tes tersebut. Hal tersebut merupakan masalah bagi banyak
penelitian di bidang pendidikan dan psikologi.
7) Teknik proyektif
Istilah teknik-teknik proyektif ini dipopulerkan oleh Frank LK. Salah satu keuntungan yang diklaim sebagai
teknik proyektif atas diri sendiri-laporan persediaan adalah bahwa mereka kurang tunduk pada berpura-pura. Teknikteknik proyektif yang paling banyak digunakan adalah Uji Rorschach dan Test Apperception Tematik (TAT). Di
Rorschach, subjek menanggapi satu set percikan tinta, sedangkan dalam TAT subjek menanggapi satu set gambar.
Terlepas dari popularitas tes proyektif kami akan merekomendasikan bahwa mereka akan digunakan dengan
hati-hati dalam proyek penelitian, karena sebagai aturan, ukuran ini membutuhkan pelatihan yang ekstensif dan
pengalaman untuk mengelola, skor, dan menafsirkan. Jika Anda memutuskan untuk menggunakan Rorschach atau
teknik proyektif serupa dalam proyek Anda, anda harus mempekerjakan orang-orang yang memenuhi syarat untuk
mengelola, skor dan menginterpretasikan hasil.[5]
C.
1.

Tes Nonstandar
Pengertian Tes Nonstandar
Tes nonstandar adalah kebalikan tes standar, yaitu tes yang disusun oleh seorang pendidik yang belum
memiliki keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat

menyusun tes secara baik, mengujicobakan, melakukan analisis sehingga validitas dan reliabilitas belum dapat
dipertanggungjawabkan.
Tes buatan guru memang memiliki beberapa kekhususan, bisa jadi syarat kualitatif belum terpenuhi, tetapi
ia memiliki kelebihan lebih cocok untuk mengukur hal-hal khusus yang tidak dapat distandarisasikan, seperi
formatif, tes diagnostik, hasilnya lebih realistik. Sebab tes ini dirancang sesuai dengan keadaan peserrta didik.
2.
1)
2)
3)

1)
2)
3)
4)
3.
1)

2)

3)

D.

Kegunaan Tes NonStandar


Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.
Untuk menentukan apakah sesuatu tujuan telah tercapai.
Untuk memperoleh suatu nilai.
Selanjutnya baik tes standard an tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan
untuk:
Mengadakan diagnosis terhadap ketidak mampuan siswa.
Menentukan tempat siswa dlam suatu kelas atau kelompok.
Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
Memilih siswa untuk program-program khusus.[6]
Menilai Tes Nonstandar
Ada 4 cara untuk menilai tes yaitu :
Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban
tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.
Pertanyaan-pertanyaan tersebut, antara lain:
Apakah banyaknya soal untuk tiap topik sudah seimbang?
Apakah semua soal menanyakan bahan yang telah diajarkan?
Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan?
Apakah soal itu tidak sukar untuk dimengerti?
Apakah soal itu tidak dapat dikerjakan oleh sebagian siswa?
Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun.
Faedah mengadakan analisis soal:
Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih
lanjut.
Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah
validitas kurikuler. Untuk mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap
bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus
tersebut.
Dalam hal ini Terry D. Ten Brink, mengemukakan pendapatnya demikian:
Untuk tes yang dirancang akan menggunakan norm-referenced tidak harus menuliskan setiap tujuan khusus,
tetapi cukup dengan tujuan-tujuan yang esensial saja.
Untuk tes yang dirancang akan menggunakan criterion referenced, maka setiap tujuan khusus harus
dicantumkan dalam tabek spesifikasi.
Cara keempat adalah dengan mengadakan checking reliabilitas.
Salah satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa kebanyakan dari
soal-soal tes itu mempunyai daya pembeda yang tinggi.[7]
Perbandingan Tes Standar dan Tes Buatan Guru.

Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama
banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah perbedaan antara tes
standar dengan tes nonstandar, atau apakah keburukan dan keuntungan tes standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya
adalah sebagai berikut:
Tes Standar
Didasarkan atas bahan dan tujuan umum dari sekolahsekolah di seluruh Negara.

Tes Nonstandar
Didasarkan atas bahan dan tujuan khusus yang
dirumuskan oleh guru untuk kelasnya sendiri.

Mencakup aspek yang luas dan pengetahuan atau


keterampilan dengan hanya sedikit butir tes untuk setiap
keterampilan atau topik.

Dapat terjadi hanya mencakup pengetahuan atau


keterampilan yang sempit.

.Disusun dengan kelengkapan staf profesor, pembahas,


dan editor butir tes.

Biasanya disusun sendiri oleh guru dengan sedikit


atau tanpa bantuan orang lain/tenaga ahli.

Menggunakan butir tes yang sudah diujicobakan (try


out), dianalisis dan direvisi sebelum menjadi sebuah tes.

Jarang menggunakan butir tes


diujicobakan, dianalisis dan direvisi.

Mempunyai reliabilitas yang tinggi.

Mempunyai reliabilitas sedang atau rendah.

Dimungkinkan menggunakan norma untuk seluruh


Negara.

Norma kelompok terbatas kelas tertentu.

yang

sudah

Sumardi Suryabrata, menegaskan bahwa dalam masalah norma, sebenarnya ada tiga jenis, yaitu:
a.
Norma nasional
b. Norma lokal
c.
Norma sekolah
Perbedaan antar norma nasional dan norma lokal mencakup daerah liputannya. Norma nasional memiliki
karateristik yang unik, tidak sederhana, dan tidak mudah menyusunnya. Sedangkan norma lokal lebih cermat dalam
menginterprestasikan prestasi dalam jangkauan wilayahnya, hal ini penting bilamana akan dipakai untuk melakukan
penilaian pendidikan. Norma nasional sekalipun sulit, namun bila sudah tersusun sangat berguna untuk acuan
menginterpretasikan taraf kompetensi individual, sekolah, dan wilayahnya.
Norma sekolah dapat dipakai sebagai acuan interpretasi hasil tes peserta didik dari sekolah bersangkutan.
Oleh karena itu masing-masing sekolah memiliki norma sendiri sesuai dengan kualitas sekolah bersangkutan.
Pada saat ini hasil belajar peserta didik kita jumpai penggunaan dua norma, yaitu norma sekolah dan norma
nasional Norma sekolah ditemuan dalam STTB dan nilai rata-rata rapor, sedangkan norma nasional ditemukan pada
NEM (Nilai Ebtanas Murni). Secara ideal lebih baik bilamana setiap peserta didik juga memiliki norma lokal.[8]
Kedua, untuk menyusun tes standar, dibutuhkan waktu yang lama. Seperti disebutkan bahwa untuk
memperoleh sebuah tes standar melalui prosedur:
Penyusunan
Uji coba
Analisa
Revisi
Edit.

Kelima kegiatan ini membutuhkan waktu lama.[9]

1.1 Jenis Jenis Teknik Non Tes


Teknik non-tes merupakan prosedur pengumpulan data untuk memahami pribadi siswa pada
umumnya yang bersifat kualitatif. Dalam hubungannya dengan memahami kesulitan belajar siswa, berikut
macam macam teknik non tes yang dapat dilakukan:
A. Teknik Observasi
Observasi adalah suatu metode pengumpulan data dengan jalan pengamatan yang bertujuan untuk
mendapatkan data tentang suatu masalah sehingga diperoleh suatu pemahaman dan dilakukan secara
langsung, seksama dan sistematis. Sehingga pengamatan memungkinkan untuk melihat dan mengamati
sendiri kemudian mencatat perilaku dan kejadian yang terjadi pada keadaan sebenarnya. Observasi yang
intensif bisa dilakukan baik di dalam maupun di luar kelas. Pengamat mencatat hal-hal yang berhubungan
dengan perilaku siswa, terutama dalam mengikuti pelajaran maupun dengan teman-temannya. Pengamatan

ini bertujuan untuk mengetahui keseharian peserta didik yang diduga mengalami kesulitan belajar.
Dalam teknik observasi, ada beberapa hal yang perlu dilakukan, diantaranya :
Rencanakan terlebih dahulu observasi yang akan dilakukan, meliputi : Apa yang akan diobservasi , dimana
letak lokasi observasi, kapan observasi akan dilakukan, siapa yang akan melaksanakan observasi tersebut,

siapa yang akan diobservasi, bagaimana melaksanakan observasi tersebut


Lengkapilah dengan catatan selama observasi
Kaji ulang hasil observasi dengan individu-individu yang terlibat

Hal hal yang tidak boleh dilakukan dalam observasi, yaitu:


Menggangu kerja individu yang diobservasi maupun individu lainnya.
Terlalu menekankan pada pekerjaan-pekerjaan yang tidak penting.

Disamping itu, teknik ini memiliki beberapa kelebihan dan kekurangan. Diantaranya :
Kelebihan :
Data yang dikumpulkan melalui observasi cenderung mempunyai keandalan yang tinggi. Kadang observasi
dilakukan untuk mengecek validitas dari data yang telah diperoleh sebelumnya dari individu-individu.
Dapat melihat langsung apa yang sedang dikerjakan, aktivitas yang rumit kadang-kadang sulit untuk
diterangkan.
Dapat menggambarkan lingkungan fisik dari kegiatan-kegiatan, misalnya tata letak fisik peralatan,
penerangan, gangguan suara dan lain-lain.
Dapat mengukur tingkat suatu pekerjaan, dalam hal waktu yang dibutuhkan untuk menyelesaikan satu unit

pekerjaaan tertentu.
Sedangkan kekurangannya adalah sebagai berikut :
Umumnya orang yang diamati merasa terganggu atau tidak nyaman, sehingga akan melakukan

pekerjaannya dengan tidak semestinya.


Dapat mengganggu proses yang sedang diamati.
Orang yang diamati cenderung melakukan pekerjaannya dengan lebih baik dari biasanya dan sering
menutup-nutupi kejelekan-kejelekannya.

B. Teknik Wawancara
Wawancara adalah suatu metode pengumpulan data dengan jalan mengadakan komunikasi dengan
sumber data. Komunikasi tersebut dilakukan dengan dialog (tanya jawab) secara lisan, baik langsung maupun
tidak langsung. Wawancara bisa dilakukan dengan peserta didik yang bersangkutan atau dengan guru, wali
kelas, orang tua maupun teman-temannya bila hal ini diperlukan.

Adapun hal-hal yang perlu dilakukan dalam wawancara, yaitu :


Pewawancara harus mendengar, mengamati, menyelidiki, menanggapi, dan mencatat apa yang sumber data
berikan. Kadang-kadang ia seperti seorang penginterogasi, kadang-kadang secara tajam ia menyerang
dengan menunjukkan kesalahan-kesalahan orang yang diwawancarai, kadang-kadang ia mengklarifikasi,
kadang-kadang pula ia seperti pasif atau menjadi pendengar yang baik. Suksesnya suatu wawancara
tergantung pada kemampuan melakukan kombinasi berbagai keterampilan sesuai dengan tuntutan situasi

dan orang yang diwawancarai.


Dalam proses wawancara, pewawancara harus meredam egonya dan melakukan pengendalian tersembunyi.
Pewawancara memantau semua yang diucapkan oleh dan bahasa tubuh orang yang diwawancarai, sambil
berusaha menciptakan suasana santai yakni suasana yang konduksif bagi berlangsungnya wawancara.
Dalam prakteknya, berbagai pikiran muncul dibenak pewawancara ketika wawancara sedang berlangsung.
Seperti : Apa yang harus saya tanyakan lagi? Bagaimana nada bicara orang yang diwawancarai ini? Dari
gerak tubuh dan nada suaranya, apakah ia terlihat bicara jujur atau mencoba menyembunyikan sesuatu?

Disamping itu, terdapat kelebihan dan kekurangan dalam teknik wawancara. Berikut adalah uraiannya.
Kelebihan:
Flexibility. Pewawancara dapat secara luwes mengajukan pertanyaan sesuai dengan situasi yang
dihadapi pada saat itu. Jika dia menginginkan informasi yang mendalam maka dapat melakukan
probing. Demikian pula jika ingin memperoleh informasi tambahan, maka dia dapat mengajukan

pertanyaan tambahan, bahkan jika suatu pertanyaan dianggap kurang tepat ditanyakan pada saat itu,
maka dia dapat menundanya.
Nonverbal Behavior. Pewawancara dapat mengetahui perilaku nonverbal, misalnya rasa suka, tidak
suka atau perilaku lainnya pada saat pertanyaan diajukan dan dijawab oleh sumber .
Question Order. Pertanyaan dapat diajukan secara berurutan sehingga sumber dapat memahami
maksud penelitian secara baik, sehingga dapat menjawab pertanyaan dengan baik pula.
Respondent alone can answer. Jawaban tidak dibuat oleh orang lain tetapi benar oleh sumber yang
telah ditetapkan.
Melalui wawancara, dapat ditanyakan hal-hal yang rumit dan mendetail.
Completeness. Pewawancara dapat memperoleh jawaban atas seluruh pertanyaan yang diajukan.
Kelemahan :
Mengadakan wawancara dengan individu satu persatu memerlukan banyak waktu dan tenaga dan juga
mungkin biaya.
Walau dilakukan secara tatap muka, namun kesalahan bertanya dan kesalahan dalam menafsirkan jawaban,
masih bisa terjadi. Sering atribut (jenis kelamin, etnik, status sosial, jabatan, usia, pakaian, penampilan
fisik, dsb) sumber dan juga pewawancara mempengaruhi jawaban.
Keberhasilan wawancara sangat tergantung dari kepandaian pewawancara dalam melakukan hubungan
antar manusia (human relation).
Wawancara tidak selalu tepat pada kondisi-kondisi tempat tertentu, misalnya di lokasi-lokasi ribut dan
ramai.
Sangat tergantung pada kesediaan, kemampuan dan keadaan sementara dari subyek wawancara, yang
mungkin menghambat ketelitian hasil wawancara.
C. Angket
Angket (Questioner) adalah alat pengumpul data melalui komunikasi tidak langsung, yaitu melalui tulisan.
Angket ini berisi daftar pertanyaan yang ditujukan kepada responden untuk dijawabnya, dimana peneliti tidak
langsung bertanya jawab dengan responden, yang bertujuan untuk mengumpulkan keterangan tentang berbagai hal
yang berkaitan dengan responden. Karena angket dijawab atau diisi oleh responden dan peneliti tidak selalu bertemu
langsung dengan responden, maka dalam penyusuna angket perlu diperhatikan beberapa hal. Pertama, sebelum
butir-butir pertanyaan atau pernyataan ada pengantar atau petunjuk pengisian. Kedua, butir-butir pertanyaan
dirumuskan secara jelas menggunakan kata-kata yang lazim digunakan (popular), kalimat tidak terlalu panjang. Dan
Ketiga, untuk setiap pertanyaan atau pernyataan terbuka dan berstruktur disediakan kolom untuk menuliskan
jawaban atau respon dari responden secukupnya.
Berikut kelebihan menggunakan angket :
Bila lokasi responden jaraknya cukup jauh, metode pengumpulan data yang paling mudah adalah dengan
angket.
Pertanyaan-pertanyan yang sudah disiapkan adalah merupakan waktu yang efisien untuk menjangkau
responden dalam jumlah banyak.
Dengan angket akan memberi kesempatan mudah pada responden untuk mendiskusikan dengan temannya
apabila menemui pertanyaan yang sukar dijawab.

Responden dapat lebih leluasa menjawabnya dimana saja, kapan saja, tanpa terkesan terpaksa.
Kelemahan dari angket :
o Apabila penelitian membutuhkan reaksi yang sifatnya spontan dengan metode ini adalah kurang tepat.
o Metode ini kurang fleksibel, kejadiannya hanya terpancang pada pertanyaan yang ada.
o Jawaban yang diberikan oleh responden akan terpengaruh oleh keadaan global dari pertanyaan. Sangat
mungkin jawaban yang sudah diberikan di atas secara spontan dapat berubah setelah melihat pertanyaan di
o

lain nomor.
Ada kemungkinan terjadi respons yang salah dari responden. Hal ini terjadi karena kurang kejelasan
pertanyaan atau karena keragu-raguan responden menjawab.

Karakteristik pertanyaan pada angket:


Susun kalimat sederhana tapi jelas
Konfidensial : Data yang diberikan responden merupakan rahasia informasi yang dapat dipercaya.
Anonim : Nama dari responden seyogyanya bukan menjadi masalah yang penting dalam penelitian.
Pertanyaan mudah dipahami oleh responden.
Spesifik : Pertanyaan harus dirumuskan secara spesifik dan jelas.
Ambigiositas : Bila pertanyaan bersifat mendua arti akan menyulitkan bagi responden untuk menjawabnya.

Contoh : Anda suka naik gunung dengan sepeda dan naik kuda? Disini dua pertanyaan ditanyakan bersama.
Faktual
:
Pertanyaan
seyogyanya
bersifat
meminta
fakta
bukan
opini.
Contoh : beberapa orang terbunuh dalam peperangan itu?(fakta) . Bagaimana pendapat anda pada
pembunuhan itu. (opini)
Ketidakjelasan atau kesamaran : Pertanyaan seyogyanya tidak mengandung ketidak jelasan atau samarsamar keraguan. Contoh : Pada suatu pertandingan sepak bola, anda suka bila ada taruhannya?
Pertanyaan seyogyanya tidak memberi petunjuk responden terarah pada suatu masalah tertentu. Contoh :
Bukankah anda berfikir bahwa menambah dosis obat yang diminum membahayakan, bukan?
Pertanyanan
hendaknya
tidak
mempersukar
responden
untuk
menjawabnya.
Contoh : Berapa kali anda setiap hari mandi atau sikat gigi?
Pertanyaan hendaknya jangan bersifat pribadi. Kecuali kalau perlu sekali, hindari pertanyaan yang bersifat
pribadi. Contoh : Apakah anda suka kawin lagi ?
Petanyaan hendaknya besifat logis. Tanpa bertanya apakah anda mempunyai TV? Sudah ditanya
Program TV apa yang anda suka?

D. Sosiometri
Sosiometri adalah alat yang tepat untuk mengumpulkan data mengenai hubungan - hubungan
sosial dan tingkah laku sosial murid (I. Djumhur dan Muh. Surya). Sosiometri adalah alat untuk
meneliti struktur sosial dari suatu kelompok individu dengan dasar penelaahan terhadap relasi sosial
dan status sosial dari masing-masing anggota kelompok yang bersangkutan (Depdikbud). Sosiometri
adalah alat untuk dapat melihat bagaimana hubungan sosial atau hubungan berteman seseorang (Bimo
Walgito).
Sosiometri merupakan suatu metode untuk memperoleh data tentang hubungan sosial dalam suatu
kelompok, yang berukuran kecil sampai sedang (10 50 orang ), berdasarkan preferensi pribadi antara
anggota-anggota kelompok (WS. Winkel). Sosiometri adalah suatu alat yang dipergunakan mengukur
hubungan sosial siswa dalam kelompok ( Dewa Ktut Sukardi,). Dari beberapa pendapat di atas dapat
disimpulkan pengertian sosiometri adalah suatu teknik untuk mengumpulkan data tentang hubungan
sosial seorang individu dengan individu lain, struktur hubungan individu dan arah hubungan sosialnya
dalam suatu kelompok.
Macam macam Sosimetri:
Tes Sosiometri ada dua macam, yaitu :
1. Tes yang mengharuskan untuk memilih beberapa teman dalam kelompok sebagai pernyataan
kesukaan untuk melakukan kegiatan tertentu ( criterium ) bersama sama dengan teman-teman yang dipilih.

10

2. Tes yang mengharuskan menyatakan kesukaannya atau ketidaksukaannya terhadap temanteman dalam kelompok pada umumnya.
Tes sosiometri jenis pertama paling sering digunakan di institusi-institusi pendidikan dengan
tujuan meningkatkan jaringan hubungan sosial dalam kelompok,sedangkan jenis yang kedua jarang
digunakan, dan inipun untuk mengetahui jaringan hubungan sosial pada umumnya saja.
Ciri khas penggunaan angket sosiometri:
Ciri khas penggunaan angket sosiometri atau tes sosiometri , yang terikat pada situasi pergaulan
sosial atau kriterium tertentu.
1. Dijelaskan kepada siswa yang tergabung dalam suatu kelompok, misalnya satuan kelas, bahwa
akan dibentuk kelompok-kelompok lebih kecil (4-6 orang ) dalam rangka mengadakan kegiatan tertentu,
seperti belajar kelompok dalam kelas, rekreasi bersama ke pantai, dsb. Kegiatan tertentu itu merupakan
situasi pergaulan social yang menjadi dasar bagi pilihan-pilihan.
2. Setiap siswa diminta untuk menulis pada blanko yang disediakan nama beberapa teman di
dalam kelompok, dengan siapa dia ingin dan lebih suka melakukan kegiatan itu. Jumlah teman yang boleh
dipilih biasanya tiga orang, dalam urutan pilihan pertama, kedua, dan ketiga. Yang terungkap dalam
pilihan-pilihan itu bukanlah jaringan hubungan sosial yang sekarang ini sudah ada, melainkan keinginan
masing-masing siswa terhadap kegiatan-kegiatan tertentu dalam hal pembentukan kelompok. Pilihanpilihan itu dapat berubah, bila tes sosiometri diterapkan lagi pada lain kesempatan terhadap kegiatan lain
(kriterium berbeda ). Ada kemungkinan siswa akan memilih teman-teman yang lain untuk belajar bersama
di kelas, dibanding dengan pilihan-pilihannya untuk pergi piknik bersama. Pilihan-pilihan siswa tidak
menyatakan alasan untuk memilih, kecuali bila hal itu dinyatakan dalam tes. Pilihan-pilihan juga tidak
menyatakan tentang sering tidaknya bergaul dengan teman-teman tertentu, atau intim tidaknya pergaulan
dengan teman-teman tertentu; bahkan tidak mutlak terungkapkan taraf popularitas siswa tertentu, dalam arti
biasanya mempunyai banyak teman, beberapa teman atau sama sekali tidak mempunyai teman.
3. Setiap siswa dalam kelompok menangkap dengan jelas kegiatan apa yang dimaksud, dan
mengetahui bahwa kegiatan itu terbuka bagi semua.
4. Pilihan-pilihan dinyatakan secara rahasia dan hasil keseluruhan pemilihan juga dirahasiakan.
Hal ini mencegah timbulnya rasa tidak enak pada siswa, yang tidak suka pilihannya diketahui umum atau
akan mengetahui bahwa ia tidak dipilih. Ciri kerahasiaan juga memungkinkan bahwa dibentuk kelompokkelompok kecil yang tidak seluruhnya sesuai dengan pilihan-pilihan siswa.
5. Biasanya siswa diminta untuk menyatakan siapa yang mereka pilih, bukan siapa yang tidak
mereka pilih dalam urutan tidak begitu disukai, kurang disukai, tidak disukai, sama sekali tidak disukai.
menyatakan pilihan yang negatif mudah dirasakan sebagai beban psikologis.
6. Tenaga kependidikan yang dapat menerapkan tes sosiometri adalah guru bidang studi, wali
kelas, dan tenaga ahli bimbingan, tergantung dari kegiatan yang akan dilakukan.

11

Tahap-tahap Pelaksanaan Sosiometri


1. Tahap Persiapan. Menentukan kelompok siswa yang akan diselidiki. Memberikan informasi
atau keterangan tentang tujuan penyelenggaraan sosiometri. Mempersiapkan angket sosiometri.
2. Tahap Pelaksanaan. Membagikan dan mengisi angket sosiometri. Mengumpulkan kembali dan
memeriksa apakah angket sudah diisi dengan benar.
3. Tahap Pengolahan. Memeriksa hasil angket, Mengolah data sosiometri dengan cara menganalisa
indeks, menyusun table tabulasi, membuat sosiogram.
Kegunaan Sosiometri:
Sosiometri dapat dipergunakan untuk :
1. Memperbaiki hubungan insani.
2. Menentukan kelompok kerja
3.Meneliti kemampuan memimpin seseorang individu dalam

kelompok tertentu untuk suatu

kegiatan tertentu.
4.Mengetahui bagaimana hubungan sosial / berteman seorang individu dengan individu lainnya.
5.Mencoba mengenali problem penyesuaian diri seorang individu dalam kelompok sosial tertentu.
6.Menemukan individu mana yang diterima / ditolak dalam kelompok social tertentu.
Norma-norma Sosiometri:
Baik tidaknya hubungan sosial individu dengan individu lain dapat dilihat dari beberapa segi yaitu
:
1. Frekwensi hubungan, yaitu sering tidaknya individu bergaul. makin sering individu bergaul,
pada umumnya individu itu makin baik dalam segi hubungan sosialnya. Bagi individu yang mengisolir diri,
di mana ia kurang bergaul, hal ini menunjukkan bahwa di dalam pergaulannya kurang baik.
2.

Intensitas

hubungan,

yaitu

intim

tidaknya

individu

bergaul.

Makin

intim/mendalam seseorang dalam hubungan sosialnya dapat dinyatakan bahwa hubungan sosialnya makin
baik. Teman intim merupakan teman akrab yang mempunyai intensitas hubungan yang mendalam.
3. Popularitas hubungan, yaitu banyak sedikitnya teman bergaul. Makin banyak teman di dalam
pergaulan pada umumnya dapat dinyatakan makin baik dalam hubungan sosialnya. Faktor popularitas
tersebut digunakan sebagai ukuran atau kriteria untuk melihat baik tidaknya seseorang dalam hubungan
atau kontak sosialnya.
Manfaat Sosiometri:
Manfaat Sosiometri dalam Bimbingan. Dengan mempelajari data sosiometri seorang konselor
dapat :

12

1. Menemukan murid mana yang ternyata mempunyai masalah penyesuaian diri dalam
kelompoknya.
2. Membantu meningkatkan partisipasi sosial diantara murid-murid dengan penerimaan sosialnya.
3. Membantu meningkatkan pemahaman dan pengertian murid terhadap masalah pergaulan yang
sedang dialami oleh individu tertentu.
4. Merencanakan program yang konstruktif untuk menciptakan iklim sosial yang lebih baik dan
sekaligus membantu mengatasi masalah penyesuaian di kelas tertentu. Cara untuk menciptakan suasana /
iklim sosial yang baik : Membentuk kelompok belajar / kelompok kerja . Mempersatukan kelompok
minoritas di dalam satu kelas. Menciptakan hubungan baik dan harmonis. Membangun perasaan berhasil
dan berprestasi. Hendaknya ditanamkan rasa bahwa kalau kompak, akan berhasil baik.

RUBRIK
2.1. Pengertian Penilaian Rubrik
Rubrik merupakan panduan penilaian yang menggambarkan kriteria yang diinginkan guru dalam menilai
atau memberi tingkatan dari hasil pekerjaan siswa Rubrik perlu memuat daftar karakteristik yang
diinginkan yang perlu ditunjukkan dalam suatu pekerjaan siswa disertai dengan panduan untuk mengevaluasi
masing-masing karakteristik tersebut.
Rubrik menurut beberapa pandangan para ahli adalah:
Menurut Arens : Rubrik adalah Deskripsi terperinci tentang tipe kinerja tertentu dan kriteria yang akan
digunakan untuk menilainya
Menurut Bernie Dodge dan Nancy Pickett : Rubrik adalah dalah alat skoring untuk asesmen yang bersifat
subjektif, yang didalamnya terdapat satu set kriteria dan standar yang berhubungan dengan tujuan pembelajaran
yang akan diases ke anak didik.
Menurut Nitko : Rubrik adalah suatu alat yang berisi seperangkat aturan yang digunakan untuk mengases
kualitas dari performansi/kinerja mahasiswa/ peserta didik .
Menurut Heidi Goodrich Andrade : Rubrik adalah suatu alat penskoran yang terdiri dari daftar seperangkat
kriteria atau apa yang harus dihitung.
Tujuan dari penilaian rubrik yaitu siswa diharapkan secara jelas memahami dasar penilaian yang akan
digunakan untuk mengukur suatu kinerja siswa. Kedua pihak (guru dan siswa) akan mempunyai pedoman
bersama yang jelas tentang tuntutan kinerja yang diharapkan. Rubrik diharapkan pula dapat menjadi pendorong
atau motivator bagi siswa dalam proses pembelajaran.
2.2. Fungsi Penilaian Rubrik
Adapun fungsi atau kegunaan dari penilaian rubrik adalah sebagai berikut :

Rubrik menjelaskan deskripsi tugas


Rubrik memberikan informasi bobot penilaian
Siswa memperoleh umpan balik yang cepat dan akurat

13

Penilaian lebih objektif dan konsisten


Para peserta didik jadi pembelajar aktif
Para peserta didik memperoleh "content knowledge" dan "procedural knowledge".
Para peserta didik dapat menilai kinerja kelompoknya sendiri
Baik pendidik maupun peserta didik memperoleh alat refleksi yang efektif tentang proses pembelajaran

yang telah berlangsung.

Sebagai alat atau pedoman penilaian kinerja atau hasil kerja mahasiswa.
2.3. Berbagai Variasi Penggunaan Rubrik
Rubrik tiga sampai lima level dan rubrik panduan penilaian merupakan jenis rubrik yang sering
digunakan dalam penilaian. Akan tetapi ternyata dalam kelas kelas khusus seperti lab, managemen, desain
grafis dan studio seni perlu dibuat jenis rubrik yang lain, walaupun secara essensi tidak berbeda dengan rubrik
yang baku.
Perbedaannya terletak pada proses pengembangan dan isi rubrik dalam menetapkan kegiatan tugas,
variasi ini kemudian membutuhkan sedikit format sedikit berbeda, tetapi sebenarnya tidak berbeda dari rubrik
yang telah di bahas sebelumnya. Karena semua variasi dari rubrik ini menyertakan komponen dasar dari skala,
dimensi, dan deskripsi dimensi yang diatur dalam sebuah table.
1.
Rubrik Bertahap
Untuk tugas yang dikerjakan bertahap rubrik ini dipakai untuk menilaia dimanaproses pembuatan tugas sama
pentingnya dengan hasil akhir. Rubrik ini bisa digunakan untuk waktu lama, sehingga bisa menjadi alat
monitoring siswa. Rubrik ini memberikan pengetahuan penambahan pengetahuan siswa tentang penyelesaian
tugas sambil juga memberikan feedback cepat terhadap apa saja yang sudah diperolehnya sejak awal. Kelemahan
dari rubrik ini yaitu tidak dapat sespesifik rubrik akhir (yang merupakan rubrik tak bertahap). Namun, rubrik
bertahap ini tidak hanya menunjukkan kepada siswa tentang langkah-langkah yang sudah diselesaikan, tetapi
juga langah-langkah yang harus dipenuhi.
2.
Rubrik Makalah Riset
Digunakan biasanya untuk proyek yang perlu waktu lama. Rubrik ini memiliki kesamaan dari rubrik bertahap,
karena terdapat elemen dari rubrik bertahap yang bisa diambil, akan tetapi rubrik ini juga bisa menjadi panduan
siswa untuk memulai penelitian dan juga menjadi bahan refleksi mengenai apa yang harus dilakukan, semacam
pengalaman.
3.
Rubrik Rangkap
Rubrik ini dipakai untuk merencanakan penaksiran atau perkiaraan di bandingkan untuk menilai. Rubrik ini
digunakan untuk menilai pada akhirnya dipakai sebagai alat penilan juga tugas yang kompleks. Pendekatan
portofolio rangkap menyatukan semua bagian-bagian dasar dari rubrik sederhana, tetapi menciptakan rubrikrubrik khusus untuk setiap dimensinya.
2.4. Isi Rubrik
Dalam setiap komponen terdiri dari satu atau beberapa dimensi. Setiap dimensi harus didevinisikan
supaya lebih jelas harus diberi contoh atau ilustrasi. Dimensi-dimensi kinerja inilah yang akan ditentukan

14

mutunya atau diberi peringkat. Setiap kategori mutu sebaiknya diberi contoh-contoh kinerja agar mempermudah
guru atau pemberi peringkat. Secara singkat scoring rubrik terdiri dari beberapa elemen, yaitu :
1.
2.
3.
4.

Dimensi, yang akan dijadikan dasar menilai kinerja anak didik.


Definisi dan contoh, yang merupakan penjelasan mengenai setiap dimensi
Skala yang akan digunakan untuk menilai dimensi
Standar untuk setiap katagori kinerja.
Rubrik biasanya dibuat dalam bentuk tabel dua lajur, yaitu baris yang berisi kriteria dan kolom yang

berisi mutu. Kriteria dapat dinyatakan secara garis besar. Kemudian dirinci menjadi komponen-komponen
penting atau dapat pula komponen-kpmponen ditulis langsung tanpa dikelompokkan dalam garis besar.
Rubrik dapat bersifat menyeluruh atau berlaku umum dan dapat juga bersifat khusus atau hanya berlaku
untuk suatu topik tertentu. Rubrik yang bersifat menyeluruh dapat disajikan dalam bentuk holistic rubrik. Rubrik
holistik adalah pedonan untuk menilai berdasarkan kesan keseluruhan atau kombinasi semua kriteria. Serta dapat
pula dalam bentuk analytic rubrik, rubrik analitik adalah pedoman untuk menilai berdasarkan beberapa kriteria
yang ditentukan. dengan menggunakan rubrik ini dapat dianalisis kelemahan atau kelebihan siswa.
Contoh rubrik holistik :
Skor
4

Deskripsi
Respons terhadap tugas sangat spesifik. Informasi yang diberikan akurat dan
memperlihatkan pemahaman yang utuh. Respons dikemukakan dalam suatu
tulisan yang lancar dan hidup. Jawaban singkat dan langsung pada masalah yang
diminta serta kesimpulan dan pendapat mengalir secara logis. Secara menyeluruh,
respons lengkap dan memuaskan.
Respons sudah menjawab tugas yang diberikan. Informasi yang diberikan akurat.
Respons dikemukakan dalam tulisan yang lancar tapi uraian cenderung brteletele.

Respons kurang memuaskan. Walaupun informasi yang diberikan akurat tetapi


tidak ada kesimpulan dan pendapat serta kurang logis.

Respons tidak menjawab tugas yang diberikan. Banyak informasi yang hilang
dan tidak akurat. Tidak ada kesimpulan atau pendapat.

Contoh rubrik analitik :


Sko

Grafik

Spesifikasi

Rasional

r
4

Gambar dan pertelaan

Semua spesifikasi yang

Rasio yang diberikan

tentang grafik yang

diberikan benar

jelas.

disajikan benar
Sebagian terbesar

Semua spesifikasi yang

Penjelasan diberikan,

gambar dan pertelaan

diberikan benar

tetapi msih

yang diberikan benar

membutuhkan

15

Beberapa gambar dan

Hanya sebagian

hambatan
Rasional yang

pertelaan yang disaji

spesifikasi yang benar

diberikan tidak lengkap

benar
Gambar dan pertelaan

Spesifikasi yang

Rasional yang

yang diberikan sangat

diberikan salah

diberikan tidak benar

terbatas dan hanya


sedikit yang benar

2.5. Macam-Macam Penilaian Rubrik

Jangkar Penampilan : Konsisten dan fokus


Menandai salah satu tugas dari sekian tumpukan tugas yang banyak sebagai salah satu cara untuk fokus

pada pekerjaannya. Beberapa orang menggunakan trik dengan menempelkan permen karet pada setiap satu tugas
yang telah diselesaikan dari sekian jumlah tugas-tugas yang telah disusun (ditumpuk). Melalui rubrik kita bisa
memfokuskan perhatian pada tugas yang kita pikirkan sebagai tugas terbaik atau terburuk.

Menyokong Feed back yang detail dan formatif


Dengan rubrik kita bias melakukan pekerjaan lebih cepat karena tidak perlu menuliskan catatan-catatan

ekstensif pada setiap makalah tugas. Karena hanya dengan mencentang atau membuat lingkaran pada rubrik,
atau menuliskan satu atau dua kata pada rubrik panduan penilaian.
Kunci dari penilaian rubrik adalah cek, lingkaran dan kata-kata terpilih, memudahkan dan mempercepat
proses penilaian sambil tetap memberikan feedback yang detail dan formatif. Pilahan pilhan itu tergantung
jenis rubrik yang dipakai, seperti :
a.
b.
c.

Rubrik tiga sampai lima level menggunakan kotak untuk dicenteng


Rubrik tiga sampai lima level menggunakan lingkaran pada teks (lingkaran)
Rubrik panduan penilaian untuk feedback naratif.
Rubrik tiga sampai lima level menggunakan kotak untuk dicenteng dalam proses pembuatannya

membutuhkan waktu yang banyak, tetapi membutuhkan waktu sedikit dalam penggunaannya.
Rubrik tiga sampai lima level menggunakan kotak untuk dicenteng merupakan rubrik yang dianggap
paling tepat untuk menilai Sesutu yang membutuhkan feedback detail dan kecepatan presentasi oral. Rubrik tiga
sampai lima level sangat menghemat waktu dalam penilaiannya.

Feedback yang fleksibel dan individual (rubrik panduan penilaian)


Rubrik dengan skala level tiga sampai lima level baik yang dicentang atau dilingkari ketika memberikan

penilaian mampu melakukan penghematan waktu dan ketika memberikan feedback kepada siswa dan kaya akan
informasi. Rubrik tiga samapai lima level memudahkan penggunaanya tetapi susah pembuatannya. Hal ini
berbeda dengan rubrik panduan penilaian. Rubrik panduan penilaian mudah dalam pembuatannya tetapi lebih
lama dalam melakukan penilaian aktual terhadap siswa. Akan tetapi rubrik panduan penilaian pada prakteknya

16

ternyata terkadang lebih menghemat waktu, selain itu rubrik panduan penilaian memiliki manfaat ganda, yaitu
individualisasi dan fleksibelitas yang lebih besar dalam penilaian.
Rubrik panduan penilaian dapat digunakan untuk menilai kegiatan siswa dimana siswa bebas berkreasi
dalam melaksanakan tugas-tugasnya. Dalam rubrik panduan penilaian dimungkinkan adanya catatan-catatan
terhadap karya siswa pada rubrik. Catatan itu merupakan komentar terhadap kriteria (level) kemampuan siswa
dalam berbagai dimensi.

Menampilkan feedback sumatif : Menetapkan Nilai.


Apabila pada masing masing dimensi pada rubrik telah ditetapkan, maka penyimpulan dapat menjadi

latihan matematis. Setiap dimensi dalam rubrik diberi nilai sebagai point, dan siswa dinilai dari seberapa banyak
mereka menempuh point-point yang terdapat dalam rubrik.

Menilai metode pengajaran sendiri


Selain digunakan untuk menilai siswa, rubrik juga bisa digunakan untuk menilai diri sendiri, untuk

feedback pribadi. Kita bisa melihat pekerjaan siswa untuk mengukur hasil pekerjaan diri sendiri.

2.6. Langkah Pengembangan Rubrik


Dalam pengembangan rubrik, perlu diperhatikan beberapa langkah. Donna Szpyrka dan Ellyn B. Smith
(1995) menyebutkan bahwa langkah-langkah pengembangan rubrik adalah sebagai berikut :
1.
2.

Menentukan konsep, keterampilan atau kinerja yang akan diasesmen.


Merumuskan atau mendefinisikan dan menentukan urutankonsep atau keterampilan yang akan diasesmen

ke dalam rumusan atau definisi yang menggambarkan aspek kognitif dan aspek kinerja.
3.
Menentukan konsep atau keterampilan yang terpenting dalam tugas yang harus diasesmen.
4.
Menentukan skala yang akan diasesmen.
5.
Mendeskripsikan kinerja mulai dari yang diharapkan sampai dengan kinerja yang tidak diharapkan (secara
gradual). Deskripsi konsep atau keterampilan kinerja tersebut dapat diikuti dengan memberikan angka pada
setiap gradasi atau member deskripsi gradasi.
6.
Melakukan uji coba dengan membandingkan kinerja atau hasil kerja dengan rubrik yang telah
dikembangkan.
7.
Berdasarkan hasil penilaian terhadap kinerja atau hasil kerja dari uji coba tersebut kemudian dilakukan
revisi terhadap deskripsi kinerja maupun konsep dan keterampilan yang akan diasesmen.
8.
Memmikirkan kembali tentang skala yang digunakan.
9.
Merevisi skala yang digunakan.
Walaupun suatu rubrik telah diupayakan untuk disusun dengan sebaik-baiknya tetapi harus disadari
bahwa tidak mungkin rubrik yang tersusun itu merupakan sesuatu yang sempurna atau dianggap sebagai satusatunya kriteria untuk menialai kinerja siswa dalam satu kegiatan.
2.7. Contoh Rubrik Penilaian
Contoh rubrik penilaian presentasi:

17

Nama kelompok

: Newton I

Waktu presentasi

: Selasa, 15 Mei 2013

Materi

: Rangkaian Listrik ( Seri dan Paralel)

Anggota

: Agustina Sukamto, Ghia Sartika, Hadist Hasanah,

No
.
1.

Kriteria penilaian

Kurang

Cukup

Baik

Sangat baik

20 39

40 59

60 79

80 98

Penguasaan materi

80

Alat peraga & power

2.

95

point
Kekompakan/pembagian

3.

79

kerja

4.

Penyampaian

Kelompok penilai

: Newton II

Anggota

: Bagas Adhika Putra

92

Fiki Adwantika
Hilmi Aziz
Total nilai

: 346

Rata-rata

: 86, 5 ( sangat baik )

Contoh rubrik penilaian:


Standar Kompetensi :

Memahami berbagai sifat dalam perubahan fisika dan kimia.

Kompetensi Dasar

Menyimpulkan perubahan fisika dan kimia berdasarkan hasil percobaan sederhana.

Indikator
1.
2.

:
:

Membuat kesimpulan dari hasil percobaan perubahan fisika dan perubahan kimia.
Membandingkan karakteristik perubahan fisika dan perubahan kimia berdasarkan percobaan.

Tujuan Pembelajaran :
1.
2.
3.
4.

Menjelaskan sebab-sebab terjadinya perubahan fisika dan kimia.


Menyebutkan ciri-ciri perubahan fisika dan perubahan kimia.
Mengamati beberapa peristiwa yang menunjukkan perubahan fisika dan perubahan kimia.
Menyebutkan perubahan fisika dan kimia dalam kehidupan sehari-hari.

Tugas
1.

Peserta didik dapat:

Produk

Peserta didik dapat menjawab pengertian perubahan fisika dan kimia serta menyebutkan beberapa

contohnya.

18

Peserta didik dapat mengetahui sebab-sebab terjadinya perubahan fisika (pelepasan dan

pengambilan panas, pencampuran zat; selama zat-zat yang bercampur tidak membentuk zat baru dan di potong
atau dibelah) melalui diskusi kelas.

Peserta didik dapat mengetahui sebab-sebab terjadinya peruba-han kimia ( pembakaran,


pencampuran zat) melalui diskusi kelas.
2.

Kinerja
Peserta didik diminta melakukan percobaan sederhana perubahan fisika dengan menggunakan es

batu, air, gelas kimia, gula, teh dan pengaduk.

Peserta didik secara berkelompok melakukan eksperimen perubahan fisika dengan menggunakan
kertas putih dan korek

api.

Rubrik Laporan Percobaan :


N
o
1

Aspek
Judul
percobaan

Sko
r
0

Judul percobaan tidak ditulis.

Judul percobaan ditulis tetapi


tidak tepat/sesuai dengan
tema praktikum.
Judul percobaan ditulis dan
tepat.

Tujuan
percobaan

2
2

Rumusan
masalah

0
2

Dasar teori

Keterangan

10

Ditulis seperti pada petunjuk


praktikum.
Tujuan ditulis dalam bentuk
ABCD (audience, behaviour,
condition, and degree)
Rumusan masalah tidak
ditulis.
Rumusan masalah ditulis
tetapi tidak mengarah pada
hubungan variabel manipulasi
dan respon.
Rumusan masalah ditulis dan
mengarah pada hubungan
variabel manipulasi dan
respon.

Memuat teori tetapi kurang


relevan dengan meteri
praktikum asam-basa.
Memuat secara singkat teori
yang relevan dengan meteri
praktikum.

19

Alat dan
bahan

Prosedur
kerja

15

Memuat secara lengkap teori


yang relevan dengan meteri
praktikum.

Alat dan bahan ditulis namun


tidak disertai dengan jumlah.

Alat dan bahan ditulis lengkap


disertai dengan jumlah dan
ukuran.

Ditulis seperti petunjuk pada


praktikum (menggunakan kata
perintah).
Ditulis dengan menggunakan
kata kerja bukan kata
perintah).
Ditulis lengkap tanpa alur
kerja.
Ditulis lengkap beserta alur
kerja.

2
5
10

Data
pengamatan

Diskusi dan
pembahasa
n

10
20
25

Simpulan

Data yang ditulis hanya


kondisi sesudah perlakuan
(setelah diberi indikator
alami).
Data yang ditulis mencakup
kondisi sebelum dan sesudah
perlakuan.
Membahas hasil pengamatan
tanpa menghubungkan
dengan dasar teori.
Mengubungkan hasil
pengamatan dengan dasar
teori namun tidak lengkap.
Menghubungkan hasil
pengamatan dengan dasar
teori dan dilengkapi dengan
bagan serta paragraf yang
mengarah pada simpulan.

Simpulan sesuai dengan hasil


praktikum tetapi tidak
mengarah pada tujuan
praktikum.

20

1
0

Daftar
pustaka

10

Simpulan sesuai dengan hasil


praktikum dan mengarah
pada tujuan praktikum.

Tidak semua sumber pustaka


ditulis.
Semua sumber pustaka ditulis
namun ada satu atau lebih
sumber pustaka yang tata
tulisannya kurang benar.
Semua sumber pustaka ditulis
dan susunannya benar.

1
1

Jawaban
petanyaan

Semua pertanyaan yang ada


dijawab dengan benar.

1
2

Laporan
sementara

Laporan sementara tidak


dilampirkan.
Laporan sementara
dilampirkan.
Lampiran foto praktikum
(sebelum dan sesudah
praktikum) tidak dilampirkan.
Lampiran foto praktikum
dilampirkan.

5
1
3

lampiran

0
3

1
4

Ketepatan
waktu
mengumpul
kan laporan

0
1
3
5

Laporan menyerahkannya
lebih dari satu minggu
terlambat
Sampai satu minggu
terlambat
Sampai dengan dua hari
terlambat
Menyerahkan laporan tepat
waktu

21

ANALISIS BUTIR SOAL


2.1 Pengertian Analisis dan Macam- macamnya
Analisis soal dilakukan untuk mengetahui berfungsi tidaknya soal. Analisis bertujuan untuk mengadakan
identifikasi soal- soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal, dapat diperoleh
informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.
Analisis pada umumnya dilakukan melalui dua cara, yaitu Analisis Kualitatif (Qualitatif Control) dan Analisis
Kuantitatif (Quantitatif Control). Analisis kualitatif sering pula dinamakan sebagai Validitas Logis yang
dilakukan sebelum soal, digunakan untuk melihat berfungsi tidaknya sebuah soal. Analisis soal secara kuantitatif
sering pula dinamakan sebagai Validitas Empiris yang dilakukn untuk melihat lebih berfungsi tidaknya sebuah
soal, setelah itu soal diujicobakan kepada sampel yang representative.
1. Analisis Kualitatif
Analisis kualitatif sering juga disebut sebagai validitas logis yaitu berupa penelaahan yang dimaksudkan untuk
menganalisis soal ditinjau dari segi teknis, isi, dan editoral. Analisis secara teknis dimaksudkan sebagai
penelaahan soal berdasarkan prinsip- prinsip pengukurandan format penulisan soal. Analisis secara isi
dimaksudkan sebagai penelaahan khusus yang berkaitan denan kelayakan pengetahuan yang ditanyakan. Analisis

22

secara editoral dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan keseluruhan format dan
keajegan editoral dari soal yang satu ke soal yang lainnya. Analisis kulitatif lainnya dapa juga dikategorikan dari
segi materi, konstruksi, dan bahasa. Analisis materi berkaitan dengan substansi keilmuan yang ditanyakan dalam
soal serta tingkat kemampuan yang sesuai dengan soal. Analisis konstruksi umumnya berkaitan dengan teknik
penulisan soal. Analisis bahasa berkaitan dengan pengunaan bahasa yang baik dan benar menurut ejaan yang
sesuai.
Berikut contoh analisis soal kualitatif:

Contoh soal pilihan ganda yang kurang baik

Seorang anak melakukan perhitungan bilangan pecahan . berapakah hasilnya?


a)
b)
c)
d)

3
2
1

Apabila kita telaah secara kualitatif, sepintas dapat kita nyatakan bahwa soal tersebut kurang bak. Ada beberapa
hal yang harus diperbaiki. Pertama, pokok soal bertele-tele dan tidak jelas. Kedua, alternative jawaban a, b, dan c
bukan merupakan alternative yang baik. Sebab, angka- angka tersebut tidak sepadan dengan pilihan yang
lainnya.

Contoh soal essay yang kurang baik

Seorang pedagang buah- buahan setiap harinya dari pagi, petang, dan sampai malam hari dapat menjual 15kg
buah- buahan alpukat, 10kg buah- buahan apel, dan 10kg buah- buahan belimbing. Ia bekarja keras untuk dapat
menjual buah- buahan tersebut. Sebutkanlah berapa banyak buah- buahan yang pedagang itu dapat menjualnya
selama ia bekerja suntuk selama 30 hari?
Sepintas bahasa yang digunakan dalam contoh soal uraian diatas kurang baik, bertele-tele,dan tidak tegas. Siswa
akan mengalami kesulitan dalam menyelesaikan soal. Analisis kualitatif dapat dilakukan dengan menghilangkan
beberapa kata yang tidak diperlukan.
2. Analisis Kuantitatif
Untuk memperoleh informasi tentang soal tes, maupun peserta tes, perlu dilakukan analisis kuantitatif. Hasil
analisis dimaksudkan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang
kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya
rendah. Informasi lainnya adalah bagaimana soal dapat membedakan antara individu maupun antar kelompok.
Analisis soal secara kuantitaif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh
secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran,
daya pembeda, dan reliabilitas. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal,
yaitu apakah suatu soal dapat:
1)
Diterima karena telah didukung oleh data statistic yang memadai
2)
Diperbaiki, karena terbukti terdapat beberapa kelemahan
3) Tidak digunakan sama sekali, karena terbukti secara empiris tidak berfungsi sama sekali

23

2.2 Langkah Analisis Butir Soal

Dalam analisis butir soal perlu langkah persiapan yang harus dilakukan. Adapun langkah yang dimaksud
adalah sebagai berikut :
1.

Mengurutkan skor pada lembar jawaban peserta didik dari skor yang tertinggi berturut-turut sampai

yang terbawah.
2.

Mengambil sebanyak 27,5% dari jumlah peserta didik dari skor yang tertinggi dan 27,5% dari skor

yang terendah. Kelompok pertama disebut kelompok tinggi (kelompok peserta didik yang nilainya
tinggi), sedangkan yang kedua disebut kelompok rendah, dan sisanya sebagai kelompok tengah.
Pembagian menjadi tiga kelompok tersebut terutama disarankan jika jumlah peserta didik cukup besar
sehingga kalau dilakukanseluruhnya akan memakan waktu yang lama. Namun, jika jumlah lembar
jawaban pesertadidik relatif sedikit, cukup dibedakan menjadi kelompok tinggi dan kelompok rendah
saja.
Gambar berikut menjelaskan hal yang dimaksud.
27,5% (kelompok tinggi)
27,5% (kelompok tengah)
27,5% (kelompok rendah)
3. Menganalis jawaban benar atau salah per butir soal per peserta didik. Analisis ini hanya dilakukan
terhadap jawaban peseta didik kelomok tinggi dan kelompok rendah, sedangkan kelompok tengah
ditinggalkan. Berdasarkan analisis atau identifikasi ini akan dapat dihitung indek masing-masing butir
soal. Berikut contoh analisis jawaban yang dimaksud. Ingat, jawaban betul berskor 1 dan salah 0.
Analisis Butir soal kelompok tinggi dan kelompok rendah.

Kelompok Tinggi
Nomor
Tes
Urut
Peser
ta
1
2
3
4
5
6
Jumlah

Jumlah
Skor

Nomor Butir Soal


1

..

4
0

1
1
1
1
0
1
5

1
1
1
0
1
1
5

1
0
1
1
1
1
5

0
1
1
1
1
1
3

1
1
0
0
1
1
4

1
1
1
1
0
0
4

1
1
1
1
1
1
6

1
1
1
0
1
0
4

.
.
.
.
.
.
.

..
..
..
..
..
..
..

1
1
1
1
0
1
5

Kelompok Rendah

2.2 Langkah Analisis Butir Soal


24

36
34
30
30
28
28

Nomor
Tes
Urut
Peser
ta
1
2
3
4
5
6
Jumlah

Jumla
h
Skor

Nomor Butir Soal


1

..

1
0
0
1
0
0
2

1
0
1
1
1
0
4

0
1
1
1
0
0
3

1
1
0
0
0
1
3

0
1
0
0
1
1
3

0
0
1
1
1
0
3

1
1
0
1
1
1
5

1
1
1
0
0
1
4

.
.
.
.
.
.
.

..
..
..
..
..
..
..

4
0
1
0
1
0
0
1
3

20
19
19
18
16
15

Berdasarkan data anka-angka jumlah jawaban benar kelompok tinggi dan kelompok rendah
sebagaimana yang terlihat pada tabel diatas maka dapat dilakukan perhitungan indeks tingkat
kesulitan dan indeks daya beda secara manual. Sebenarnya, perhitungan kedua hal tersebut dapat
dilakukan cepat, sedang yang memakan waktu adalah analisis jawaban diatas.
2.3 Kreteria Tes yang Baik
Sebuah tes yang dapat dikatakan baik sebagai alat pengukur harus memenuhi tes, yaitu :
a.

Validitas

Validitas merupakan sebuah kata benda, sedangkan valid merupakan kata sifat. Sebuah tes dapat dikatakan
valid apabilates itu dapat tepat mengukur apa yang hendah di ukur.
Jika data yang dihasilkan dari debuah instrumen valid, maka dapat dikatakan bahwainstrumen tersebut valid,
karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan atau keadaan
sesungguhnya. Dari sedikit uraian dan contoh tersebut dapat di simpulkan bahawa : jika data yang dihasilkan
oleh instrumen benar dan valid, sesuai kenyataan, maka instrumen yang digunakan tersebut juga valid.
Validitas tes dapat diketahui dari hasil pemikiran (validitas logis) dan dari hasil pengalaman (validitas empiris)
b.

Reliabilitas

Reliabilitas berasal dari kata reliable yang artinya dapat dipercaya. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes,
berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah perubahan yang terjadi
dapat dikatakan tidak berarti.
Jika validitas terkait dengan ketepatan objek yang tidak lain adlah tidak menyimpangnya data dari kenyataan,
artinya bahwa data tersebut benar, maka konsep reliabilitas terkain dengan pemotretan berkali-kali. Instrumen
yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai denagn kenyataan.sehubungan
dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu
validitas dan reliabilitas ini penting. Dalam hal ini validitas itu penting, dan reliabilitas ini perlu karena
menyokong terbentuknya validitas.

25

c.

Objektivitas

Objektif berarti tidak adanya unsur pribadi yang mempengaruhi. Sebuah tes dikatakan memiliki objektivitas
apabila dalam melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi. Hal ini terutama terjadi pada
sistem skoringnya. Ada 2 faktor ayng mempengaruhi subjektivitas dari sesuatu tes yaitu :
1.
Bentuk tes
Tes yang berbentuk uraian, akan memberi banyak kemungkianan kepada si penilai untuk memeberiakn peniliaian
menurut caranya sendiri. Untuk menghindarai masuknya subjektivitas dari penilai, maka sistem skoringngnya
dapat dilakukan dengan cara sebaik-baiknya, antara lain dengan membuat pedoman skoring terlebih dahuli.
2.

Penilai

Untuk menghindari atau mengurangi masuknya unsur subjektivitas dalam pekerjaan penilaian , maka penilaian
atau evaluasi ini harus dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud, terutama
menyangkut masalah pengadministrasian yaitu kontinuitas dan komperhensivitas
d.

Praktikabilitas

Sebuah tes dapat dikatakan memiliki praktikabilitas yang tinggi apabila tes tersebut bersifat praktis, mudah
pengadministrasiannya.
Tes yang praktis adalah tes yang :
1.

Mudah dilaksanakan, misalnya tidak menuntut peralatan yang banyak dan dan memeberi kebebasan kepada
siswa untuk mengerjakan terlebih dahulu bagian yang di anggap mudah bagi siswa.

2.

Mudah pemeriksaannya, artinya tes itu dilengkapi denagn kunci jawaban maupun pedoman skoringnya.

3.

Dilengkapi dengan petunjuk-prtunjuk yang jelas sehingga dapat diberikan/diawali oleh orang lain.

e.

Ekonomis

Yang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya
yang mahal, tenaga yang banyak, dan waktu yang lama.
2.4 Langkah-Langkah dalam Penyusunan Tes
Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran mana yang akan di cakup dalam sebuah
tes jika sudah diketahui tujuanya.
Urutan langkah yang dilakukan adalah:

Menentukan tujuan mengadakan tes.

Mengadakan pembatasan terhadap bahan yang akan diteskan.

Merumuskan tujuan intruksional khusus dari tiap bagian bahan.

26

Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku terkandug dalam TIK
itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap tingkah laku yang dikehendaki, agar tidak
terlewati.
Contoh :
Tabel TIK dan aspek tingkah laku yang dicakup
No
1
2

TIK Aspek Tingkah Laku


Ssiswa dapat menjumlah 2
bilangan bersusun.
Siswa
dapat
merangkum
hukum
komulatif
dan
seterusnya

Ingatan

Pemahaman

Aplikasi

Keterangan

Menyusun tabel spesifikasi yang memuat pokok materi, aspek berpikir yang diukur beserta imbangan
antara kedua hal tersebut.

Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah di tuliskan pada tabel TIK dan aspek
tingkah laku yang dicakup.

27

VALIDITAS

2.1.1

Pengertian Validitas

Menurut Gronlund dan Linn (1990): Validitas adalah ketepatan interpretasi yang dibuat dari hasil
pengukuran atau evaluasi
Menurut Anastasi (1990): Validitas adalah ketepatan mengukur konstruk, menyangkut; What the test
measure and how well it does
Menurut Arikunto (1995): Validitas adalah keadaan yang menggambarkan tingkat instrumen
bersangkutan yang mampu mengukur apa yang akan diukur.
Menurut Sukadji (2000): Validitas adalah derajat yang menyatakan suatu tes mengukur apa yang
seharusnya diukur.
Menurut Azwar (1986):Validitas adalah sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsinya.
Validitas adalah suatu ukuran yang menunjukan tingkat kevalidan atau kesahihan suatu instrumen. Prinsif
validitas adalah pengukuran atau pengamatan yang berarti prinsif keandalan instrumen dalam mengumpulkan data.
Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran
atau pengamatan.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen
tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan
dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan
alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur
yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data
mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur
variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya
mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data
tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di
antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak
mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil
penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi

28

tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas
itu tidak akan terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota
lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu
yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu
yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan
alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat
memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan
memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang
sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986).
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang
berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk
satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah
kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid
untuk mengukur apa), serta valid bagi kelompok subjek yang mana?
2.1.2

Pengertian Uji Validitas

Menurut Sugiyono (2006)


Uji validitas adalah suatu langkah pengujian yang dilakukan terhadap isi (content) dari suatu instrumen, dengan
tujuan untuk mengukur ketepatan instrumen yang digunakan dalam suatu penelitian
2.1.3

Tujuan uji validitas

Mengetahui sejauh mana ketepatan dan kecermatan suatu instrumen pengukuran dalam melakukan fungsi ukurnya.
Agar data yang diperoleh bisa relevan/sesuai dengan tujuan diadakannya pengukuran tersebut.
2.1.4

Cara menentukan vadilitas

Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan
skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya
indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks
validitasnya (Arikunto, 1999: 78)
Untuk menguji validitas instrumen digunakan rumus korelasi product moment dengan angka kasar, yaitu:

29

dengan rxy merupakan koefisien korelasi antara variabel X dan variabel Y, N merupakan jumlah siswa uji coba, X
adalah skor-skor tiap butir soal untuk setiap individu atau siswa uji coba, dan Y adalah skor total tiap siswa uji coba.
Untuk menginterpretasikan tingkat validitas, maka koefisien kolerasi dikategorikan pada kriteria sebagai berikut:

Setelah harga koefisien validitas tiap butir soal diperoleh, perlu dilakukan uji signifikansi untuk mengukur
keberartian koefisien korelasi berdasarkan distribusi kurva normal dengan menggunakan statistik uji-t dengan
persamaan:

dengan: t merupakan nilai hitung koefisien validitas, rxy adalah nilai koefisien korelasi tiap butir soal, dan N adalah
jumlah siswa uji coba.
Kemudian hasil diatas dibandingkan dengan nilai t dari tabel pada taraf kepercayaan 95% dan derajat kebebasan
(dk) = N2. Jika thitung > ttabel maka koefisien validitas butir soal pada taraf signifikansi yang dipakai.
2.1.5

Konsep Pengukuran Validitas

Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu
aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang
bersangkutan.
Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspekaspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik.
Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat
membuktikannya secara empiris dengan langsung.
Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran
yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid
bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak
diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang
ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk

30

melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur
tertentu.
Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah
selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri.
Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur
tersebut.
2.1.6

Macam-macam validitas

Menurut Djaali dan Pudji (2008) validitas dibagi menjadi 3 yaitu:


a.

Validitas isi (content validity)

Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap
isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran. Dengan kata lain, tes yang
mempunyai validitas isi yang baik ialah tes yang benar-benar mengukur penguasaan materi yang seharusnya
dikuasai sesuai dengan konten pengajaran yang tercantum dalam Garis-Garis Besar Program Pengajaran (GBPP).
Menurut Gregory (2000) validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes
atau instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenai tes tersebut.
Artinya tes mencerminkan keseluruhan konten atau materi yang diujikan atau yang seharusnya dikuasai secara
proporsional.
Untuk mengetahui apakah tes itu valid atau tidak harus dilakukan melalui penelaahan kisi-kisi tes untuk
memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang
seharusnya dikuasai secara proporsional. Oleh karena itu, validitas isi suatu tes tidak memiliki besaran tertentu yang
dihitung secara statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes. Oleh karena itu,
wiersma dan Jurs dalam Djaali dan Pudji (2008) menyatakan bahwa validitas isi sebenarnya mendasarkan pada
analisis logika, jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika.
Untuk memperbaiki validitas suatu tes, maka isi suatu tes harus diusahakan agar mencakup semua pokok
atau sub-pokok bahasan yang hendak diukur. Kriteria untuk menentukan proporsi masing-masing pokok atau sub
pokok bahasan yang tercakup dalam suatu tes ialah berdasarkan banyaknya isi (materi) masing-masing pokok atau
sub-pokok bahasan seperti tercantum dalam kurikulum atau Garis-Garis Besar Program Pengajaran(GBPP).
Selain itu, penentuan proporsi tersebut dapat pula didasarkan pendapat (judgement) para ahli dalam bidang
yang bersangkutan. Jadi situasi tes akan mempunyai validitas isi yang baik jika tes tersebut terdiri dari item-item
yang mewakili semua materi yang hendak diukur. Salah satu cara yang biasa digunakan untuk memperbaiki validitas
isi suatu tes ialah dengan menggunakan blue-print untuk menentukan kisi-kisi tes.
b. Validitas Konstruk (Construct validity)
Menurut Djaali dan Pudji (2008) validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh
item-item tes mampu mengukur apa-apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi
konseptual yang telah ditetapkan.
Validitas konstruk biasa digunakan untuk instrumen-instrumen yang dimaksudkan mengukur variabelvariabel konsep, baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri,

31

lokus control, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya performansi
maksimum seperti instrumen untuk mengukur bakat (tes bakat), intelegensi (kecerdasan intelekual), kecerdasan
emosional dan lain-lain.
Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelaahan teoritis dari suatu
konsep dari variabel yang hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator, sampai
kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan
sintesis dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis dan komparasi yang
logik dan cermat.
Menyimak proses telaah teoritis seperti telah dikemukakan, maka proses validasi konstruk sebuah
instrumen harus dilakukan melalui penelaahan atau justifikasi pakar atau melalui penilaian sekelompok panel yang
terdiri dari orang-orang yang menguasai substansi atau konten dari variabel yang hendak diukur.
Contoh Format Penelaahan Butir Soal Bentuk Uraian
Mata Pelajaran

:..

Kelas/Semester

:..

Penelaah

:..

Petunjuk pengisian format penelaahan butir soal bentuk uraian:


Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di dalam format!
Berilah tanda cek ( ) pada kolom ya bila soal yang ditelaah sudah sesuai dengan kriteria
Berilah tanda cek ( ) pada kolom tidak bila soal yang ditelaah tidak sesuai dengan kriteria, kemudian tuliskan
alasan pada ruang catatan atau pada teks soal dan perbaikannya.

Nomor Soal

No. Aspek yang Ditelaah

Ya Tidak Ya Tidak Ya Tidak


A1 MateriSoal sesuai dengan indikator (menuntut tes
2 tertulis untuk bentuk uraian)Batasan pertanyaan dan
jawaban yang diharapkan sudah sesuai
3
Materi yang ditanyakan sesuai dengan kompetensi
4 (urgensi, relevasi, kontinyuitas, keterpakaian

32

sehari-hari tinggi)

Isi materi yang ditanyakan sesuai dengan jenjang


jenis sekolah atau tingkat kelas

6
Konstruksi
7
8
C

Menggunakan kata tanya atau perintah yang


menuntutjawaban uraian
Ada petunjuk yang jelas tentang cara pengerjaan
soal.

9
Ada pedoman penskorannya
10
Tabel, gambar, grafik, peta, atau yang sejenisnya
11 disajikan dengan jelas dan terbaca
12 Bahasa
13 Rumusan kalimat soal komunikatif
Butir soal menggunakan bahasa Indonesia yang
baku
Tidak
menggunakan
kata/ungkapan
menimbulkan penafsiran ganda atau
pengertian
Tidak menggunakan
setempat/tabu

bahasa

yang

yang
salah

berlaku

Rumusan soal tidak mengandung kata/ungkapan


yang dapat menyinggung perasaan siswa

Catatan:

33

Contoh Format Penelaahan Butir Soal Bentuk Pilihan Ganda


Mata Pelajaran

:..

Kelas/Semester

:..

Penelaah

:..

Petunjuk pengisian format penelaahan butir soal bentuk pilihan ganda:


Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di dalam format!
Berilah tanda cek ( ) pada kolom ya bila soal yang ditelaah sudah sesuai dengan kriteria
Berilah tanda cek ( ) pada kolom tidak bila soal yang ditelaah tidak sesuai dengan kriteria, kemudian tuliskan
alasan pada ruang catatan atau pada teks soal dan perbaikannya.

Nomor Soal

No. Aspek yang Ditelaah

Ya Tidak Ya Tidak Ya Tidak


A1 MateriSoal sesuai dengan indikator (menuntut tes
2 tertulis untuk bentuk pilihan ganda)Materi yang
ditanyakan sesuai dengan kompetensi (urgensi,
3 relevasi, kontinyuitas, keterpakaian sehari-hari
tinggi)
4
Pilihan jawaban homogen dan logis
B
Hanya ada satu kunci jawaban

34

Konstruksi

Pokok soal dirumuskan dengan singkat, jelas dan


tegas

7
8

Rumusan pokok soal dan pilihan jawaban


merupakan pernyataan yang diperlukan saja

Pokok soal tidak memberi petunjuk kunci jawaban

10 Pokok soal bebas dari pernyataan yang bersifat


negatif ganda
11
Pilihan jawaban homogeny dan logis ditinjau dari
12 segi materi
13 Gambar, grafik, table, diagram, atau sejenisnya
jelas dan berfungsi
14
Panjang pilihan jawaban relatif sama
C
Pilihan jawaban tidak menggunakan pernyataan
15 semua jawaban di atas salah/benar dan
sejenisnya
16

Pilihan jawaban yang berbentuk angka/waktu


17 disusun berdasarkan urutan besar kecilnya angka
atau kronologisnya
18

Butir soal tidak bergantung pada jawaban soal


sebelumnya
Bahasa
Menggunakan bahasa yang sesuai dengan kaidah
bahasa Indonesia
Menggunakan bahasa yang komunikatif
Tidak menggunakan
setempat/tabu

bahasa

yang

berlaku

Pilihan jawaban tidak mengulang kata/kelompok


kata yang sama, kecuali merupakan satu kesatuan
pengertian

35

Catatan:

c.

Validitas empiris

Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan
kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang
menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu sendiri
yang menjadi kriteria. Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan sebagai
kriteria eksternal.
Validitas yang ditentukan berdasarkan kriteria internal disebut validitas internal, sedangkan validitas yang
ditentukan berdasarkan kriteria eksternal disebut validitas eksternal.
d. Validitas internal
Validitas internal merupakan validitas yang diukur dengan besaran yang menggunakan instrumen sebagai
suatu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu.
Dengan demikian validitas internal mempermasalahkan validitas butir atau item suatu instrumen dengan
menggunakan hasil ukur instrumen tersebut sebagai suatu kesatuan dan sebagai kriteria, sehingga biasa disebut juga
validitas butir.
Pengujian validitas butir instrumen atau soal tes dilakukan dengan menghitung koefesien korelasi antara
skor butir instrumen atau soal tes dengan skor total instrumen atau tes. Butir atau soal yang dianggap valid adalah
butir instrumen atau soal tes yang skornya mempunyai koefesien korelasi yang signifikan dengan skor total
instrumen atau tes.
e.

Validitas eksternal

Kriteria eksternal dapat berupa hasil ukur instrumen yang sudah baku atau instrumen yang dianggap baku
dapat pula berupa hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau
varaibel yang hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang merupakan hasil perhitungan
statistika. Jika kita menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran
validitas eksternal dari instrumen yang kita kembangkan didapat dengan jalan mengkorelasikan skor hasil ukur
instrumen yang dikembangkan dengan skor hasil ukur instrumen baku yang dijadikan kriteria. Makin tinggi
koefesien korelasi yang didapat, maka validitas instrumen yang dikembangkan juga makin baik. Kriteria yang
digunakan untuk menguji validitas eksternal adalah nilai table r (r-tabel).
Jika koefesien korelasi antara skor hasil ukur instrumen yang dikembangkan dengan skor hasil
ukurinstrumen baku lebih besar dari pada r-tabel, maka instrumen yang dikembangkan dapat valid berdasarkan

36

kriteria eksternal yang dipilih (hasil ukur instrumen baku). Jadi keputusan uji validitas dalam hal ini adalah
mengenai valid atau tidaknya instrumen sebagai suatu kesatuan, bukan valid atau tidaknya butir instrumen seperti
pada validitas internal.
Ditinjau dari kriteria eksternal yang dipilih, validitas eksternal dapat dibedakan atas dua macam yaitu:
1.

Validitas prediktif apabila kriteria eksternal yang digunakan adalah adalah ukuran atau penampilan masa
yang akan datang.

2.

Validitas kongkuren apabila kriteria eksternal yang digunakan adalah ukuran atau penampilan saat ini atau
saat yang bersamaan dengan pelaksanaan pengukuran.

Menurut Ebel (dalam Nazir 1988) membagi validitas menjadi


- concurrent validity
- construct validity
- face validity
- factorial validity
- empirical validity
intrinsic validity
- predictive validity
- content validity
- curricular validity.

Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur
oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan
kinerja yang baik dalam pengukuran.
Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan
bukan terhadap apa yang seharusnya hendak diukur.
Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang
yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini
diperoleh dengan menggunakan teknik analisis faktor.
Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu
kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan
oleh pengukuran.
Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk
memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar
mengukur apa yang seharusnya diukur.
Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur
dengan kinerja seseorang di masa mendatang.
Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan
menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspekaspek sesuai dengan tujuan instruksional.

Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct
validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).

37

2.1.7

Koefisien Validitas

Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara
tes dan kriteria itu adalah rxy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur.
Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun
semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu
koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien
validitas yang tinggi adalah lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan
estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari
komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh r xy tersebut.
Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang
lain.

2.2 RELIABILITAS
2.2.1

Pengertian

Kata reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam bahasa inggris, berasal dari kata,
reliable yang artinya dapat di percaya. reliabilitas merupakan kata benda, sedangkan reliable merupakan kata
sifat atau keadaan.
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability.
Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable).Walaupun
reliabilitas mempunyai berbagai arti seperti kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi, namun
ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil pengukuran dapat dipercaya.
-

Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur
yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya
untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbedabeda.

Menurut Sukadji (2000) reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten
sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi.

Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau
kenyataan hidup tadi diukur atau diamati berkali kali dalam waktu yang berlainan. Alat dan cara
mengukur atau mengamati sama sama memegang peranan penting dalam waktu yang bersamaan.

Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan
sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai reliabelitas
tinggi, apabila tes yang dibuat mempunyai hasil konsisten dalam mengukur yang hendak diukur.

Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing
reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes, ekivalen,
dan belah dua yang ditentukan melalui korelasi.

38

2.2.2

Tipe-tipe Reliabelitas

Berbagai tipe tersebut akan diuraikan sebagai berikut:


1)

Relibalelitas Dengan Tes-Retes

Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu.
Tes-Retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua
kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa
skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang
sama. Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes
mengukur apa yang ingin diukur (Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri
tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh
karena tesnya satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trialmethod.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
1.

Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.

2.

Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama
dengan kelompok yang sama tersebut.

3.

Korelasikan kedua hasil tes tersebut.

Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti
tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).
2)

Reliabelitas Dengan Bentuk Ekivalensi

Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik dengan
tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya
mempunyai karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai
jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan
interpretasi yang sama (Sukardi 2008).
Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah bahasa
Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:
1.

Tentukan sasaran yang hendak dites

2.

Lakukan tes yang dimaksud kepada subjek sasaran tersebut.

39

3.

Administrasinya hasilnya secara baik.

4.

Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut

5.

Korelasikan kedua hasil skor tersebut (Sukardi, 2008).

Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara
esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi, 2008). Pernyataan lain
juga disampaikan oleh Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes pekerjaannya berat karena
harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
3)

Reliebilitas Dengan Bentuk Belah Dua

Menurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal.
Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap
item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:
1.

Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.

2.

Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan
nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.

3.

Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.

4.

Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran
(Sukardi, 2008).

Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):
3

Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen

Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes.
Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktorfaktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1)

Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.

2)
Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok
siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.

40

3)
Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor
reliabilitas rendah.
4)
Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai
hasil yang sama.

41

You might also like