wisuda program pasca 2012

wisuda program pasca 2012
foto bersama

Minggu, 16 Desember 2012

Analisis Kualitas tes dan Butir Soal





ANALISIS KUALITAS TES DAN BUTIR SOAL Oleh: Asis & Roisul Burhani Abstraks Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sulit. Analisis butir soal bertujuan untuk memperoleh kualitas soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya. Dalam analisis butir soal secara kuantitatif ada empat yang perlu dianalisis pada setiap soal yang telah dikerjakan siswa yaitu: Analisis tingkat kesukaran soal untuk dapat membedakan soal kategori mudah, sedang dan sukar. Analisis daya pembeda mengkaji apakah soal mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah. Analisis validitas mengkaji kesahihan alat ukur (soal) dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur. Analisis reliabilitas mengkaji keajegan atau ketetapan hasil tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali. Kata Kunci; Analisis, Tes, Validitas, Reabilitas, Tingkat Kesukaran dan Daya Pembeda PENDAHULUAN Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar mengenai materi yang disampaikan. Menurut Tyler sebagaimana dikutip Nana sudjana bahwa penilaian berfungsi untuk mengetahui sebarapa jauh tujuan-tujuan pendidikan tersebut telah atau belum dicapai. Dari hasil penilaian kemudian dapat diketahui bagian-bagian mana dari system yang masih memerlukan perbaikan Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta rentang skor masing-masing. Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagai tes yang baik, maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu analisis butir soal. Analisis butir soal adalah pengkajian pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Apakah item-item tersebut sudah cukup baik atau belum? Kalau belum dimana letak kelemahannya? Apakah item tersebut masih bisa direvisi atau harus dibuang sama sekali? Dan lain sebagainya. Analisa semacam ini dinamakan analisa empiris. Dengan analisa empiris ini dapat kita ketahui apakah tes apakah tes yang kita susun itu sudah merupakan tes yang baik atau belum? Dengan analisa empiris ini dapat diketahui item-item mana yang perlu dirubah atau diperbaiki atau dibuang sama sekali, dan item-item mana yang baik dipergunakan untuk selanjutnya. Sedangkan analisis berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba dinamakan analisis rasional, karena semata-mata dilakukan atas dasar pertimbangan rasio. PEMBAHASAN Definisi Tes Sebelum lebih jauh berbicara tentang analisis kualitas tes terlebih dahulu harus mengetahui dan memahami definisi dari tes itu sendiri. Istilah tes diambil dari kata “testrum” suatu pengertian dalam bahasa Prancis kuno yang berarti yang berarti piring untuk menyisihkan logam-logam mulia. Ada juga yang mendefinisikan sebagai sebuah piring yang dibuat dari tanah. Seorang ahli bernama James Ms. Cattel, pada tahun 1890 telah memperkenalkan pengertian tes ini kepada masyarakat melalui bukunya yang berjudul “Mental test and Measurement”(mental tes dan pengukuran). Banyak ahli yang mulai mengembangkan tes ini untuk berbagai bidang, namun yang terkenal adalah sebuah tes inteligensi yang disusun oleh seorang Perancis bernama Binet, yang kemudian dibantu penyempurnaanya oleh Simon, sehingga tes tersebut dikenal sebagai tes Binet Simon(tahun 1904). Dengan alat ini Benet dan Simon berusaha untuk membedakan anak menurut tingkat inteligensinya. Dari pekerjaan Benet dan Simon inilah kemudian kita kenal istilah-istilah: Umur kecerdasan, umur kalender dan indeks kecerdasan. Inteligensia Kuosien atau Intelligence Quotient. Lebih sederhannya definisi tes ini dapat kita lihat pada pengertian yang ditulis oleh : Wayan Nurkancana dan Sumartana dalam bukunya; Evaluasi Pendidikan yaitu; Tes adalah suatu cara untuk mengadakan penilaian yang berbentuk suatu tugas atau serangkaian tugas yang harus dikerjakan oleh anak atau sekelompok anak sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak tersebut, yang dapat dibandingkan dengan nilai yang dicapai oleh anak-anak lain atau dengan nilai standart yang ditetapkan. Apabila definisi dari Wayan Nurkancana dan Sumartana kalau kita analisa, maka terurai dalam unsur-unsur berikut ini: Bahwa tes itu berbentuk suatu tugas yang terdiri dari pertanyaan- pertanyaan atau perintah-perintah Bahwa tes itu diberikan kepada seorang anak atau sekelompok anak untuk dikerjakan. Bahwa respon anak atau kelompok anak tersebut dinilai. Ada beberapa istilah menurut Suharsimi yang berhubungan dengan tes antara lain; Tes Adalah merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Untuk mengerjakan tes ini tergantung dari petunjuk yang diberikan misalnya: melingkari salah satu huruf didepan pilihan jawaban, menerangkan, mencoret jawaban yang salah, melakukan tugas atau suruhan, menjawab secara lisan dan sebagainya. Testing Testing merupakan saat pada aktu tes itu dilaksanakan. Dapat juga dikatakan testing saat pengambilan tes. Testee (Dalam istilah Indonesia tercoba), adalah responden yang sedang mengerjakan tes. Orang-orang inilah yang akan dinilai atau diukur, baik mengenai kemampuan, bakat, minat, pencapaian dan sebagainya. Tester (Dalam istilah Indonesia: pencoba), adalah orang yang diserahi untuk melaksanakan pengambilan tes terhadap para responden. Atau dengan kata lain tester adalah subyek evaluasi(tetapi adakalanya hanya orang yang ditunjuk oleh subyek evaluasi untuk melaksanakan tugasnya). Tugas tester antara lain: Mempersiapkan ruangan dan perlengkapan yang diperlukan Membagikan lembaran tes dan alat-alat lain untuk mengerjakan Menerangkan cara mengerjakan tes Mangawasi responden mengerjakan tes Memberikan tanda-tanda waktu Mengumpulkan pekerjaan responden Mengisi berita acara atau laporan yang diperlukan(jika ada). Macam-macam Tes Apabila ditinjau dari bentuk-bentuk pertanyaan yang diberikan tes hasil belajar yang biasa dipergunakan oleh tenaga pendidik, untuk menilai hasil belajar anak-anak disekolah dapat dibedakan atas dua jenis; Tes Obyektif Tes Obyektif disebut pula”short-answer’(jawaban singkat) tes atau “new-type”(tipe baru) tes. Tes obyektif terdiri dari item-item yang dapat dijawab dengan jalan memilih salah satu alternative yang benar dari sejumlah alternative yang tersedia, atau dengan mengisi jawaban yang benar dengan beberapa perkataan atau simbul. Ada empat bentuk tes obyektif menurut Nana Sudjana yaitu : jawaban singkat, benar salah, menjodohkan, dan pilihan ganda, kecuali bentuk jawaban singkat, dalam soal-soal bentuk obyektif telah tersedia kemungkinan-kemungkinan jawaban yang dapat dipilih. Berikut ini beberapa contoh soal bentuk tes obyektif: Bentuk soal jawaban singkat Anggota Dewan Perwakilan Rakyat Indonesia dilih setiap……(5thn) Bentuk soal benar salah (B) – S Danau Toba Sumatra Utara dari segi pembentukannya merupakan danau tiktonik Bentuk soal menjodohkan Kelompok A Kelompok B b. 1. Kekurangan Vitamin C a. Penyakit rabun ayam a. 2. Kekurangan Vitamin A b. Sariawan Bentuk soal pilihan ganda Untuk menarik simpati bangsa Indonesia, Jepang membentuk BPUPKI yang diketuai oleh: Ir. Soekarno Mr. Moh. Yamin Mr. Soepomo Dr. Radjiman W. Kunci : d. Setiap bentuk tes sudah pasti ada kelebihan dan kekurangannya; Kelebihan tes Obyektif Tes obyektif dapat dijawab dengan cepat, sehingga memungkinkan para peserta didik untuk menjawab sejumlah besar pertanyaan dalam satu periode tes. Akibatnya materi tes yang diberikan dapat mencakup hamper sebagian besar dari pada bahan pelajaran yang diberikan. Reabilitas skor yang diberikan pada peserta didik dapat dijamin sepenuhnya. Item-item dalam tes obyektif hanya mengandung satu jawaban yang bisa diterima. Oleh karnanya siapapun yang menskor dan kapanpun diskor, skornya tetap sama. Jawaban-jawaban tes obyektif dapat dikoreksi dengan mudah dan cepat, dengan mempergunakan kunci jawaban. Kekurangan tes obyektif Disamping ada kelebihan tes obyektif memiliki kelemahan antara lain sebagai berikut: Dalam tes obyektif murid-murid memberikan jawaban dengan jalan memilih salah satu dari alternative-alternatif yang disediakan. Dalam hal ini ada kemungkinan bahwa murid-murid yang tidak mengetahui pilihan yang tepat, akan mengadakan pilihan secara menerka-nerka saja. Tes obyektif terdiri dari jumlah item yang cukup banyak, maka sudah pasti membutuhkan biaya administrasi yang cukup besar untuk mencetak bahan tes tersebut. Namun demikian kelemahan ini dapat dikurangi dengan jalan menyediakan lembar jawaban yang terpisah dari lembaran tes sehingga lembaran tes dapat disimpan untuk dipergunakan dalam pereode tes berikutnya. Tes Essay Tes essay adalah suatu bentuk tes yang terdiri dari suatu pertanyaan atau suatu suruhan yang menghendaki jawaban yang berupa uraian-uraian yang relative panjang. Bentuk-bentuk pertanyaan atau suruhan yang meminta kepada murid-murid untuk menjelaskan, membandingkan, menginterpretasikan dan mencari perbedaan. Semua bentuk pertanyaan atau suruhan tersebut mengharapkan agar murid-murid menunjukkan pengertian mereka terhadap materi yang dipelajari. Tes esaay, jika direncanakan dengan baik , sangat tepat untuk menilai proses berfikir seseorang serta kemampuannya mengekspresikan buah pikiran. Kebaikan tes essay Berikut ini adalah kelebihan dari pada tes essay antara lain: Tes ini sangat cocok untuk mengukur atau menilai hasil daripada suatu proses belajar yang kompleks, yang yang sukar diukur dengan mempergunakan tes obyektif. Tes essay memberikan kesempatan kepada anak-anak untuk menyusun jawaban yang sesuai dengan jalan pikirannya sendiri. Hal ini sangat penting untuk melatih murid-murid agar bisa mengemukakan jalan pikiran jalan pikiran secara teratur. Kelemahan tes essay Berikut ini kelemahan-kelemahan tes yang berupa essay antara lain; Pemberian skor terhadap jawaban tes kurang reliable. Dalam tes essay tidak hanya satu jawaban yang bisa diterima. Dan tingkat kebenaran daripada jawaban-jawaban tersebut sangat bervariasi. Oleh karna itu skor yang diberikan akan bervariasi juga. Tes essay menghendaki jawaban-jawaban yang relative panjang. Oleh karna itu waktu yang diperlukan untuk menulis jawaban terhadap satu item juga lama. Karnanya dalam satu pereode tes hanya dapat diberikan beberapa buah item saja. Dengan demikian materi yang dipergunakan sebagai bahan tes kurang refresentatif terhadap seluruh materi yang diajarkan. Cara mengkoreksi tes essay memerlukan waktu yang cukup lama, sebab tiap jawaban harus dibaca satu persatu secara teliti. ANALISIS TES DAN BUTIR SOAL Analisis butir soal yang dalam bahasa inggris disebut item analisis dilakukan terhadap empirik. Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh. Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut. Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal yang baik,kurang baik dan soal yang buruk. Sehingga dapat petunjuk untuk mendapatkan perbaikan. Manfaat yang dapat diberikan apabila dilakukan analisis terhadap butir soal,sebagai berikut : Untuk mengetahui soal yang dianalisis telah berfungsi sebagaimana yang diharapkan. Untuk mengetahui tingkat kesukaran soal.Untuk mengetahui apakah tanggapan-tanggapan soal yang dianalisis sudah baik susunannya. Untuk mengetahui apakah soal yang dianalisis sudah betul/baik konstruksinya. Untuk bahan masukan menyusun program remedial teaching. Untuk meningkatkan keterampilan guru dalam merencanakan dan mengolah hasil tes. Jenis-jenis analisis Ada dua jenis analisis butir soal yang dapat pendidik laksanakan, yaitu : Analisis secara kualitatif(prosedur peningkatan secara judgement, terkait dengan isi dan bentuk soal) Teknik analisis kualitatif Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli dan dimoderatori oleh satu orang. Kelebihan : Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Kelemahan : Teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal. Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti. Analisis secara kuantitatif prosedur peningkatan secara empirik,terkait dengan ciri-ciri statistiknya. Penelaahan butir soal didasarkan pada data empirik dari butir soal terkait yang telah diujikan. Pendekatan Analisis Kuantitatif ada dua yaitu: Secara Klasik Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan : mudah , murah, sederhana, familier digunakan guru-guru, dapat menggunakan data sampel kecil. Kelemahan : Tingkat kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat kemampuan peserta didik mudah. Jika tes mudah artinya tingkat kemampuan peserta didik tinggi. Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam grup yang menjawab benar soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik yang dites dan kemampuan tes yang diberikan. Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik. Secara Modern Penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu soal dengan kemampuan siswa. IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan kemampuan siswa atau tingkatan/level prestasi siswa. Kelebihan: asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat kemampuan peserta didik adalah independen; asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang menggambarkan untuk tujuan kalibrasi soal; statistik yang digunakan untuk menghitung tingkat kemampuan siswa diperkirakan dapat terlaksana. Kelemahan : prosesnya cukup rumit dan sulit Penghitungan dalam penelaahan butir soal secara kuantitatif dapat menggunakan bantuan kalkulator scientific atau program komputer.Program yang sudah dikenal secara umum adalah EXCEL, atau program khusus seperti ITEMAN (analisis secara klasik), RASCAL, ASCAL, BILOG (analisis secara item respon teori atau IRT), FACETS (analisis model Rasch untuk data kualitatif). Dalam analisis butir soal secara kuantitatif ada empat yang perlu dianalisis pada setiap soal yang telah dikerjakan siswa yaitu: Analisis Tingkat Kesukaran Soal Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkan. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya. Dalam menentukan kriteria soal, apakah soal tersebut termasuk mudah, sedang, atau sukar adalah berdasarkan pertimbangan – pertimbangan tertentu. Pertimbangan tersebut antara lain adalah: Aspek yang di ukur dalam pernyataan tersebut. Sifat materi yang di ujikan atau ditanyakan. Isi bahan yang di tanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya. Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah sebagai berikut : Menentukan indeks kesukaran (difficulty index), yaitu bilangan yang menunjukan sukar dan mudahnya sesuatu soal. Dalam dunia evaluasi belajar umumnya dilambangkan dengan huruf P (proporstion). 0,0 1,0 Sukar Mudah Rumus mencari indeks kesukaran soal : P= B/Js x 100 % Dengan: P= Indeks kesukaran B= banyaknya siswa yang menjawab soal itu dengan betul Js= jumlah seluruh siswa peserta tes Menentukan tingkat kesukaran, adalah ukuran yang menunjukan derajat kesulitan soal untuk diselesaikan oleh siswa dan mengetahui soal-soal yang termasuk mudah, sedang dan sukar. Rumus mencari tingkat kesukaran soal i).Tk=JB/JJ x 100 % Dengan: Tk = Tingkat kesukaran JB = Jumlah jawaban yang benar JJ = Jumlah jawaban keseluruhan ii).F=(PH+PL)/2 Dengan: F = Tingkat kesukaran PH = Prosentase pada kelompok tinggi PL = Prosentase pada kelompok renda Contoh soal : Misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang .lembar jawababn murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor terendah paling bawah. Kita ambil 27% dari mereka yang mendapatkan skor tertinggi. Dalam hal ini 27% X 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang. begitu pula kita ambil 27% dari mereka yang mendapatkan skor terendah.jumlahnya tentu sama dengan kelompok atas ,yaitu 14 orang juga. Misalkan data yang diperoleh adalah sebagi berikut : Untuk item no.1,dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang. Untuk item no.2,dari kelompok bawah salah 8 orang dan dari kelompok atas salah 85orang. Untuk item no.3,dari kelompok bawah salah 14 orang dan dari kelompok atas salah 8 orang. Untuk item no.4,dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah. Untuk item no.5,dari kelompok bawah salah 13 orang dan dari kelompok atas salah 11 orang. Untuk item no.6,dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang. Berdasarkan data tersebut ,maka dapat dibuat tabel sebagai berikut : No.item PL PH PL+PH PL-PH 1 9 2 11 7 2 8 5 13 3 3 14 8 23 6 4 6 0 6 6 5 13 11 24 2 6 2 3 5 -1 Dst Dari tabel tersebut,maka tingkat kesukaran untuk masing-masing item dapat dicari sebagi berikut : Untuk item no.1. Tk=JB/JJ x 100 % TK= 11/28 x100%=39% Untuk item no.2 Tk=JB/JJ x 100 % TK= 13/28 x100%=46% Untuk item no.3 Tk=JB/JJ x 100 % TK= 23/28 x100%=82% Untuk item no.4 Tk=JB/JJ x 100 % TK= 6/28 x100%=21% Untuk item no.5 Tk=JB/JJ x 100 % TK= 24/28 x100%=86% Untuk item no.6 Tk=JB/JJ x 100 % TK= 5/28 x100%=18% Derajat kesukaran yang baik adalah derajat kesukaran yang bergerak 25% sampai 75%. item yang mempunyai derajat kesukaran dibawah 25% berarti bahwa item tersebut terlalu mudah .sebaliknya item yang mempunyai derajat kesukaran 75% ,berarti bahwa item tersebut terlalu sukar. Kreteria indeks kesukaran soal adalah sebagai berikut: Kriteria yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal tersebut. Sebaliknya, makin besar indeks yang diperoleh makin mudah soal tersebut. 0,00-0,30 Soal sukar 0,31-0,70 Soal sedang 0,71-0,90 Soal mudah Analisis Daya Pembeda Daya pembeda adalah mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke dalam kategori rendah dan kategori tinggi prestasinya. Tujuan daya pembeda yaitu untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya. Cara melakukan analisis daya pembeda adalah sebagai berikut: Daya pembeda soal ditunjukan indeks diskriminasi (D) yang dihitung dengan menggunakan rumus: D=PH-PL Dengan: D = Daya Pembeda PH= Prosentase pada kelompok tinggi PL = Prosentase pada kelompok rendah Cara lain menghitung daya pembeda DP=(PL-pH)/n Dengan : DP = Indeks DP atau daya pembeda yang di cari PH = Prosentase pada kelompok tinggi PL = Prosentase pada kelompok renda n=jumlah kelompok atas atau kelompok bawah Mengambil dari tabel dari soal tingkat kesukaran tadi bisa dilihat juga daya pembeda No.item PL PH PL+PH PL-PH 1 9 2 11 7 2 8 5 13 3 3 14 8 23 6 4 6 0 6 6 5 13 11 24 2 6 2 3 5 -1 Dst Untuk item no.1 DP=(PL-pH)/n DP= 7/14=0,50 Untuk item no.2 DP=(PL-pH)/n DP= 3/14=0,21 Untuk item no.3 DP=(PL-pH)/n DP= 6/14=0,43 Untuk item no.4 DP=(PL-pH)/n DP= 6/14=0,43 Untuk item no.5 DP=(PL-pH)/n DP= 2/14=0,14 Untuk item no.6 DP=(PL-pH)/n DP= (-1)/14=-0,07 c). Klasifikasi daya pembeda adalah sebagai berikut: 0,00-0,20 Buruk 0,21-0,40 Cukup 0,41-0,70 Baik 0,71-1,00 Baik sekali Analisis validitas Suatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara. Pertama, penganalisaan yang dilakukan dengan jalan berpikir secara rasional atau penganalisaan dengan menggunakan logika (logical analysis). Kedua, penganalisaan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisaan dilaksanakan dengan menggunakan empirical analysis. a. Pengujian Validitas Tes Secara Rasional Tes hasil belajar yang setelah dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity). Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis. 1). Validitas isi (content validity) Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut validitas kurikuler. Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan. Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka¬-angka. Contoh : Misalnya apabila kita ingin memberikan tes biology kepada anak-anak kelas II, maka item-itemnya harus diambil dari pelajaran kelas II. Kalau terdapat item-item yang diambil dari kelas III maka tes itu tidak valid lagi. 2).Validitas konstruksi (construct validity). Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus. Tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi apabila tes hasil belajar tersebut (–ditilik dari segi susunan, kerangka atau rekaannya–) telah dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus. Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan. b. Pengujian Validitas Tes Secara Empirik. Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity). 3).Validitas “Ada Sekarang” (Concurrent Validity) Validitas ini lebih umum dikenal dengan validitas empiris. Dikatakan validitas empiris jika hasilnya sesuai dengan pegalaman. Pengalaman selalu mengenal hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent). Cara yang dipergunakan untuk menilai validitas ini dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes dengan hasil-hasil yang dicapai dalam tes yang sejenis yang telah diketahui mempunyai validitas tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi yang diperoleh menunjukkan tinggi rendahnya validitas tes yang akan kita nilai kualitasnya. 4).Validitas Prediksi (Predictive Validity) Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Istilah “ramalan” jika dikaitkan dengan validitas tes, maka yang dimaksud dengan validitas ramalan dari suatu tes adalah suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki prediksi. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara: mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang ada. Jika diantara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya: apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek. Dalam rangka mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang telah ditentukan itu, cara sederhana yang paling sering digunakan adalah dengan menerapkan Teknik Analisis Korelasional Product Moment dari Karl Pearson. Cara mengetahui Validitas Alat ukur. Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson. Rumus korelasi product moment ada 2 macam,yaitu : Korelasi product moment dengan simpangan Dengan : rxy = koefisien korelasi antara variable x dan variable y,dua variable yang dikorelasikan (x=X-x dan y=Y-y) rxy = jumlah perkalian x dengan y x2 = kuadrat dari x. y2 = kuadrat dari y. Korelasi product moment dengan kata kasar Dengan : ┌xy = koefisien korelasi anatara variable x dan variable y,dua variable yang dikorelasikan. N= Banyaknya siswa X= Nilai total Y= Skor total. Untuk mengadakan Interprestasi mengenai besarnya koefisien korelasi adalah sebagai berikut: Antara 0,81-1,00 Tinggi Antara 0,61-0,80 Cukup Antara 0,41-0,60 Agak rendah Antara 0,21-0,40 Rendah Antara 0,00-0,20 Sangat rendah Contoh soal : Tabel : Persiapan U/ Mencari Validitas Tes Prestasi B.Inggris No Nama X Y x y x2 y2 xy 1 Al-Hadi 6,5 6,3 0 -0,1 0,0 0,01 0,0 2 Ali Makki 7 6,8 +0,5 +0,4 0,25 0,16 +0,2 3 Firdaus 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8 4 Asnawi 7 6,8 +0,5 +0,4 0,25 0,16 +0,2 5 Dia Wahyuni 6 7 -0,5 +0,6 0,25 0,36 -0,3 6 A. Ruslan 6 6,2 -0,5 -0,2 0,25 0,04 +0,1 7 Khoiri 5,5 5,1 -0,1 -1,3 1,0 1,69 +1,3 8 Qosyim 6,5 6 0 -0,4 0,0 0,16 0,0 9 Arifah Wikansari 7, 6,5 +0,5 +0,1 0,25 0,01 +0,05 10 Eli Mufidah 6 5,9 -0,5 -0,6 0,25 0,36 +0,3 Jumlah 65,0 63,8 3,5 3,59 2,65 Bila dilihat pada kedua hitungan diatas terdapt perbedaan 0,003 lebih besar pd simpangan ini wajar karna adanya pembulatan . Koefisien Korelasi adalah sebagai berikut: Antara 0,800 sampai dengan 1,00 = sangat tinggi Antara 0,600 sampai dengan 0,800 = tinggi Antara 0,400 sampai dengan 0,600 = cukup Antara 0,200 sampai dengan 0,400 =rendah Antara 0,00 sampai dengan 0,200 = sangat rendah Validitas Butir Soal Atau Validitas Item. Validitas di atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas soal perlu juga mencari validitas butir soal atau validitas item. Sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi. Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah). Sedangkan skor total merupakan jumlah dari skor untuk semua item yang membangun soal tersebut. Rumus untuk menghitung validitas item. Keterangan : Rpbi = koefisien korelasi biserial. Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya. Mt = rerata skor total St = standar deviasi dan skor otal P = proporsi siswa yang menjawab benar (banyakknya siswa yang benar dibagi jumlah seluruh siswa) g = proporsi siswa yang menjawab salah (g=1-p) Sedangkan untuk menghitung validitas item pada soal-soal tes dan soal-soal bentuk uraian di mana skor untuk setiap item diberikan menghendaki gradualisasi penialain, menggunakan rumus korelasi product moment baik dengan simpanagan atau dengan angka kasar antara skor setiap item dengan skor total. Penafsiran koefisien korelasinya dapat melihat ke tabel harga kritik r product moment pearson dengan kriteria jika r yang dihitung lebih besar dari r tabel maka item tersebut valid. Analisis Reliabilitas. Suatu tes dapat dikatakan mempunyai kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian realibilitas tes berhubungan dengan masalah ketetapan hasil tes atau seandainya hasilnya berubah-rubah, perubahan yang terjadi dapat dikatakan tidak berarti. Reliabilitas alat penilaian adalah ketetapan atau keajegan alat dalam menilai apa yang dinilainya. Beberapa hal yang memepengaruhi hasil tes: Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya. Hal yang berhubungan dengan tercoba (testee) Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarakan besar kecilnya reliabilitas tes. Hal yang berhubungan dengan penyelenggaraan tes. Faktor penyelenggaraan tes yang bersifat administrasi sangat menentukan hasil tes. Kualitas butir-butir soal ditentukan oleh : Jelas tidaknya rumusan soal. Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab. Petunjuknya jelas sehingga mudah dan cepat dikerjakan. Cara – cara mencari besarnya reliabilitas yaitu : Metode Bentuk Parallel (Equivalent). Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalya berbeda. Metode Tes Ulang (Test-Retest Method) Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetesannya memiliki satu segi tetapi dicobakan dua kali. Metode Belah Dua(Split-Half Method). Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali pada waktu membelah dua dan mengkorelasikan dua belahan baru diketahui reliabiltas separo tes. Syarat menggunakan metode ini adalah bahwa banyaknya butir soal harus genap agar dapat dibelah, item-item yang membangun soal harus homogeny atau dibelah terdapat keseimbangan antara belahan pertama dan belahan kedua. Rumus empiris Spearman-Brown sebagai berikut : r_(11=) (2 .r 1⁄2 1⁄2)/(( 1+r 1⁄(2 1⁄2))) dengan keterangan: r11 : koefisien realiabilitas yang sudah disesuaikan. r1/21/2 : korelasi antara skor-skor setiap belahan tes. . Contoh: Koefisien korelasi belah dua adalah 0,60 R11 = = Sedangkan untuk mengatasi kesulitan bila berhadapan dengan banyaknya butir soal ganjil atau genap, maka digunakan rumus kuder-Richhardson (KR-20) sebagai berikut : r_11=[n/(n-1)][(S^2- ∑▒pq)/S^2 ] dengan : r11 = reliabilitas instrument n= banyakknya butir soal S=standar deviasi dari tes (akar varians) P=proporsi subjek yang menjawab item dengan benar q =proporsi subjek yang menjawab item dengan salah. Σpq= jumlah hasil perkalian p dan q Untuk mecari reliabilitas tes bentuk uraian dan bentuk non tes digunakan rumus Alpha sebagai berikut : Misalnya disusun tes sebanyak 80 soal. Setelah diberikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata rata dan simpangan bakunya. Misalnya diperoleh nilai rata rata 60 dan simpangan bakunya 8. Dengan rumus di atas maka: R11 = = = = 0,77 Uraian ukuran reliabilitas yang telah dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling tepat digunakan ber¬gantung pada peneliti. Pertimbangan tersebut, antara lain sifat va¬riabel yang diukur, jenis alat ukur, jumlah subjek yang diukur, serta hasil hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian. Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah melakukan dua kali pengukuran didapatkan skor tes sebagai berikut: Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut: Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect. Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-soal dan bahkan jawaban ketika dilakukan test pertama. CONTOH PERHITUNGAN RELIABILITAS (METODA BELAH DUA) Nama Skor Skor Siswa Ganjil Genap X Y X2 Y2 X.Y A 20 25 400 625 500 B 38 40 1444 1600 1520 C 28 26 784 676 728 D 33 32 1089 1024 1056 E 33 43 1089 1849 1419 F 44 45 1936 2025 1980 G 17 16 289 256 272 H 33 32 1089 1024 1056 I 36 35 1296 1225 1260 J 35 32 1225 1024 1120 K 30 26 900 676 780 L 42 38 1764 1444 1596 —————————————————————————————————- Jumlah: 389 390 13305 13448 13287 Setelah dihitung / dijumlahkan diperoleh harga-harga: Y=390,X=389, N=12, XY=13287Y2=13448, X2=13305,  Harga-harga tersebut di atas dimasukkan ke dalam rumus Pearson’s Product Moment sebagai berikut: Y)X) (XY) – (N ( rxy = –____________________________— Y) 2]Y2) - ( X)2] [N(X2) - ( √ [N( Dengan rumus itu diperoleh harga rxy atau rgg = 0,88 2 x 0,88 1,72 Koef. reliabilitas (rtt) = ————- = —— = 0,94 1 + 0,88 1,88 Berarti tes ini tergolong baik sebab reliabilitasnya tinggi. KESIMPULAN Tes adalah suatu cara untuk mengadakan penilaian yang berbentuk suatu tugas atau serangkaian tugas yang harus dikerjakan oleh anak atau sekelompok anak sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak tersebut, yang dapat dibandingkan dengan nilai yang dicapai oleh anak-anak lain atau dengan nilai standart yang ditetapkan Ada beberapa cara melalukan analisis butir soal: untuk dapat membedakan soal kategori mudah, sedang dan sukar. Analisis tingkat kesukaran soal untuk dapat membedakan soal kategori mudah, sedang dan sukar. Analisis daya pembeda mengkaji apakah soal mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah. Analisis validitas mengkaji kesahihan alat ukur (soal) dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur. Analisis reliabilitas mengkaji keajegan atau ketetapan hasil tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali. DAFTAR PUSTAKA Daryanto, H. 2001. Evaluasi Pendidikan. Cetakan II. Jakarta: Rineka Cipta. http://evaluasipendidikan.blogspot.com/2008/04/reliabilitas-pendekatan-tes ulang_10.html http://fidanurlaeli.wordpress.com/2010/11/28/analisis-kualitas-tes-dan-butir-soal/ http://gurupembaharu.com/home/Panduan Analisis Butir Soal http://www.azuarjuliandi.com/openarticles/cronbachalpha(manual).pdf Mahasiswa uhamka angkatan 2001 fkip. 2005. Kumpulan Hasil Diskusi Evaluasi Proses Dan Hasil Belajar,(Jakarta: FKIP UHAMKA) Nana sudjana&Ibrahim dalam bukunya, Penelitian dan Penilaian Pendidikan, (Bandung; Sinar Baru Algensindo, 2004) Rufi’i, “Penilaian Hasil Belajar(Asesmen)”, dalam modul Program Pendidikan dan Latihan Profesi guru, bagian B,(Surabaya; Departemen Pendidikan Nasional Universitas PGRI Adi Buana Surabaya, 2009) Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar. Cetakan III. (Bandung: Rosdakarya,1991) Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta, Bumi Aksara,1986) Wayan Nurkancana dan Sumartana, Evaluasi Pendidikan, (Surabaya; Penerbit, Usaha nasional,tth,)

Tidak ada komentar :

Posting Komentar