Jumat, 07 Oktober 2016

Teori, Eksperimen Skinner dan Implementasinya di Pembelajaran

Skinner
Burrhusm Frederic Skinner (lahir di Susquehanna, Pennsylvania, 20 Maret 1904 – meninggal di Massachusetts, 18 Agustus 1990pada umur 86 tahun) adalah seorang psikolog Amerika Serikat terkenal dari aliran behaviorisme. Inti pemikiran Skinner adalah setiap manusia bergerak karena mendapat rangsangan dari lingkungannya. Sistem tersebut dinamakan "cara kerja yang menentukan" (operant conditioning). Setiap makhluk hidup pasti selalu berada dalam proses bersinggungan dengan lingkungannya. Di dalam proses itu, makhluk hidup menerima rangsangan atau stimulan tertentu yang membuatnya bertindak sesuatu. Rangsangan itu disebut stimulan yang menggugah. Stimulan tertentu menyebabkan manusia melakukan tindakan-tindakan tertentu dengan konsekuensi-konsekuensi tertentu.
Skinner menempuh pendidikan dalam bidang Bahasa Inggris dari Hamilton College. Beberapa tahun kemudian, Skinner menempuh studi dalam bidang psikologi di Universitas Harvard. Pada tahun 1936, Ia mengajar di Universitas Minnesota, dan pada tahun 1948, ia mengajar di Universitas Harvard sampai akhir hayatnya. Salah satu buku terbaik dalam bidang psikologi yang ditulisnya adalah Walden II.

Eksperimen Skinner
Operant Conditioning
Dalam salah satu eksperimennya, Skinner menggunakan seekor tikus yang ditempatkan dalam sebuah peti yang disebut dengan Skinner Box. Kotak Skinner ini berisi dua macam komponen pokok, yaitu manipulandum dan alat pemberi reinforcement yang antara lain berupa wadah makanan. Manipulandum adalah komponen yang dapat dimanipulasi dan gerakannya berhubungan dengan reinforcement. Komponen ini terdiri dari tombol, batang jeruji, dan pengungkit.
Dalam eksperimen tadi mula-mula tikus itu mengeksplorasi peti sangkar dengan cara lari kesana kemari, mencium benda-benda yang ada disekitarnya, mencakar dinding, dan sebagainya. Tingkah laku tikus yang demikian disebut dengan ‘’ emmited behavior ” (tingkah laku yang terpancar), yakni tingkah laku yang terpancar dari organism tanpa memedulikan stimulus tertentu. Kemudian salah satu tingkah laku tikus (seperti cakaran kaki, sentuhan moncong) dapat menekan pengungkit. Tekanan pengungkit ini mengakibatkan munculnya butir-butir makanan ke dalam wadahnya.
Butir-butir makanan yang muncul merupakan reinforce bagi tikus yang disebut dengan tingkah laku operant yang akan terus meningkat apabila diiringi reinforcement, yaitu penguatan berupa butiran-butiran makanan kedalam wadah makanan.
Teori belajar operant conditioning ini juga tunduk pada dua hukum operant yang berbeda lainnya, yaitu law operant conditioning dan law extinction. Menurut hukum operant conditioning, jika suatu tingkah diriingi oleh sebuah penguat (reinforcement), maka tingkah laku tersebut meningkat. Sedangkan menurut hukum law extinction, jika suatu tingkah laku yang diperkuat dengan stimulus penguat dalam kondisioning, tidak diiringi stimulus penguat, maka tingkah laku tersebut akan menurun atau bahkan musnah. Kedua hukum ini pada dasarnya juga memiliki kesamaan dengan hukum pembiasaan klasik (classical conditioning).




Skinner membedakan perilaku atas :
1.                    Perilaku alami (innate behavior), yang kemudian disebut juga sebagai clasical ataupun respondent behavior, yaitu perilaku yang diharapkan timbul oleh stimulus yang jelas ataupun spesifik, perilaku yangbersifat refleksif.
2.                   Perilaku operan (operant behavior), yaitu perilakuyang ditimbulkan oleh stimulus yang tidak diketahui, namun semata-mataditimbulkan oleh organisme itu sendiri setelah mendapatkan penguatan.
Skinner yakin jika kebanyakan perilaku manusia dipelajari lewat Operant Conditioning atau pengkondisian operan, yang kuncinya adalah penguatan segera terhadap respons. Operant Conditioning adalah suatu proses penguatan perilaku yang dapatmengakibatkan perilaku tersebut dapat berulang kembali atau menghilang sesuaidengan keinginan.
Skinner membuat mesin untuk percobaanya dalam Operant Conditioning yang dinamakan dengan"Skinner Box" dan tikus yang merupakan subjek yang sering digunakandalam percobaanya.
Dalam percobaannya tersebut yang dilakukan oleh Skinner dalam Laboratorium, seekor tikus yang lapar diletakkan dalam Skinner Box, kemudian binatang tersebut akan akanmenekan sebuah tuas yang akan membukakan dulang makanan, sehingga diperolehpenguatan dalam bentuk makanan. Di dalam setiap keadaan, seekor binatang akanmemperlihatkan bentuk perilaku tertentu; tikus tadi misalnya, akanmemperlihatkan perilaku menyelidik pada saat pertama kali masuk kedalam Box,yaitu dengan mencakar-cakar dinding dan membauinya sambil melihat-lihat kesekelilingnya. Secara kebetulan, dalam perilaku menyelidik tersebut tikusmenyentuh tuas makanan dan makanan pun berjatuhan. Setiap kali tikus melakukanhal ini akan mendapatkan makanan; penekanan tuas diperkuat dengan penyajian makanan tersebut, sehingga tikus tersebut akan menghubungkan perilaku tertentudengan penerimaan imbalan berupa makanan tadi. Jadi, tikus tersebut akanbelajar bahwa setiap kali menekan tuas dia akan mendapatkan makanan dan tikustersebut akan sering kali mengulangi perilakunya, sampai ada proses pemadamanatau penghilangan dengan menghilangkan penguatannya.
Dalam eksperimen Skinner tersebut terdapat istilah Penguatan atau dapat disebut sebagai reinforcementyaitu, setiap kejadian yang meningkatkan ataupun mempertahankan kemungkinan adanya respon terhadap kemungkinan respon yang diinginkan. Biasanya yangberupa penguat adalah sesuatu yang dapat menguatkan dorongan dasar (basicdriver, seperti makanan yang dapat memuaskan rasa lapar atau air yang dapatmenuatkan rasa haus) namun tidak harus selalu demikian.
Pada manusia, penguatan sering salah sasaran sehingga pembelajaran menjadi tidak effisien. Masalah lain dengan pengkondisian manusia adalah penentuan manakahkonsekuansi-konsekuensi yang menguatkan dan manakah yang melemahkan. Karena bergantung pada sejarah individu, penguatan dan disiplin terkadang dapatmenjadi penguatan sedangkan ciuman dan pujian dapat menjadi hukuman.
Dalam penguatantersebut dibedakan antara pengutan positif dan negatif.
·                     Penguatan positif adalah stimulus yang apabila diberikan sesudah terjadinya respon, meningkatkan kemungkinan respon tersebut.

                              ->          Respon 1
                           /
S (Rangsang)  --->              Respon 2       -->          Penguatan
                           \
                             ->          Respon 3
Menjadi :

S(Rangsang)   -->              Respon 2 berulang-ulang

·                     Penguatan negatif adalah stimulus yang dihapuskan sesudah responnyatimbul, meningkatkan kemungkinan adanya respon; shock elektrik dan bunyi yangmenyakitkan digolongkan sebagai penguat negatif dan sebagai penguat negatifjika penguat itu dapat ditiadakan ketika timbul respon yang diinginkan.
                               ->        Respon 1     -->                Shock elektrik
                             /
S (Rangsang)    -->            Respon2
                            \
                             ->          Respon3      -->               Shock elektrik
Menjadi :

S (Rangsang)        -->             Respon2

Adapun Jenis-Jenis Penguat Skinner dikategorikan, sbb;
1.                   Penguat utama (Primary reinforcers) adalah  penguat yang memengaruhi perilaku tanpa perlu belajar, seperti: makanan, minuman, seks. Ini disebut penguat alami. 
2.                   Penguat sekunder (Secondar reinforcers). Adalah penguat yang membutuhkan  tenaga penguat karena sudah diasosiasikan dengan penguat utama, seperti memuji seseorang. 
      Tadi telah diuraikan bahwa bagaimana seekor tikus dalam Skinner Box yang menekan tuas akan menerima butir-butir makanan setiap kali tikus tersebut melakukannya. Apabila kita menghentikan pemberian penguatan ini, perilaku penekanan tuas pun secara bertahap akan menghilang, biasanya hanya beberapa menit setelahpenghentian penguatan. Apa yang membuat Operant Conditioning ini penting untuk menjelaskan belajar adalah pengembangan jadwal penguatan yang dilakukanoleh Skinner. Jadwal ini merupakan bentuk lain dari penyajian penguatan yang dihasilkannya perbedaan pada taraf respons (respons rate), yaitu taraf penekanan tuas oleh tikus tadi, maupun pada taraf penghapusan (extinctionrate), yaitu terhapusnya perilaku penekanan tuas. Jadwal penguatan inilahyang membuat Operant Conditioning menjadi bentuk belajar yang sangatFleksibel. Setiap respons yang pada suatu saat dapat dibiasakan dan dapat juga diakhiri sesuai dengan keinginan kita, dan ini tercapai dengan melalui beragam jadwal pengautan.
    Penguatan dapat dialakukkan kepada perilaku entah melalui jadwal yang berkesinambungan atau sebentar-sebentar. Dalam jadwal-penguatan-berkesinambungan (continous schedule), organisme diperkuat untuk setiap responnya. Jenis penjadwalan ini dapat meningkatkan frekuensi respons sekalipun pemakaian penguat kadang-kadang tidak efisien. Skinner kemudian mengusulkan jadwal-penguatan sebentar-sebentar (intermittent schedules) yang bukan hanya lebih effisien menggunakan penguat, tetapi juga menghasilkan respons yang lebih resisten terhadap pemadaman. Melaui intermittent schedule Skinner mengidentifikasi dua macam penguatan yaitu penguatan berjangka (Interval reinforcement ) dan penguatan berbanding ( ratio reinforcement).
·                      Interval reinforcement adalah penguatan yang dijadwalkan atau yang muncul pada interval waktu yang telah ditentukan. Contoh: seseorang memutuskan untuk memberikan permen  hanya jika orang tersebut  tetap diam  selama lima menit. Setelah itu baru diberikan permen, tidak ada penguatan tambahan yang diberikan sampai berlalu lima menit berikutnya.

·                  Ratio reinforcement adalah penguatan yang muncul setelah sejumlah respon tertentu. Contoh: seseorang akan memberikan permen pada seoranganak apabila anak tersebut menampilkan perilaku patuh, setelah anak tersebutpatuh kemudian diberikan permen tersebut dan terus seperti itu sehingga anaktersebut benar-benar patuh.
Penjadwalan tersebut terbagi lagi menjadi 4 jenis penguatan jadwal, yakni :
·                     Rasio tetap (Fixed ratio), dimana penguatan tergantungpada sejumlah respon yang terbatas. Artinya, mengatur pemberian reinforcement sesudah respon yang dikehendaki muncul yang kesekian kalinya. Misalnya, Pekerja diberikan bonus apabila mampu menghasilkan produk sesuai target dengan kualitas produk yang sesuai dengan standar (mampu mengikuti prosedur)
Tujuan , membentuk perilaku bekerja yang efektif dan dengan tetap memperhatikan kualitas
Reinforcement, bonus
·                     Rasio yang dapat berubah (variable ratio), dimana sejumlah respon yang dibutuhkan untuk penguatan yang berbeda-berbeda dari satu penguatan ke penguatan berikutnya. Misalnya, Pemberian bonus pada pekerja dilakukan secara acak yaknipada periode tertentu pekerja diberikan bonus apabila mampu memberikan performa kerja yang ramah dan menghasilkan produk berjumlah 1000 unit, namun pada periode yang lain pekerja diberikan bonus apabila telah mampu menghasilkan produk 2000 unit, dan pada waktu yang lain pekerja mendapatkan bonus saat mampu menghasilkan produk 2500 unit.
Tujuan, membentuk perilaku bekerja dengan tidak selalu bergantung kepada bonus karena bonus akan diberikan sewaktu-waktu sehingga pekerja cenderung akan menampilakan performa kerjanya yang paling maksimal.
Reinforcement, bonus
·                     Interval tetap (fixed interval), dimana  suatu responmenghasilkan penguatan setelah jangka waktu tertentu (khusus).Misalnya, Ujian tengah semester diberikan pada pertengahan semester (waktu telah ditentukan). Mahasiswa akan belajar lebih sungguh-sungguh saat menjelang ujian agar mendapat nilai yang baik.
Tujuan, membentuk perilaku belajar.Reinforcement,  nilai yang baik (A)
·                     Interval yang dapat berubah (variable interval), dimana penguatan tergantung pada waktu dan  suatu respon, tetapiwaktu antara penguatan berbeda-beda. Artinya, reinforcement diberikkan dalam waktu yang tidak menentu, tetapi jumlah atau rata-rata penguat yang diberikkan sama dengan pengaturan tetap.Misalnya, dosen yang memberikan kuis tiba-tiba dalam perkuliahan sehingga mahasiswa diharapkan selalu belajar agar apabila diadakan kuis mendadak mereka akan siap dan dapat meraih nilai yang baik
Tujuan, membentuk perilaku belajar mahasiswa
Reinforcement, nilai yang baik (A)

                              /-->      Fixed Ratio
                       Ratio
                      /        \ -->     Variable Ratio
                     /
Reinfocement
                    \
                     \            /-->      Fixed interval
                      Interval
                                  \-->       Variable Interval

Extinction (pemadaman)
       Meskipun sudah dipelajari, respons masih dapat padam karena empat alasan berikut :
1.                   Respons bisa dilupakkan dalam beberapa waktu
2.                   Respons dapat hilang jika ada campur tangan dari proes pembelajaran lain sebelum atau sesudahnya
3.                   Respon dapat hilang akibat penghukuman
4.                   Kecenderungan respon yang sudah diperoleh sebelumnyauntuk menjadi progresif dan melemahkan respon sesudahnya yang sudah tidak lagimendapatkan penguatan
Prinsip dari extinction dalampengkondisian operan adalah penahanan pemberian reinforcement atau penghentian pemberian reinforcement, artinya bila respon yang diinginkanterjadi, maka respon tersebut tidak diikuti dengan pemberian reinforcement. Pada percobaan Skinner diatas, penekanan tuas tidak lagi diikuti dengan munculnya makanan, maka secara bertahap perilaku menekan tuas pada tikus akan hilang Generalisasi Stimulus     
Unconditional Response dalam pengkondisian klasikal, cenderung untuk muncul bila dihadapkan pada US (Unconditioned Stimulus) yang mirip.
Demikian juga halnya dengan Pengkondisian Operan. Bila stimulus atau event yang mengawali suatu respon itu mirip, maka perilaku (respon) yang sama cenderung untukmuncul. Contohnya dapat kita lihat dalam penelitian Skinner terhadap seekor burung merpati dalam kotak. Dalam kotak tersebut ada "kunci" yangdapat diterangi oleh lampu. Saat lampu dinyalakan (dan menerangi"kunci") burung mematuk "kunci" tersebut, maka makanan akanmengalir dari lubang di bawah kunci. Untuk kepentingan penelitian generalisasi stimulus, lampu yang menerangi "kunci" diubah-ubah intensitasnya.Besar kecilnya peningkatan tergantung dari kedekatan atau kemiripan stimulus atau situasi yang menimbulkan respon.
Stimulus Diskriminasi
Diskriminasi stimulus bertujuan agar subjek dapat melakukan perbedaan terhadap stimulus atausituasi yang dihadirkan agar subjek hanya melakukan respon terhadap stimulusatau situasi yang sesuai. Dalam pengkondisian operan, diskriminasi stimulus dilakukan dengan pemberian reinforcement terhadap respon yang diinginkan dalam suatu situasi atau stimulus yang sesuai dan tidak memberikan reinforcement bila respon tersebut muncul dalamsituasi yang tidak sesuai. Contohnya pada percobaan burung merpati tadi. Makanan sebagai reinforcer hanya diberikan bila yang menyala lampu hijau. Sedangkan bila yang menyala lampu merah, reinforcer tidak diberikan. Pemasangan lampu merah dan hijau ini dilakukan secara berturut-turut, hijau-merah-hijau-merah, dst, atau makanan-tidakada-makanan-tidak ada, dst. Oleh karena itu teknik ini disebut dengan prosesdikriminasi "go-no-go".
Reinforcement Negative dan Escape Learning
Escapelearning adalah prosesbelajar yang didasarkan pada pengkondisian operan dengan teknik pemberianreinforcer negatif. Contohnya dapat kita lihat melalui penelitian terhadapseekor tikus di dalam kotak percobaan yang terdiri dari sebuah kandang yangmemiliki dua tingkat tempat tikus berdiri. Bila tikus turun dari tingkat keduake tingkat pertama, maka tikus akan mengalami kejutan listrik. Oleh sebab itu tikus berusaha untuk naik kembali ke tingkat dua. Perilaku seperti itulah yangdisebut dengan proses belajar escape (melarikan diri) yangdidasarkan pada pemberian reinforcer negatif pada pengkondisian operan.
Avoidance Learning
Avoidance learning adalah proses belajar untuk menghindari reinforcement negatif. Caranya dengan menghadirkan suatu stimulus sebelum pemberian reinforcer negatif. Pada contoh percobaan di atas, tikus diberi sebuah bel atau buzzer sebelumdiberi kejutan listrik. Setelahterjadi proses belajar, dengan mendengar buzzer saja tikus sudah berusaha naik ke tingkat dua agar tidak terkena kejutan listrik. Oleh karena itu proses belajar yang demikian disebut dengan avoidance learning (proses belajar untuk menghindarkan diri dari reinforcer negatif)
Punishment
Punisher adalah stimulus atau kejadian dimana jika diberikan pada suatu respon akan menurunkan kemungkinan respon tersebut akan muncul kembali.
Punishment  adalah penggunaan punisher untuk menekan atau menghentikan suatu trespon agar tidak muncul kembali.
Positive Punishment (juga disebut "Hukuman dengan rangsangan tidak terduga") muncul ketika suatu prilaku (respon) diikuti oleh suatu rangsangan tidak menyenangkan, sepertimemperkenalkan setruman atau suara keras, menghasilkan prilaku yang tidak diinginkan berkurang atau seseorang dipukul karena salah.
Negative Punishment (juga disebut "Hukuman dengan pengambilan tidakterduga" muncul ketika suatu perilaku (respon) diikuti dengan membuang rangsangan yang menyenangkan, seperti mengambil mainan anak-anak bersama perilaku yang tidak diinginkan, menghasilkan perilaku yang tidak diinginkan berkurang, pemotongan uang jajan.

Sejarah Munculnya Teori Kondisioning Operan B.F Skinner
Asas pengkondisian operan B.F Skinner dimulai awal tahun 1930-an, pada waktu keluarnya teori S-R. Waktu itu model kondisian klasik dari Pavlov telah memberikan pengaruh yang kuatpada pelaksanaan penelitian. Istilah-istilah seperti cues (pengisyratan), purposive behavior (tingkah laku purposive) dandrive stimuli (stimulus dorongan) dikemukakan untuk menunjukkan daya suatu stimulus untuk memunculkan atau memicu suatu respon tertentu.
Skinner tidak sependapat dengan pandangan S-R dan penjelasan reflex bersyarat dimana stimulus terus memiliki sifat-sifat kekuatan yang tidak mengendur. Menurut Skinner penjelasan S-R tentang terjadinya perubahan tingkah laku tidak lengkap untuk menjelaskan bagaimana organisme berinteraksi dengan lingkungannya. Bukan begitu, banyak tingkah laku menghasilkan perubahan atau konsekuensi pada lingkungan yang mempunyai pengaruh terhadap organisme dan dengan begitu mengubah kemungkinan organisme itu merespon nanti.
Asas-asas kondisioning operan adalah kelanjutan dari tradisi yang didirikan oleh John Watson. Artinya, agar psikologi bisa menjadi suatu ilmu, maka studi tingkah laku harus dijadikan fokus penelitian psikologi. Tidak seperti halnya teoritikus-teoritikus S-R lainnya, Skinner menghindari kontradiksi yang ditampilkan oleh model kondisioning klasik dari Pavlov dan kondisioning instrumental dari Thorndike. Ia mengajukan suatu paradigma yang mencakup kedua jenis respon itu dan berlanjut dengan mengupas kondisi-kondisi yang bertanggung jawab atas munculnya respons atau tingkah laku operan.
    
C.    Teori Belajar Skinner
Teori Skinner sering juga disebut dengan operant conditioning. Dinamakan teori Skinner karena penelitian pada teori ini dilakukan oleh seorang ilmuan bernama lengkap Burhuss Frederic Skinner. Dialahir pada tanggal 20 Maret 1904 di sebuah kota kecil bernama Susquehanna, Pennsylvania. Ayahnya adalah seorang pengacara dan ibunya adalah seorang ibu rumah tangga yang baik. Ia merefleksikan tahun-tahun awal kehidupannya sebagai suatu masa dalam lingkungan yang stabil, dimana belajar sangat dihargai dan disiplin sangat kuat. Sebelum membahas lebih mendalam mengenai Teori Skinner ini, terlebih dahulu akan dibahas mengenai Teori Conditioning.
Mula-mula teori Conditioning ini dipelopori oleh Ivan Pavlov (1927), kemudian dikembangkan oleh Watson (1970). Percobaan yang dilakukan Pavlov terhadap anjingnya menggambarkan bahwa belajar dilakukan dengan mengasosiasikan suatu ganjaran (reward) dengan rangsangan (stimulus) yang mendahului ganjaran itu. Perangsang bersyarat dan perangsang tidak bersyarat merupakan pengkondisian (conditioning) di dalam proses pembentukan perilaku. Watson mengembangkan teori ini melalui percobaan tentang gejala takut pada anak, dengan menggunakan tikus putih. Menurut teori ini, belajar adalah suatu proses yang disebabkan oleh adanya syarat tertentu yaitu berupa rangsangan. Pengkodisian (conditioning) dalam bentuk rangsangan dan pembiasaan mereaksi terhadap perangsang tertentu menimbulkan proses belajar.
Seperti Pavlov dan Watson, Skinner juga memikirkan tingkah laku sebagai hubungan antara perangsang dan respons, tetapi berbeda dengan kedua ilmuan yaitu Pavlov dan Watson. Skinner kurang setuju dengan teori dari Pavlov. Skinner menyatakan bahwa teori Pavlov hanya berlaku bagi interaksi antara stimulus dan respons yang sederhana saja. Padahal manusia dalam menjalankan fungsinya memerlukan prilaku yang kompleks yang mempersyaratkan terjadinya interaksi stimulus dan respons yang kompleks pula. Dengan demikian, interaksi stimulus-respons dalam diri seorang individu tidaklah sesederhana itu.
Menurut Skinner, kunci untuk memahami perilaku individu terletak pada pemahaman terhadap hubungan antara stimulus satu dengan stimulus lainnya, respons yang dimunculkan, dan juga berbagai konsekuensi yang diakibatkan oleh respons tersebut. Skinner setuju dengan pendapat Watson yang mengatakan bahwa belajar merupakan proses perubahan perilaku.
Ada enam asumsi dasar dari teori Operant Conditioning ini, yaitu :
1)      Hasil belajar merupakan perilaku yang dapat diamati
2)      Perubahan perilaku sebagai hasil belajar secara fungsional berhubungan dengan perubahan situasi dalam lingkungan atau suatu kondisi
3)      Hubungan antara perilaku dan lingkungan dapat ditentukan hanya jika elemen-elemen perilaku dan kondisi percobaan diukur secara fisik dan diamati perubahannya dalam situasi yang terkontrol ketat
4)      Data yang dihasilkan oleh percobaan-percobaan trhadap perilaku merupakan satu-satunya data yang dapat dipergunakan untuk mengkaji alasan munculnya suatu perilaku.
5)      Sumber data yang paling tepat adalah perilaku dari masing-masing individu.
6)      Dinamika interaksi antara individu dengan lingkungannya bersifat relatif sama untuk semua jenis makhluk hidup.
Skinner mengembangkan teori operant conditioning ini melalui percobaan terhadap burung dan kotak yang dilengkapi pengungkit. Apabila pengungkit itu kena tekanan maka ia dapat mengeluarkan makanan. Skinner membedakan adanya dua macam respons, yaitu :
1)      Respondent response (reflexive response), yaitu respons yang ditimbulkan oleh prangsang-perangsang tertentu. Perangsang-perangsang yang demikian itu, yang disebut eliciting stimuli, menimbulkan respons-respons yang secara relatif tetap, misalnya makanan yang menimbulkan keluarnya air liur. Pada umumnya perangsang-perangsang yang demikian itu mendahului respons yang ditimbulkannya.
2)      Operant Response (instrumental response), yaitu respons yang timbul dan berkembangnya diikuti oleh perangsang-perangsang tertentu. Perangsang yang demikian itu disebut reinforcing stimuli ataureinforceri, karena perangsang-perangsang tersebut memperkuat respons yang telah dilakukan oleh organisme. Jadi, perangsang yang demikian itu mengikuti (dan karenanya memperkuat) sesuatu tingkah laku tertentu yang telah dilakukan. Jika seorang anak belajar (telah melakukan perbuatan), lalu mendapat hadiah, maka dia akan menjadi lebih giat belajar (responsnya menjadi lebih intensif/kuat).

Dalam kenyataannya, respons jenis pertama itu (respondent response atau respondent behavior) sangat terbatas adanya pada manusia dan karena adanya hubungan yang pasti antara stimulus dan respons kemungkinan untuk memodifikasikannya adalah kecil. Sebaliknya, operant response atau instrumental behavior merupakan bagian terbesar daripada tingkah laku manusia, dan kemungkinannya untuk memodifikasi \boleh dikatakan tak terbatas. Fokus teori Skinner adalah pada respons atau jenis tingkah laku yang kedua ini; soalnya ialah bagaimana menimbulkan, mengembangkan dan memodifikasikan tingkah laku tersebut. Jika disederhanakan prosedur pembentukan tingkah laku dalam operant conditioningitu adalah sebagai berikut :
1)      Dilakukan identifikasi mengenai hal apa yang merupakan reinforcer (hadiah) bagi tingkah laku yang akan dibentuk itu.
2)      Dilakukan analisis untuk mengidentifikasi komponen-komponen kecil yang membentuk tingkah laku yang dimaksud. Komponen-komponen itu lalu disusun dalam urutan yang tepat untuk menuju kepada terbentuknya tingkah laku yang dimaksud.
3)      Dengan mempergunakan secara urut komponen-komponen itu sebagai tujuan-tujuan sementara, mengidentifikasi reinforcer (hadiah) untuk masing -masing komponen itu.
4)      Melakukan pembentukan tingkah laku dengan menggunakan urutan komponen-komponen yang telah tersusun itu. Kalau komponen pertama telah dilakukan maka hadiahnya diberikan; hal ini akan mengakibatkan komponen itu makin cenderung untuk sering dilakukan. Kalau ini sudah terbentuk, dilakukannya komponen kedua yang diberi hadiah (komponen pertama tidak lagi memerlukan hadiah); demikian berulang-ulang, sampai komponen kedua terbentuk. Setelah itu dilanjutkan dengan komponen ketiga, keempat, dan selanjutnya, sampai seluruh tingkah laku yang diharapkan terbentuk.

Dalam kenyataan, prosedur penyederhanaan operant conditioning banyak variasi dan lebih kompleks.Komponen proses belajar menurut Skinner terdiri dari stimulus yang diskriminatif (discriminative stimulus) dan penguatan (positif, negatif, dan hukuman) untuk menghasilkan respons (perubahan tingkah laku). Stimulus yang diskriminatif menurut Skinner merupakan stimulus yang selalu hadir untuk pemunculan suatu respons. Kunci berwarna merah merupakan stimulus yang diskriminatif dalam percobaan Skinner terhadap burung merpati. Jika merpati mematuk kunci merah maka merpati akan memperoleh makanan. Setelah beberapa kali pengulangan, jika kunci diganti warna maka merpati tidak akan mematuk. Makanan dalam hal ini berfungsi sebagai faktor penguatan. Kemungkinan pemunculan respons dapat dimaksimalkan dengan kehadiran stimulus yang diskriminatif. Jika ada stimulus lain yang memiliki persamaaan dengan stimulus diskriminatif maka respons dapat dimunculkan kembali
Skinner juga membuat eksperimen dalam laboratoriumnya dengan memasukkan tikus kedalam kotak yang disebut Skinner Box.  Kotak ini sudah dilengkapi dengan berbagi perlengkapan yaitu tombol, alat pemberi makan, penampung makanan, lampu yang diatur nyalanya dan lantai yang dialiri oleh listrik.  Karena dorongan lapar sang tikus (hunger drive), si tikus berusaha keluar untuk mencari makanan.
Selama tikus itu bergerak kesana-kemari untuk keluar dari box, tidak sengaja tikus itu menekan tombol sehingga makanan keluar. Secara terjadwal, diberikan makanan secara bertahap sesuai peningkatan perilaku yang di tunjukkan oleh tikus tersebut, sehingga proses ini disebut shapping. Tujuan dari eksperimen ini sendiri adalah bahwa unsur terpenting dalam belajar adalah penguatan. Maksudnya adalah pengetahuan yang terbentuk melalui ikatan stimulus respon akan semakin kuat bila diberi penguatan. Selain itu menghasilkan hukum-hukum dari teori belajar yaitu:
1)      Law of operant conditioning, yaitu jika timbulnya perilaku yang diiringi dengan stimulus penguat, maka perilaku itu menguat.
2)      Law of operant of extinction, yaitu jika timbulnya operant telah diperkuat melalui proses conditioning itu tidak diiringi stimulus penguat , maka perilaku itu akan menurun.(John W. satrock, 2007).

Jika dalam teori Thorndike dikenal konsep reward, maka dalam teori Skinner menganggapreinforcement merupakan faktor penting dalam belajar. Reinforcement (penguatan) adalah konsekuensi yang meningkatkan probabilitas bahwa suatu perilaku akan terjadi. Dan Punishment (hukuman) adalah konsekuensi yang menurunkan probabilitas terjadinya suatu perilaku. Penguatan boleh jadi kompleks. Penguatan berarti memperkuat. Secara umum reinforcement (penguatan) dibedakan menjadi tiga kelompok, yaitu:
a.       Dari Segi Jenisnya, reinforcement dibagi menjadi dua kategori, yaitu:
         Reinforcemen primer yaitu reinforcemen yang berupa kebutuhan dasar manusia seperti; makanan, air, keamanan, dan kehangatan.
         Reinforcemen sekunder yaitu reinforcemen yang diasosiasikan dengan reinforcemen primer, seperti; uang mungkin tidak mempunyai nilai bagi anak kecil sampai ia belajar bahwa uang itu dapat digunakan untuk membeli kue kesukaannya.
b.      Dari Segi Bentuknya, reinforcement dibagi menjadi dua, yaitu:
         Penguatan Positifadalah penguatan berdasarkan prinsip bahwa frekuensi respons meningkat karena diikuti dengan stimulus yang mendukung (rewarding). Bentuk-bentuk penguatan positif adalah berupa hadiah (permen, kado, makanan, dll) dan berupa perilaku (senyum, menganggukkan kepala untuk menyetujui, bertepuk tangan, mengacungkan jempol, atau penghargaan).
         Penguatan Negatifadalah penguatan berdasarkan prinsip bahwa frekuensi respons meningkat karena diikuti dengan penghilangan stimulus yang merugikan (tidak menyenangkan). Bentuk-bentuk penguatan negatif antara lain: menunda/tidak memberi penghargaan, memberikan tugas tambahan atau menunjukkan perilaku tidak senang (menggeleng, kening berkerut, muka kecewa, dll).

c.       Waktu pemberian reinforcemen, ada empat macam pemberian jadwal reinforcemen, yaitu:
         Fixed Rtio (FR) adalah salah satu skedul pemberian reinforcemen ketika reinforcemen diberikan setelah sejumlah tingkah laku. Misalnya, seorang guru mengatakan “kalau kalian dapat menyelesaikan sepuluh soal matematika dengan cepat dan benar, maka kalian boleh pulang dahulu”.
         Variabel-Ratio (VR) adalah sejumlah prilaku yang dibutuhkan untuk berbgai macam reinforcemen, dari reinforcemen satu ke reinforcemen yang lain.
         Fixed Interval (FI), yang diberikan ketika seorang menunjukkan prilaku yang diinginkan pada waktu tertentu.
         Variabel Interval (VI) yaitu reinforcemen yang diberikan tergantung pada waktu dan sebuah respons. Tetapi antara waktu dan reinforcemen bermacam-macam.

Satu  cara untuk mengingat perbedaan antara penguatan positif dan penguatan negatif adalah dalam penguatan positif ada sesuatu yang ditambahkan atau diperoleh. Dan rangsangannya makin memperkuat atau mendorong suatu tindak balas. Dalam penguatan negatif, ada sesuatu yang dikurangi atau di hilangkan serta menghindari suatu tindak balas tertentu yang tidak memuaskan. Adalah mudah mengacaukan penguatan negatif dengan hukuman. Agar istilah ini tidak rancu, ingat bahwa penguatan negatif meningkatkan probabilitas terjadinya suatu prilaku, sedangkan hukuman menurunkan probabilitas terjadinya perilaku. Skiner menekankan bahwa hukuman dapat menghasilkan tiga dampak yang tidak diharapkan, yaitu hukuman hanya bersifat sementara dalam menghilangkan respons yang tak diinginkan, hukuman dapat mengakibatkan timbulnya perasaanyang tidak mengenakkan, sepert malu, rasa bersalah, dll, dan hukuman dapat meningkatkan pemunculan perilaku yang dianggap mengurangi hadirnya stimulus yang tidak menyenangkan. Secara umum, hukuman tidak menghasilkan perilaku yang positif. Oleh karena itu, Skinner lebih menganjurkan penggunaan penguatan daripada hukuman jika ingin memperoleh respons yang benar.
Berikut ini disajikan contoh dari konsep penguatan positif, negatif, dan hukuman. Contoh dari konsep penguatan positif, negatif, dan hukuman( John W. Satrock, 2007).

Penguatan positif
Perilaku
Murid mengajukan pertanyaan yang bagus
Konsekuensi
Guru menguji murid
Prilaku kedepan
Murid mengajukan lebih banyak pertanyaan
Penguatan negatif
Perilaku
Murid menyerahkan PR tepat waktu
Konsekuensi
Guru berhenti menegur murid
Prilaku kedepan
Murid makin sering menyerahkan PR tepat waktu
Hukuman
Perilaku
Murid menyela guru
Konsekuensi
Guru mengajar murid langsung
Prilaku kedepan
Murid berhenti menyela guru

Penguatan bisa berbentuk postif dan negatif. Dalam kedua bentuk itu, konsekuensi meningkatkan prilaku. Dalam hukuman, perilakunya berkurang.

Teori Skinner tidak hanya mencakup penjelasan terhadap proses belajar sederhana, namun juga proses belajar yang kompleks, yang dikenal dengan nama shaping (pembentukan). Proses shaping yang dilakukan secara bertahap akan menghasilkan penguasaan terhadap perilaku yang kompleks melalui perancangan (manipulasi) stimulus yang diskriminatif dan penguatan. Menurut Skinner, proses shaping dapat menghasilkan perilaku yang kompleks yang tidak memiliki kemungkinan untuk diperoleh secara alamiah atau dengan sendirinya. Shaping yang berkelanjutan yang dilakukan untuk memperoleh perilaku kompleks, disebut dengan program oleh Skinner. Dari serangkaian percobaan yang dilakukan oleh Skinner dapat disimpulkan bahwa :
a)      Setiap langkah dalam proses belajar perlu dibuat pendek-pendek, berdasarkan tingkah laku yang pernah dipelajari sebelumnya.
b)      Untuk setiap langkah yang pendek tersebut disediakan penguatan yang dikontrol dengan hati-hati.
c)      Penguatan harus diberikan sesegera mungkin setelah respons yang benar dimunculkan.
d)     Stimulus diskriminatif perlu dirancang sedemikian rupa agar dapat diperoleh perampatan stimulus dan peningkatan keberhasilan belajar.

Dasar teori Skinner dan perkembangan teorinya selanjutnya menjadikan Skinner seorang penganut aliran perilaku yang mempunyai nama dan pengaruh yang sangat besar terhadap perkembangan teori belajar dalam aliran perilaku. Teori Operant Conditioning dari Skinner percaya bahwa setiap individu harus diidentifikasi karakteristik maupun perilaku awalnya untuk suatu proses shaping. Skinner menyatakan, bahwa perilaku dapat dibentuk (dan juga dihilangkan) sehingga (hampir) semua orang yang memperoleh latihan yang layak akan dapat memiliki perilaku tertentu yang diinginkan. Juga pengkondisian suatu respons sangat tergantung kepada penguatan yang dilakukan berulang-ulang secara berkesinambungan. Skinner juga mengemukakan bahwa manusia dapat diajar untuk berpikir atau menjadi kreatif melalui metode pemecahan masalah yang melibatkan proses identifikasi masalah secara tepat (labeling), dan proses mengaktifkan strategi (rule and or sequence) untuk memanipulasi variabel dalam masalah tersebut sehingga diperoleh pemecahan masalahnya.

Implementasi Teori Belajar B.F. Skinner dalam Pembelajaran
Penggunaan teori Skinner ini diimplementasikan dalam proses pembelajaran dikelas  sebagai berikut :
1)      Bahan yang dipelajari dianalisis sampai pada unit-unit secara organis.
2)      Hasil berlajar harus segera diberitahukan kepada siswa, jika salah dibetulkan dan jika benar diperkuat.
3)      Proses belajar harus mengikuti irama dari yang belajar.
4)      Materi pelajaran digunakan sistem modul.
5)      Tes lebih ditekankan untuk kepentingan diagnostic.
6)      Dalam proses pembelajaran lebih dipentingkan aktivitas sendiri.
7)      Dalam proses pembelajaran tidak dikenakan hukuman.
8)      Dalam pendidikan mengutamakan mengubah lingkungan untuk mengindari pelanggaran agar tidak menghukum.
9)      Tingkah laku yang diinginkan pendidik diberi hadiah.
10)  Hadiah diberikan kadang-kadang (jika perlu)
11)  Tingkah laku yang diinginkan, dianalisis kecil-kecil, semakin meningkat mencapai tujuan.
12)  Dalam pembelajaran sebaiknya digunakan shaping.
13)  Mementingkan kebutuhan yang akan menimbulkan tingkah laku operan.
14)  Dalam belajar mengajar menggunakan teaching machine.
15)  Melaksanakan mastery learning yaitu mempelajari bahan secara tuntas menurut waktunya masing-masing karena tiap anak berbeda-beda iramanya. Sehingga naik atau tamat sekolah dalam waktu yang berbeda-beda. Tugas guru berat, administrasi kompleks.



















Tidak ada komentar:

Posting Komentar