Sabtu, 24 Januari 2009

CAPTCHA, are you human?


Jika Anda pernah mengisi formulir di internet, seperti mendaftar email dan sebagainya, tentu Anda pernah melihat gambar huruf yang bengkok atau kacau balau seperti di gambar, lalu diminta menuliskan huruf-huruf itu dalam sebuah kotak isian. Apa huruf-huruf itu? Apa gunanya?



Gambar huruf kacau balau itu disebut CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart). Ini adalah salah satu penerapan metode Turing Test yang digagas oleh Alan Turing di tahun 1950. Gunanya untuk memastikan bahwa pengisi formulir adalah benar-benar seorang manusia. Program komputer akan mengalami kesulitan dalam mengartikan huruf-huruf yang bengkok-bengkok atau bertumpuk sementara manusia masih dengan (agak) mudah membacanya.

Sebelum ada CAPTCHA, spammer/hacker dapat membuat program untuk secara otomatis mengisi formulir seperti pendaftaran email gratis, sehingga ia akan memperoleh ribuan alamat email dengan mudah untuk kemudian disalah-gunakan.
Atau untuk mengubah hasil sebuah polling online, seseorang bisa saja membuat program sederhana untuk mengisi polling tersebut dengan jawaban yang sama sebanyak ribuan atau bahkan jutaan kali. Akibatnya polling itu tentu saja menjadi tidak valid.

Untuk mencegah program seperti itu, kini semua formulir akan menampilkan CAPTCHA berupa gambar huruf-huruf bengkok atau saling menyambung yang sukar dibaca oleh program atau komputer, namun (relatif) mudah dibaca manusia. Jika isian dari pengisi formulir sesuai dengan gambar yang ditampilkan, maka kemungkinan besar pengisi formulir adalah seorang manusia, bukan program komputer.
CAPTCHA biasanya dibuat secara otomatis secara acak setiap kali ada orang yang masuk halaman formulir di web, sehingga hampir tidak ada dua CAPTCHA yang serupa. Ini membuat jumlah kombinasi yang mungkin muncul sangat-sangat banyak, sehingga hampir tidak mungkin untuk membuat program yang mampu mengingat dan menjawab CAPTCHA yang akan muncul.
Selain CAPTCHA visual yang sering kita jumpai, ada juga versi audio bagi penyandang cacat mata, dengan prinsip yang kurang lebih sama.

Saat ini ada inisiatif untuk memanfaatkan CAPTCHA untuk tujuan positif. Untuk menyelamatkan arsip-arsip penting didunia, di banyak negara kini ada pihak yang bertanggung jawab untuk mengubah format arsip yang sudah ada (buku, dokumen tercetak) ke format digital (file komputer). Dua kendala utama yang muncul adalah banyaknya jumlah arsip yang tersimpan selama ratusan tahun, serta kualitas cetakan yang buruk sehingga hasil scan-nya sukar dikenali oleh komputer. Dengan gabungan kedua kendala itu, hampir tidak mungkin membayar tenaga manusia untuk membaca secara manual arsip yang gagal dibaca komputer.
Untuk mengatasinya kini muncul re-CAPTCHA, sebuah sistem yang bekerja sama dengan Google Books dan The Internet Archive, dimana hasil scan arsip yang gagal dibaca komputer dimunculkan sebagai CAPTCHA, lalu hasil isian itu dianggap sebagai teks yang hilang/tak terbaca. Agar yakin teks itu benar, biasanya tidak hanya satu jawaban yang dipakai, melainkan hingga sepuluh atau lebih jawaban yang sama.
Ini menjadi solusi win-win bagi semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yang sudah tidak bisa dikenali oleh komputer super canggih yang dipakai untuk proses digitalisasi arsip, sehingga hacker juga kesulitan membuat program yang mampu membacanya. Dan bagi pihak pengubah format arsip, dengan begitu banyaknya formulir yang diisi diseluruh dunia tiap harinya, re-CAPTCHA dapat membantu digitalisasi arsip dengan cepat dan gratis.
Jadi saat mengisi formulir di website yang bekerja sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip dunia bagi anak cucu kita semua.

Sayangnya setelah diimplementasikan sekian tahun, sistem CAPTCHA sudah mulai menunjukkan beberapa kelemahan. Perkembangan hardware dan software membuatnya tidak lagi terlalu sukar untuk dipecahkan oleh program. Apalagi kini muncul perusahaan-perusahaan di dunia ketiga yang bersedia memecahkan CAPTCHA dengan biaya yang sangat murah. DeCaptcher.com bersedia memecahkan CAPTCHA dengan hanya US$2 per 1000 CAPTCHA.
----- Updated 12 Sept 2010: Bahkan di Indonesiapun banyak pihak yang mengumpulkan pekerja pembobol CAPTCHA melalui situs seperti Kaskus dengan kedok "kerja online". (lihat komentar dibawah).
Untuk mengatasinya, saat ini beberapa pihak seperti Universitas Carnegie Mellon dan Penn State sedang mengembangkan CAPTCHA yang berbasis gambar, bukan lagi huruf.
Jadi jangan heran jika suatu saat nanti Anda ditanya 'Gambar apakah ini?' saat mengisi sebuah formulir di internet.

6 komentar:

  1. Bagi pengunjung yang sedang mencari info tentang decapther yang menghasilkan duit, perlu Anda ketahui bahwa decaptcher adalah sarana bagi spammer/hacker untuk membobol captcha dengan memanfaatkan tenaga kerja murah meriah (Anda) untuk mendapatkan keuntungan besar (yang belum tentu dibagi pada Anda).
    Decaptcher jelas ILEGAL. Bagi yang bilang Google juga akan membuat hal yang sama, mohon jelaskan nama dan linknya, karena saya belum pernah mendengarnya. Tapi jika Anda tidak keberatan "diperbudak" spammer, silakan saja daftar sebagai decaptcher.

    BalasHapus
  2. http://www.kaskus.us/showthread.php?t=4742468
    Optical Character Recognition

    mirip bgt ma yang bapak jelaskan

    BalasHapus
  3. @kememmorrison: Betul sekali.

    Memang sangat disayangkan bahwa tingkat ekonomi negeri ini membuat banyak rakyatnya kebingungan mencari penghasilan tambahan, kalau perlu dengan merugikan orang lain.
    :(

    Saya tidak pernah melarang orang berusaha mencari penghasilan dengan cara apapun, sepanjang ia tahu dan sadar atas semua fakta dan implikasi dari yang dilakukannya itu.

    BalasHapus
  4. Nge-crack CAPTCHA dengan software memang illegal pak (ngelanggar DMCA), tapi klo Decaptcher kayak gitu kayaknya engga... lebih ke bentuk outsourcing murahan. Tentu secara moral tetap ga bisa dibenarkan, tapi saya ngga bisa menemukan dasar hukum/aturan yang secara konkrit melarang model Decapther ini. Yang di Kaskus itu aja udah mencapai ribuan anggota, pak. Saya ngeliat top scorernya... seharian kemaren dia bisa ketik 4500an CAPTCHAs... tarifnya $ 3 tiap 1000 CAPTCHAs... jadi dia dapet sekitar $ 13.5 tiap harinya, klo dia bisa 30 hari nonstop minimal 4500 sehari klo diitung-itung Rp 3.6 jutaan/bulan pendapatannya... tapi coba pikir lagi isi 4500 CAPTCHAs per hari butuh berapa jam coba? saya udah males ngebayangin, tapi saya yakin itu ngabisin jauh lebih banyak waktu daripada jam kerja saya, lagian saya juga kerja 20 hari/bulan, ngga 30 hari. Apa bisa 30 hari nonstop begitu terus? apa mata gak pedih tuh? itu top scorer lho ya dapet 3.6 sebulan klo kerja mati²an... saya ngga tau apa dia sempat tidur, istirahat, nonton TV, ngeceng di mall, pacaran, bersosialisasi dengan orang lain, dsb. Saya tau bener di Jakarta seorang fresh graduate IT S1 bisa dapet salary segitu koq. Ngapain juga membunuh mata sendiri perlahan-lahan, sambil merugikan orang lain (yang punya CAPTCHA), wah bener² ya bangsa kita... rela (secara tidak langsung) merugikan orang lain dan diri sendiri demi duit.

    BalasHapus
  5. @Fulvian: Wow, 4500 captcha sehari? kalo 1 captcha 5 detik, itu 6.25 jam sehari, 7 hari seminggu tanpa libur... O_o
    (siap-siap langganan dokter mata + tukang pijit tuh..)

    BalasHapus
  6. Hehehe saya paling cuma 500 captcha sehari...
    sambil nonton TV.. udah pusing dan sampai jenuuuuh bang

    BalasHapus