reCAPTCHA adalah sebuah layanan CAPTCHA gratis yang membantu proses digitalisasi buku, koran dan siaran radio pada masa lalu. CAPTCHA sendiri adalah sebuah program yang bisa menentukan apakah seseorang itu sebuah komputer atau manusia (biasanya berupa gambar dari sebuah kata yang dibuat terdistorsi). CAPTCHA biasanya digunakan untuk menghindari serangan bot dan spam pada suatu website. Karena sampai saat ini belum ada program komputer yang dapat membaca kata-kata yang terdistorsi sebaik manusia.
Sekitar 200 juta CAPTCHA dapat dipecahkan oleh manusia setiap harinya. Rata-rata manusia membutuhkan waktu sekitar 10 detik untuk dapat memecahkan kata yang terdapat dalam CAPTCHA. Sebenarnya itu termasuk waktu yang cukup singkat, namun jika dikalikan dengan jumlah CAPTCHA yang dipecahkan setiap harinya, maka setara dengan 150.000 jam kerja setiap harinya. Agar jam kerja tersebut tidak terbuang dengan sia-sia maka dibuatlah sistem CAPTCHA yang bernama reCAPTCHA.
Lantas apa bedanya CAPTCHA dan reCAPTCHA ? Bedanya hanya terletak pada sumber kata-katanya saja. Jika CAPTCHA menggunakan kata-kata secara random (acak), maka reCAPTCHA menggunakan kata-kata yang berasal dari proyek digitalisasi buku. Jadi secara tidak langsung dengan menggunakan reCAPTCHA kita telah membantu proyek digitalisasi buku di dunia ini. Sampai sekarang reCAPTCHA telah membantu proses digitalisasi versi lama New York Times serta buku-buku dari Google Books
Ilustrasi OCR
Terus bagaimana cara kerja reCAPTCHA ? Pada awalnya buku-buku di scan secara terlebih dahulu. Setelah itu dirubah menjadi teks menggunakan Optical Character Recognition (OCR). Proses perubahan diperlukan untuk mengubah buku yang berformat image menjadi text sehingga ukurannya bakal lebih ringan dan juga lebih mudah dibaca tentunya. OCR sendiri merupakan software yang tidak sempurna karena tidak mampu mengenali semua karakter dengan baik. Disinilah tugas reCAPTCHA untuk dapat membantunya. reCAPTCHA membantu proses digitalisasi buku dengan mengirimkan kata-kata yang tidak dapat dikenali komputer, ke suatu website dalam bentuk CAPTCHA. Hal ini dimungkinkan karena hampir semua program OCR dapat membedakan apakah suatu kata dapat terbaca dengan baik atau tidak.
Terus bagaimana komputer tahu bahwa kata yang kita masukan adalah kata sebenarnya ? Begini, setiap kata yang tidak dapat dibaca dengan baik oleh program OCR akan, digabungkan dengan suatu kata yang telah diketahui kebenarannya. Pengguna kemudian diharuskan untuk menjawab keduanya. Jika mereka dapat memecahkan kata yang telah diketahui kebenarannya maka, sistem akan menganggap benar jawaban untuk kata lainnya. Itulah mengapa reCAPTCHA terdiri dari dua buah kata.
Kalau butuh kita untuk mendigitize nya, mengapa ReCaptcha bisa mengetahui kalo tulisan yang kita ketik salah ?? Jawabannya simple, karena salah satu kata yg diberikan sudah diketahui tulisannya oleh ReCaptcha, sehingga kata "Dummy" yang boleh diabaikan itu yang tidak dimengerti oleh sistem, dan dengan mengabaikan kata "Dummy" tersebut, kita telah kehilangan kesempatan untuk membantu mendigitize buku tersebut. Intinya, ReCaptcha memberikan kita 2 kata, kata yang satu sudah dikenali oleh sistem, sedangkan kata yang satunya lagi, adalah kata yg ingin didigitize. Itulah yang menyebabkan kita bisa menulis salah satu kata nya saja.
Intinya, pada ReCaptcha diberikan 2 kata. 1 kata, merupakan kata yang sudah dikenal sistem, dan kata itu yang akan menentukan benar ato salahnya kita ngisi captcha. Sedangkan kata yg 1 lagi, adalah kata "Dummy" ato bohongan aja. Nah kata bohongan tersebut, merupakan hasil scan dari buku (buku bentuk fisik di scan), karena banyak kata yg tidak dimengerti oleh software OCR, maka google punya ide, mengapa tidak menggunakan tenaga gratisan saja untuk menerjembahkannya menjadi satu kata yang utuh, itulah fungsi dari kata "Dummy" tersebut.
Kalau anda ingin membantu men-digitalkan karya Shakespeare, jangan abaikan kata "Dummy" tersebut, justru itulah gunanya ReCaptcha.
Setelah membaca info diatas, masihkah anda ingin mengabaikan kata "Dummy" dari ReCaptcha ?
Kalau masih, berarti anda tidak membantu melestarikan Karya Shakespare, ketika anda bisa melakukannya dengan mudah
Jadi kesimpulannya dilihat dari segi efektifitas dan keuntungan, penggunaan reCAPTCHA sebagai image verification lebih baik dibanding CAPTCHA.
Tidak ada komentar:
Posting Komentar