reCAPTCHA یا همان ریکپچا یک سرویس رایگان کپچا برای ایجاد نسخه های دیجیتالی از کتاب، روزنامه و برنامه های رادیویی قدیمی است. همانطور که در مقاله ای با عنوان کپچا چیست و چه کاربردهایی دارد نیز بیان کردیم، CAPTCHA برنامه ای برای تشخیص انسان از روبات در فضای اینترنت است و معمولا در فرم های ثبت نام یا بخش نظرات بکار گرفته میشود.

با توجه به افزایش تعداد اسپمرها در سال های اخیر، استفاده از CAPTCHA تقریبا برای هر سایتی به امری ضروری بدل گشته و هر روز جایگاه خود را محکمتر از قبل خواهد کرد. در این مقاله به بررسی تفاوت reCAPTCHA و CAPTCHA پرداخته و شکل گیری این ایده ی ساده ولی بسیار کاربردی را به شما معرفی خواهیم کرد.

recaptcha ساخت

تصویری از یک نمونه recaptcha

کاربران بطور متوسط در هر روز ۲۰۰ میلیون بار به سوالات CAPTCHA در اینترنت پاسخ میدهند که در هر مورد کمتر از چند ثانیه زمان کاربر صرف میشود. در نگاه اول این زمان چشمگیر نخواهد بود ولی با توجه به تعداد بالای آن زمانی معادل ۱۵۰۰۰۰ ساعت کار در روز برای پاسخ گویی به سوالات CAPTCHA هدر میشود. چه راهی برای استفاده مفیدتر از این زمان و جلوگیری از هدر رفتن بخشی از آن بنظر شما میرسد؟ reCAPTCHA با ایده ای خلاقانه برای تبدیل این وقت و انرژی به کتاب های دیجیتالی و استفاده مفید از این منبع رایگان شکل گرفت.

تفاوت CAPTCHA و reCAPTCHA

برای دسترسی بهتر به اطلاعات و ایجاد نسخه های دیجیتالی از کتاب ها و روزنامه هایی که قبل از پیدایش کامپیوتر نوشته و چاپ شده اند روش های متعددی بکار گرفته شده است. مهمترین روش اسکن کامپیوتری صفحات کتاب و تشخیص ظاهری کاراکترها یا همان Optical Character Recognition – OCR است. تبدیل تصویر به متن حجم مورد نیاز برای ذخیره سازی یک کتاب را تاحد زیادی کاهش میدهد که موجب افزایش سرعت دانلود و کاهش هزینه نگهداری یک دیتابیس بزرگ خواهد شد. مشکل اصلی زمانی ایجاد میشود که دقت سیستم های OCR کامل نیست و همواره با خطاهایی در تشخیص حروف همراه خواهد بود. reCAPTCHA در این مرحله کارایی خود را نشان داده و به کمک بشر آمده است.

recaptcha چیست

نمونه ای از ناتوانی سیستم OCR در تشخیص کلمات

reCAPTCHA فرآیند ایجاد نسخه های دیجیتالی را ساده کرده و کلمات را بعنوان CAPTCHA برای کاربران اینترنتی ارسال میکند. در این روش تنها کلماتی که توسط سیستم OCR قابل تشخیص نیستند برای کاربران ارسال میگردد که عموما شامل مواردی مانند پخش جوهر چاپ یا تا خوردگی در صفحات میشوند.
سوال اصلی آن است که اگر کامپیوتر قادر به تشخیص این تصاویر نیست چگونه از صحت اطلاعات وارد شده توسط کاربر برای یک reCAPTCHA مطمئن میشود؟ برای حل این مشکل، هر کلمه ای که از سیستم OCR ارسال میشود بهمراه کلمه ای دیگر که توسط سیستم reCAPTCHA تولید شده و جواب صحیح آن مشخص است به کاربر نمایش داده میشود. اگر به کلمه اول پاسخ صحیح داده شود شانس درست بودن پاسخ برای کلمه دوم که از طریق OCR ارسال شده نیز بسیار بالا خواهد بود. برای تایید نهایی پاسخ های reCAPTCHA هر کلمه برای چندین کاربر متفاوت ارسال میگردد تا در صورت یکسان بودن پاسخ ها بعنوان جواب اصلی به سیستم OCR ارسال گردد.
در نتیجه اگر شما در یک سوال reCAPTCHA به کلمه اول پاسخ صحیح و به کلمه دوم پاسخی نادرست بدهید باز هم دسترسی به مرحله بعدی ثبت نام خواهید داشت زیرا تنها کلمه اول بعنوان ملاکی برای تشخیص انسان از روبات استفاده شده و کلمه دوم بعنوان همکاری در یک پروژه بین المللی و رایگان بکار گرفته میشود.

نحوه ساخت کد reCAPTCHA

برای دسترسی به کاربران بیشتر و استفاده از منابع انسانی رایگان در اینترنت، reCAPTCHA نیازمند همکاری وبمستران است. این پروژه که در حال حاضر توسط گوگل مدیریت میشود امکاناتی را برای قراردادن سیستم reCAPTCHA بصورت رایگان در سایت های اینترنتی ارائه کرده است.
اگر شما صاحب یک سایت هستید و با اسپمرها مشکل دارید میتوانید با قرار دادن reCAPTCHA بر روی سایت، هم به مقابله با اسپمرها در سایت خود پرداخته و هم در این پروژه شرکت داشته باشید. گوگل افزونه های رایگانی را برای سیستم های مدیریت محتوای پراستفاده مانند وردپرس منتشر کرده تا شما بدون نیاز به دانش کدنویسی بتوانید از امکانات reCAPTCHA استفاده کنید.
برای دریافت کد مورد نظر میتوانید به صفحه Get reCAPTCHA مراجعه کرده و در آن عضو شوید.

سخن پایانی

چنین ایده ای ما را به فکر می اندازد که چرا از آن برای کتاب های فارسی و ایجاد نسخه های دیجیتالی در ایران استفاده نکنیم. راه اندازی این پروژه برای زبان فارسی نیازمند حمایت دولتی و سرمایه گذاری بخش خصوصی در کشور است که امیدواریم توجهی ویژه به آن بشود زیرا دستاوردهای استفاده از reCAPTCHA میتواند از نظر مالی و فرهنگی بسیار سودآور باشد. البته حضور سیستم های فارسی مانند کپچافا ما را امیدوار به راه اندازی پروژه ریکپچا در ایران میکند که متاسفانه سایت مربوط به کپچافا در زمان نوشتن این مقاله در دسترس نبود! اگر شما هم ایده یا راهکاری برای استفاده از این سیستم و امکانات آن در ذهن دارید در بخش نظرات همین مقاله با وبسیما و سایر دوستان به اشتراک بگذارید.