Google acquiert reCAPTCHA pour optimiser ses technologies de numérisation

Mise au point par reCAPTCHA, la technologie de génération aléatoire de caractères au format graphique utilisée pour sécuriser des formulaires en ligne intéresse Google pour ses livres numériques.

Google vient d’annoncer, par voie de blog, avoir acquis la société reCAPTCHA, une start-up issue d’un projet de l’Université Canergie Mellon. Le montant de l’opération n’a pas été précisé. ReCAPTCHA a développé une technologie de filtrage qui permet de vérifier la présence humaine derrière la saisie d’un formulaire.

Les CAPTCHA sont essentiellement utilisés pour éviter la multiplication des inscriptions automatiques en ligne par des robots notamment contrôlés par des ordinateurs zombies (botnets). La technologie des CAPTCHA génère des caractères alphanumériques au format graphique et généralement déformés (parfois presque illisible par les humains) que l’internaute est invité à recopier en «clair» pour valider sa saisie.

Selon reCAPTCHA, 200 millions de captcha sont générés quotidiennement. Selon Google, 100.000 sites web et blog l’utilisent pour se protéger des infections automatiques. La technologie vise à réduire la quantité de spams ou les tentatives de fraudes. Un botnetest en effet capable de générer à la suite plusieurs milliers d’inscriptions sur un site afin de pouvoir envoyer tout autant d’e-mails non-sollicité s (spam). Avec les captcha preuve est théoriquement faite qu’il s’agit d’une personne physique et non d’un robot qui est derrière l’écran.

Google s’est donc déclaré plus qu’intéressé par la technologie même si elle continuera à être utilisée sur n’importe quel site web. Plus précisément, la firme pense exploiter les Captcha dans l’utilisation des livres numériques proposés par Google. La firme de Mountain View souhaite ainsi améliorer son processus de numérisation de livres.

Sur son blog officiel, Google explique : « Les mots dans beaucoup de CAPTCHA fournis par reCAPTCHA proviennent de la numérisation de journaux ou de livres anciens. Les ordinateurs ont du mal à reconnaître ces mots parce que l’encre et le papier ont été dégradés avec le temps, mais en les tapant dans un CAPTCHA, les internautes apprennent aux ordinateurs comment lire du texte numérisé « .

La société ReCaptcha, créée en 2008 par le professeur Luis von Ahn de l’Université Carnegie Mellon, a expliquée être satisfaite de cet accord même si elle poursuivra ses activités propres.