Vous connaissez sûrement le système de vérification humaine reCAPTCHA qui permet de lutter contre les robots en saisissant 2 mots déformés d’une image.
Mais saviez-vous que ce système de vérification permet de manière astucieuse de numériser des milliers de livres papiers grâce à votre propre contribution ?
Un système astucieux
Sur les 2 mots que le système vous affiche, un seul est connu et vérifié, l’autre n’est qu’une numérisation d’un mot extrait d’un livre. En proposant ce mot issu de la numérisation à des centaines d’internautes différents et en ayant toujours la même réponse de leur part, le système en déduit alors que l’association entre le mot numérisé et le mot saisi par les internautes est correct. Voila comment on arrive à numériser des milliers d’ouvrages avec un système anti-robot !
Main-d’œuvre gratuite
L’OCR (système de reconnaissance des caractères automatique par informatique) n’est aujourd’hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain et la naïveté des internautes, on arrive à de biens meilleurs résultats. Le slogan de la société présent sur le module incarne bien le fonctionnement de ce système : « stop spam, read books ».
Laisser un commentaire