au sommaire
Le Newton MessagePad 100, d'Apple, sorti en 1993, intégrait une reconnaissance optique de caractères, que l'on écrivait sur l'écran tactile à l'aide d'un stylet. © Rama/Musée Bolo
Un système de reconnaissance optique des caractères analyse optiquement un texte et en produit une version informatique, sous forme d'un fichier texte, comme s'il avait été tapé sur un ordinateur. On utilise également l'acronyme OCR du terme anglais Optical Character RecognitionOptical Character Recognition.
Fonctionnement de l'OCR
La saisie optique peut être réalisée sur un scanner d'ordinateur lorsqu'il s'agit d'un texte imprimé. Cela peut être une image numérique d'origine quelconque. Enfin, l'OCR sert également à reconnaître en temps réel des caractères écrits sur un écran tactileécran tactile.
La plupart des logicielslogiciels d'OCR actuels connaissent déjà un grand nombre de polices de caractères mais peuvent aussi procéder par apprentissage. La reconnaissance de textes manuscrits et écrits de manière naturelle avec des caractères liés entre eux reste encore un défi. Le logiciel doit aussi savoir se repérer dans une page de journal et s'en tenir au texte concerné, en repérant les lignes et en ignorant les autres articles, les légendes des photos ou les encarts publicitaires.