Abbyy : leader mondial de la reconnaissance de documents

L’éditeur russe Abbyy est plus connu pour ses solutions OEM que pour ses applications finales de reconnaissance et d’analyse des documents, un marché où il est pourtant le leader mondial

A l’occasion du Forum de la GEIDE, Abbyy a présenté la version 8 de

FineReader Engine, son kit de développement logiciel (SDK) de reconnaissance des documents. Au programme des nouveautés, des fonctions de reconnaissance pleine page, de reconnaissance par champ, de conversion PDF et de capture de données. Une manière élégante de rappeler que cet acteur peu connu de la reconnaissance de documents, moscovite d’origine russe, est le premier éditeur mondial de solutions sur ce marché, mais dont l’activité est principalement OEM, donc proposée avec le hardware de fabricants de solutions de scan. Jupp Stöpetie, le directeur de la division Europe d’Abbyy, nous rappelle que les activités de l’éditeur se répartissent autour de trois lignes de produits : – les solutions ‘end users‘ d’OCR (lecture optique de documents) ; – les solutions ‘développeurs‘ de document management destinés à intégrer les solutions de scan. Abbyy développe les composants de l’offre, et les intégrateurs développent l’interface utilisateur à leur image ; – et enfin les solutions de ‘capture d’information‘ pour la lecture automatique de documents. Ce qui différencie les offres d’Abbyy, c’est à la fois l’étendue de leur capacité d’exportation ? texte, XML, PDF, Word, etc. ? mais aussi leur capacité d’analyse sémantique. Abbyy dispose de 36 dictionnaires de langues qui permettent de renseigner 179 versions linguistiques de ses applications. Quant à son modèle économique, il s’avère plutôt complexe, avec des licences calculées à partie des fonctionnalités intégrées, des volumes qui seront traités, et de la formation des équipes de développement qui devront être certifiées. L’étonnante reconnaissance du texte à partir de photos numériques, à suivre à la suite de la photo ci dessous. Reconnaître du texte sur des photos numériques

Parmi les fonctionnalités les plus étonnantes de FineReader 8.0, version grand public disponible dans le commerce et dernière version en date du logiciel de reconnaissance optique des caractères (OCR) de Abbyy, nous avons été surpris par la reconnaissance du texte sur des photos numériques. Certes, FineReader 8.0 dispose d’avancées susceptibles de retenir notre attention, comme une amélioration de 30% de la capacité à reconnaître des documents en faible résolution. La conversion ‘intelligente‘ des documents de ou vers le PDF, et jusqu’au format des écrans PDA. Mais le plus bluffant est venu de cette reconnaissance de photos numériques qui permet de décrypter des documents, même non aplanis, photographiés à l’aide d’un appareil photos numérique. Le logiciel traduit les documents flous, de faible luminosité, déformés, ce qui ouvre des perspectives intéressantes au-delà de la photographie, lors du scan de gros volumes par exemple.