Abbyy rend son OCR multi plates-formes

Reconnaissance de documents et conversion de PDF, le russe Abbyy propose aux programmeurs une nouvelle version du SDK de son moteur FineReader Engine 8.0, devenu multi plates-formes

Windows, Linux, FreeBSD ou Mac OS X (Power ou Intel), les développeurs auront désormais accès à l’un des moteurs de reconnaissance de documents les plus performants,

Abby FineReader Engine 8.0.

La demande en matière de reconnaissance optique de caractères (OCR), de lecture de code barres et de conversion de fichiers au format PDF est de plus en plus sensibles au sein des entreprises qui collectent, manipulent et archivent des volumes de documents eux aussi de plus en plus importants.

Avec un module de reconnaissance des documents, une application peut convertir les documents scannés ou PDF dans des formats de fichiers modifiables et indexables, pour que les utilisateurs puissent facilement les retrouver, les publier après modification et collecter des informations pour alimenter des bases de données.

D’où l’intérêt de disposer d’un moteur de reconnaissance, sans qu’il soit nécessaire de réinventer le roue. A ce titre, FineReader Engine 8.0 est fourni en OEM avec de nombreux environnements et produits?

« Abbyy FineReader Engine 8.0 est une plate-forme extrêmement performante pour la reconnaissance et la conversion de documents. Elle intègre de nombreuses fonctions spécifiques, y compris la création de fichiers PDF indexés pour les besoins d’archivage, le traitement de photos numériques, la collecte des données dans des champs ou des zones de texte et la lecture de codes barres. Avec cette nouvelle version, les développeurs sous Linux ou BSD vont enfin pouvoir profiter de toutes ces fonctionnalités !« , a confirmé Alexander Rylov, responsable ‘corporate’ des produits technologiques chez l’éditeur.

Ce qu’embarque un moteur d’OCR moderne

Abby FineReader Engine 8.0 est constitué d’un jeu de bibliothèques facilitant l’accès des développeurs aux principales fonctionnalités de reconnaissance optique de caractères via une API (interface de programmation). La plupart des fonctions sont également accessibles au moyen d’une interface à ligne de commande.

Le SDK (environnement de programmation) offre des fonctions sophistiquées d’analyse de document avec précision. Une fonction avancée de conversion de PDF, avec le support de tous types de fichiers PDF, y compris les PDF dits de ‘texte et image’, ‘texte sur image’, ‘texte sous image’, ainsi que l’extraction et la reprise des renvois internes et des liens hypertextes, le support des paramètres avancés de sécurité et des algorithmes de cryptage, et l’enregistrement des informations extraites de PDF dans un format balisé avec, éventuellement, des métadonnées.

Le support multilingue et polices reconnaît 189 langues, y compris le chinois, le japonais et le coréen. Il reconnaît également les textes imprimés par une imprimante matricielle, les anciennes polices européennes, et la plupart des caractères gothiques, ainsi que les polices spécifiques au secteur financier, comme les caractères OCR-A, OCR-B et MICR (E13B).

Et bien évidemment le support de plusieurs plates-formes, testé dans les environnements d’exploitation comme Red Hat Linux, Fedora Core, SUSE Linux Enterprise, FreeBSD et Mac OS (Intel).

Sans oublier une architecture et un système de licence flexibles pour développer des applications de n’importe quelle taille et avec n’importe quel degré de complexité : depuis les applications client les plus simples jusqu’aux projets faisant appel aux serveurs voire de serveurs décentralisés.

Avec l’architecture et sa politique de licence modulables et flexibles d’ABBYY, les développeurs sont libres de n’acheter que les outils et fonctions dont ils ont besoin quitte à étendre progressivement les fonctionnalités de leurs applications à leurs besoins.