GramLab : l’open source au service du langage

Avec GramLab, la mise au point d’outils de traitement du langage sera grandement facilitée. Un projet placé sous licence open source et qui dispose d’un premier démonstrateur.

Le projet GramLab vient de faire son entrée sur SourceForge (et sur le web). Financé par le Feder (Fonds Européen de Développement Économique), il permettra de créer des outils de traitement du langage open source, couvrant un large ensemble de domaines.

Un outil très flexible
GramLab est conçu dès la base pour s’adapter à des besoins très variés. Il pourra ainsi être utilisé au sein d’outils de correction orthographique, d’indexation sémantique dans une base documentaire, d’extraction automatique d’informations, de reconnaissance de termes, etc. Il est conçu pour les langues anglaise et française.

Ce projet est porté par quatre éditeurs de logiciels (Actimos, Lingway, Kwaga et Qwam Content Intelligence) et le LIGM (Laboratoire d’Informatique Gaspard-Monge) qui œuvre au sein de l’Université Paris-Est Marne-La-Vallée.

Une première application pratique
L’équipe de GramLab fournit d’ores et déjà un premier exemple d’utilisation de sa technologie, qui prend la forme d’un annotateur compatible avec le standard Apache IUMA. CityAnnotator permet de repérer les noms des communes françaises au sein d’un ensemble de pages HTML.

Cet outil pourra par la suite être modifié pour reconnaitre d’autres séries de termes ou pour utiliser une grammaire différente (basée ou non sur celle de CityAnnotator).