Données non structurées : une véritable épouvante…

Les données non structurées nous envahissent, c’est peu de l’écrire.
C’est devenu la hantise de nombreux DSI

A en croire OpenText (qui a la solution!…), il n’y aurait que 10% de données structurées en entreprise, la quasi totalité constituant ce remarquable bazar ambiant qui va de la messagerie électronique, en passant par les pdf, les .ppt et autres joyeuses abréviations désignant aussi bien des fichiers texte, qu’audio ou vidéo. Le problème, c’est que ces données ont la fâcheuse tendance à doubler en volume tous les deux mois, ce qui représente la bagatelle d’une croissance de +6.400% l’an (source IDC) ! A l’inverse, la croissance des données structurées, essentiellement relatives aux transactions économiques de l’entreprise, ne connaîtrait qu’une (petite) croissance de 4% par an (source OTC). Rien de surprenant lorsqu’on se rappelle la fameuse répartie de Marcel Bleustein-Blanchet : «

Quoique vous fassiez en matière d’e-commerce, un individu moyen ne mangera jamais plus d’un poulet par jour !» Certains en concluent que les ERP vont bientôt se voir surclasser par les ECM (Enterprise content management). Cela pourrait se vérifier notamment en ce qui concerne le traitement des e-mails, d’autant plus que la croissance de ces derniers est pour le moment explosive. Selon IDC, on passerait de 9,7 millions en 2000 à quelque 35 milliards cette année, ce qui est tout à fait en ligne avec la croissance moyenne de 40% par an détectée par le Gartner Group. De son côté, le Radicati Group estime que la taille moyenne d’un courrier électronique sans pièce jointe est de 4,7 Ko, contre 300 Ko lorsqu’une pièce jointe y est attachée. Tout ceci ne serait pas très gênant et permettrait à certains de continuer à gentiment vidanger leur boîte aux lettres sans trop se soucier de ce qu’ils jettent si la part des données critiques (contrats, propositions commerciales, factures, documents sociaux, etc.) présentes dans lesdits courriers ne connaissait pas, elle aussi, une progression vertigineuse (+ 60 % l’an passé). Si bien que l’on se retrouve devant le tragique dilemne: ne rien jeter (ce que font de plus en plus d’utilisateurs) ou de passer des heures à se demander ce que l’on garde ou pas. D’où un marché ECM qui commence à devenir coquet. Qu’on en juge plutôt : fin 2004, selon un rapport de la SEC, il pesait, rien que pour les 10 premiers acteurs, presque 2 milliards de dollars (1.917 millions précisément). Le trio de tête de ce segment est constitué par Open Text (440 millions $) suivi de près par FileNet (400 millions $) et IBM (350 millions $). Sur l’Europe, la répartition entre les produits est la suivante : -Open Text : 23 % -IBM : 16 % -Documentum : 12 % -FileNET : 10 % Autres: 38 %, parmi lesquels on notera la présence de produits tels que ceux proposés par le groupe français Ever. En bref, un marché à suivre? et à ne pas garder en copie cachée !