Avis d’expert : Big Data, de la Business Intelligence à la Business Analytics

Le Big Data : que définit ce terme, qu’implique-t-il et que peut-on en attendre ? Un avis d’expert signé par Nicolas Eimery de Gfi Informatique.

Analyses de ce nouveau capital informationnel

Arriver à capter toute cette masse d’informations interne et externe à l’entreprise n’a de sens que si l’analyse de ce nouveau capital informationnel est possible. La Business Intelligence (BI) classique n’est plus un moyen suffisant, car elle impose :

– De disposer de données structurées et organisées, de devoir parfois connaître a priori les types d’analyse que l’on souhaite mettre en œuvre pour pouvoir modéliser correctement son entrepôt de données (ou Data Warehouse) ;

– De pouvoir intégrer des volumes de plus en plus importants de données, dans des délais de plus en plus courts, en respectant la structuration des différents modèles de stockage.

C’est là tout l’enjeu du Big Data : les données stockées, en plus d’être à très fortes volumétries, sont hétérogènes en terme de contenant (format structuré et non structuré) mais surtout de contenu. Les informations provenant des réseaux sociaux par exemple possèdent un contenu non prédictible, pouvant toucher aussi bien la connaissance client que l’e-réputation. Ainsi, l’entreprise doit faire face à deux écueils pour l’exploitation de ces données à des fins d’analyse :

– La très grosse volumétrie d’informations structurées et non structurées à prendre en compte ;

– La non-connaissance a priori du contenu de l’information à analyser.

Pour contrer le premier écueil, on voit émerger des solutions techniques comme le framework Hadoop permettant des traitements sur des volumes de données importants, de l’ordre de plusieurs pétaoctets.

Pour le deuxième écueil, des approches combinant outils de BI classique et outils de mining (data mining et text mining) permettent l’exploitation de ces données en séparant bien ce qui est de l’ordre du prédictif (adressé par la Business Intelligence) de ce qui est de l’ordre du non prédictif (adressé par le data et le text mining : la Business Analytics).