Pour gérer vos consentements :
Categories: Big DataCloud

Avis d’expert : Big Data, de la Business Intelligence à la Business Analytics

Avec cet avis d’expert, Nicolas Eimery, directeur du pôle de compétences performance management & business intelligence de Gfi Informatique, veut aller au-delà du buzz pour cerner les concepts sous-jacents du Big Data.

Qu’est-ce que le Big Data ?

Par Big Data, il faut entendre trois concepts liés :

– La capacité à adresser et stocker de fortes volumétries de données, qu’elles soient structurées ou non structurées ;

– L’interaction avec les nombreuses sources d’informations extérieures à l’entreprise et non maîtrisées par elle ;

– L’analyse de l’ensemble de ce nouveau capital informationnel.

Traitement et stockage de données

La capacité à adresser et stocker de fortes volumétries de données (à la fois structurées et non structurées), difficilement exploitables avec des solutions classiques de gestion de bases de données est le premier objectif du Big Data. Que cela soit à des fins transactionnelles ou décisionnelles, les entreprises sont de plus en plus confrontées à cette problématique de croissance exponentielle de la donnée à exploiter. Les premiers à avoir dû trouver des solutions ont été les acteurs historiques du web (Yahoo, Google…) puis tous les acteurs du e-commerce (e-Bay, Amazon…) et des réseaux sociaux (Facebook, LinkedIn…).

Pour traiter ces gros volumes de données, les éditeurs se sont tournés vers les appliances, c’est-à-dire la combinatoire entre du « hard » (le matériel) et du « soft » (le logiciel) à l’image de Teradata, acteur historique dans ce domaine. On peut citer dans sa lignée les solutions Exadata pour Oracle, GreenPlum pour EMC², Netezza pour IBM, Fast-track pour Microsoft, HANA pour SAP…

Interactions avec les sources de données externes

De nombreuses études montrent que les sources d’informations internes à l’entreprise ne sont plus suffisantes pour pouvoir appréhender de manière adéquate un sujet majeur comme la connaissance client. En effet, de plus en plus de données sont stockées en dehors des Systèmes d’Information de l’entreprise, par des acteurs tiers, qui détiennent ainsi des informations capitales pour la bonne compréhension de ses enjeux. De plus, le web des objets (web 4.0) va aussi contribuer à fournir une masse d’informations au fil de l’eau pour les entreprises, par exemple les compteurs Linky pour ERDF. Toutes les données provenant des médias sociaux, des capteurs intelligents, sont donc de nouvelles sources de données importantes à prendre en compte, avec la particularité qu’elles peuvent être structurées et non structurées et qu’elles doivent être captées en continu.

Sur ce segment, les acteurs traditionnels du monde ETL (Informatica, Datastage, Talend, ODI…) se positionnent via le couplage à des web services.

Page: 1 2 3

Recent Posts

Étude Trends of IT 2024 : comprendre les mutations de l’environnement IT

Silicon et KPMG lancent Trends of IT 2024, une étude co-construite avec les managers IT…

4 heures ago

Guillaume Poupard, DGA de Docaposte : « Le plus de l’offre, c’est notre position comme acteur de confiance »

Avec son Pack cybersécurité lancé au Forum InCyber 2024, Docaposte tend une perche aux PME.…

4 heures ago

Quels impacts de l’IA générative sur le monde de la cybersécurité ? : regards croisés entre Onepoint, Wavestone et Fortinet

Quels sont les impacts immédiats de l'IA générative sur la cybersécurité ? Comment le contexte…

8 heures ago

Des serveurs IA cyberattaqués : le vecteur s’appelle Ray

Un éditeur attire l'attention sur des attaques exploitant l'absence d'autorisation dans une API du framework…

11 heures ago

Amazon débloque la deuxième tranche de son investissement dans Anthropic

Après un premier financement en septembre 2023, Amazon a débloquer le reste de l'enveloppe qu'il…

13 heures ago

Les logiciels libres entrés au SILL au premier trimestre 2024

D'Alpine Linux à XPipe, voic les dernières entrées au SILL (Socle interministériel de logiciels libres).

1 jour ago