Pour gérer vos consentements :
Categories: Big DataCloud

Big Data : des technologies et des usages

Qu’est-ce que le Big Data ? Une réponse s’impose : un ensemble d’outils pour affronter l’augmentation exponentielle des données. Qu’ils soient fournisseurs ou clients, tous s’entendent sur ce point. La notion de données structurées ou non structurées est à peine effleurée. La priorité c’est de faire face à ces données qui submergent les organisations, ou ne manqueront pas de le faire. Et pour cela, il faut que l’infrastructure suive… ou s’adapte. « Faites le point sur votre équipement, renforcez votre réseau et améliorez sa performance », nous a conseillé un utilisateur pragmatique. « Après, si cela ne suffit pas, vous pourrez vous tourner vers le Big Data ! »

Le Big Data, c’est donc d’abord la capacité de stocker de très gros volumes de données. Ce que la technologie apporte ici, face à l’existant, c’est la « scalabilité », la capacité d’évoluer, et cela plus simplement. Pas de gigantesques fermes de données, mais des appliances qui peuvent se plugger les unes à la suite des autres afin d’augmenter l’espace de stockage. Le « file system », le système de fichiers, qui qualifie l’organisation des données, est essentiel. Sur lui pèse la gestion de l’empilement et de l’accumulation des fichiers, ou plutôt des blocs.

Après l’infrastructure vient l’analyse

C’est bien de pouvoir stocker les données, mais encore faut-il pouvoir également les retrouver, les rechercher et les exploiter : l’analytique. En la matière, une technologie s’impose, Hadoop. Ce projet applicatif, qui prend place au-dessus du matériel, fait l’unanimité, même s’il est encore loin d’être stable dans ses développements. Hadoop présente un avantage et un inconvénient : porté par une communauté open source, il emporte un message bourré d’opportunisme économique ; en revanche, il affiche une rare complexité qui est loin de le rendre accessible au commun des DSI.

Le Big Data est-il révolutionnaire ?

Oui et non ! Pour les tenants de l’infrastructure, le Big Data n’est qu’une vision de l’usage de technologies de stockage existantes, rien de plus. Pas grand-chose de révolutionnaire là dedans, hormis peut-être la simplification de l’extension des configurations en place. Pour les tenants de l’analytique, en revanche, la révolution est bien là : le Big Data affiche une double promesse, de pouvoir traiter données structurées et non structurées, et d’être capable de paramétrer quasiment n’importe quel besoin analytique. Attention, cependant, déployer une infrastructure Big Data demande de mettre les mains dans le cambouis et de programmer. « Nous pourrons faire ce que nous voulons des données, nous a-t-on affirmé, à condition de rentrer dans le code pour obtenir ce que l’on souhaite. »

Big Data risque-t-il de faire de l’ombre au Cloud ?

L’ombre du Cloud Computing a plané lors des débats. En revanche, le nuage est peu présent dans les discours des personnes que nous avons rencontrées. Est-ce parce que les préoccupations des uns et des autres divergent ? Probablement pas, bien au contraire. Il nous a plutôt semblé que les utilisateurs prêts à s’impliquer dans le Big Data ont d’ores et déjà atteint un haut niveau de maturité sur le cloud, et que le Big Data ne serait finalement qu’un composant d’une stratégie dans les nuages. De toute évidence, les candidats au Big Data font preuve d’un pragmatisme à toute épreuve : ils doivent y passer, car ils n’ont pas d’autre choix !

L’adoption du Big Data risque fort d’être l’une des plus rapides que le monde des IT professionnelles ait connue, un phénomène technologique au service de la consumérisation de la donnée, en quelque sorte. À suivre…

Recent Posts

GPT-4o : où, quand et pour qui ?

OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.

2 jours ago

Nom de domaine : Twitter définitivement remplacé par X

Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…

2 jours ago

Microsoft propose une délocalisation hors de Chine à ses ingénieurs IA et Cloud

Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…

2 jours ago

Du « Monde » à Reddit, le point sur les partenariats data d’OpenAI

Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?

2 jours ago

Comment Younited a appliqué la GenAI au crédit conso

Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…

2 jours ago

Processeurs : les États-Unis fabriqueront 30 % des puces avancées d’ici 2032

Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…

3 jours ago