Big Data : sur site ou dans le Cloud ?

Bien qu’intéressées par une stratégie Big Data, les PME sont souvent démunies face à la mise en œuvre d’un tel projet. Parmi leurs hésitations : hébergement sur site ou dans le Cloud ? Plusieurs critères entrent en ligne de compte pour choisir entre ces deux voies.

Thomas Vial, OCTO TechnologyDéployer un projet Big Data reste complexe pour une PME. Parmi ses interrogations, celui du choix de l’hébergement de la solution : Sur site ? Dans le Cloud ? « Tout dépend de la maturité technologique de l’entreprise, de ses compétences internes, de la rapidité à laquelle elle souhaite déployer le projet et de l’investissement qu’elle veut y consacrer », répond Thomas Vial, IT Architect chez OCTO Technology.

 

En effet, plusieurs critères doivent être étudiés. Le premier : le coût. Dans un déploiement sur site, l’entreprise doit acquérir l’infrastructure matérielle et logicielle et intégrer le coût des ressources humaines liées à son fonctionnement. Dans une solution Cloud, chaque requête et traitement de données est facturé. « L’étude doit donc prendre en compte le nombre de requêtes et de traitements que l’entreprise prévoit de réaliser à court terme, mais aussi dans le futur, car l’addition risque de croitre rapidement si le nombre de requêtes et le volume de données à traiter sont importants », prévient notre expert.

Le deuxième critère concerne les compétences. Avec le Cloud, les entreprises s’épargnent le besoin de celles liées à l’administration de la plateforme (virtualisation, OS…), mais doivent s’entourer de collaborateurs dotés de compétences en matière d’architecture, d’Hadoop ou NoSQL ou encore de DevOps. Pour Thomas Vial, « ce sont des investissements non négligeables, qu’il faut intégrer au coût du projet et qu’il faut également projeter dans le temps, en intégrant la dimension formation, pour maintenir ces compétences et les accompagner dans la maitrise des nouvelles technologies. »

Intégration au SI et traitement de la donnée

Troisième critère de choix : l’intégration avec le système d’information. Dans le cadre d’une offre Cloud, l’entreprise doit prendre en compte la complexité de gérer une architecture mixte avec d’un côté son SI interne, et de l’autre la solution hébergée. « Ce genre de configuration est plus complexe à gérer qu’une architecture monolithique interne. Ce type d’architecture contraint également à mettre en place des flux de données performants, » poursuit Thomas Vial.

Par ailleurs, une solution sur site structurée autour d’un Data Lake centralise à la fois le stockage, le traitement des données et la diffusion des résultats. En revanche dans le Cloud, pour des raisons économiques, il n’y a pas de cluster de traitement permanent. Le Data Lake centré sur le stockage n’effectue que des analyses éphémères.

Quatrième critère enfin, celui de la rapidité d’exécution du projet. « Le déploiement sur site nécessite d’initier le projet, de concevoir l’architecture, de paramétrer la solution. Alors qu’une solution dans le Cloud est opérationnelle en trois clics. Cet aspect est un atout pour les entreprises qui souhaitent mettre rapidement un produit ou un service sur le marché, » insiste notre expert.

En conclusion, Thomas Vial résume « Cloud ? Site ? Ce sont les coûts et l’usage qui influencent le choix de l’architecture ». Toutefois, le Cloud est sans doute, pour une PME, un moyen de mettre le pied à l’étrier d’un projet Big Data, une façon de s’approprier ces outils sans s’engager dans d’importants investissements. Quitte à réinternaliser la solution lorsque le cas d’usage explose.