Réseau On-Demand

Big data et SDN : des contributions croisées

Le fort développement du Big Data dans les organisations nécessite une infrastructure informatique à la hauteur. Les apports du SDN (Software defined network) s’avèrent très précieux : il permet de fluidifier les flux de données et d’éviter certains déboires en garantissant les meilleures performances réseaux. Réciproquement, le Big Data, couplé à l’analytique, apporte sa contribution à l’optimisation du SDN et des offres télécoms ‘on demand’.

La progression des traitements Big Data dans les entreprises ou institutions publiques (universités, centres de recherche) se confirme. Selon IDC (1), les revenus issus du Big Data & Business Analytics (BDA) dans le monde atteindront 203 milliards de dollars en 2020 (contre 130,1 milliards en 2016).

De son côté, Cisco observe que de plus en plus d’entreprises se rendent compte des avantages de l’analyse des données, mais constatent qu’elles deviennent très dépendantes des diverses applications de données activées sur le Cloud. Et là, le problème soulevé est clair : l’Internet public montre vite ses limites.

Il est vrai que les traitements Big Data utilisant, par exemple, une plateforme Apache Hadoop imposent de fortes exigences ‘réseaux’. Le plus souvent, le temps d’exécution d’un traitement Hadoop conditionne directement l’efficacité des activités métier. Autrement dit, le traitement des données très volumineuses n’a réellement d’intérêt que s’il tend à produire des résultats exploitables en temps réel ou quasi-temps réel.

Dans le cas d’Hadoop, par exemple, il devient nécessaire de disposer d’une analyse des performances et d’outils de ‘trouble shooting’ (détection de conflits de données, engorgements, etc.) sur l’infrastructure virtualisée (cf. les données ‘vPort’ : noms des nœuds, leur rôle, etc.).

Il faut s’assurer d’un bon contrôle du trafic des liens primaires et secondaires pour les gros fichiers HDFS (Hadoop Distributed File System), ce qui nécessite une allocation de bande passante dynamique intelligente (cf. les commandes vFlow). Il faut également repérer les points de congestion lors du brassage des résultats, etc.

En clair, si l’on veut tirer parti du Big data sur des solutions SDN (Software defined network, pour des ressources réseaux ‘on demand’), il est nécessaire de disposer d’une infrastructure réseau à haut débit qui tienne la route. Tout en assurant un suivi en temps réel de divers points de contrôle et de fluidification du trafic (2).

Dans une offre de réseau à très haut débit, comme IQ chez Colt, capable d’apporter jusqu’à 100 Gbit/s, il est clair que les risques sont limités. Typiquement, ce sont les services financiers qui sont concernés, en particulier ceux liés aux opérations boursières comme les énormes volumes de données à traiter du fait de la mise en conformité FRTB (3) et MiFID II (4) ou des entreprises déjà bien avancées dans l’exploitation des objets connectés (IoT) et le Big Data.

Les opérateurs télécoms travaillent également à exploiter le SDN sur des “infras moins riches”, comme des offres d’interconnexion Ethernet entre datacentres et des services de Cloud public chez Azure (Microsoft) et AWS (Amazon), là où les traitements Big Data sont en forte croissance. Là encore, les offres de services réseaux ‘on demand‘ apportent beaucoup de flexibilité.

Réciprocité : l’apport du Big data au  SDN

Inversement, dans la conception des architectures de ‘backbone’ des services télécoms ‘on demand’, les analyses prédictives et l’exploitation des métadonnées issues du Big Data commencent à apporter aux opérateurs une contribution sans équivalent.

Le Big Data peut bénéficier au SDN, notamment pour l’ingénierie du trafic, pour les développements ‘cross-layer’ (entre couches de services), pour la cyber-sécurité ou pour les réseaux de datacentres intra et inter-SDN, etc.

Les plateformes SDN, s’appuyant sur de fonctionnalités NFV (Network function virtualization), visent à automatiser des décisions prises jusque-là par des responsables humains en charge de l’exploitation. Le processus de décision fait appel en grande partie à l’utilisation d’API (interfaces programmatiques).

L’idée, avec l’utilisation du Big Data, est de créer, à partir des données recueillies sur les décisions prises, des boucles de feedback qui viennent alimenter la plateforme. Cette dernière contribue alors à l’optimisation des services en intégrant toutes les demandes de connectivité des clients. Le résultat est là : des clients de l’opérateur, en se connectant au portail de services, peuvent activer eux-mêmes une capacité nouvelle en réponse à des événements inattendus.

Dans les services SDN, le recours au traitement des Big Data et Data analytics peut également conduire à de nouveaux modèles économiques. Les clients des opérateurs sont intéressés par des services WAN plus flexibles, moins onéreux du fait de la virtualisation des ressources réseaux.

Dans l’environnement SDN, de nouveaux services vont émerger grâce à l’analyse, en temps réel ou quasi temps réel, des data fournies par l’infrastructure. Ces data peuvent concerner la bande passante, les performances (niveaux SLA) ou toutes informations sur les caractéristiques des applications et sur l’expérience utilisateur.

En résumé, une nouvelle ère exploratoire est en train de s’ouvrir.
__
Sources :
(1) IDC, World wide Big Data and Business Analytics market trends through 2020.
(2) IEEE Network, SDN for big data and big data for SDN (Volume : 30, Numéro 1, janvier-février 2016).
(3) : revue fondamentale du portefeuille de négociation (FRTB), nouveau cadre règlementaire du risque de marché
(4) : MiFID II, révision et renforcement de la directive sur les marchés d’instruments financiers (Markets in Financial Instruments Directive en anglais)