Pour gérer vos consentements :
Categories: Big DataCloud

Cray marie supercalculateur et Big Data analytique avec Intel Hadoop

Cray, le constructeur historique de supercalculateurs, a annoncé la disponibilité de la nouvelle distribution Hadoop d’Intel sur sa technologie CS300 de supercomputing. La combinaison des deux donne naissance à une puissante solution de Big Data analytique.

Cray CS300

Cray CS300

Le Cray CS300 est un cluster sous Linux, piloté par l’application Cray ACE (Advanced Cluster Engine), secondée par une version adaptée de SLURM (Simple Linux Utility for Resource Management), et qui supporte désormais Infiniband.

Répondant aux attentes du marché en matière de standardisation, la machine embarque une plateforme 2 sockets, lesquels accueillent des processeurs Intel Xeon. Une partie de son innovation provient de son refroidissement liquide et de son architecture qui optimise l’efficacité énergétique.

Intel Distribution Hadoop

Le constructeur se fait ici remarquer avec l’adoption de la plateforme Big Data Intel Distribution for Apache Hadoop. Intel a conçu cette distribution afin d’optimiser le code de Hadoop pour sa plateforme Xeon (voir la vidéo de Stanislas Odinot, consultant technique pour Intel : « Big data : nous avons notre propre distribution Hadoop »). Une démarche qui vient confirmer l’intérêt du fondeur pour le marché du Big Data et sa volonté d’aller au-delà des serveurs.

Intel travaille avec la communauté Hadoop depuis 2009. Mais le fondeur a franchi un nouveau pas en février avec l’annonce de sa propre distribution Hadoop. Parmi les apports d’Intel figure l’optimisation de l’usage de ses processeurs par le support des technologies qui y sont intégrées, à l’image de AES-NI (Advanced Encryption Standard New Instructions) qui permet d’accélérer le chiffrement sur le système de fichier HDFS (Hadoop Distributed File System).

La stratégie Big Data Hadoop de Cray

Une architecture de performance

La combinaison du HPC et de l’analytique devrait permettre de franchir un nouveau pas dans la puissance du Big Data. Elle pourrait surtout être une étape incontournable pour atteindre le temps réel. Et elle confirme que le Big Data analytique a trouvé dans les clusters sa plateforme de prédilection pour l’exécution d’algorithmes complexes.

Avec Intel Distribution for Apache Hadoop, Cray renforce la sécurité de sa plateforme, améliore le temps réel dans le traitement de la donnée, ainsi que les performances de son architecture de stockage. La solution devrait également intégrer les applications Hadoop qu’Intel n’a pas souhaité rendre open source, comme Intel Manager for Apache Hadoop pour la configuration et le déploiement, ou Active Tuner for Apache Hadoop qui améliore la performance du compute sur le cluster où s’exécute sa distribution.

La vision de Cray en matière de Big Data analytique

Les architectures de référence sur lesquelles tourne Hadoop montrent des faiblesses tant du côté du stockage de données que du traitement de ces données. Le HPC, dans sa configuration désormais classique en clusters, pourrait donc se révéler comme étant une architecture de référence pour l’analytique. D’autant plus que le HPC offre des capacités d’évolution adaptées à cette approche.


Voir aussi

Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes

Recent Posts

USF : 7ème mandat consécutif pour Gianmaria Perancin

Le Conseil d’Administration de l’Association des Utilisateurs SAP Francophones ( USF) a réélu Gianmaria Perancin…

48 minutes ago

Comment Amadeus hybride l’IA générative pour améliorer l’expérience du voyage

Le secteur du transport aérien utilise des algorithmes depuis des années. Mais cette chasse gardée…

2 heures ago

Un mode batch sur l’API OpenAI : ce qu’il faut savoir

Une option de traitement par lots est arrivée sur l'API OpenAI. Voici quelques clés de…

5 heures ago

Ce qui va changer dans l’offre VMware d’OVHcloud

De la migration vers VCD aux engagements pour les clients SecNumCloud, OVHcloud esquisse le devenir…

7 heures ago

OpenAI ouvre son premier bureau en Asie au Japon

OpenAI ouvre son premier bureau en Asie à Tokyo. Quelques jours après l'annonce d'un investissement…

7 heures ago

Les leçons d’une start-up sur l’usage de l’API OpenAI

Après 500 millions de tokens traités avec GPT-3.5 Turbo et GPT-4 via l'API OpenAI, une…

1 jour ago