Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Apache vient booster Hadoop avec Spark 1.0

Spark 1.0 se veut jusqu'à 100 fois plus rapide qu'Hadoop MapReduce. Une offre dédiée aux applications analytiques de hautes performances.

Publié par La rédaction le 2 juin 2014 | Mis à jour le 28 déc. 2021 à 09:15

Lecture
2 min

Imprimer

Présenté comme le couteau suisse de la pile Big Data Hadoop, Spark est aujourd'hui livré en version 1.0 par la Fondation Apache.

Spark est un outil dédié aux traitements de données à large échelle, qui propose de multiples innovations :

Il affiche des vitesses de fonctionnement très avantageuses par rapport à MapReduce de Hadoop : jusqu'à x10 sur disque et jusqu'à x100 en mémoire.
Les applications Spark pourront être écrites en divers langages de programmation : Java, Scala ou Python.
Spark peut s'intégrer à un cluster Hadoop ou fonctionner de manière autonome et est capable de lire des données depuis HDFS, Hbase ou Cassandra.

Au besoin, Spark est même capable de se connecter à des bases SQL, ce qui en fait un outil particulièrement flexible, à la croisée des chemins entre les bases de données classiques et les solutions dédiées au Big Data.

Une adoption très rapide

Spark est tout indiqué pour créer des applications d'analyse de données sur des jeux massifs d'informations. Il a d'ores et déjà été adopté par certains grands noms, comme Alibaba, la Nasa ou encore Yahoo. La Nasa compte par exemple l'employer dans le cadre de la mise au point de modèles climatiques.

Notez que Spark est aujourd'hui présent dans la plupart des distributions Hadoop. Les offres de Cloudera, IBM, Intel, MapR et Pivotal sont ainsi citées.

Voir aussi
Quiz Silicon.fr - Testez vos connaissances sur le Big Data

Publié par :
La rédaction

Tags associés :

News Corp, éditeur du Wall Street Journal, poursuit Perplexity

Par Tom Jowitt - Silicon UK le 24 oct. 2024

Contrôler un PC avec un LLM : ce que propose vraiment Anthropic

Par Clément Bohic le 23 oct. 2024

Gestion des API : à architectures distribuées, sourcing multiple

Par Clément Bohic le 23 oct. 2024

Des copilotes aux agents autonomes, où en est Microsoft ?

Par Clément Bohic le 22 oct. 2024

Les LLM Granite 3.0 d'IBM, signes des temps

Par Clément Bohic le 21 oct. 2024

Abonnez-vous à Silicon Magazine !

Recevez le magazine chez vous ou sur votre lieu de travail et accédez à la version numérique à tout moment !

à partir de 120€ par an pour 1 an d'abonnement

J'en profite

Livres Blancs

Checkmarx

La meilleure liste de contrôle de Sécurité du code au cloud

Changement de l'impact et du rôle des applications cloud Qu'est-ce que le Code to Cloud [...]

Télécharger

OpenText

Intégration ERP, le guide ultime pour transformer [...]

Découvrez comment l'intégration ERP peut booster l'efficacité opérationnelle, fluidifier vos échanges de données [...]

Télécharger

Hitachi

VSP One Block, la simplification de la gestion des [...]

Découvrez comment VSP One Block d'Hitachi Vantara optimise le stockage, réduit l’énergie et renforce la sécurité [...]

Télécharger

Keeper

Les responsables informatiques se préparent à faire [...]

Une enquête mondiale menée en 2024 par Keeper Security en partenariat avec TrendCandy Research auprès de plus de [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

Inscrivez-vous

4 juillet 2024

La Matinale Silicon : IA & Cybersécurité

Organisé par Silicon

Voir le replay

29 mai 2024

Le grand dîner de gala de la Communauté

Organisé par Silicon

Revivre en images

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.