Silicon.fr L'actualité informatique et high-tech pour décideurs IT

- Cloud
- Cybersécurité
- Data & IA
- Emploi & Formation
- Green IT
- Open source
- Workspace
- Actualités
- Dossiers
- Fiches pratiques
- Événements
- Offres d'emplois
- Webinars
- Livres blancs
- Hubs
  - Optimisez vos processus documentaires
  - Industrie 4.0 : les industriels français affichent leurs ambitions
  - Etant données, le podcast des acteurs de la data
  - Accélérez la transformation de votre entreprise grâce au travail hybride
  - Le Cloud à coûts maîtrisés, avec IONOS
  - Solutions télécoms, cloud et cybersécurité pour entreprises
  - Ecosystèmes hyperconnectés : préparez votre entreprise à l'hyperbusiness
  - intel + Silicon présentent : DSI, Héros de l'IT
  - Engage for Sucess by Intelcia

En ce moment En ce moment

Google I/O : Dataflow alimente en temps réel Big Query en Big Data

Après la mobilité, Google a parlé du Big Data lors de son évènement développeurs. La firme a dévoilé le service Dataflow qui permet d'injecter des flux de données à la volée dans l'outil Big Data maison, Big Query.

Publié par La rédaction le 26 juin 2014 | Mis à jour le 2 mars 2021 à 13:51

Lecture
2 min

Imprimer

Il y a une vie en dehors d'Android. A Google I/O, les développeurs ont pu également se concentrer sur le Big Data. La firme de Mountain View a en effet présenté un service nommé Cloud Dataflow, un outil intégré dans Cloud Platform et qui permet d'analyser des flux de données à la volée.

Dans un billet de blog, Greg DeMichillie, responsable produit, a expliqué que « ce service est basé sur deux technologies internes à Google, Flume et Millwheel ». La première est capable de créer des « pipelines » de données issues de sources différentes et l'autre facilite le transit des données. A l'occasion de la conférence, Urs Hölzle, responsable de la création du réseau mondial de datacenters de Google, a souligné que ce service permet aux entreprises de faire face à des pétaoctets de données. « Cloud Dataflow est le résultat de plus d'une décennie d'expérience dans l'analyse de données », précise le dirigeant. Sur scène, il a fait la démonstration de cette solution en analysant en temps réel le ressenti des personnes sur Twitter lors du match d'ouverture de la coupe du monde de football au Brésil.

Un successeur à MapReduce

Urs Hölzle a continué son exposé en expliquant que « depuis longtemps, Google travaillait avec le système MapReduce qui est devenu la norme pour le traitement Big Data. Il a parcouru des centaines de serveurs pour nous aider à construire un gigantesque index des pages web qui sous-tend notre moteur de recherche. Maintenant, nous avons un clone Open Source de MapReduce-Hadoop ». Il ajoute, « Google n'utilisera plus MapReduce mais Flume, alias FlumeJava pour le traitement de données massives en mode batch ».

Disponible en version bêta, Dataflow pourra se brancher directement sur Big Query, la solution Big Data as a Service de Google. Cette initiative n'est pas unique comme le montre le service de streaming MapReduce de Twitter baptisé Summingbird et présenté en septembre 2013. Amazon Web Services propose également une offre en mode similaire à Dataflow, Kinesis permettant de traiter en temps réel des données récoltées en continu à une échelle massive. Les données peuvent ensuite être envoyées vers différents services, notamment Amazon S3, DynamoDB et Redshift (solutions d'entreposage de données).

Luc de Brabandere, « Le Big Data est un outil de découverte pas d'invention »

Big Data : les bénéfices ne sont pas là où on les attend

Publié par :
La rédaction

Tags associés :

RGPD : Cegedim Santé condamné à 800 000 $

Par La rédaction le 13 sept. 2024

OpenAI, vers une valorisation de 150 milliards $ ?

Par La rédaction le 13 sept. 2024

Avec o1, à quel point OpenAI change-t-il d'approche ?

Par Clément Bohic le 13 sept. 2024

Pixtral, un premier modèle multimodal pour Mistral AI

Par La rédaction le 11 sept. 2024

Oracle héberge un peu d'OCI chez Google Cloud

Par Clément Bohic le 11 sept. 2024

Abonnez-vous à Silicon Magazine !

Recevez le magazine chez vous ou sur votre lieu de travail et accédez à la version numérique à tout moment !

à partir de 120€ par an pour 1 an d'abonnement

J'en profite

Livres Blancs

Amazon Business

Santé : L’IA générative change la donne

L’intelligence artificielle (IA) générative représente un changement de paradigme voué à remodeler le paysage [...]

Télécharger

Check Point

Rapport sur la cybersécurité 2024

Bienvenue à l'édition 2024 du Rapport sur la cybersécurité de Check Point. L'année 2023 a été témoin d'une [...]

Télécharger

Rimini Street

Transformer les économies en solutions commerciales

La part d’économies de 50 % réalisée sur les frais annuels du support IT affecte directement le compte de [...]

Télécharger

Sigma

CSRD : le guide indispensable

82 exigences de divulgation imposées. Plus de 1 200 indicateurs. Ces chiffres, à eux seuls, peuvent effrayer [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

4 juillet 2024

La Matinale Silicon : IA & Cybersécurité

Organisé par Silicon

Voir le replay

29 mai 2024

Le grand dîner de gala de la Communauté

Organisé par Silicon

Revivre en images

30 novembre 2023

Silicon Day Cybersécurité et Data

Organisé par Silicon

Voir les replays

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédantaux informations clés de votre domaine.