Pour gérer vos consentements :

Big Data : Airbnb place son outil de requête en Open Source

Airbnb, le célèbre site de location d’appartements, place en Open Source (sur Github) son application Airpal, permettant à ses employés sans compétences techniques d’explorer ses données. Associé à l’outil de requête PrestoDB de Facebook, Airpal offre une alternative à bas coût pour exploiter de larges sources de données, notamment celles stockées dans des clusters Hadoop. Alors que PrestoDB est conçu pour les data scientist et requiert des compétences pointues, l’application de Airbnb est pensée pour tous types de salariés. En production depuis un an au sein de la société, Airpal est utilisé par environ un tiers de ses employés, explique James Mayfield, de Airbnb, dans un billet de blog.

Un remplaçant au Redshift d’Amazon

Au sein de la start-up, les données, environ 0,5 Po, sont stockées dans un cluster Hadoop, géré par Apache Hive. PrestoDB fournit la capacité de recherche via des requêtes SQL, Airpal offrant une méthode alternative – et plus accessible à des non informaticiens – pour explorer les données. Les utilisateurs peuvent utiliser un simple navigateur pour soumettre leurs questions et reçoivent en retour des fichiers CSV (facilement exploitables par un tableur).

Avant l’utilisation de cette combinaison, Airbnb exploitait le service Redshift d’Amazon Web Service. « Redshift nécessite un ensemble d’outils d’ETL pour préparer les données. Et l’outil est limité en termes de nombre de requêtes pouvant être exécutées simultanément, ce qui peut freiner l’usage des données, explique Andy Kramolisch, un ingénieur logiciel au sein de la start-up. De plus, nos développeurs trouvaient les messages d’erreur de Redshift peu clairs, rendant le débugage difficile. » Airbnb dit s’être appuyé sur l’expertise des équipes de Facebook pour mettre au point Airpal.

A lire aussi :

Big Data : Accor valorise ses recommandations clients avec la BI
Big Data : eBay lance Pulsar, outil d’analyse de données en temps réel
Big Data : IBM, GE, SAS, Hortonworks… forment une alliance autour de Hadoop

Crédit photo : agsandrew / Shutterstock

Recent Posts

GPT-4o : où, quand et pour qui ?

OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.

20 heures ago

Nom de domaine : Twitter définitivement remplacé par X

Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…

1 jour ago

Microsoft propose une délocalisation hors de Chine à ses ingénieurs IA et Cloud

Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…

1 jour ago

Du « Monde » à Reddit, le point sur les partenariats data d’OpenAI

Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?

1 jour ago

Comment Younited a appliqué la GenAI au crédit conso

Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…

1 jour ago

Processeurs : les États-Unis fabriqueront 30 % des puces avancées d’ici 2032

Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…

2 jours ago