Pinterest a rendu disponible une solution Open Source, nommée Terrapin, conçue pour placer plus efficacement des données dans Hadoop et rendre les informations utilisables par d’autres systèmes. Pour cela, les ingénieurs de Pinterest ont élaboré Terrapin comme un remplaçant de la base de données NoSQL, HBase, car elle est relativement lente et à des performances réduites au-delà de 100 Go de données. La société a regardé aussi le logiciel Open Source ElephantDB comme autre alternative, mais les résultats n’ont pas été parfaits.
Varun Sharma, ingénieur de l’équipe infrastructure de Pinterest, explique sur un blog que « Terrapin offre un accès aléatoire à faible latence pour les valeurs-clés sur un grand nombre de jeux de données, lesquels sont immuables et regénerer dans leur globalité (cf diagramme ci-dessous) ». Il ajoute : « Terrapin peut ingérer des données issues de S3 (Amazon), HDFS ou d’un traitement via MapReduce. Il est élastique, tolérant aux pannes et assez performant pour être utilisé par des applications de Pinterest comme Pinnability et Data Discovery. »
Pinterest a testé Terrapin en production pendant un peu plus d’un an avec une capacité de données qui s’établit aujourd’hui à 180 To de données. Avec la disponibilité de l’outil sur GitHub d’autres entreprises pourront l’essayer, voire l’adopter. Pinterest a déjà publié des solutions Open Source comme Pinball, PINCache et Secor.
A lire aussi :
Comment extraire de la valeur du Big Data, selon Intel
Big Data : les technologies sont déployées, mais pas sécurisées
Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…
À la grogne des partenaires VMware, Broadcom répond par diverses concessions.
iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.
FT Group, éditeur du Financal Times, a signé un accord avec OpenAI afin d'utiliser ses…
Au premier trimestre, Microsoft, Meta/Facebook et Alphabet/Google ont déjà investi plus de 32 milliards $…
La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…