Big Data : Cassandra 1.2, base de données NoSQL open source

La fondation Apache annonce la disponibilité de Cassandra 1.2, dernière version de la base de données NoSQL open source.

Cassandra 1.2 s’annonce comme une version majeure de cette base de données NoSQL open source. Cette seconde génération de la base apporte son lot de nouvelles fonctionnalités validées par l’ASF (Apache Software Foundation).

Cassandra 1.2 est tout d’abord une base de données haute performance, capable de traiter simultanément des milliers de requêtes, destinée au Big Data, NoSQL pour traiter la diversité des informations non structurées – par opposition aux données SQL structurées -, scalable pour évoluer sans interruption et à tolérance de panne.

Cette nouvelle version a densifié le support des clusters avec le clustering au travers de nœuds virtuels (vnode), chaque nœud pouvant supporter plusieurs téraoctets de données, la virtualisation des nodes simplifiant la gestion des clusters et réduisant la charge des machines virtuelles Java. Elle apporte la communication inter nœuds, et un mapping plus puisant ; la simplification du modeling ; et la capacité de représenter l’information de manière plus naturelle.

Cassandra

Atomic batches et CQL3

Autre nouveauté, les ‘atomic batches’, un mécanisme de protection de l’intégrité transactionnelle des processus professionnels destiné aux développeurs. Un ‘batch’ permet de regrouper plusieurs mises à jour dans un seul état. Précédemment il était nécessaire de reproduire manuellement une seule mise à jour. À noter que l’atomic batches peut afficher une surconsommation d’environ 30%.

Enfin Cassandra 1.2 intègre la version 3 de CQL (Cassandra Query Language). Apache Cassandra étant une base de données distribuée, il est souvent nécessaire de réunir des données qui ne sont pas stockées sur un même support physique. Or le langage de requête n’offrait pas la commande JOIN.

C’est pourquoi le support de la ‘collection’ des données est probablement le principal apport de cette nouvelle version CQL3, ce qui devrait aider à simplifier la modélisation de la donnée, de manière naturelle.

Une communauté enrichie

Dans son communiqué, l’ASF a donné une indication sur les acteurs du marché qui exploitent Cassandra : Adobe, Appscale, Appssavvy, Backupify, Cisco, Clearspring, Cloudtalk, Constant Contact, DataStax, Digg, Digital River, Disney, eBay, Easou, Formspring, Hailo, Hobsons, IBM, Mahalo.com, Morningstar, Netflix, Openwave, OpenX, Palantir, PBS, Plaxo, Rackspace, Reddit, RockYou, Shazam, SimpleGeo, Spotify, Thomson-Reuters, Twitter, Urban Airship, US Government, Walmart Labs, Williams-Sonoma, Inc., et Yakaz.


Voir aussi

Quiz Silicon.fr – Le vocabulaire du cloud

Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes