Sakari Keskitalo, Codership : « Galera Cluster offre une meilleure protection contre la perte de données »

Galera Cluster

Focus sur la prochaine mouture majeure de Galera Cluster, une solution de réplication synchrone pour MySQL. Une offre qui monte en puissance.

Suite à la présentation fin septembre de la mouture bêta de la solution de réplication synchrone Galera Cluster (dédiée aux bases de données MySQL), nous nous sommes entretenus avec Sakari Keskitalo, directeur des opérations de Codership, la startup finlandaise se cachant derrière ce projet open source.

Silicon.fr – Quels sont les avantages de votre solution par rapport au clustering classique ?

Sakari Keskitalo – Si on la compare à la la réplication asynchrone MySQL / Tungsten, j’en citerai quatre :

  • La réplication MySQL ou Tungsten est asynchrone soit 1 maître + n esclaves. Généralement, les esclaves se placent derrière le maître. Chacun détient des valeurs et données différentes, ce qui signifie qu’il est possible de perdre des informations. Galera Cluster est multimaître. L’utilisation de la réplication synchrone sur tous les maîtres (ou esclaves) permet de toujours avoir les mêmes données. Nous offrons une meilleure disponibilité du service et une meilleure protection contre la perte de données.
  • Les utilisateurs peuvent écrire et lire depuis tous les nœuds, car Galera Cluster est multimaître. Avec la réplication asynchrone MySQL ou Tungsten, vous écrivez sur un seul maître et lisez depuis plusieurs esclaves. Le maître peut devenir un goulot d’étranglement dans la réplication asynchrone. Notre modèle multimaître est donc plus facile à appréhender du point de vue du développeur d’applications.
  • Avec Galera Cluster, il n’y a pas de failover complexe à gérer. Si l’un des serveurs de la grappe tombe, ce n’est pas grave, d’autres sont disponibles et le service reste disponible en 24/7. Avec la réplication asynchrone MySQL ou Tungsten, si le maître tombe, des pertes de données sont possibles, puisque les esclaves sont derrière. D’autre part, une procédure de basculement complexe (soit manuelle, soit automatique) est nécessaire pour sélectionner un nouveau maître. Cela peut prendre du temps et provoquer une longue rupture de service.
  • Enfin, pour améliorer les performances, Galera Cluster peut faire de la réplication parallèle.

Le constat est évidemment différent si on compare à MySQL Cluster. Tout comme Galera Cluster, ce dernier est une offre synchrone, mais elle ne supporte que le moteur de stockage NDB. Galera Cluster prend en charge InnoDB, qui est le moteur de stockage le plus populaire dans le monde MySQL. De plus MySQL Cluster est destiné principalement aux applications télécoms, alors que notre offre est mieux adaptée aux applications web et au cloud computing.

Quelles sont les nouveautés les plus importantes de Galera Cluster 3.0 ?

D’abord, Galera Cluster est prêt pour MySQL Community Edition Server 5.6, une release importante de la part d’Oracle, que de nombreux utilisateurs vont commencer à utiliser. Signalons également la prise en charge de MySQL 5.6 GTID (identifiant de transaction global). Les utilisateurs peuvent désormais entrer et sortir d’un système Galera Cluster en utilisant la réplication asynchrone MySQL. D’autre part, la version 3.0 intègre un format d’écriture optimisé avec une accélération sensible du traitement des transactions de grande taille. Enfin, je citerai la détection de la proximité d’un nœud. Cela réduit considérablement le trafic réseau entre les centres de données. En outre, lorsqu’il rejoint le cluster, un nouveau nœud choisira un donneur issu du segment le plus proche.

Quelle est la roadmap pour la sortie de la mouture définitive de Galera Cluster 3.0 ?

La 3.0 devrait arriver en mouture définitive dans le mois à venir. En parallèle, nous travaillons en étroite collaboration avec MariaDB et SkySQL. Galera 3.0 devrait ainsi être intégré à MariaDB Galera Cluster peu de temps après sa sortie.

Galera Cluster pour MySQL est une solution qui s’avère fiable et très performante. Nos clients gèrent des applications critiques, ou de gros sites cumulant beaucoup de trafic. La technologie Galera pourrait être utilisée pour répliquer les données au sein de n’importe quel système transactionnel, même si nos plans à moyen terme se focalisent sur le seul marché des bases de données.


Voir aussi
Quiz Silicon.fr – Connaissez-vous les logiciels open source ?