Utilisateur:LuandK/Projets/Cassandra (base de données)


Cassandra est un Système de Gestion de Base de Données (SGBD) NoSQL, Open Source et est un projet prioritaire de la Fondation Apache [1]. Cassandra est conçue pour gérer des quantités massives de données réparties sur plusieurs serveurs (cluster), en assurant tout particulièrement une disponibilité maximale des données et en éliminant les point individuel de défaillance.

Cassandra est basée sur une structuration en paires clé-valeur de type eventually consistent[2]. L'architecture relationnelle est orientée colonne, avec des éléments plus traditionnels (stockage horizontal des paires).

Historique

modifier

Initialement développée par Facebook, l'application a été libéré dans l'espace open-source et rapidement adoptée par plusieurs grandes entreprises gérant d'importants volumes de données, telles que Twitter[3] ou digg.com[4]. Jeff Hammerbacher, directeur de la division Data chez Facebook, a décrit Cassandra comme une application du type de BigTable servie par une infrastructure proche de Dynamo.

Fonctionnalités

modifier

Décentralisation

modifier

Chaque nœud du cluster est identique. Il n'y a pas de point individuel de défaillance.

Tolérance aux pannes

modifier

Les données sont automatiquement répliquées sur plusieurs nœuds de tolérance aux pannes. La réplication dans plusieurs centres de données est prise en charge. Un nœud défaillant peut être remplacé sans nécessiter d'arrêt.

Élasticité

modifier

Principaux utilisateurs

modifier

Articles connexes

modifier

Notes et références

modifier
  1. « Cassandra is an Apache top level project », Mail-archive.com, (consulté le )
  2. http://www.cs.cornell.edu/projects/ladis2009/papers/lakshman-ladis2009.pdf
  3. Cassandra @ Twitter: An Interview with Ryan King (en) Interview de Ryan King, chef de l'équipe de stockage chez Twitter
  4. Digg (en) Digg annonce qu'il va utiliser Cassandra

Liens externes

modifier