On Thu, 26 Aug 2010 23:45:22 +0200, Jerome Benoit jerome.benoit@grenouille.com wrote:
Pour les NoSQL distribués, je suis preneur de retour d'expérience et de conseils, j'ai zéro expérience avec contrairement à certains DFS (Column Families, Key Value / Tuple Store, Document Store, etc.) ...
Pour la famille de documents, à toi de voir en fonction de ce que tu veux stocker. Personnellement j'aime bien les structures de données qui ressemblent à des hashes (document stores).
Concernant la scalabilité, si tu ne l'as pas encore fait, commence par lire http://jamesgolick.com/2010/3/29/most-nosql-dbs-are-not-scalable.html.
Cassandra est "scalable" au sens où on l'entend en général, pour HBase je ne sais pas. MongoDB et CouchDB sont faits pour des échelles plus petites. J'ai aussi entendu du bien de Riak. Je travaille actuellement dans AWS donc je triche et j'utilise SimpleDB.
Il faut aussi faire attention à la propriété fondamentale du NoSQL scalable : l'absence de consistence pure (propriétés AP du Théorème de Brewer : http://www.julianbrowne.com/article/viewer/brewers-cap-theorem). En particulier, un bon nombre de bases de données de ce genre n'offrent pas d'option permettant de lire ses écritures. SimpleDB permet depuis quelques mois de choisir à la lecture entre AP (rapide et disponible) et CP (qualité des données) mais je ne connais pas de système libre qui offre cette option.
Au passage, quelqu'un a testé ce que donne VoltDB (http://voltdb.com/) sous une charge conséquente en écriture ?