Le Fri, 27 Aug 2010 18:43:04 +0200, Pierre Chapuis catwell@archlinux.us a écrit :
Cassandra est "scalable" au sens où on l'entend en général, pour HBase je ne sais pas. MongoDB
MongoDB vient d'avoir le sharding mais la manière donc çà a été implémenté me plait guère (en gros, c'est du scatter/gather sur des partitions de données qui se veut distribué que je trouve mal foutu, l'algo est vraiment naïf et il est correspond pas à ce que je veux).
et CouchDB sont faits pour des échelles plus petites.
Et couchdb fait du "shared nothing", çà correspond encore moins à mes besoins, la consistance est géré avec les pieds en plus :)
C'est pour çà que j'ai les mis dans l'éventuel :)
J'ai aussi entendu du bien de Riak.
Tu peux élaborer ?
Je travaille actuellement dans AWS donc je triche et j'utilise SimpleDB.
Hum, c'est pas extrêmement cher mais je suis pas sur que çà colle au contexte d'outsourcer ce tiers.
Il faut aussi faire attention à la propriété fondamentale du NoSQL scalable : l'absence de consistence pure (propriétés AP du Théorème de Brewer : http://www.julianbrowne.com/article/viewer/brewers-cap-theorem). En particulier, un bon nombre de bases de données de ce genre n'offrent pas d'option permettant de lire ses écritures. SimpleDB permet depuis quelques mois de choisir à la lecture entre AP (rapide et disponible) et CP (qualité des données) mais je ne connais pas de système libre qui offre cette option.
Si si Cassandra le fait : http://wiki.apache.org/cassandra/ArchitectureOverview
Cassandra est le mieux pensé dans l'état de mes investigations mais certaines limitations comme la taille maximum de 2GB par colonne peut être gênante.
Au passage, quelqu'un a testé ce que donne VoltDB (http://voltdb.com/) sous une charge conséquente en écriture ?
Putaing, si çà marche vraiment comme annoncé, c'est la solution miracle ... /me a du code source à lire tiens :)
Merci.