Le Fri, 27 Aug 2010 10:50:02 +0200, Greg greg-frsag@duchatelet.net a écrit :
et tu veux qu'on fasse tout ton travail :-P
Du tout :) c'est une exposition pour une aide et retour d'expérience éventuel.
- Cluster de données/stockage :
Une fois de plus : Ceph http://ceph.newdream.net/ (et j'aimerais bien que quelqu'un fasse le 1er pas ! :) ) Une fois de plus: évitez (ou test et bench bien) GlusterFS.
Je vais pas le faire ce premier pas vers ceph pour la simple et bonne raison que quand je vois les commit dans le repo git de Linus, le nombre de bugs corrigés est important le concernant et du bug lourd ou les nœuds ne reprennent pas leur activité, perdent de la data. C'est absolument pas envisageable pour un projet ou je n'ai pas de R&D dans la feuille de route.
Pour les NoSQL distribués, je suis preneur de retour d'expérience et de conseils, j'ai zéro expérience avec contrairement à certains DFS (Column Families, Key Value / Tuple Store, Document Store, etc.) ...
Sphinx : on a testé en prod, ça fonctionnait bien, et avec quelques K$ tu peux demander des nouvelles features au développeur russe, très efficace (1 semaine) et pas buggé. Grace a Sphinx on a divisé par 4 le nombre de serveurs nécessaires, et améliorer le temps de réponse par plus de 100 ! Pour améliorer encore les perfs, on a fait notre propre moteur: l'index est stocké en ram, full scan a chaque fois mais temps de réponse de fou, et ça ne consomme que du "bon" cpu. Prochaine étape: la même chose avec des cartes graphiques ou FPGA :)
Intéressant.
Tu parles bien de çà :
http://sphinxsearch.com/about.html ?
C'est du distribué au sens strict ?
a +.