Le samedi 27 juillet 2019, 10:18:29 CEST Grégory Poudrel a écrit :
Bonjour à tous,
allez c'est l'été, je pose une colle :-)
Comment gérez-vous une infra zero downtime / fault tolerent ? Pour situer le périmètre, je parle dans un contexte de virtualisation, du fait que l'ensemble de vos VMs continuent à fonctionner sans avoir subi de reboot suite à un crash de l'hyperviseur qui les héberge, donc dans un cas de disaster recovery uniquement. Autrement dit, un RTO RPO de 0 précisément.
[...]
Bonjour,
Désolé, je ne vais pas répondre à la question, mais juste dire que de nos jours (Cloud...) la réponse n'es plus dans l'infrastructure mais dans les applications.
Avec une application dont l'architecture logicielle est redondante, on peut dire "Cloud Native", tu peut atteindre du TRO/RPO faible sur des machines standard, quelconque sans garantie de SLA.
Et surtout au delà des pannes, on doit quand même redémarrer les applis et les système pour les mises à jour, dans ce cas, pouvoir faire du rolling upgrade sur plusieurs machines, l'une après l'autre sans interruption de service.
Bref, s'il n'y a plus beaucoup de solution de fault tolerance (VMware doit toujours avoir ça), c'est peut-être que simplement ça n'a plus d'utilité sur les nouveaux environnements applicatifs (Cloud native apps, Kubernetes...).
Bonne journée,
PS: Je ne crois pas aux miracle, et RTO=RPO=0, dans un cadre de PRA, à moins d'avoir aucune exigence de perf, je n'y crois pas (théorème CAP).