Pour un PRA 2h, il faut monter une infra similaire sur un autre site et pouvoir la lancer ou effectuer une bascule dessus une fois que ton analyse montrera l'indisponibilité complète de la production. 1- tu détectes l'incident 2- analyse et visuel du niveau d'impact 3- résolution soit avec une restauration partielle soit en basculant sur ton système "PRA" qui fonctionne sur un autre site.
Dans quasiment tous les cas de résolution, si tu dois respecter 2h entre la détection et la résolution, il faut que ton infra soit dupliquée et fonctionnelle dans un environnement indépendant. Il faudra effectuer des bascules régulières pour vérifier le bon fonctionnement du PRA en cas de panne importante.
Bon courage http://www.captainadmin.com
Le 20-01-2015 14:05, Dominique Rousseau a écrit :
Le Tue, Jan 20, 2015 at 12:32:33PM +0100, jean-yves@lenhof.eu.org [jean-yves@lenhof.eu.org] a écrit: [...]
On me demande en effet une disponibilité à 99% sur une année et un PRA exécutable en 2h (99% sur une infra VMWARE ne me parait pas si difficle, mais c'est plus ce dernier point de 2h qui me tracasse le plus, deux heures en pleine nuit, cela va très vite entre le réveil, la prise d'appels, le diagnostic et ensuite seulement l'action !).
Pour la HA, y'a eu plein de réponses. Ton plus gros problème, c'est ton histoire de « PRA exécutable en 2h ». Ça couvre quoi ? La boulette humaine qui supprime des données ? La destruction totale de la salle machine hébergeant le cluster ? Il faut avoir mis en route la restauration d'une sauvegarde en 2h, et tant pis si tous les délais sont explosés parcequ'elle met 8h à se charger ? Bref, c'est très vague de parler de PRA sans en préciser le périmètre :)