Le 24/08/2017 à 17:22, François Poulain a écrit :
Le Thu, 24 Aug 2017 16:48:56 +0200, Mathieu Arnold mat@mat.cc a écrit :
Ici on est en train de passer de nagios à icinga, avec la version 2, ils ont un méta langage qui fait y'a tellement moins de configuration a écrire, par exemple, ajouter un check ssh à toutes les machines FreeBSD qui ont une ipv4 ou v6
Je confirme. Avec icinga2, comparé à icinga/nagios on peut avoir à peu de frais une description très déclarative de l'host (par ex: volumes disques, vhosts http, processes) et utiliser cette description pour définir automagiquement les services associés.
Pour se faire une idée : https://admin.chapril.org/doku.php?id=admin:procedures:ajout-d-une-machine
Et le code qui parse ces descriptions pour définir des services est relativement trivial.
Le tout en se débarrassant de nrpe.
Une des raisons pour lesquelles notre migration vers icinga2 n'est pas terminée est parce que justement, j'ai voulu virer nrpe, en utilisant le multi-zone, et le problème que j'ai, c'est que tous les checks d'une machine sont fait en local sur la machine, et ça inclue le hostalive.
Du coup, quand une machine est coupée du réseau (ou down), l'agent icinga en local est bien content, localhost continue à ping (ou il est plus là mais osef). Le master, lui a bien vu qu'un agent était plus là, mais il ne s'en inquiète pas trop, et je n'arrive pas à trouver comment faire pour avoir un check en local sur le master qui se plaindrait de la disparition d'un hôte (à part ajouter automatiquement un second host pour chaque host qui serait checké depuis le master.)
Bref, est-ce que c'est un problème que je suis le seul à avoir, ou est-ce un problème que vous avez aussi rencontré ?