Re,
Comment on gère les alertes? Maintenant que tout est métrique, on a dev un scheduler distribué ( Metronome sur github ) et on utilise https://functions.ovh/ pour générer et process l'alerting. L'alerting est un projet à part, as code, est générique et utilise des backends (Metrics, Logs, MySQL, custom...). On va le mettre un peu sous pression en interne puis on le fera tester sur labs.ovh.com :)
...
créer un système d'alerting custom, cela conforte mon intuition sur le fait qu'il n'existe pas encore de solution/projet.
1) Totalement d'accord, ce mail était très clair et super intéressant. Au passage cela m'a permis aussi de découvrir qu'OVH s'est mis au Serverless avec Functions (qui n'existe pas encore sur labs). Le serverless étant pour moi vraiment l'avenir pour beaucoup de startups qui font des APIs... je serais hébergeur aujourd'hui, j'investirais à fond là-dessus (avant que tout le monde parte chez AWS).
2) Ma conclusion sur le système d'alerting n'est pas la même... ce que je retiens c'est que Metronome est un event scheduler (distribué) qui permet donc de déclencher le lancement des alertes (genre un sms.sh), le tout basé sur des métriques. Donc tu l'as ton système d'alerting relié à tes métriques. A priori la partie qu'il faudra dev custom c'est celle du calendrier d'astreinte... mais ça c'est un problème qui existe dans nombre de solutions existantes. Le travail ensuite c'est de définir les bons seuils sur les bonnes métriques, comme on faisait sur un nagios-like. Non ?
A+,