En ce n’est ni plus ni moins qu’une supervision, donc c’est sur cette optique qu’il faudrait que tu partes.
- Considérant qu’un besoin peut toujours évoluer (on commence par la mémoire et le cpu, et on s’aperçoit vite que le disque aussi c’est utile, puis la présence réseau car si pas de réseau pas de cpu ni de mémoire à monitorer), mieux vaut choisir une application qui soit évolutive dans ses possibilités, tout en restant constante dans son modèle de configuration.
- Il est utile d’avoir une fonctionnalité qui te permet de faire une chaine du type: pas de ping alors j’ignore les autres alarmes du serveur.
Ensuite il y a le mode de monitoring:
- Avec Agent (qui implique une application en local sur chaque serveur, avec les problématiques éventuelles de mises à jour lors d’une évolution, sans oublier l’utilisation de l’agent comme faille de sécurité)
- Sans agent (il y a deux choix: SNMP de préférence en v3, ou via SSH), personnellement je ne recommande pas une supervision par accès direct à WMI car c’est potentiellement très unsecure
Le dashboard n’est en fait que la dernière étape. Car sans info un dashboard n’est rien.
- Zabbix a pas mal progressé. Quelques fonctionnalités intéressantes comme le suivi de parcours d’un visiteur web.
- Centréon est pas mal représenté et est plutôt stable avec une quantité de plugins impressionnante. le plus courant dans les outils libres. la plate-forme est simple à mettre en place (des VM toutes prêtes existent). permet de créer ses propres « vues » à l’aide de widgets. gestion organisée des alertes.
- Pour une gestion évènementielle, Prometheus est prometteur (sans jeu de mot ), mais pour la visualisation, il faut passer par Grafana.
- Grafana est une plateforme de visualisation et d’analyse de métriques. Bon générateur de tableau de bord, mais pas vraiment un outil de supervision à la base. Donc il faudra une autre application pour avoir le monitoring.
LibreNMS ou OpenNMS sont d’abord des outils de monitoring réseau au départ, plutôt prévu pour des grands parcs dans le cas de OpenNMS.
Pour ce qui est d’avoir deux serveurs, avoir un CentOS et une Debian n’est pas pertinent, car cela nécessite d’avoir des compétences sur les deux. La mise en place d’une telle plate-forme ne se fait pas en launch and forget. Une supervision demande un travail constant. Donc il faut s’assurer de la pérennité des compétences. Qui plus est, quitte à avoir deux plateformes pour la redondance,autant avoir deux plate-formes identiques, c’est préférable en terme d’architecture distribuée.
Ensuite pourquoi faire de la réplication alors qu’un simple système de sauvegarde peut suffire.
S’agit-il ensuite de machine physiques ou virtuelles? car la réplication sur du virtuel est moins pertinente.
Enfin, la taille du parc à monitorer a aussi son importance sur la stratégie de déploiement et son architecture.
Donc comme le dit Clochette: fait toi une liste des besoins indépendamment du produit que tu utiliseras.
C’est en fonction de ce qu’il faudra faire que tu détermineras ce que tu vas choisir.
Grafanna n’est que la fin de chaine. seul il n’est d’aucune utilité pour faire de la supervision.
enfin, n’oublie pas que l"'outil choisi va avoir un impact sur la méthodologie d’exploitation. Mieux vaut une application dont l’évolution d’un polling est simpleà maitriser (utilisation de templates en cascae par exemple: Host standard -> host specialisé , services standards -> services spécialisés, etc… )
De la même façon, as-tu besoin uniquement de metriques, ou as-tu besoin d’une gestion d’évènement et d’alertes, y compris en cascade (i.e.: un switch est en panne, tous les équipement deservis par ce switch seront alors considérés comme en panne). et as-tu besoin aussi d’un système de notifications?
Bon courage