[Debian 6] Load Average élevé sur un switch

Bonjour,

Dans le cadre de mon projet de fin d’année, j’ai installé cacti sur Debian pour vérifié l’état de santé sur les switch de mon entreprise. Entre 10h35 et 10h40, j’ai eu un pic élevé sur le graphique Load Average qui dépassé plus de 4.0,je présume que c’est en pourcentage.

1 minute average current : 2.21
5 minute average 1.54
15 minute average 0.86

Cela n’avait duré que 5 minutes.
Je présume le fait que plusieurs processus était en cours.

Que signifie réellement ces courbes ?

Le load average est le nombre de processus en cours d’éxécution. 4 est beaucoup en moyenne maisponctuellement ça n’est pas grave. Par exemple, l’un de mes serveurs aatteint 4,57 le 17 février à 13h. Bon, c’étaitune batterie de spams. Il m’est arrivé d’atteindre 30 (quelqu’un avait envoyé des spams au nom d’au n des domaines, j’avais tous les retours: des dizaines de milliers de mails à l’heure qui passaient par l’antivirus. J’étais à 800km. Un quart d’heure pour que la console réponde, unquart d’heure pour passer en root, un quart d’heure pour tuer clamav, puis la journée pour épuiser le reste. Là c’est signe de pbms (ici limiter l’antivirus aux mails ayant un destinataire par exemple). 4 pendant 5 minutes, ça n’est pas grave…

Merci beaucoup pour tes explications qui m’avance énormément.
Question bête, mais est-il possible de connaître quels sont les processus qui était en cours à ce moment-là dans Cacti ? (ou avec un autre logiciel depuis Debian).

Hum, pas de moyens simples à ma connaissance, il faut se bricoler un robot.

Avec plus de sondes, tu devrait pouvoir savoir le programme et/ou le “truc” qui s’est passé;
Sur mes machines, je graphe une floppée d’info, justement avoir une idée après coup : des données sur les services (web, postfix, dovecot, nfs, mysql, sque tu veux), tout les IO (réseau en paquet et bande passante, disk en taille et en nombre d’IO etc), mémoire (avec les différents types), charge (idem), nombre de processus actifs, nombre de users, interruption du kernel etc, une 50aine de graphes par machine en gros.
Avec les logs, les graphes sont la seule chose qui te permet d’avoir une vue sur un evenement passé;

Merci pour vos réponses :slightly_smiling:
Je vais regardé ça de plus prêt et voir pour me bricoler un petit robot de surveillance.
Au final, j’ai peur qu’avec tout ça, ma machine risque d’avoir un jolie ralentissement.
Je vais donc faire des recherches plus poussé, sujet résolu :slightly_smiling: