Problème avec root [ Résolu ]

Bonjour à tous,

J’ai un serveur qui fonctionne et j’y accède depuis ssh sans problème. Puis un jour ssh ne fonctionne plus donc je fais un nmap sur ma machine je vois que le port 22 ouvert. Je vais physiquement sur la machine pour vérifier les logs or je n’arrive pas à me connecter en root, j’ai le message suivant : " login : failure forking ressource temporarily unavailable" .

Qui a déjà eu ce problème ?

Merci.

Tu dois avoir un script qui forke en boucle.
Si tu as accés en ssh, fais un ps aux, tu devrais voir quelle commande (répètée en trés grand nombre) provoque le problême.
Si c’est ça, un simple redémarrage devrait te remettre (temporairement) en état de marche, non ?

[quote=“mattotop”]Tu dois avoir un script qui forke en boucle.
Si tu as accés en ssh, fais un ps aux, tu devrais voir quelle commande (répètée en trés grand nombre) provoque le problème.
Si c’est ça, un simple redémarrage devrait te remettre (temporairement) en état de marche, non ?[/quote]

En fait je n 'ai pas accès à la machine c’est ca mon problème, ni en ssh, ni physiquement. La seule solution que je vois c’est d’éteindre brutalement le serveur mais ca fais peur.

C’est pourtant ce qu’il te reste à faire. Trouver le script qui fork autant et résoudre ce problème pour qu’il ne réapparaisse pas. Pourtant il me semble que le système réserve quelques pid pour les processus de root (histoire justement d’arrêter la fork bomb quand c’est possible). Si tu as un nagios d’opérationnel en vérifiant ou la charge (load) ou la mémoire ou le CPU de ton serveur tu devrais pouvoir réagir juste assez vite pour éviter un autre reboot.

c-moi

c-moi, si geokool dit que seul le port 22 est ouvert, c’est que nagios ne peut de toutes les façons pas répondre.

geokool, je ne comprend pas: tu peux accèder physiquement ou pas ?

Voila la liste des ports ouverts :

22/tcp open ssh
80/tcp open http
3306/tcp open mysql

Mes excuses je me suis mal exprimé, je parlais dans un futur proche. Je présume que le script empêchant actuellement le login a mis un “certain” temps à se “répandre”. Attention ce ne sont que suppositions. Je parlais donc d’un moyen (possible) de prévention : alerter lorsqu’il y a une montée en charge anormale. Mais c’est peut être hors sujet.

À ce que j’ai compris il accède physiquement au serveur mais ne peut s’authentifier que ce soit en ssh ou directement. Il peut donc redémarrer le serveur manu militari. Ou alors j’ai zappé quelque chose ^-^

c-moi

geokool, si tu as accés physiquement, et qu’il ne répond plus aux utilisateurs tu ne risque rien à redémarrer sinon d’en savoir un peu plus. Prépares juste un livecd quelconque pour intervenir en urgence si ça ne boote pas.
Mais sans possibilité d’avoir plus d’info, il n’y a rien à faire d’autre. Tu l’as fait, ce ps ?

J’y accède physiquement, il répond bien aux utilisateurs, mon souci c’est pour moi de pouvoir y accéder via ssh pour faire des modifs et aussi pour la sauvegarde.
Avant d’éteindre je préfère demander l’aval de mes supérieurs.

Ca se défend.

Un simple reboot a suffit

merci à tous :smiley: