Serveur injoignable

Bonjour =)

dans ma boite, on a un serveur de développement sous debian, dont le problème est le suivant.

Plusieurs fois par jour, certaines personnes n’ont plus aucun accès au serveur, pas de ping, pas d’accès SSH, aucun accès à redmine, alors que par exemple, pour moi et d’autres, il n’y a aucun soucis, et ça peut être l’inverse, moi qui n’ai pas accès, et je problème ne dure jamais très longtemps. Et jamais tout le monde n’est touché.

Le soucis c’est que je ne sais absolument pas d’ou peut venir le problème, et à la longue c’est gênant.

Donc si quelqu’un a une piste, je suis preneur ! :slightly_smiling:

Bonne journée :wink:

J’oubliais

C’est une debian lenny 2.6.26-2-686
Et les autres serveurs qui sont sous debian ont la même version, et sont configuré de la même manière pour tout ce qui concerne le réseau.

Salut
les ressources du serveur son toujour disponible ? disque cpu ,ram,swap.
en redémarrant le serveur ?

sinon les log indique rien ?

Oui, genre quand quelqu’un à le problème, ou même moi, je me logue sur un autre serveur, et je fais un accès ssh de se serveur sur celui qui à le problème, ça fonctionne, et avec htop ou n’importe quoi d’autre, rien de suspect. Un redémarrage du serveur avait offert de l’espoir, mais le soucis est revenu, puis rien trouvé non plus dans les logs. C’est pour ça que je coince vraiment, j’ai aucune piste :frowning:

Et sur mon serveur de supervision, rien d’anormal, il voit tout en vert ^^, du moins rien de différent comparé aux autres serveurs

Salut,
À tout hasard: fail2ban ne serait pas installé ?

Non, pas de fail2ban :slightly_smiling:

les paquet arrive j’usqu’a la machine ? regarde avec iptraf et iostat pour voir si les i/o son pas en attente.
fait un tail -f sur les fichier log sa peux montrer la vitesse de reception des donnée. apres je vois pas .

Re,
Pas de portsentry ou autre chose du genre non plus ?
Il faudrait faire un grep de l’IP bloquée dans les logs, histoire de voir ce qu’en dit le système.

iptables -S raconte quoi ?

Ca ressemble plus a une problème réseau que de la machine elle même si elle reste dispo pour certain et pas d’autre … non ?

Salut,

Je verrai bien un truc coté réseau aussi…

Un DHCP foireux et/ou une machine qui prend la même IP que ton serveur Debian ?

Non pas de portsentry ou autres du genre :confused:

Au niveau réseau ça parait logique oui, mais j’ai aucun conflit d’IP, mes serveurs sont sur une plage réservée, et ont leur adresse IP réservée. le tout sur un 2003 serveur. Une lease reservée pour les machines clientes.

Au niveau DNS ça répond bien, pas de problème niveau résolution de nom ni rien.

Donc je ne vois pas ou je me serais gaufré dans la config :confused:

C’est quand même chelou, et j’ai l’impression que ça touche les mêmes personnes en même temps. alors ça foire pour eux, et quand eux ça marche, moi ça peut foirer ^^

J’ai également une entrée dans auth.log toutes les minutes.

pam_winbind(sshd:account): request failed
Mar 14 17:43:39 Serveur sshd[25925]: Accepted publickey for production from 192.168.0.32 port 51347 ssh2
Mar 14 17:44:39 Serveur sshd[25947]: pam_winbind(sshd:account): request failed
Mar 14 17:44:39 Serveur sshd[25947]: Accepted publickey for production from 192.168.0.32 port 51374 ssh2
Mar 14 17:44:39 Serveur sshd[25949]: Address 192.168.0.32 maps to domain.eu, but this does not map back to the address - POSSIBLE BREAK-IN ATTEMPT!

Serveur étant le serveur qui a le problème, 192.168.0.32 étant l’IP d’un autre serveur, qui s’avère avoir le même problème au final -_-. Mais ce sont les 2 seuls.

Salut,
Tu pourrais décrire un peu le réseau ?
C’est un simple LAN avec des swithcs passif ou il y a du matériel plus élaboré ?

Et que te donne un “traceroute” au moment des problèmes ?

l’architecture réseau est pas compliqué, vais vous faire un beau dessin

°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°routeur
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°|°°°°wifi2
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°|°°°°/
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°switch1
°°°°°°°°°°°°°°°°°°°°°°°°wifi1°°°°/°°°°°°°°
°°°°°°°°°°°°°°°°°°°°°°°°°°°°\°°°/°°°°°°°°°°
°°°°°°°°°°°°°°°°°°°°°°°°°°°°switch2°°°°°°°°°switch3 (les informaticiens)
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°|
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°|
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°switch4 (les serveurs)

Une partie des développeur est sous wifi1, ils ont des macs et se sont mis en wifi, et ont les mêmes problèmes.

Au niveau des switchs, c’est dell powerconnect, donc en théorie assez fiable.
Et je pense pas que ça vienne d’eux, puisque quand les serveurs 2 font leurs trucs bizarre, on accède à tout le reste comme si de rien était, sauf leur services web (Jenkins, redmine …), je ne sais pas si c’est à chaque fois, mais quand ça arrive, j’ai l’impression qu’on ne peut pas pinger le serveur (uniquement ceux qui ont le problème, mais également la machine qui essaie d’accéder !)

Et aucun accès ssh en direct, alors qu’en passant par un autre serveur ça fonctionne.

Tous tes serveurs dépendent du switch 4 ?
Et certain sont accessible et pas d’autre ?
Oui vraiment bizarre comme pb :017

Oui tous sur le switch 4, dont 1 (serveur supervision) est à cheval sur switch1 en port mirroring

Et en fait le problème ne dure que quelque minutes à chaque fois, mais revient très souvent. Et pas pour tout le monde :smiley:
J’avais redémarrer les 2 serveurs mais non, ça a pas changé grand chose, la semaine dernière un des 2 serveurs a été impeccable pendant 3 jours, ensuite c’est revenu.

Je ne vois qu’une solution pour diagnostiquer ton problème si tu n’as pas de logs => Tcpdump des deux côtés

Tu regardes ce qui entre/sort du serveur et idem du côté du PC pour voir ce qui entre/sort du PC.
C’est le seul moyen de voir d’où vient plus ou moins le problème. Là, je crois que c’est indiagnostiquable comme problème. Quand j’ai des problèmes de réseau, je fais toujours ça et ça m’aide très bien à comprendre d’où vient le problème :slightly_smiling:

Humm, tu n’aurais pas une limite de connexions simultanées sur ton serveur SSH? Après ça n’expliquerais pas le ping ni les autres symptômes :s

Non j’ai aucune limite de connexion simultanées ><

Depuis aujourd hui j’ai un autre problème, ça m’a mis ça comme erreur, du coup quand on essayait de se loguer en ssh, ça mettait “permission denied”, ça dure quelque minutes pendant lesquelles on peut pas se loguer, puis après on peut se loguer normalement …

pam_winbind(sshd:auth): getting password (0x00000000)
Mar 21 11:54:31 Serveur1 sshd[31169]: pam_winbind(sshd:auth): request failed: No logon servers, PAM error was Authentication service cannot retrieve authentication info (9), NT error was NT_STATUS_NO_LOGON_SERVERS

Je ne comprend pas du tout cette erreur :confused:

Depuis aujourd hui j’ai un autre problème

Bonjour =)

Désolé du double poste mais j’ai une piste, j’avais jamais fait gaffe, mais des fois, le serveur balance la mauvaise adresse MAC quand je ping
Avec Wireshark, j’ai pu voir dans les request et les reply, que par moment, une mauvaise adresse mauvaise adresse MAC, qui ne correspond pas à celle de la carte réseau (l’adresse change d’une lettre), était envoyée. Ca ne le fait pas tout le temps donc.

Et ce sur donc plusieurs serveurs …

Ca serait donc la cause des problèmes qui font l’objet de mon post initial ?

Donc à part de l’ARP spoofing, ça pourrait être du à quoi ?

Avec arpwatch je vois mes adresses MAC changer -_-