Crash des interfaces réseau (MB ou PCI) en usage intensif

bonjour à tous,

je me permets de venir vous poser une question après plusieurs jours de tests et de nombreuses recherches sur internet…

j’ai à la maison un ancien ordi (amd xp 2000 + 2GO RAM + 2hddx80GO en IDE + 2hddx1TO sata) qui me sert de serveur pour divers services (nfs/samba/ssh/subsonic/zoneminder) équipé de 2 cartes reseaux, une intégrée à la CM (10/100mbps) et l’autre en PCI (10/100/1000mbps) à la base j’utilise celle en pci, mais pour mes tests j’ai également utilisé l’autre.

pour télécharger des fichiers en provenance du serveur aucun problème (connecté à 100mbps ou à 1000mbps…tout fonctionne à merveille quelle que soit le service utilisé (sftp, samba ou nfs)

MAIS depuis plusieurs mois, j’ai un souci lors de transferts de fichiers VERS le serveur.
en effet à tout moment sans prévenir, l’interface reseau du serveur ne repond plus (et se remets à fonctionner avec un ifdown/ifup).

tous les ordis sont reliés par une freebox V6 et sont tous en debian testing à jour.

quelques conclusions de mes tests :

  • cela se produit quelle que que soit l’interface réseau utilisée mais est moins fréquent à 100mbps qu’à 1000 mbps
  • à 1000mbps le transfert plante quasi instantanement
  • à 100mbps pas de plantage sur des petit fichiers envoyés 1 à 1 (mais dès que je les groupe par paquet de + 1 go -> plantage)
  • les plantages se produisent quelle que soit le protocole utilisé (samba/nfs/sftp)
  • les planatges se produisent quelque que soit le disque de destination (les 2 ide et les 2 sata, sur des partitions en ext4/ext2 ou fat32)
  • les plantages se produisent quelle que soit l’interface réseau utilisée
  • activer ou non la partition de swap (2GO) n’y change rien
  • lors des transferts, la mémoire vive se rempli fortement…mais les crash se produisent aléatoirement (apparement) à la quantité de mémoire restante
  • si je lis un fichier avec un ordinateur du reseau (comme un film), et que j’essaie avec un autre d’en envoyer un sur le serveur (même 100mo) : plantage.
  • noapic n’y change rien
  • un livecd d’ubuntu (13.04 beta) ne change pas les choses (j’ai l’impression que le serveur plante moins facilement, mais il plante quand même!)

les info sur les cartes réseau utilisées (lspci -v):


je ne vois rien relatif au plantage dans les fichiers de log (ou je cherche mal…)

auriez-vous une idée?

Rien dans les messages du noyau (/var/log/kern.log) ?

malheureusement…non…

exemple : le réseau a crashé à 13h49 et j’ai appuyé sur le boutton power du serveur (pour l’éteindre) à 13:51:18 ; ensuite je l’ai redémarré :

j’ai pensé que le “fuse exit” était dû au crash mais non…c’ets le début de la procedure d’exctinction qui se met en route quand j’appuie sur le bouton power…vu que le serveur est toujours vivant…c’est juste l’interface reseau qui est morte.

indépendamment d’un problème logiciel, as tu envisagé un problème matériel par exemple thermique ?
As tu fais un test poussé de la RAM ?

pour la ram j’ai 2 barrettes de 1GO
j’ai testé barrette 1 seule, barrette 2 seule , les 2 barrettes ensemble…avec ou sans swap…le problème était à chaque fois présent.
(quand je dis que j’y ai passé bcp de temps…c’est vraiment beaucoup de temps… :mrgreen:)

je suspecte un probleme de CM…du coup…mais je ne sais pas comment tester…

je te confirmerai volontier le probleme materiel vu qu’avec un live cd le probleme est toujours present…

j’ai fait des test memtester :

avec le swap activé j’ai :

[quote]root@caterpillar:~# memtester 3000 3
memtester version 4.2.2 (32-bit)
Copyright © 2010 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffff000
want 3000MB (3145728000 bytes)
got 2803MB (2939887616 bytes), trying mlock …Processus arrêté
[/quote]

sans le swap tout se passe normalement…

Pour un test poussé de la RAM, utilise memtest depuis un live CD (ou usb).
Si tu testes depuis un OS qui tourne, il ne teste pas (ou pas complétement) la partie de la RAM utilisée par l’OS.
et laisse faire au moins 2 passes (4 ou 5, c’est encore mieux).
Tu peux aussi tester un burntest du proc, mais je n’ai pas d’exemple sous le main (ça fait longtemps que je n’en ai plus fait).

bon ok je vais tenter un memtest (surement la semaine prochaine le serveur est sans ecran ni clavier ni souris…c’ets à chaque fois le boxon pour les intervention hors ssh…mais je vais me debrouiller…)

et je vous tiens au courant

merci beaucoup pour votre aide en tout cas! :wink:

(là il tourne depuis 2 jours sans plantage…mais je fais mes transfert par paquet inferieur à 1GO…en ayant bridé la freebox à 100mbps…du coup la situation est vivable…pas le pied…mais vivable…)