Plantage serveur

Bonjour,

J’ai un serveur sous debian squeese sur lequel tourne un postfix mysql dovecot et rouncube.
Par moment, il plante sans raison. Impossible de faire quoique ce soit, ecran figee. Je tiens a signaler que j’ai installer le serveur sur un autre matériel puis même problème. La solution est de le redémarrer manuellement. ci-dessous le syslog:

Jan 4 02:14:57 nic postfix/anvil[6635]: statistics: max cache size 1 at Jan 4 02:11:35 Jan 4 02:17:01 nic /USR/SBIN/CRON[6662]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly) Jan 4 02:17:16 nic kernel: [33115.190831] DMA: Out of SW-IOMMU space for 24576 bytes at device 0000:00:1f.2 Jan 4 02:17:16 nic kernel: [33115.190871] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Jan 4 02:17:16 nic kernel: [33115.190878] ata3.00: failed command: WRITE DMA Jan 4 02:17:16 nic kernel: [33115.190887] ata3.00: cmd ca/00:c0:58:aa:29/00:00:00:00:00/e1 tag 0 dma 98304 out Jan 4 02:17:16 nic kernel: [33115.190889] res 50/00:00:af:c0:3e/00:00:00:00:00/e1 Emask 0x40 (internal error) Jan 4 02:17:16 nic kernel: [33115.190894] ata3.00: status: { DRDY } Jan 4 02:17:16 nic kernel: [33115.236473] ata3.00: configured for UDMA/133 Jan 4 02:17:16 nic kernel: [33115.236483] ata3: EH complete

Merci pour vos aides :slightly_smiling:

Tu as essayé aussi sur de nouveau disques dur ?

Oui oui, j’ai essaye les sata, ide…

Pour éliminer la piste d’une défaillance mémoire, as tu passer un coup de memetest ?
Mes souvenirs de DMA sont anciens, mais il me semble que c’est lié avec les interruptions.
as tu regardé de ce coté là ?
Regarde aussi du coté des paramètres de mémoire partagée:
kernel.shmall
kernel.shmmax

Outre les supports de stockage et la RAM foireux, la carte mère, la carte PCI ou l’alimentation qui dégoisent sont aussi imaginables.
Revoir les réglages du BIOS, cavaliers maître/esclave, cordons électriques, nappes connectées à la carte-mère||carte PCI …
Remettre les réglages du BIOS d’origine, débrancher tout le superflu pour tester.

J’ai déjà eu ce genre de problème sur un serveur DELL R710 de mémoire pour un hyperviseur KVM. Au final c’etait le firmware du serveur qui avait une couille et DELL nous avait donné un correctif … Peut être que c’est une piste si ton deuxiéme essai sur un matériel différent était un autre serveur de la même marque, d’un même modèle.

effectivement el_profesor, les deux serveurs que j’ai utilise sont de même marque, même modèle :013 … 3 mois de galère pour un problème hard pffff. Merci beaucoup les gars pour vos aides. Je vais essayer avec un autre serveur pour voir… :wink: