HTTP et SSH plantent aléatoirement

Bonjour. Je suis confronté à un problème depuis quelques temps. C’est une machine virtuelle tournant sur un macmini.
J’ai configuré mon serveur essentiellement orienté web. Par moment, c’est rare mais ça survient au moins une fois par jour, on perd aléatoirement http et ssh mais le serveur ping toujours. C’est vraiment très étrange. Il se peut que je rafraîchisse ma page web et qu’elle s’affiche alors que pour d’autres le serveur ne répond pas et inversement. Généralement le problème se résout de lui-même mais je n’arrive pas à l’identifier.

J’ai pensé à deux choses. Tout d’abord quelqu’un avait déplacé la machine virtuelle. Elle était très à l’étroit. Il restait 7Go d’espace disque sur son nouveau disque dur (pour 1To). J’ai donc pensé à la déplacer sur un disque dur plus grand. Ensuite, nos sites web étaient accessibles depuis une freebox qui n’avait que 0.6Mb/s d’upload. Quand je regardais le trafic avec iftop et que je voyais par moment des pics à 1.5Mo (surtout quand les bots des moteurs de recherche se connectaient), je me suis dit que la box ne pouvait pas répondre rapidement à tous les clients. J’ai donc fait passer le serveur sur une box SDSL (2Mb/s).
Depuis ces manipulations, les problèmes sont moins fréquents et durent moins longtemps. Mais ils sont toujours présents et il me faut m’en débarrasser. J’ai donc besoin de vos avis.
Merci pour votre aide. Je joins les fichiers syslog.log (83.8 KB) et messages.log (83.8 KB).

Noyau: Linux androprod 3.2.0-4-686-pae #1 SMP Debian 3.2.51-1 i686 GNU/Linux
lspci :

00:00.0 Host bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX Host bridge (rev 01) 00:01.0 PCI bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX AGP bridge (rev 01) 00:07.0 ISA bridge: Intel Corporation 82371AB/EB/MB PIIX4 ISA (rev 08) 00:07.1 IDE interface: Intel Corporation 82371AB/EB/MB PIIX4 IDE (rev 01) 00:07.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 08) 00:07.7 System peripheral: VMware Virtual Machine Communication Interface (rev 10) 00:0f.0 VGA compatible controller: VMware SVGA II Adapter 00:10.0 SCSI storage controller: LSI Logic / Symbios Logic 53c1030 PCI-X Fusion-MPT Dual Ultra320 SCSI (rev 01) 00:11.0 PCI bridge: VMware PCI bridge (rev 02) 00:15.0 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.1 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.2 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.3 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.4 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.5 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.6 PCI bridge: VMware PCI Express Root Port (rev 01) 00:15.7 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.0 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.1 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.2 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.3 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.4 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.5 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.6 PCI bridge: VMware PCI Express Root Port (rev 01) 00:16.7 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.0 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.1 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.2 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.3 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.4 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.5 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.6 PCI bridge: VMware PCI Express Root Port (rev 01) 00:17.7 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.0 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.1 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.2 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.3 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.4 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.5 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.6 PCI bridge: VMware PCI Express Root Port (rev 01) 00:18.7 PCI bridge: VMware PCI Express Root Port (rev 01) 02:00.0 USB controller: VMware USB1.1 UHCI Controller 02:01.0 Ethernet controller: Advanced Micro Devices [AMD] 79c970 [PCnet32 LANCE] (rev 10) 02:02.0 Multimedia audio controller: Ensoniq ES1371 [AudioPCI-97] (rev 02) 02:03.0 USB controller: VMware USB2 EHCI Controller

ifconfig:

[code]eth0 Link encap:Ethernet HWaddr 00:0c:29:a9:90:cf
inet adr:172.16.0.130 Bcast:172.16.0.255 Masque:255.255.255.0
adr inet6: fe80::20c:29ff:fea9:90cf/64 Scope:Lien
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:35068 errors:0 dropped:0 overruns:0 frame:0
TX packets:39023 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 lg file transmission:1000
RX bytes:7179342 (6.8 MiB) TX bytes:43458895 (41.4 MiB)
Interruption:19 Adresse de base:0x2000

lo Link encap:Boucle locale
inet adr:127.0.0.1 Masque:255.0.0.0
adr inet6: ::1/128 Scope:Hôte
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:456842 errors:0 dropped:0 overruns:0 frame:0
TX packets:456842 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 lg file transmission:0
RX bytes:136657129 (130.3 MiB) TX bytes:136657129 (130.3 MiB)
[/code]

/etc/network/interfaces

[code]# The loopback network interface
auto lo
iface lo inet loopback

The primary network interface

auto eth0
iface eth0 inet static

address 172.16.0.130
netmask 255.255.255.0
gateway 172.16.0.2
network 172.16.0.0
broadcast 172.16.0.255
[/code]

resolv.conf

domain RVS4000 search RVS4000 nameserver 172.16.0.22 nameserver 212.27.40.240 nameserver 212.27.40.241

Ca n’a pas l’air de beaucoup inspirer. Il vous faut d’autres logs?

Salut,

Tu peux toujours scruter le log d’erreurs d’Apache.
Et, lorsque ssh n’est plus accessible, tu peux tenter le mode verbose (-v ou -vv)

Oui les logs des logiciels qui plantent serait plus adapté.
Sinon laisse une session SSH connecté en permanence à la machine pour voir si tu te fait déconnecté.
Enfin utilise un soft tel que Monit ou autre pour avoir un historique le l’activité de la machine, des fois que ce soi une tâche CRON qui prenne 100% du CPU et qui rende indispo les autres services.

C’est peut être tout simple un problème réseau : aucune autre machine de ton réseau n’est susceptible d’avoir la même IP que ce serveur? Ou sinon, peut être un problème DNS?

Courage :033

Bonjour. Oui je vous enverrai des logs au prochain problème. C’est vraiment très régulier comme problème. Tous les jours vers 14h07. Ce n’est pas un cron, j’ai vérifié et aucun ne tourne à ce moment là. Par contre on a des utilitaires de sauvegardes comme timemachine ou carbonecopy qui font des backups sur les serveurs physiques, peut-être que ça pourrait venir de là.
Je doute que ça puisse être un problème de DNS. tout fonctionne très bien que je sois sur le réseau local ou de l’extérieur. Tous nos sites fonctionnent bien sauf pendant une brève période vers 14h00.
Je vous enverrai les logs au plantage de demain.

Et quelle est la durée de cette brève période ? :017

Ton système de sauvegarde désactiverai pas les cartes virtuelles pour éviter les modifications pendant la sauvegarde ??

Un peu comme quand tu fais un dump mysql, tes tables sont “lock” un moment.
Enfin c’est qu’une suggestion comme ca en passant :slightly_smiling:.

Bonjour. Toujours rien dans les logs. En dehors des erreurs standards warning type “fichier introuvable” dans apache.

La durée des plantages est aléatoire. Ca avait l’air d’aller mieux ces derniers temps mais hier ca sautait toutes les deux minutes pendant une bonne heure. Aujourd’hui ca a duré 15 minutes environ.

Apparemment aucune sauvegarde ne se fait pendant cette période mais je ne pense pas que le problème vienne du serveur virtuel.
J’ai fais un ping sur le serveur pendant la période d’inactivité de tout à l’heure. J’ai des pings assez élevés pendant toute cette période, une fois revenu à la normale tout fonctionne à nouveau.

64 bytes from xeolia.com (172.16.0.130): icmp_req=14 ttl=64 time=193 ms icmp_req=15 ttl=64 time=112 ms icmp_req=16 ttl=64 time=31.0 ms icmp_req=17 ttl=64 time=258 ms icmp_req=18 ttl=64 time=183 ms icmp_req=19 ttl=64 time=100 ms icmp_req=20 ttl=64 time=19.7 ms icmp_req=21 ttl=64 time=248 ms icmp_req=22 ttl=64 time=168 ms icmp_req=23 ttl=64 time=91.6 ms icmp_req=24 ttl=64 time=318 ms icmp_req=25 ttl=64 time=127 ms icmp_req=26 ttl=64 time=2.06 ms icmp_req=27 ttl=64 time=75.2 ms icmp_req=30 ttl=64 time=145 ms icmp_req=31 ttl=64 time=66.7 ms icmp_req=32 ttl=64 time=293 ms icmp_req=33 ttl=64 time=214 ms icmp_req=34 ttl=64 time=138 ms icmp_req=35 ttl=64 time=56.8 ms

Certains temps paraissent normaux mais ce n’est pas le cas puisque la machine et le serveur sont sur le même réseau. Quand les instabilités ont cessées :

64 bytes from xeolia.com (172.16.0.130): icmp_req=150 ttl=64 time=0.689 ms 64 bytes from xeolia.com (172.16.0.130): icmp_req=151 ttl=64 time=0.760 ms 64 bytes from xeolia.com (172.16.0.130): icmp_req=152 ttl=64 time=0.556 ms 64 bytes from xeolia.com (172.16.0.130): icmp_req=153 ttl=64 time=0.635 ms 64 bytes from xeolia.com (172.16.0.130): icmp_req=154 ttl=64 time=0.628 ms 64 bytes from xeolia.com (172.16.0.130): icmp_req=155 ttl=64 time=0.763 ms

Je pense que ça a un lien. Mais pourquoi? Est-ce que selon vous, une connexion sdsl 2Mbps soit suffisante pour de l’hébergement web? Sachant que ce ne sont pas des petits sites statiques mais des applications parfois lourdes. On a par exemple des flip book flash qui pèsent 11Mo chacuns. Soit quasiment 90Mb.

Bizarrement aussi, je n’arrive pas à ping depuis l’extérieur du réseau. Donc peut-être qu’il y a en effet des problèmes quelque part au niveau des DNS aussi.