[résolu] Probleme de disque dur/bus (?) et le systeme bloque

Bonjour a tous,

Mon systeme: kernel 2.6.20 (mais le pb existait en 2.6.10)
Debian Stable.
Processeur VIA Samuel 2
CM : EPIA M800
512 Mo ddr
UDMA active (confirmé par hdparm)

Bus :
0000:00:00.0 Host bridge: VIA Technologies, Inc. VT8623 [Apollo CLE266]
0000:00:01.0 PCI bridge: VIA Technologies, Inc. VT8633 [Apollo Pro266 AGP]
0000:00:0d.0 FireWire (IEEE 1394): VIA Technologies, Inc. IEEE 1394 Host Controller (rev 80)
0000:00:10.0 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 80)
0000:00:10.1 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 80)
0000:00:10.2 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 80)
0000:00:10.3 USB Controller: VIA Technologies, Inc. USB 2.0 (rev 82)
0000:00:11.0 ISA bridge: VIA Technologies, Inc. VT8235 ISA Bridge
0000:00:11.1 IDE interface: VIA Technologies, Inc. VT82C586A/B/VT82C686/A/B/VT823x/A/C PIPC Bus Master IDE (rev 06)
0000:00:11.5 Multimedia audio controller: VIA Technologies, Inc. VT8233/A/8235/8237 AC97 Audio Controller (rev 50)
0000:00:12.0 Ethernet controller: VIA Technologies, Inc. VT6102 [Rhine-II] (rev 74)
0000:00:14.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)
0000:01:00.0 VGA compatible controller: VIA Technologies, Inc. VT8623 [Apollo CLE266] integrated CastleRock graphics (rev 03)

Symptome :

Apres un certain temps de marche et une activité disque un tt petit peu soutenu (un peu de mldonkey, un apache qui tourne un peu, 2 , 3 session SSH, du w3m) le systeme bloque. En fait, le systeme n’est pas completement bloqué (naviguer dans w3m fonctionne encore, les applies fonctionnent encore), mais dès que je dois lancer un programme nouveau (ls, ps, n’importe quoi d’autre) ou quitter un programme en cours, le shell reste bloqué.
Impossible d’ouvrir une nouvelle session ssh non plus. Seul moyen de revenir comme avant => bouton reset.
J’ai aucune info dans syslog, rien dans message, rien dans dmesg ni kern.log qui sont effacés par le reboot.

J’ai fait un petit shell qui tourne en nohup et log des infos systeme (top ten des programmes les plus consomateurs, 1 vmstat de 2 lignes, 1 lsof). Et j’ai constaté qu’a chaque “plantage” le prog continue a loguer et la seul info pertinente trouvé dans le log c’est le I/O wait de vmstat (colonne “wa”) qui passe de 0 a 97

exemple

11h52 tt va bien:
procs -----------memory---------- —swap-- -----io---- --system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
0 0 0 6316 15308 375840 0 0 0 0 569 172 1 1 98 0

a 11h53 le systeme bloque et le vmstat de mon petit prog log :

0 3 0 6464 15368 375304 0 0 0 0 594 605 13 3 0 84
0 3 0 8312 15220 375720 0 0 0 0 571 600 4 3 0 93

etc…
Comment puis-je investiguer plus en avant ?

Merci de votre aide

Misti

Pour une ancienne histoire d’economie d’energie et de silence, j’avais mis /var/ sur clé usb. Il est possible que pour une raison ou pour une autre, un probleme survienne pour ce montage ésotérique et vu la sensibilité du repertoire , que cela foute la grouille sur le systeme.
J’ai retiré la clé, rebooté en laissant /var sur le disque dur directement, pour l’instant ca a l’air de tenir.

arf :slightly_smiling:

Méfiez vous, les clefs USB sont basées sur des mémoire de type FLASH, qui n’ont pas des cycle d’écriture infinies. (on parle de 10 000 a 100 000 écritures. A partir de la, leur comportement est complètement indéterminé!!!) Méfiez vous !