Erreur d'entrée/sortie d'un point de montage, très fréquente

Bonjour,

Je rencontre un problème assez gênant depuis deux semaines. J’ai un serveur Debian Squeeze depuis deux ans, et le point de montage de mon disque dur externe posé à côté me pose des problèmes.

Au bout d’un court laps de temps, par exemple aujourd’hui entre 2h du matin et 7h, mon point de montage devient inaccessible et affiche :

:/media/maxtor$ ll ls: lecture du répertoire .: Erreur d'entrée/sortie total 0

J’ai tenté de le démonter j’obtiens :

:/media/maxtor$ sudo umount /media/maxtor/ [sudo] password for xxx: umount: /media/maxtor: device is busy. (In some cases useful info about processes that use the device is found by lsof(8) or fuser(1))

Cela fonctionne en revanche avec umount -l.

J’ai fixé le point de montage en spécifiant l’UUID de la partition (et dans fstab également, sait on jamais).

Les infos habituelles maintenant, uname :

lspci

00:00.0 Host bridge: Intel Corporation Mobile 915GM/PM/GMS/910GML Express Processor to DRAM Controller (rev 04) 00:02.0 VGA compatible controller: Intel Corporation Mobile 915GM/GMS/910GML Express Graphics Controller (rev 04) 00:02.1 Display controller: Intel Corporation Mobile 915GM/GMS/910GML Express Graphics Controller (rev 04) 00:1b.0 Audio device: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller (rev 04) 00:1c.0 PCI bridge: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) PCI Express Port 1 (rev 04) 00:1c.1 PCI bridge: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) PCI Express Port 2 (rev 04) 00:1c.2 PCI bridge: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) PCI Express Port 3 (rev 04) 00:1d.0 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB UHCI #1 (rev 04) 00:1d.1 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB UHCI #2 (rev 04) 00:1d.2 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB UHCI #3 (rev 04) 00:1d.3 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB UHCI #4 (rev 04) 00:1d.7 USB Controller: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) USB2 EHCI Controller (rev 04) 00:1e.0 PCI bridge: Intel Corporation 82801 Mobile PCI Bridge (rev d4) 00:1f.0 ISA bridge: Intel Corporation 82801FBM (ICH6M) LPC Interface Bridge (rev 04) 00:1f.2 IDE interface: Intel Corporation 82801FBM (ICH6M) SATA Controller (rev 04) 00:1f.3 SMBus: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) SMBus Controller (rev 04) 01:00.0 Ethernet controller: Atheros Communications Inc. AR5001 Wireless Network Adapter (rev 01) 03:00.0 Ethernet controller: Atheros Communications L2 Fast Ethernet (rev a0)

lsusb

Bus 005 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub Bus 004 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub Bus 003 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub Bus 002 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub Bus 001 Device 015: ID 152d:2338 JMicron Technology Corp. / JMicron USA Technology Corp. JM20337 Hi-Speed USB to SATA & PATA Combo Bridge Bus 001 Device 004: ID 05e3:0505 Genesys Logic, Inc. Bus 001 Device 003: ID 0951:1606 Kingston Technology Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

/var/log/syslog.1

Mar 23 06:25:04 debian rsyslogd: [origin software="rsyslogd" swVersion="4.6.4" x-pid="912" x-info="http://www.rsyslog.com"] rsyslogd was HUPed, type 'lightweight'. Mar 23 06:25:05 debian kernel: [982987.774150] EXT4-fs error (device sdd1): ext4_find_entry: reading directory #2 offset 0 Mar 23 06:25:05 debian kernel: [982987.774230] EXT4-fs (sdd1): previous I/O error to superblock detected Mar 23 06:25:05 debian kernel: [982987.774285] Buffer I/O error on device sdd1, logical block 0 Mar 23 06:25:05 debian kernel: [982987.774327] lost page write due to I/O error on sdd1 Mar 23 06:25:13 debian transmission-daemon[11701]: LeNomDeMonTorrent read failed for "LeNomDuFichier": Input/output error (inout.c:141)

La dernière erreur sature mon fichier de log depuis cette heure.

Dans /var/log/message à l’heure précise du problème, j’ai juste ça (les autres lignes ont l’air normales):

df -h

Sys. de fichiers Taille Uti. Disp. Uti% Monté sur /dev/sda1 15G 3,1G 12G 22% / tmpfs 501M 4,0K 501M 1% /lib/init/rw udev 497M 180K 497M 1% /dev tmpfs 501M 0 501M 0% /dev/shm tmpfs 64M 0 64M 0% /tmp /dev/sdd1 294G 207G 73G 74% /media/maxtor

On remarque immédiatement que malgré la précision de l’UUID pour le point de montage, la commande précédente montre le point de montage à partir de /dev/sdd1 alors que le disque est désormais en /dev/sdb1 comme le montre fdisk -l :

[code]Disk /dev/sda: 16.1 GB, 16139354112 bytes
255 heads, 63 sectors/track, 1962 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0001c6a8

Device Boot Start End Blocks Id System
/dev/sda1 1 1963 15759360 83 Linux

Disk /dev/sdb: 320.1 GB, 320072933376 bytes
255 heads, 63 sectors/track, 38913 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x92517add

Device Boot Start End Blocks Id System
/dev/sdb1 1 38914 312569856 83 Linux[/code]

Mon serveur fait tourner différents services dont Transmission 2.03 à qui est dédiée cette partition.

Je remercie par avance ceux qui m’accorderont de leur temps libre.

Salut,
Je ne te donnerai pas la réponse, mais j’ai un problème similaire depuis aussi 15 jours-trois semaines, avec mes deux partitions de stockage sur un disque usb, qui décrochent et font apparaitre des messages du genre “impossible de monter disk 125Go”.
Le "remontage à la main fonctionne généralement, mais plusieurs fois j’ai du rebooter pour que tout redevienne normal.

Ca doit venir d’une mise à jour récente.
(quoique, justement là, rien ne s’est produit sur ces dernières 24 heures)

“I/O Error”, ça mériterait un backup des données et un diagnostic du disque dur, via smartmontools (smartctl -H /dev/sdX) mais en USB ça ne passera pas, il faudrait le brancher directement sur la carte-mère.

J’ai déjà fait un check disque, il fonctionne sans aucun problème sur mon pc portable.

peut-être le boitier usb qui déconne, sait-on jamais

Salut,

[quote=“agentsteel”]“I/O Error”, ça mériterait un backup des données et un diagnostic du disque dur[/quote] +1

[quote=“Vincent14”]il fonctionne sans aucun problème sur mon pc portable.[/quote]Avec le même câble ? Quand c’est sur le pc, c’est sur les connecteurs avants ou arrière ?

Il s’agit d’un boîtier externe, je l’ai tout simplement connecté en USB j’ai pu récupérer 10 épisodes d’une saison qui traînait là.

[quote]Au bout d’un court laps de temps, par exemple aujourd’hui entre 2h du matin et 7h, mon point de montage devient inaccessible et affiche :[/quote]Et en dehors de ces périodes, tu accèdes facilement ?
Ces périodes d’inaccessibilité sont-elles toujours aussi longues (2 H ==> 7 H) ?
Tu n’as pas de rapport avec une tâche cron ?

N’es tu pas curieux de connaître les processus en cours …

Notes: fsck serait un plus …

@ricardo Les “plantages” ont lieu à toute heure de la journée, mais mon dernier remontage manuel avait eu lieu à 22h. Lorsque la partition entre en erreur elle y reste jusqu’à une action de ma part, c’est donc souvent même plus long. J’ai regardé avec crontab -l, aucun cron n’est activé.

@BelZéButh je j’ai que ça :

[quote]:~$ fuser -vc /media/maxtor/
UTIL. PID ACCÈS COMMANDE
/media/maxtor/: root kernel mount /media/maxtor[/quote]

et toujours :

$ sudo umount /media/maxtor/ umount: /media/maxtor: device is busy. (In some cases useful info about processes that use the device is found by lsof(8) or fuser(1))

J’ai fait un check du disque avec gParted depuis mon PC portable, il n’a rien signalé. Vous avez d’autres hypothèses ?

Éventuellement, au lieu de l’ UUID du DD ext, essaie avec un LABEL dans le fstab.



et la commande blkid t'indique sdb1 ou sdd1 ?
recharger le cache de blkid
[code]#blkid -g[/code]

vérifier aussi avec:
[code]ls -l /dev/disk/by-uuid/[/code]

et la commande blkid t’indique sdb1 ou sdd1 ?
recharger le cache de blkid

vérifier aussi avec:

Salut,

A part smartmontools, je n’en connaît pas d’autres ! Je suis donc curieux de savoir comment tu as fait ?

Rhaaa putain de bordel ma session a expiré je dois retaper toutes mes réponses.

@ricardo : j’ai switché de /dev/xxxx à UUID à cause de mon problème, je veux bien tester Label mais je n’ai pas trouvé comment s’en servir dans fstab : LABEL=Maxtor ?

@nykoos: /dev/sdb1 toujours

:~$ ls -l /dev/disk/by-uuid/ total 0 lrwxrwxrwx 1 root root 10 11 mars 21:22 704c285b-bfd0-44c3-a02b-f5e042429450 -> ../../sda1 lrwxrwxrwx 1 root root 10 23 mars 03:28 d188b7cb-689c-4f92-9bc5-19d896557592 -> ../../sdb1

@ggoodluck47: Dans gParted ? Clic droit sur la partition & “Vérifier”. :open_mouth: C’est pas ça ? En tout cas ça ne m’a pas alerté sur le moindre problème.

Je ne sais pas. Est-ce que ça fait une vérification du système de fichier (fsck) ou un test matériel (smartctl) ?
Il faudrait faire l’autre…

As-tu possibilité de tester un autre disque USB (qui n’a pas de données importantes) sur la machine qui pose problème (le problème vient peut-être du connecteur USB) ?

Le message est clair, il y a une erreur matérielle sur le disque. Les tests sont en tout ou rien, il te faut plutôt regarder le rapport de smartmontools.
L’option -l de umount est une arnaque, elle ne fait que mettre en tache de fond le démontage du disque dès que celui ci sera disponible (dans ton cas jamais).
Personnellement je ferais

  1. Backup
  2. Lecture des smartmontools et autotest
    éventuellement test du disque de nombreuses fois d’affilée
  3. diminution de la confiance en ce disque.

@kna: Très bonne idée :slightly_smiling:
fsck a été exécuté en moins de 5 secondes, j’ai un doute :

:~$ sudo fsck /dev/sdb1 fsck from util-linux-ng 2.17.2 e2fsck 1.41.12 (17-May-2010) Maxtor : récupération du journal Maxtor : propre, 1052/19537920 fichiers, 55248041/78142464 blocs

smartctl en revanche :

[code]:~$ sudo smartctl -l selftest /dev/sdb
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright © 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

1 Extended offline Completed without error 00% 3701 -[/code]

@fran.b: je dois avouer avoir sué en lisant ton message :blush: C’est mon disque dédié à seeder des torrents, il ne craint rien, en revanche j’aimerai l’utiliser :smiley:

Selon vous fsck est normal d’aller aussi vite ? Ma partition pourrait causer ce problème ? (je ne veux pas vous orienter, ce n’est qu’une simple question).

fsck n’est d’aucune utilité avec une ‘erreur d’ entreé/sortie’, branche ton disque externe sur une autre machine et tu pourras te faire une idée et par précaution, sauvegarde ses données

Bien, j’annonce que mon disque dur est officiellement décédé. Je l’ai débranché l’espace de quelques minutes, et au redémarrage (quand les plateaux sont élancés) un bruit de craquement répétitif se produit toutes les secondes. C’est fini.

Merci pour l’aide apportée, du coup je doute très fort des capatacités de smartctl car pour l’avoir lancé encore hier, il m’indiquait qu’absolument aucune erreur n’était présente sur mon disque, malgré les dysfonctionnements à répétition depuis une semaine.

Ce matin, j’ai tenté un redémarrage pour réinitialiser le fichier /etc/mtab, rien ne s’est passé. Je suis allé modifier /etc/fstab afin de remplacer l’UUID par le LABEL, et au redémarrage le bruit mécanique a commencé.

Moralité quand un disque montre très tot des signes précurseurs de fatigue, ne plus attendre pour backuper. Je vais tenter la fameuse méthode du congélateur pour sauver ce qui peut l’être mais je n’avais rien d’important dessus. Ça fait tout de même 280Go/320 de perdu.

Bonne continuation :cry:

Coup de théâtre ce soir. Au moment de remplacer mon disque dans le boîtier, le même bruit se produit. Idem avec un troisième disque. Je n’arrive pas à croire que mes problèmes étaient tous dû à ce boîtier que j’ai acheté justement en remplacement d’un autre qui a rendu l’âme. Étrange hasard. J’ai contacté le revendeur pour le SAV.