Problèmes avec un lecteur de bandes

Bonjour,

j’ai un poste installé en serveur de sauvegarde avec un lecteur de bande HP StorageWorks Ultrium 232 qui me pose beaucoup de soucis et je voulais savoir si quelqu’un aurait eu un problème similaire ou une idée…

Je vous explique le problème :
Le serveur de sauvegarde est installé sous Debian Lenny et la sauvegarde est réalisée avec Bacula.
Jusqu’à récemment tout fonctionnait très bien et du jour au lendemain les sauvegardes ne se sont plus faites…
J’ai été vérifier et c’est le lecteur de bandes qui bloquait la sauvegarde.
Il m’était impossible de lancer la moindre commande pour interagir avec le lecteur, même par exemple un mt -t /dev/st0 offline…
J’ai essayé de rebooter plusieurs fois le serveur voyant ce problème, je me suis dis qu’il pouvait s’agir d’un disfonctionnement temporaire ??? Rien n’y a fait et même après avoir passé une cassette de nettoyage je n’ai toujours pas réussis à accéder au lecteur.
Lorsque je met une cassette dedans il se met à la dérouler sans arrêt pendant un temps indéfini (je n’ai pas compté, je l’ai laissé faire jusqu’à ce qu’il m’éjecte la cassette) et je vois apparaître un message régulièrement dans syslog que je vous indique ci-dessous :

[ 4069.641125] INFO: task mt:6047 blocked for more than 120 seconds.
[ 4069.641157] “echo 0 > /proc/sys/kernel/hung_task_timeout_secs” disables this message.
[ 4069.641202] mt D 0000000000000000 0 6047 5908
[ 4069.641243] ffff810071125d08 0000000000000082 0000000000000000 ffff81007d064aa0
[ 4069.641303] ffff81007f0bd020 ffff81007f0254f0 ffff81007f0bd2a8 00000003a001dccd
[ 4069.641369] ffff8100379cba10 0000000000000000 00000000ffffffff 0000000000000000
[ 4069.641413] Call Trace:
[ 4069.641485] [] schedule_timeout+0x1e/0xad
[ 4069.641519] [] blk_execute_rq_nowait+0x6b/0x82
[ 4069.641576] [] :scsi_mod:scsi_execute_async+0x322/0x36f
[ 4069.642576] [] wait_for_common+0xcf/0x13a
[ 4069.642612] [] default_wake_function+0x0/0xe
[ 4069.642657] [] :st:st_do_scsi+0x235/0x265
[ 4069.642696] [] :st:st_sleep_done+0x0/0x60
[ 4069.642740] [] :st:st_int_ioctl+0x5fc/0x943
[ 4069.642792] [] :st:st_flush+0x244/0x25d
[ 4069.893834] [] filp_close+0x37/0x65
[ 4069.893869] [] sys_close+0x7e/0xb7
[ 4069.893903] [] system_call_after_swapgs+0x8a/0x8f

Maintenant le lecteur n’est même plus reconnu par le système, auparavant je voyais dans le résultat de la commande dmesg l’information sur le lecteur et je ne la vois plus (ce qui fais que je ne peux vous la donner :confused: ) et le voyant Tape clignote en orange…

C’est tout ce que je peux vous dire pour l’instant…

Je voudrais savoir si quelqu’un a déjà eu ce genre de problèmes avec un lecteur de bandes, si vous avez une idée du problème voire de la solution ???
Si vous désirez plus d’informations n’hésitez pas à les demander …

Cordialement,

Guillaume

Il serais pas en train de te lâcher ton lecteur de bande ? Peut tu l’essayer sur une autre machine ? Et essayer un autre lecteur de bande sur ton serveur ?

Sinon as tu fait une mise a jour dernièrement ?

Salut,

Voyant que c’est un lecteur scsi tu peux aussi mettre en doute
1 - La carte scsi
2 - Le câble
3 - La connexion
4 - Éventuellement un autre périphérique scsi et son bouchon de terminaison :slightly_smiling:

Bonsoir,

merci de ta réponse et de tes pistes…

Je pense que je vais arriver à ouvrir le serveur pour vérifier. Le seul pb est qu’il n’est pas à moi (je ne suis pas l’administrateur de cette société, le centre où je donne mes cours) et donc je ne voulais pas prendre la responsabilité d’ouvrir le serveur. De plus je ne pourrais pas le laisser éteint trop longtemps car on a d’autres choses dessus…
Mais oui je vais arriver à l’ouvrir pour vérifier s’il n’y a pas un pb dedans …

A bientôt