Bonjour à tous;
Sur mon serveur, j’ai mis en daemon smartd.
Et j’ai une remonté d’erreur/warning que je n’arrive pas à interpréter:
The following warning/error was logged by the smartd daemon:
Device: /dev/sdb, not capable of SMART self-check
Device info:
ST1000DM003-1SB10C, S/N:Z9A0VMZ0, WWN:5-000c50-087b8b568, FW:CC43, 1.00 TB
For details see host's SYSLOG.
A savoir que le disque en question n’est mounté que temporairement pour faire des sauvegardes. Mais il est branché “en dur”. C’est un script qui le mount fait un rsync et démount.
Est ce que l’erreur pourrait venir du fait que le test est fait sur un disque justement non monté?
Bah non, là, c’est le smart qui dit qu’il ne peut pas causer avec les capteurs du disque, pas de question de montage dans le message.
Le message est un peu bizarre avec un disque récent, mais il y en a qui n’ont pas de routine d’auto test.
Tu es sûr que le branchement SATA est sans faux contact ?
En effet, il dit qu’il n’arrive pas a faire son auto-test.
Revoir les connexion est un bon début, mais s’il n’a pas bougé depuis un moment j’ai des doutes.
Tu dit qu’il est démonté et remonté a chaque lancement de ton script rsync, mais ton disque est bien alimenté électriquement en permanence ?
De façon général y a-t-il un évènement récent qui a changé quoique ce soit sur le disque ?
smartctl is a command line utility designed to perform SMART tasks such as printing the SMART self-test and error logs,
enabling and disabling SMART automatic testing, and initiating device self-tests.
Note: if the user issues a SMART command that is (apparently) not implemented by the device,
smartctl will print a warning message but issue the command anyway (see the -T, --tolerance option below).
This should not cause problems: on most devices, unimplemented SMART commands issued to a drive are ignored and/or return an error.
Je serais toi je testerai tout simplement manuellement le disque et vérifierai si il est justement capable de gérer les tests smart.
J’ai regardé, c’est un seagate de 1To récent, ça serait étonnant qu’il n’ai pas de smart.
Mais bon, c’est vrai que ça mérite d’être testé avant d’ouvrir le capot, il peut y avoir des messages plus explicites lors des tests.
Merci a tous pour vos réponses.
Je fais une réponse commune si vous permettez.
Pour le problème de connexion, je n’ai pas bougé la machine depuis 1an et demi. Tout est branché a l’intérieur, c’est une “petite” machine de récup que j’ai reconverti et place sous un escalier. Et quand j’ai écrit que je mountais, ce n’est pas physiquement, c’est juste que le disque n’a pas de répertoire dédié et donc j’utilise mount en scripts pour les sauvegardes uniquement puis umount des que c’est fini.
Dans les log, je n’ai… Rien de plus que ce que j’ai dans le mail d’alerte (cf. Premier post).
Et voilà un test :
# less /tmp/smart-tool-sdb.txt
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64
] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www
.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.14 (AF)
Device Model: ST1000DM003-1SB10C
Serial Number: Z9A0VMZ0
LU WWN Device Id: 5 000c50 087b8b568
Firmware Version: CC43
User Capacity: 1 000 204 886 016 bytes [1,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use:
-P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Wed Nov 21 07:06:29 2018 CET
SMART support is: Available - device has SMART capability
.
SMART support is: Enabled
Un peu plus loin:
SMART Error Log Version: 1
No Errors Logged
Ce qui, pour moi, ne veut pas dire qu’i n’y a pas d’erreur. Juste qu’elles ne sont pas écrites.
Et pour finir, pas d’évennement récent, si ce n’est la mise en marche de mon script de sauvegarde concomitant avec la mise en daemon de smartd.
Il n’y a jamais de question stupide.
De plus, j’ai deux autres disques, qui ne génèrent pas d’erreur.
Ce ne doit donc pas venir de la.
Par contre, depuis que j’ai modifié la conf comme proposé par @grandtoubab , je n’ai plus d’erreur !
Miracle de la technologie ?
Non miracle des documentations…
/etc/cron.weekly/smartctl:
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.4-4-19-4-23-nov-2018] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Tue Nov 27 12:16:56 2018
Use smartctl -X to abort test.
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.4-4-19-4-23-nov-2018] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 10404 -
# 2 Short offline Completed without error 00% 10389 -
# 3 Short offline Completed without error 00% 10378 -
# 4 Short offline Completed without error 00% 8620 -
# 5 Extended offline Completed without error 00% 8363 -
# 6 Short offline Completed without error 00% 8353 -
# 7 Short offline Completed without error 00% 6883 -
# 8 Short offline Completed without error 00% 6373 -
# 9 Short offline Completed without error 00% 6199 -
#10 Short offline Completed without error 00% 3367 -
#11 Short offline Completed without error 00% 2694 -
#12 Short offline Completed without error 00% 2376 -