Message de Gparted

syrtacus · Mai 4, 2020, 4:45pm

Bonjour à tous

Voilà depuis quelques jours j’ai de nombreux messages d’erreurs au démarrage de debian. Ces messages concernent un disque dure le sde pour le nommer clairement.
J’ai tenté une réparation via GParted et voici le message :

GParted 0.32.0 --enable-libparted-dmraid --enable-online-resize
Libparted 3.2

Vérifier et réparer le système de fichiers (ntfs) sur /dev/sde1  00:02:00    ( ERREUR )
     	
calibrer /dev/sde1  00:00:12    ( SUCCÈS )
     	
chemin : /dev/sde1 (partition)
début : 63
fin : 1025589599
taille : 1025589537 (489.04 Gio)
vérifier le système de fichiers sur /dev/sde1 et corriger les problèmes (si possible)  00:01:48    ( ERREUR )
     	
ntfsresize -i -f -v '/dev/sde1'  00:01:48    ( ERREUR )
     	
ntfsresize v2017.3.23AR.3 (libntfs-3g)
Device name : /dev/sde1
NTFS volume version: 3.1
Cluster size : 4096 bytes
Current volume size: 525101838848 bytes (525102 MB)
Current device size: 525101842944 bytes (525102 MB)
Checking for bad sectors ...
Bad cluster: 0x35 - 0x35 (1)
Bad cluster: 0x1e1d - 0x1e1d (1)
ERROR: This software has detected that the disk has at least 2 bad sectors.
****************************************************************************
* WARNING: The disk has bad sector. This means physical damage on the disk *
* surface caused by deterioration, manufacturing faults or other reason. *
* The reliability of the disk may stay stable or degrade fast. We suggest *
* making a full backup urgently by running 'ntfsclone --rescue ...' then *
* run 'chkdsk /f /r' on Windows and rebooot it TWICE! Then you can resize *
* NTFS safely by additionally using the --bad-sectors option of ntfsresize.*
*************************************************************************

Avez vous un conseil ou un moyen de tenter une réparation??
Ou un formatage total réglera-t-il le problème??

anon93295908 · Mai 4, 2020, 4:16pm

Ton disque dur est défectueux.
Il faut envisager à le changer rapidement.

tu peu le cloner avec ddrescue depuis un livecd afin de récupérer le maximum de données

syrtacus · Mai 5, 2020, 10:45am

Ah merci !!!
Bon c’est dommage ce disque dure ne me servait que très rarement et n’était pas hyper sollicité. Incroyable qu’il présente des signes de défectuosités.
Juste en complément d’info c’est un disque d’1, 5 To partitionnée en 3 x 500 Go.

anon74666808 · Mai 5, 2020, 11:26am

Salut @syrtacus bonjour

Essaie déjà ça , sinon comme dit Le Loup ton disque est sûrement défectueux.
Je ne connais pas DDrescue ,mais je présume qu’il y a l’outil smartctl
Il faut l’utiliser pour voir dans quel état est ton disque .Les spécialistes hardware sauront. Bonne chance

anon93295908 · Mai 5, 2020, 12:38pm

Il suffit de faire et de remplacer sda par le bon disque dur. ensuite de poster le résultat.

sudo smartctl --quietmode=errorsonly --all /dev/sda

syrtacus · Mai 7, 2020, 7:25pm

Voici le résultat de la commande :

smartctl --quietmode=errorsonly --all /dev/sde1
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
190 Airflow_Temperature_Cel 0x0022   054   032   045    Old_age   Always   In_the_past 46 (255 255 46 46 0)

ATA Error Count: 2241 (device log contains only the most recent five errors)
Error 2241 occurred at disk power-on lifetime: 7126 hours (296 days + 22 hours)
Error 2240 occurred at disk power-on lifetime: 7126 hours (296 days + 22 hours)
Error 2239 occurred at disk power-on lifetime: 7126 hours (296 days + 22 hours)
Error 2238 occurred at disk power-on lifetime: 7126 hours (296 days + 22 hours)
Error 2237 occurred at disk power-on lifetime: 7126 hours (296 days + 22 hours)

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 2  Selective offline   Completed: read failure       90%      7010         487
# 3  Selective offline   Completed: read failure       90%      7010         487
# 4  Short offline       Completed: read failure       90%      7010         487
# 5  Extended offline    Completed: read failure       90%      7010         487

anon93295908 · Mai 7, 2020, 3:33pm

smartctl --quietmode=errorsonly --all /dev/sde

c’est mieux

syrtacus · Mai 8, 2020, 9:28am

smartctl --quietmode=errorsonly --all /dev/sde
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
190 Airflow_Temperature_Cel 0x0022   063   032   045    Old_age   Always   In_the_past 37 (255 255 37 19 0)

ATA Error Count: 2250 (device log contains only the most recent five errors)
Error 2250 occurred at disk power-on lifetime: 7127 hours (296 days + 23 hours)
Error 2249 occurred at disk power-on lifetime: 7127 hours (296 days + 23 hours)
Error 2248 occurred at disk power-on lifetime: 7127 hours (296 days + 23 hours)
Error 2247 occurred at disk power-on lifetime: 7127 hours (296 days + 23 hours)
Error 2246 occurred at disk power-on lifetime: 7127 hours (296 days + 23 hours)

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 2  Selective offline   Completed: read failure       90%      7010         487
# 3  Selective offline   Completed: read failure       90%      7010         487
# 4  Short offline       Completed: read failure       90%      7010         487
# 5  Extended offline    Completed: read failure       90%      7010         487

PascalHambourg · Mai 8, 2020, 9:34am

Non, ce qui serait mieux ce serait d’exécuter smartctl sans l’option --quietmode afin de tout afficher. Ainsi on verrait vraiment l’ampleur des dégâts (nombre de secteurs défectueux).

Là, tout ce qu’on peut voir c’est que le disque a surchauffé (68 °C pour une limite à 55°C) et a au moins un secteur défectueux, ceci ayant pu causer cela.

syrtacus · Mai 9, 2020, 12:20pm

Voilà la commande sans l’option

smartctl  --all /dev/sde

smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-8-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.11
Device Model:     ST31500341AS
Serial Number:    9VS3GNVB
LU WWN Device Id: 5 000c50 01f94e613
Firmware Version: CC1H
User Capacity:    1 500 300 828 160 bytes [1,50 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Sat May  9 14:17:59 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  617) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 296) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x103f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   090   086   006    Pre-fail  Always       -       168955584
  3 Spin_Up_Time            0x0003   098   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3628
  5 Reallocated_Sector_Ct   0x0033   097   097   036    Pre-fail  Always       -       151
  7 Seek_Error_Rate         0x000f   074   060   030    Pre-fail  Always       -       26381481
  9 Power_On_Hours          0x0032   092   092   000    Old_age   Always       -       7128
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       1
 12 Power_Cycle_Count       0x0032   097   037   020    Old_age   Always       -       3839
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       2203
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   063   063   000    Old_age   Always       -       37
190 Airflow_Temperature_Cel 0x0022   065   032   045    Old_age   Always   In_the_past 35 (255 255 35 20 0)
194 Temperature_Celsius     0x0022   035   068   000    Old_age   Always       -       35 (0 11 0 0 0)
195 Hardware_ECC_Recovered  0x001a   044   025   000    Old_age   Always       -       168955584
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       12
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       12
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       6051 (196 206 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       364011167
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       630580316

SMART Error Log Version: 1
ATA Error Count: 2267 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 2267 occurred at disk power-on lifetime: 7128 hours (297 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 e7 01 00 00  Error: UNC at LBA = 0x000001e7 = 487

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 01 e7 01 00 40 00      00:11:23.366  READ FPDMA QUEUED
  ec 00 01 00 00 00 00 00      00:11:23.363  IDENTIFY DEVICE
  b0 da 00 00 4f c2 00 00      00:11:23.335  SMART RETURN STATUS
  27 00 00 00 00 00 e0 00      00:11:23.307  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      00:11:23.306  IDENTIFY DEVICE

Error 2266 occurred at disk power-on lifetime: 7128 hours (297 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 e7 01 00 00  Error: UNC at LBA = 0x000001e7 = 487

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 07 e1 01 00 40 00      00:11:20.284  READ FPDMA QUEUED
  60 00 01 e0 01 00 40 00      00:11:20.284  READ FPDMA QUEUED
  e5 00 00 00 00 00 00 00      00:11:20.283  CHECK POWER MODE
  60 00 01 df 01 00 40 00      00:11:20.194  READ FPDMA QUEUED
  60 00 01 de 01 00 40 00      00:11:20.193  READ FPDMA QUEUED

Error 2265 occurred at disk power-on lifetime: 7128 hours (297 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 e7 01 00 00  Error: UNC at LBA = 0x000001e7 = 487

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 f8 08 01 00 40 00      00:11:12.822  READ FPDMA QUEUED
  60 00 78 88 00 00 40 00      00:11:12.822  READ FPDMA QUEUED
  60 00 30 48 00 00 40 00      00:11:12.821  READ FPDMA QUEUED
  60 00 10 28 00 00 40 00      00:11:12.821  READ FPDMA QUEUED
  60 00 08 10 00 00 40 00      00:11:12.819  READ FPDMA QUEUED

Error 2264 occurred at disk power-on lifetime: 7128 hours (297 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 e7 01 00 00  Error: UNC at LBA = 0x000001e7 = 487

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 01 e7 01 00 40 00      00:10:58.117  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      00:10:58.089  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      00:10:58.087  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      00:10:58.073  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:10:58.045  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 2263 occurred at disk power-on lifetime: 7128 hours (297 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 e7 01 00 00  Error: UNC at LBA = 0x000001e7 = 487

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 f8 08 01 00 40 00      00:10:44.960  READ FPDMA QUEUED
  60 00 78 88 00 00 40 00      00:10:44.960  READ FPDMA QUEUED
  60 00 30 48 00 00 40 00      00:10:44.960  READ FPDMA QUEUED
  60 00 10 28 00 00 40 00      00:10:44.960  READ FPDMA QUEUED
  60 00 08 10 00 00 40 00      00:10:44.958  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Interrupted (host reset)      00%      7010         -
# 2  Selective offline   Completed: read failure       90%      7010         487
# 3  Selective offline   Completed: read failure       90%      7010         487
# 4  Short offline       Completed: read failure       90%      7010         487
# 5  Extended offline    Completed: read failure       90%      7010         487

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA    MAX_LBA  CURRENT_TEST_STATUS
    1        0  999999999  Not_testing
    2        0          0  Not_testing
    3        0          0  Not_testing
    4        0          0  Not_testing
    5        0          0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

PascalHambourg · Mai 9, 2020, 2:22pm

Ah, là au moins on peut voir des choses.

Confirmation que la température du disque a effectivement atteint 68 °C, ce qui n’était qu’une interprétation de ma part des données partielles. C’est beaucoup trop. Cela a pu endommager le disque. Mais on ne peut pas savoir quand.

Il n’y a pas au moins 1 mais au moins 12 secteurs défectueux. 12 identifiés, mais il peut y en avoir d’autre encore non identifiés. Pour les débusquer tous il faudrait passer badblocks en lecture seule sur tout le disque sans s’arrêter au premier secteur défectueux trouvé.

Il y a déjà eu 151 secteurs réalloués. Pas de panique : un secteur réalloué est opérationnel, ce n’est pas (ou du moins plus) un secteur défectueux, et il y a encore plein de secteurs de réserve. D’un côté c’est donc mieux que des secteurs qui sont restés défectueux sans pouvoir être réalloués, mais d’un autre côté ça veut dire que que le disque n’est pas sans défaut. C’est le genre de paramètre dont il faut surveiller l’évolution car son augmentation régulière peut indiquer une dégradation progressive et inéluctable du disque.

Tous les logs d’erreur sont récents et concernent le même secteur défectueux 487 situé très près du début du disque, de même que les auto-tests qui s’arrêtent sur ce secteur.

Tu demandais si un formatage complet pouvait réparer ces erreurs. En effet le formatage complet (non rapide) avec mkntfs réécrit à zéro et vérifie tous les secteurs. Cependant des secteurs qui n’étaient pas encore identifiés comme défectueux pourraient ne pas être réparés. Je suppose néanmoins que dans ce cas ils seront marqués comme inutilisables pour le système de fichiers.

syrtacus · Mai 10, 2020, 3:11pm

Je te remercie. J’ai pris des dispositions et ai fait une sauvegarde de quelques fichiers importants pour moi.
Pour info je tourne aussi avec Windows de temps en temps et lui par contre ne peut même plus ouvrir le disque endommagé. C’est Debian qui m’a informé, vu qu’au moment où Debian se lance il m’affiche un tas de message concernant ce disque.
J’essaierai de voir ce que je peux faire avec mkntfs, plus tard, j’imagine que cette commande doit prendre un certain temps pour se terminer et confinement oblige je partage ce pc et je ne peux pas le bloquer trop longtemps!!!

PascalHambourg · Mai 10, 2020, 4:19pm

Oui, l’effacement+vérification d’une partition de 500 Go doit prendre au moins deux heures. Mais on peut quand même utiliser l’ordinateur pour faire autre chose pendant ce temps.

syrtacus · Mai 19, 2020, 4:09pm

J’ai aussi été intrigué par le fait que le disque dure a pu chauffer autant. J’ai donc ouvert mon pc et constaté que le ventilo de la face avant ne tournait pas . Après avoir potassé la doc de l’alim. car le ventilateur est branché dessus, je n’ai rien vu de concluant. Soit le ventilo ne tourne que quand une certaine température est atteinte soit il est défectueux. C’est bizarre ce pc n’a pas 2 ans.

PascalHambourg · Mai 19, 2020, 4:14pm

Il faudrait le tester en le branchant ailleurs. Il n’y a pas un connecteur sur la carte mère ?

syrtacus · Mai 22, 2020, 9:54am

si mais le fil du ventilo est trop court pour aller jusqu’au connecteur!!

PascalHambourg · Mai 22, 2020, 10:46am

Démonter le ventilateur pour le rapprocher.
Oui le brancher sur un connecteur d’alimentation molex (avec un adaptateur fourni avec les ventilateurs de boîtier ou deux fils bricolés si on a bien identifié les fils de masse et de 12V du ventilateur).