Erreurs sur partitions, système bloqué

Bonjour,
Mon ordinateur portable sous Debian 10 ne démarre plus en interface graphique.
Je n’ai accès qu’à la ligne de commande et ne peux pas faire grand chose, car les partitions /dev/sda2 (racine /) et /dev/sda3 (Partition d’échange Linux) sont en lecture seule.
Je peux en revanche écrire sur /dev/sda4 (/home).
De nombreux messages d’erreurs s’affichent au démarrage, en voici quelques-uns que j’ai pu noter :
/dev/sda2 contains a file system with errors
error on dev sda3
print-req-error : I/O error, dev sda, sector xxxxxxx
(Ce dernier message s’affiche à plusieurs reprises, en indiquant des chiffres à la place de xxxx.)
J’ai tenté une réparation (fsck) en suivant les instructions de la page suivante :
https://debian-facile.org/doc:systeme:fsck
mais ça n’a rien changé.
Comment diagnostiquer (et si possible résoudre) le problème ?
J’ai un peu peur que ça ne soit un problème physique…
Merci !

Personnellement je n’essaierai pas de réparer (tout de suite). J’installerai un nouveau système sur une autre partition, je récupérai les données de l’ancien, puis éventuellement j’essaierai de réparer ou je reformaterai l’ancienne partition.

Relever les messages d’erreur complets du noyau concernant le disque.

dmesg | egrep -i "sd[: a]|[^d]ata|scsi"

Afficher le statut SMART du disque

smartctl -a /dev/sda

Si le paquet smartmontools n’est pas installé, alors il faudra le faire depuis un autre système (live par exemple).

Soit c’est un problème matériel, soit c’est une régression du noyau.

Bonsoir,
Merci pour vos réponses.
Avant de faire quoi que ce soit (réinstallation, reformatage), je préferais venir m’informer sur le forum + prendre le temps de sauvegarder les données qui ne l’étaient pas.

Voici le résultat des deux commandes mentionnées :

dmesg | egrep -i "sd[: a]|[^d]ata|scsi"
[ 1.846882] Block layer SCSI generic (bsg) driver version 0.4 loaded (major 247)
[ 2.323055] SCSI subsystem initialized
[ 2.345416] libata version 3.00 loaded.
[ 2.377856] ahci 0000:00:13.0: AHCI 0001.0300 32 slots 2 ports 3 Gbps 0x3 impl SATA mode
[ 2.384663] scsi host0: ahci
[ 2.412360] scsi host1: ahci
[ 2.412523] ata1: SATA max UDMA/133 abar m2048@0xd0815000 port 0xd0815100 irq 90
[ 2.412526] ata2: SATA max UDMA/133 abar m2048@0xd0815000 port 0xd0815180 irq 90
[ 2.727342] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 2.729571] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
[ 2.733815] ata2.00: ATAPI: MATSHITA DVD-RAM UJ8FBS, 1.00, max UDMA/100
[ 2.741031] ata2.00: configured for UDMA/100
[ 2.784008] ata1.00: ATA-8: TOSHIBA MQ01ABD100, AX0R2J, max UDMA/100
[ 2.784019] ata1.00: 1953525168 sectors, multi 16: LBA48 NCQ (depth 32), AA
[ 2.787267] ata1.00: configured for UDMA/100
[ 2.789088] scsi 0:0:0:0: Direct-Access ATA TOSHIBA MQ01ABD1 2J PQ: 0 ANSI: 5
[ 2.793099] scsi 1:0:0:0: CD-ROM MATSHITA DVD-RAM UJ8FBS 1.00 PQ: 0 ANSI: 5
[ 4.268197] sd 0:0:0:0: [sda] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
[ 4.268201] sd 0:0:0:0: [sda] 4096-byte physical blocks
[ 4.268213] sd 0:0:0:0: [sda] Write Protect is off
[ 4.268216] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[ 4.268235] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn’t support DPO or FUA
[ 4.311465] sr 1:0:0:0: [sr0] scsi3-mmc drive: 24x/24x writer dvd-ram cd/rw xa/form2 cdda tray
[ 4.313143] sr 1:0:0:0: Attached scsi CD-ROM sr0
[ 4.413694] sda: sda1 sda2 sda3 sda4
[ 4.415502] sd 0:0:0:0: [sda] Attached SCSI disk
[ 8.690035] ata1.00: exception Emask 0x0 SAct 0xb000001 SErr 0x40000 action 0x0
[ 8.690367] ata1.00: irq_stat 0x40000008
[ 8.690542] ata1: SError: { CommWake }
[ 8.690711] ata1.00: failed command: READ FPDMA QUEUED
[ 8.690944] ata1.00: cmd 60/78:c0:88:38:81/00:00:03:00:00/40 tag 24 ncq dma 61440 in
[ 8.691557] ata1.00: status: { DRDY ERR }
[ 8.691726] ata1.00: error: { UNC }
[ 8.691892] ata1: hard resetting link
[ 9.007855] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 9.021264] ata1.00: configured for UDMA/100
[ 9.022844] sd 0:0:0:0: [sda] tag#24 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 9.022861] sd 0:0:0:0: [sda] tag#24 Sense Key : Medium Error [current]
[ 9.022875] sd 0:0:0:0: [sda] tag#24 Add. Sense: Unrecovered read error - auto reallocate failed
[ 9.022891] sd 0:0:0:0: [sda] tag#24 CDB: Read(10) 28 00 03 81 38 88 00 00 78 00
[ 9.022900] print_req_error: I/O error, dev sda, sector 58800344
[ 9.023244] ata1: EH complete
[ 16.757583] ata1.00: exception Emask 0x0 SAct 0x31 SErr 0x40000 action 0x0
[ 16.757898] ata1.00: irq_stat 0x40000008
[ 16.758072] ata1: SError: { CommWake }
[ 16.758239] ata1.00: failed command: READ FPDMA QUEUED
[ 16.758473] ata1.00: cmd 60/08:20:d8:38:81/00:00:03:00:00/40 tag 4 ncq dma 4096 in
[ 16.759080] ata1.00: status: { DRDY ERR }
[ 16.759250] ata1.00: error: { UNC }
[ 16.759419] ata1: hard resetting link
[ 17.077588] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 17.083432] ata1.00: configured for UDMA/100
[ 17.084227] sd 0:0:0:0: [sda] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 17.084245] sd 0:0:0:0: [sda] tag#4 Sense Key : Medium Error [current]
[ 17.084259] sd 0:0:0:0: [sda] tag#4 Add. Sense: Unrecovered read error - auto reallocate failed
[ 17.084275] sd 0:0:0:0: [sda] tag#4 CDB: Read(10) 28 00 03 81 38 d8 00 00 08 00
[ 17.084286] print_req_error: I/O error, dev sda, sector 58800344
[ 17.084625] Buffer I/O error on dev sda3, logical block 27, async page read
[ 17.084967] ata1: EH complete
[ 20.929540] ata1.00: exception Emask 0x0 SAct 0x1000c0 SErr 0x40000 action 0x0
[ 20.929869] ata1.00: irq_stat 0x40000008
[ 20.930043] ata1: SError: { CommWake }
[ 20.930210] ata1.00: failed command: READ FPDMA QUEUED
[ 20.930442] ata1.00: cmd 60/08:30:d8:38:81/00:00:03:00:00/40 tag 6 ncq dma 4096 in
[ 20.931050] ata1.00: status: { DRDY ERR }
[ 20.931220] ata1.00: error: { UNC }
[ 20.931388] ata1: hard resetting link
[ 21.249388] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 21.262899] ata1.00: configured for UDMA/100
[ 21.264452] sd 0:0:0:0: [sda] tag#6 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 21.264469] sd 0:0:0:0: [sda] tag#6 Sense Key : Medium Error [current]
[ 21.264484] sd 0:0:0:0: [sda] tag#6 Add. Sense: Unrecovered read error - auto reallocate failed
[ 21.264499] sd 0:0:0:0: [sda] tag#6 CDB: Read(10) 28 00 03 81 38 d8 00 00 08 00
[ 21.264509] print_req_error: I/O error, dev sda, sector 58800344
[ 21.264796] Buffer I/O error on dev sda3, logical block 27, async page read
[ 21.265154] ata1: EH complete
[ 26.515884] EXT4-fs (sda2): mounted filesystem with ordered data mode. Opts: (null)
[ 30.526155] EXT4-fs (sda2): re-mounted. Opts: errors=remount-ro
[ 32.033482] sd 0:0:0:0: Attached scsi generic sg0 type 0
[ 32.033548] sr 1:0:0:0: Attached scsi generic sg1 type 5
[ 38.041227] ata1.00: exception Emask 0x0 SAct 0x24004031 SErr 0x50000 action 0x0
[ 38.051014] ata1.00: irq_stat 0x40000001
[ 38.053156] ata1: SError: { PHYRdyChg CommWake }
[ 38.055015] ata1.00: failed command: WRITE FPDMA QUEUED
[ 38.056881] ata1.00: cmd 61/08:00:00:28:87/00:00:01:00:00/40 tag 0 ncq dma 4096 out
[ 38.060684] ata1.00: status: { DRDY ERR }
[ 38.062560] ata1.00: error: { UNC }
[ 38.064432] ata1.00: failed command: READ FPDMA QUEUED
[ 38.066279] ata1.00: cmd 60/78:20:88:38:81/00:00:03:00:00/40 tag 4 ncq dma 61440 in
[ 38.070058] ata1.00: status: { DRDY ERR }
[ 38.071916] ata1.00: error: { UNC }
[ 38.073750] ata1.00: failed command: READ FPDMA QUEUED
[ 38.075590] ata1.00: cmd 60/f8:28:08:39:81/00:00:03:00:00/40 tag 5 ncq dma 126976 in
[ 38.079337] ata1.00: status: { DRDY ERR }
[ 38.081198] ata1.00: error: { UNC }
[ 38.083030] ata1.00: failed command: READ FPDMA QUEUED
[ 38.084866] ata1.00: cmd 60/20:70:b8:d5:d1/00:00:00:00:00/40 tag 14 ncq dma 16384 in
[ 38.088613] ata1.00: status: { DRDY ERR }
[ 38.090454] ata1.00: error: { UNC }
[ 38.092261] ata1.00: failed command: READ FPDMA QUEUED
[ 38.094081] ata1.00: cmd 60/08:d0:80:67:70/00:00:74:00:00/40 tag 26 ncq dma 4096 in
[ 38.097728] ata1.00: status: { DRDY ERR }
[ 38.099539] ata1.00: error: { UNC }
[ 38.101343] ata1.00: failed command: READ FPDMA QUEUED
[ 38.103158] ata1.00: cmd 60/20:e8:00:15:8e/00:00:01:00:00/40 tag 29 ncq dma 16384 in
[ 38.106854] ata1.00: status: { DRDY ERR }
[ 38.108705] ata1.00: error: { UNC }
[ 38.110532] ata1: hard resetting link
[ 38.425929] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 38.477902] ata1.00: configured for UDMA/100
[ 38.478319] sd 0:0:0:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.478337] sd 0:0:0:0: [sda] tag#0 Sense Key : Medium Error [current]
[ 38.478351] sd 0:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.478367] sd 0:0:0:0: [sda] tag#0 CDB: Write(10) 2a 00 01 87 28 00 00 00 08 00
[ 38.478377] print_req_error: I/O error, dev sda, sector 25634816
[ 38.487969] Buffer I/O error on dev sda2, logical block 3178496, lost sync page write
[ 38.490320] sd 0:0:0:0: [sda] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.490323] sd 0:0:0:0: [sda] tag#4 Sense Key : Medium Error [current]
[ 38.490326] sd 0:0:0:0: [sda] tag#4 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.490329] sd 0:0:0:0: [sda] tag#4 CDB: Read(10) 28 00 03 81 38 88 00 00 78 00
[ 38.490331] print_req_error: I/O error, dev sda, sector 58800344
[ 38.490479] JBD2: Error -5 detected when updating journal superblock for sda2-8.
[ 38.492504] sd 0:0:0:0: [sda] tag#5 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.494477] Aborting journal on device sda2-8.
[ 38.494478] sd 0:0:0:0: [sda] tag#5 Sense Key : Medium Error [current]
[ 38.494481] sd 0:0:0:0: [sda] tag#5 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.496427] sd 0:0:0:0: [sda] tag#5 CDB: Read(10) 28 00 03 81 39 08 00 00 f8 00
[ 38.496429] print_req_error: I/O error, dev sda, sector 58800392
[ 38.498650] sd 0:0:0:0: [sda] tag#14 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.498653] sd 0:0:0:0: [sda] tag#14 Sense Key : Medium Error [current]
[ 38.498656] sd 0:0:0:0: [sda] tag#14 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.498659] sd 0:0:0:0: [sda] tag#14 CDB: Read(10) 28 00 00 d1 d5 b8 00 00 20 00
[ 38.498661] print_req_error: I/O error, dev sda, sector 13751736
[ 38.500852] sd 0:0:0:0: [sda] tag#26 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.500856] sd 0:0:0:0: [sda] tag#26 Sense Key : Medium Error [current]
[ 38.500859] sd 0:0:0:0: [sda] tag#26 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.500862] sd 0:0:0:0: [sda] tag#26 CDB: Read(10) 28 00 74 70 67 80 00 00 08 00
[ 38.500863] print_req_error: I/O error, dev sda, sector 1953523584
[ 38.502767] sd 0:0:0:0: [sda] tag#29 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 38.502769] sd 0:0:0:0: [sda] tag#29 Sense Key : Medium Error [current]
[ 38.502772] sd 0:0:0:0: [sda] tag#29 Add. Sense: Unrecovered read error - auto reallocate failed
[ 38.502775] sd 0:0:0:0: [sda] tag#29 CDB: Read(10) 28 00 01 8e 15 00 00 00 20 00
[ 38.502776] print_req_error: I/O error, dev sda, sector 26088704
[ 38.504682] ata1: EH complete
[ 38.608264] EXT4-fs error (device sda2): ext4_journal_check_start:61: Detected aborted journal
[ 38.610668] EXT4-fs (sda2): Remounting filesystem read-only
[ 38.617942] EXT4-fs error (device sda2): ext4_journal_check_start:61: Detected aborted journal
[ 42.553756] ata1.00: exception Emask 0x0 SAct 0x8190000 SErr 0x40000 action 0x0
[ 42.564028] ata1.00: irq_stat 0x40000008
[ 42.566236] ata1: SError: { CommWake }
[ 42.568197] ata1.00: failed command: READ FPDMA QUEUED
[ 42.570178] ata1.00: cmd 60/08:d8:d8:38:81/00:00:03:00:00/40 tag 27 ncq dma 4096 in
[ 42.574178] ata1.00: status: { DRDY ERR }
[ 42.576157] ata1.00: error: { UNC }
[ 42.578116] ata1: hard resetting link
[ 42.891576] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 42.904382] ata1.00: configured for UDMA/100
[ 42.904828] sd 0:0:0:0: [sda] tag#27 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 42.904846] sd 0:0:0:0: [sda] tag#27 Sense Key : Medium Error [current]
[ 42.904861] sd 0:0:0:0: [sda] tag#27 Add. Sense: Unrecovered read error - auto reallocate failed
[ 42.904877] sd 0:0:0:0: [sda] tag#27 CDB: Read(10) 28 00 03 81 38 d8 00 00 08 00
[ 42.904887] print_req_error: I/O error, dev sda, sector 58800344
[ 42.914995] Buffer I/O error on dev sda3, logical block 27, async page read
[ 42.917263] ata1: EH complete
[ 46.805336] ata1.00: exception Emask 0x0 SAct 0x56000000 SErr 0x40000 action 0x0
[ 46.815422] ata1.00: irq_stat 0x40000008
[ 46.817588] ata1: SError: { CommWake }
[ 46.819526] ata1.00: failed command: READ FPDMA QUEUED
[ 46.821471] ata1.00: cmd 60/08:e0:d8:38:81/00:00:03:00:00/40 tag 28 ncq dma 4096 in
[ 46.825383] ata1.00: status: { DRDY ERR }
[ 46.827301] ata1.00: error: { UNC }
[ 46.829227] ata1: hard resetting link
[ 47.143382] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 47.150943] ata1.00: configured for UDMA/100
[ 47.151386] sd 0:0:0:0: [sda] tag#28 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 47.151405] sd 0:0:0:0: [sda] tag#28 Sense Key : Medium Error [current]
[ 47.151420] sd 0:0:0:0: [sda] tag#28 Add. Sense: Unrecovered read error - auto reallocate failed
[ 47.151436] sd 0:0:0:0: [sda] tag#28 CDB: Read(10) 28 00 03 81 38 d8 00 00 08 00
[ 47.151446] print_req_error: I/O error, dev sda, sector 58800344
[ 47.161553] Buffer I/O error on dev sda3, logical block 27, async page read
[ 47.163699] ata1: EH complete
[ 51.209790] ata1.00: exception Emask 0x0 SAct 0x38c0000 SErr 0x40000 action 0x0
[ 51.220201] ata1.00: irq_stat 0x40000008
[ 51.223367] ata1: SError: { CommWake }
[ 51.226330] ata1.00: failed command: READ FPDMA QUEUED
[ 51.229319] ata1.00: cmd 60/00:90:00:38:81/01:00:03:00:00/40 tag 18 ncq dma 131072 in
[ 51.235330] ata1.00: status: { DRDY ERR }
[ 51.237399] ata1.00: error: { UNC }
[ 51.239388] ata1: hard resetting link
[ 51.555012] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 51.563942] ata1.00: configured for UDMA/100
[ 51.564405] sd 0:0:0:0: [sda] tag#18 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 51.564432] sd 0:0:0:0: [sda] tag#18 Sense Key : Medium Error [current]
[ 51.564447] sd 0:0:0:0: [sda] tag#18 Add. Sense: Unrecovered read error - auto reallocate failed
[ 51.564463] sd 0:0:0:0: [sda] tag#18 CDB: Read(10) 28 00 03 81 38 00 00 01 00 00
[ 51.564472] print_req_error: I/O error, dev sda, sector 58800344
[ 51.574979] ata1: EH complete
[ 51.641008] Adding 4078588k swap on /dev/sda3. Priority:-2 extents:1 across:4078588k FS
[ 52.804333] EXT4-fs (sda4): mounted filesystem with ordered data mode. Opts: (null)

smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-5.4.0-4-amd64] (local build)
Copyright © 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Toshiba 2.5" HDD MQ01ABD…
Device Model: TOSHIBA MQ01ABD100
Serial Number: Z4L5S5J0S
LU WWN Device Id: 5 000039 5f5808066
Firmware Version: AX0R2J
User Capacity: 1 000 204 886 016 bytes [1,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 2.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Sun May 17 20:10:13 2020 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 120) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 249) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 050 Pre-fail Always - 0
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0x0027 100 100 001 Pre-fail Always - 1718
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 3805
5 Reallocated_Sector_Ct 0x0033 100 100 050 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 050 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 100 100 050 Pre-fail Offline - 0
9 Power_On_Hours 0x0032 076 076 000 Old_age Always - 9875
10 Spin_Retry_Count 0x0033 175 100 030 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 3315
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 102
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 132
193 Load_Cycle_Count 0x0032 077 077 000 Old_age Always - 238890
194 Temperature_Celsius 0x0022 100 100 000 Old_age Always - 29 (Min/Max 9/43)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 48
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
220 Disk_Shift 0x0002 100 100 000 Old_age Always - 0
222 Loaded_Hours 0x0032 082 082 000 Old_age Always - 7513
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 0
224 Load_Friction 0x0022 100 100 000 Old_age Always - 0
226 Load-in_Time 0x0026 100 100 000 Old_age Always - 269
240 Head_Flying_Hours 0x0001 100 100 001 Pre-fail Offline - 0

SMART Error Log Version: 1
ATA Error Count: 140 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It « wraps » after 49.710 days.

Error 140 occurred at disk power-on lifetime: 9872 hours (411 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH


40 41 38 d8 38 81 40 Error: UNC at LBA = 0x008138d8 = 8468696

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name


60 08 30 80 b0 fd 40 00 00:04:20.648 READ FPDMA QUEUED
60 08 38 d8 38 81 40 00 00:04:20.642 READ FPDMA QUEUED
60 08 28 40 b0 fd 40 00 00:04:20.642 READ FPDMA QUEUED
e3 00 f4 00 00 00 40 00 00:04:20.639 IDLE
ef 10 03 00 00 00 a0 00 00:04:20.639 SET FEATURES [Enable SATA feature]

Error 139 occurred at disk power-on lifetime: 9872 hours (411 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH


40 41 90 d8 38 81 40 Error: UNC at LBA = 0x008138d8 = 8468696

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name


60 08 90 d8 38 81 40 00 00:04:16.488 READ FPDMA QUEUED
60 08 88 d0 38 81 40 00 00:04:16.487 READ FPDMA QUEUED
60 08 80 40 b0 fd 40 00 00:04:16.481 READ FPDMA QUEUED
60 08 78 20 b0 fd 40 00 00:04:16.458 READ FPDMA QUEUED
60 08 70 f8 66 70 40 00 00:04:16.449 READ FPDMA QUEUED

Error 138 occurred at disk power-on lifetime: 9872 hours (411 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH


40 41 80 d8 38 81 40 Error: UNC at LBA = 0x008138d8 = 8468696

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name


60 20 50 00 08 00 40 00 00:04:12.248 READ FPDMA QUEUED
60 68 30 88 27 03 40 00 00:04:12.238 READ FPDMA QUEUED
60 80 28 00 27 03 40 00 00:04:12.238 READ FPDMA QUEUED
60 f8 20 00 26 03 40 00 00:04:12.238 READ FPDMA QUEUED
60 00 08 00 24 03 40 00 00:04:12.223 READ FPDMA QUEUED

Error 137 occurred at disk power-on lifetime: 9872 hours (411 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH


40 41 78 d8 38 81 40 Error: UNC at LBA = 0x008138d8 = 8468696

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name


60 08 00 00 b0 fd 40 00 00:01:17.250 READ FPDMA QUEUED
60 08 78 d8 38 81 40 00 00:01:17.227 READ FPDMA QUEUED
60 08 68 f0 67 70 40 00 00:01:17.227 READ FPDMA QUEUED
e3 00 f4 00 00 00 40 00 00:01:17.226 IDLE
ef 10 03 00 00 00 a0 00 00:01:17.226 SET FEATURES [Enable SATA feature]

Error 136 occurred at disk power-on lifetime: 9872 hours (411 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH


40 41 58 d8 38 81 40 Error: UNC at LBA = 0x008138d8 = 8468696

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name


60 08 58 d8 38 81 40 00 00:01:13.056 READ FPDMA QUEUED
60 08 50 d0 38 81 40 00 00:01:13.056 READ FPDMA QUEUED
60 08 48 c8 38 81 40 00 00:01:13.056 READ FPDMA QUEUED
60 08 40 c0 38 81 40 00 00:01:13.056 READ FPDMA QUEUED
60 08 38 b8 38 81 40 00 00:01:13.056 READ FPDMA QUEUED

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Le disque annonce qu’il a 48 secteurs physiquement défectueux qui n’ont pas pu être réalloués.

Bonjour,
Merci pour ta réponse.

J’imagine que ce n’est pas récupérable ? Donc le mieux à faire, c’est une réinstallation sur une autre partition et de ne plus toucher aux partitions défectueuses ?

Comment as-tu compris qu’il y a 48 secteurs défectueux ? J’ai parcouru les deux rapports, mais n’y ai pas compris grand chose…

Bonjour cdpointpoint

Les secteurs eux-même, parfois si (grâce à la réallocation interne du disque). Les données qu’ils contenaient, généralement non.

Rien ne dit qu’il y n’y a pas de secteurs défectueux dans le reste du disque. SMART n’indique pas la localisation de chacun (on peut seulement voir les adresses LBA des derniers accès en erreur dans le log d’erreur), et surtout il peut y avoir des secteurs défectueux non détectés tant qu’on n’a pas essayé d’y accéder.

Le mieux c’est de sauvegarder toutes les données utiles sur un support sain, d’essayer de réparer les secteurs défectueux et en cas de succès, après avoir vérifié que le disque est stable (pas de nouveaux secteurs défectueux), réinstaller le système et restaurer les données. En cas d’échec, soit remplacer le disque, soit faire avec les secteurs défectueux de différentes façons :

  • les isoler dans des partitions non utilisées s’ils sont physiquement regroupés (note : les zones saines discontiguës peuvent être regroupées avec LVM)

  • sinon, les identifier et les marquer à ne pas utiliser dans les systèmes de fichiers lors de l’initialisation. Ceci n’est possible que si la structure de données supporte le marquage des blocs défectueux (ex : mke2fs -c ou e2fsck -c pour ext4). Je crois que ce n’est pas possible pour le swap.

Bonjour,
@MicP : Ah oui, j’avais repéré cette ligne, mais je pensais que PENDING signifiait autre chose.
@PascalHambourg : OK, je tente la réparation/réinstallation demain. Je croise les doigts… :fearful:
(Au passage, comment on fait pour citer un message comme vous l’avez fait ?)
Bonne fin de journée !

Pour essayer de réparer les secteurs défectueux, le plus simple est d’utiliser badblocks en écriture destructive (c’est pourquoi il faut sauvegarder avant).

Pour citer, il suffit de sélectionner le texte et de cliquer sur « Citer ».

Voir :


J’ai sélectionné dans ton message la suite de mots comment on fait pour citer un message
et j’ai cliqué sur la zone sur fond gris dans laquelle il y avait écrit Citer au dessus de la sélection

Capture d’écran_2020-05-19_14-04-03

et la suite de mots a été automatiquement insérée dans ce message avec les balises qu’il faut.
j’ai juste ajouté la suite de trois points avant et après pour signifier que c’est un extrait du message.

Je pensais utiliser e2fsck car j’ai vu la mention suivante dans le manuel de badblocks :

Important note: If the output of badblocks is going to be fed to the e2fsck or mke2fs programs, it is important that the block size is properly specified, since the block numbers which are generated are very dependent on the block size in use by the filesystem. For this reason, it is strongly recommended that users not run badblocks directly, but rather use the -c option of the e2fsck and mke2fs programs.

Du coup, je pensais suivre les instructions de cette page :
https://www.techwalla.com/articles/how-to-fix-bad-sectors-in-linux
Mais le manuel de e2fsck précise que l’option -c est read-only, donc non destructive, j’imagine.

-c This option causes e2fsck to use badblocks (8) program to do a read-only scan of the device in order to find any bad blocks.

Il vaut donc mieux que j’utilise badblocks avec l’option -w ?
Ne faut-il pas que je spécifie aussi la taille des blocs (option -b), comme indiqué dans le manuel (cf. note citée ci-dessus) ?

Effectivement, je m’étais borné à chercher pending dans mon dictionnaire anglais…

Et OK pour les citations, merci !

L’option -cc fait un test en lecture-écriture non destructive. Du moins en principe, car un secteur « chancelant » pourrait devenir défectueux.

Mais e2fsck ne vérifie que les systèmes de fichiers ext*, pas ce qui est en dehors, ni le swap…

Idéalement la taille de bloc avec badblocks doit être égale à la taille de secteur physique (512 ou 4096) du disque. C’est affiché par fdisk.

Bonjour,
Aujourd’hui, mon PC démarre sans problème et sans message d’erreur.
Je n’ai donc pas lancé badblocks car j’en ai profité pour travailler sur d’autres projets.
Pensez-vous qu’il vaut mieux tenter la réparation quand même maintenant, ou puis-je attendre quelques temps avant de le faire ? Quitte à surveiller régulièrement avec smartctl que de nouveaux blocs défectueux n’apparaissent pas…
J’avoue que ça m’arrangerait de ne pas avoir à tout réinstaller ces jours-ci !

Je t’ai dit ce qu’il en était, maintenant tu fais ce que tu veux, ce que tu fais avec tes données ne me concerne pas.

Hello,
Mon PC n’ayant pas démarré du premier coup hier matin, je me suis effectivement dit qu’il était plus prudent de lancer badblocks sans plus tarder.
(Ça a pris 25 h 30 :sleeping:)

badblocks -svw -b 4096 /dev/sda

Checking for bad blocks in read-write mode
From block 0 to 244190645
Testing with pattern 0xaa: done
Reading and comparing: done
Testing with pattern 0x55: done
Reading and comparing: done
Testing with pattern 0xff: done
Reading and comparing: done
Testing with pattern 0x00: done
Reading and comparing: done
Pass completed, 0 bad blocks found. (0/0/0 errors)

Il n’a donc pas trouvé d’erreurs, et effectivement :
smartctl -a /dev/sda

197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0

Le problème semble donc résolu. Merci @PascalHambourg pour tes conseils.
C’est parti pour une réinstallation !

(Par curiosité, les « patterns » de test (0xaa, etc.) qu’utilise badblocks ont-ils une signification ?)

Tant mieux, ça veut dire qu’a priori les secteurs défectueux ont été réparés par écriture ou réallocation. L’attribut Reallocated_Sector_Ct a peut-être évolué.

0x00 = 00000000 tous les bits à 0
0x55 = 01010101 alternance de bits à 0 et 1
0xaa = 10101010 alternance de bits à 1 et 0
0xff = 11111111 tous les bits à 1

Ces motifs ont une signification historique à l’époque ou les codages d’enregistrement étaient simples (RLL, MFM) : ils constituaient les motifs ayant le plus et le moins de transitions d’état avec les plus grandes différences entre eux, donc les « pires cas » pour la bande passante, la synchronisation et la rémanence respectivement. Cependant les disques durs utilisent depuis longtemps des codages beaucoup plus complexes pour lequels ces valeurs ne sont plus significatives.

Non, il est à 0 comme auparavant.

OK, compris le principe.