Problème lancement debian et oublie pass root (Stretch)

Bonjour à tous,

Je suis tout nouveau sur le forum ainsi que sur Linux.
Actuellement je tourne sous debian 9 avec Grub 2.02 afin de lancer windows en parallèle pour utiliser mon logiciel de CAO. C’est mon beau frère qui m’a fait l’installation mais perso je n’aurai pas été capable.

Bref maintenant au lancement l’ordi fait un tas de vérification et après quelques messages comme “dependency failed for /home” il me demande mon mot de passe super-utilisateur pour débuter la maintenance.

Évidement pour couronner le tout je n’ai pas le mot de passe et mon beau frère non plus…

J’ai essayer de la changer via Grub (en ayant déjà regarder sur plusieurs forum) mais sans réussite. Il m’a parler de forcer un fsck mais je n’ai pas compris et il n’ai pas beaucoup disponible.

Pour cela que je me tourne vers vous car j’aimerai pouvoir continuer à utiliser Debian. Par avance merci

DSC05511

YGG

J’arrive enfin à arriver en mode root. J’ai fait un fdisk et je sort ça :
DSC05512

J’ai linux en sda et windows en sdb je crois.

Mais surtout je vois rien de bootable en sda…

J’espère que je ne dit pas n’importe quoi, je suis un peu perdu !

Ygg

J’ai réussi en accédant au root et en utilisant fsdk

Pour info je suis pas le premier à qui ça arrive !

Je ne sais pas ce que tu as réussi, mais la première copie d’écran montre une erreur matérielle de lecture-écriture irrécupérable (UNCorrectable) lors d’un accès à la partition n° 2 du disque sda, sda2, qui serait utilisée comme /home. C’est inquiétant pour sa santé. Je t’engage à faire un diagnostic du disque avec un outil SMART comme smartctl du paquet smartmontools.

Difficile à dire, il y a des partitions Linux et Windows sur les deux disques.
Si sda2 est /home, la racine est probablement sdb3.

GRUB n’a pas besoin de partition bootable.

Bonjour,

Merci de cette réponse.

J’ai fait comme tu m’a dit et il en est ressortie que mes deux disques, sda (sata) et sdb (ssd) étaient à changer. Dure… Mais ce qu’y m’étonne le plus c’est que le ssd est un kingston de même pas 1 ans…

Je me base sur les données “TYPE” d’où il ne ressors que des pré-fail ou old-age. Est-ce juste ?

Merci
YGG

La colonne TYPE n’indique que le type de l’attribut, à savoir si c’est un indicateur de défaillance anormale ou de vieillissement normal. C’est la valeur de l’attribut qui indique l’existence éventuelle d’un défaut. Si tu veux de l’aide pour interpréter les résultats, poste-les ici.

Et voilà les résultats :

Capture d'écran de 2018-03-24 13-57-56

Merci de l’attention !

Un copier-coller du texte de la console aurait été préférable à une capture d’écran graphique.
La ligne 197 rapporte 72 secteurs illisibles détectés lors d’une tentative de lecture. C’est beaucoup. Ça ne veut pas dire que le disque va tomber en panne mais les données contenues dans ces secteurs sont perdues (donc les fichiers qu’ils contiennent sont endommagés de façon irréversible) et il y en a peut-être d’autres qui n’ont pas encore été détectés et de nouveaux qui peuvent apparaître. Bref, en l’état ce disque n’est pas fiable.

En fait si je fais un copier-coller c’est super brutal comme affichage (pas de tableau, texte brut sans espace) du coup j’ai préféré la capture d’écran. Sinon ça donne ça :

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Toshiba 2.5" HDD MQ01ABD...
Device Model:     TOSHIBA MQ01ABD032
Serial Number:    63BASYQ8S
LU WWN Device Id: 5 000039 4d5a844cc
Firmware Version: AX001A
User Capacity:    320 072 933 376 bytes [320 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Mar 24 15:17:32 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  120) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  82) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       1013
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       4786
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   071   071   000    Old_age   Always       -       11969
 10 Spin_Retry_Count        0x0033   195   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       4540
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       944
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       79
193 Load_Cycle_Count        0x0032   083   083   000    Old_age   Always       -       177886
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       31 (Min/Max 6/54)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       72
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       0
222 Loaded_Hours            0x0032   081   081   000    Old_age   Always       -       7786
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       266
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 151 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 151 occurred at disk power-on lifetime: 11874 hours (494 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 c0 20 69 af 40  Error: UNC at LBA = 0x00af6920 = 11495712

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 c0 20 69 af 40 00      09:26:03.126  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00      09:26:03.122  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00      09:26:03.122  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      09:26:03.121  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      09:26:03.121  SET FEATURES [Set transfer mode]

Error 150 occurred at disk power-on lifetime: 11874 hours (494 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 a0 20 69 af 40  Error: UNC at LBA = 0x00af6920 = 11495712

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 a0 20 69 af 40 00      09:25:59.717  READ FPDMA QUEUED
  60 08 98 18 69 af 40 00      09:25:59.707  READ FPDMA QUEUED
  60 10 90 40 8a 6f 40 00      09:25:59.706  READ FPDMA QUEUED
  60 20 88 20 8a 6f 40 00      09:25:59.706  READ FPDMA QUEUED
  60 10 80 00 8a 6f 40 00      09:25:59.706  READ FPDMA QUEUED

Error 149 occurred at disk power-on lifetime: 11874 hours (494 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 68 20 69 af 40  Error: UNC at LBA = 0x00af6920 = 11495712

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 e8 a0 00 80 6f 40 00      09:25:56.085  READ FPDMA QUEUED
  60 40 30 c0 6f 6f 40 00      09:25:56.085  READ FPDMA QUEUED
  60 08 58 68 6f 6f 40 00      09:25:56.084  READ FPDMA QUEUED
  60 08 50 80 6d 6f 40 00      09:25:56.084  READ FPDMA QUEUED
  60 08 48 68 6d 6f 40 00      09:25:56.083  READ FPDMA QUEUED

Error 148 occurred at disk power-on lifetime: 11874 hours (494 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 d8 20 69 af 40  Error: UNC at LBA = 0x00af6920 = 11495712

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 d8 20 69 af 40 00      09:23:32.073  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00      09:23:32.072  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00      09:23:32.072  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      09:23:32.071  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      09:23:32.071  SET FEATURES [Set transfer mode]

Error 147 occurred at disk power-on lifetime: 11874 hours (494 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 b8 20 69 af 40  Error: UNC at LBA = 0x00af6920 = 11495712

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 b8 20 69 af 40 00      09:23:28.675  READ FPDMA QUEUED
  60 08 b0 18 69 af 40 00      09:23:28.666  READ FPDMA QUEUED
  60 10 a8 40 8a 6f 40 00      09:23:28.665  READ FPDMA QUEUED
  60 20 a0 20 8a 6f 40 00      09:23:28.665  READ FPDMA QUEUED
  60 10 98 00 8a 6f 40 00      09:23:28.665  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Il faut mettre toutes les copies de console en format “texte préformaté”, comme je viens de le faire en éditant ton message.

Salut
Une info sur l’état global du disque est donnée par la commande

smartctl -H

Exemple

root@debian:/# smartctl -H /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
190 Airflow_Temperature_Cel 0x0022   055   040   045    Old_age   Always   In_the_past 45 (Min/Max 20/46)

root@debian:/# 


test result: PASSED => tout va bien
Ce qui doit être surveillé

If the device reports failing health status, this means either that the device has already failed, or that it is predicting its own failure within the next 24 hours. If this happens, use the ‘-a’ option to get more information, and get your data off the disk and to someplace safe as soon as you can.

Plus d’info https://www.smartmontools.org/browser/trunk/smartmontools/smartctl.8.in

Yes merci à vous. J’ai capté pour le texte préformaté et la commande smartctl -H me retour “passed”.

Donc test global ok et rassurant à première vue.

pour avoir l’historique

smartctl -l selftest

Exemple

 smartctl -l selftest /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      8353         -
# 2  Short offline       Completed without error       00%      6883         -
# 3  Short offline       Completed without error       00%      6373         -
# 4  Short offline       Completed without error       00%      6199         -
# 5  Short offline       Completed without error       00%      3367         -
# 6  Short offline       Completed without error       00%      2694         -
# 7  Short offline       Completed without error       00%      2376         -

Pour retrouver les erreurs journalisées
smartctl -l error

Exemple

 smartctl -l error /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
No Errors Logged

Si la présence de 72 secteurs défectueux (et combien d’autres pas encore détectés ?) ne t’inquiète pas, alors tout va bien…

Tout dépends de comment ça a été traité dans la suite de la vie du disque

Traité par qui/quoi ?

Si tu parles du contrôleur intégré au disque, ça n’a pas été traité. Les secteurs sont toujours illisibles, et à mon avis leur contenu actuel est perdu à jamais. Seule une écriture est susceptible de forcer la réallocation dans un secteur de réserve, et par expérience ce n’est même pas garanti.

Si tu parles de l’administrateur de la machine, alors je doute qu’il ait pris la moindre mesure pour identifier et répertorier les secteurs défectueux afin qu’ils ne soient plus utilisés (ce qui n’empêche pas leur contenu antérieur d’être définitivement perdu au passage).

Donc tu penses que cette explication est erronée

Quand des secteurs instables sont lus avec succès, cette valeur est diminuée.
_ Si des erreurs se produisent à la lecture d’un secteur, le disque va tenter de récupérer les données, puis de les transférer vers la zone de réserve et va marquer le secteur comme réalloué._

Non. Mais d’après mon expérience les conditions nécessaires sont rarement remplies.

“Quand des secteurs instables sont lus avec succès” -> ça n’arrive quasiment jamais
"le disque va tenter de récupérer les données" -> ça ne réussit quasiment jamais

Les attributs n° 5 et 196 sont à 0, indiquant qu’il n’y a eu aucune réallocation.

Bref, il ne faut pas trop compter dessus.

Quelques recherches m’amenent ici

https://www.smartmontools.org/wiki/FAQ#ATAdriveisfailingself-testsbutSMARThealthstatusisPASSED.Whatsgoingon

If the drive fails a self-test, but still has ‘PASSED’ SMART health status, this usually means that there is a corrupted (uncorrectable=UNC) sector on the disk. This means that the ECC data stored at that sector is not consistent with the user data stored at that sector, and an attempt to read the sector fails with a UNC error. This can be a one-time transient effect: a sudden power failure while the disk was writing to the sector corrupted the ECC code or data, but the sector could correctly store new data. Or it can be a permanent effect: the magnetic media has been damaged by a bit of dust, and the sector could not correctly store new data.

If the disk can read the sector of data a single time, and the damage is permanent, not transient, then the disk firmware will mark the sector as ‘bad’ and allocate a spare sector to replace it. But if the disk can’t read the sector even once, then it won’t reallocate the sector, in hopes of being able, at some time in the future, to read the data from it. A write to an unreadable (corrupted) sector will fix the problem. If the damage is transient, then new consistent data will be written to the sector. If the damange is permanent, then the write will force sector reallocation. Please see Bad block HOWTO for instructions about how to force this sector to reallocate (Linux only).

Traduction Google

Si le disque échoue à un autotest, mais a toujours l’état d’intégrité SMART ‘PASSED’, cela signifie généralement qu’il y a un secteur corrompu (uncorrectable = UNC) sur le disque. Cela signifie que les données ECC stockées sur ce secteur ne sont pas cohérentes avec les données utilisateur stockées dans ce secteur, et qu’une tentative de lecture du secteur échoue avec une erreur UNC. Cela peut être un effet transitoire ponctuel: une panne de courant soudaine pendant que le disque écrivait dans le secteur corrompait le code ou les données ECC, mais le secteur pouvait stocker correctement de nouvelles données. Ou cela peut être un effet permanent: le support magnétique a été endommagé par un peu de poussière et le secteur n’a pas pu stocker correctement de nouvelles données.

Si le disque peut lire le secteur de données une seule fois, et que les dommages sont permanents et non transitoires, alors le micrologiciel du disque indiquera que le secteur est ‘mauvais’ et allouera un secteur de réserve pour le remplacer. Mais si le disque ne peut pas lire le secteur une seule fois, il ne réaffectera pas le secteur, dans l’espoir de pouvoir, à un moment donné dans le futur, en lire les données. Une écriture dans un secteur illisible (corrompu) résoudra le problème. Si les dommages sont transitoires, de nouvelles données cohérentes seront écrites dans le secteur. Si le damange est permanent, alors l’écriture forcera la réallocation de secteur. Reportez-vous à Bad block HOWTO pour obtenir des instructions sur la façon de forcer la réallocation de ce secteur (Linux uniquement).

Et la démarche pas à pas pour réparer:

https://www.smartmontools.org/wiki/BadBlockHowto

Tout cela est de la théorie. En pratique, d’après mon expérience c’est loin d’être le cas. Les secteurs illisibles le restent pour toujours si on ne fait rien et l’écriture dans un secteur illisible ne le répare pas toujours.