On peut voir que le disque est connecté à un contrôleur SATA Nvidia nForce géré par le pilote sata_nv.
Il n’y a qu’une seule erreur directement liée au disque :
Jun 7 04:26:44 kernel: [ 168.940082] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 7 04:26:44 kernel: [ 168.940087] ata1.00: failed command: READ DMA
Jun 7 04:26:44 kernel: [ 168.940094] ata1.00: cmd c8/00:08:00:20:a8/00:00:00:00:00/e4 tag 31 dma 4096 in
Jun 7 04:26:44 kernel: [ 168.940094] res 40/00:00:4e:00:00/00:00:0d:00:00/e0 Emask 0x4 (timeout)
Jun 7 04:26:44 kernel: [ 168.940096] ata1.00: status: { DRDY }
Jun 7 04:26:44 kernel: [ 168.940101] ata1: hard resetting link
Jun 7 04:26:44 kernel: [ 168.940102] ata1: nv: skipping hardreset on occupied port
Jun 7 04:26:45 kernel: [ 169.412065] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Jun 7 04:26:45 kernel: [ 169.419574] ata1.00: configured for UDMA/100
Apparemment il s’agit d’un time-out, le disque n’a pas répondu à une commande dans les temps. Cela peut arriver quand le disque, le contrôleur SATA ou la connectique est défectueux ou en cas d’incompatibilité spécifique entre deux éléments. Normalement le noyau réinitialise la chaîne et recommence, mais ici la suite est moins habituelle : il y a deux WARNING dans le sous-système libata du noyau lui-même :
Jun 7 04:26:45 kernel: [ 169.419609] WARNING: CPU: 0 PID: 70 at /build/linux-EbeuWA/linux-4.9.130/drivers/ata/libata-eh.c:4088 ata_eh_finish+0xdb/0xe0 [libata]
...
Jun 7 04:26:45 kernel: [ 169.419815] WARNING: CPU: 0 PID: 70 at /build/linux-EbeuWA/linux-4.9.130/drivers/ata/libata-eh.c:609 ata_scsi_error+0xd6/0xe0 [libata]
Je ne sais pas interpréter ces messages mais d’après la trace des appels dans la pile (call trace), ils se produisent au cours du traitement de l’erreur initiale.
Ensuite, il y a des messages répétitifs signalant que le processus pvscan, qui sert à rechercher les volumes physiques LVM sur les disques, est bloqué depuis plus de 2 minutes :
Jun 7 04:29:59 kernel: [ 363.488077] INFO: task pvscan:6211 blocked for more than 120 seconds.
A noter que le précédent scan des disques par l’installateur pour localiser ses propres fichiers n’a pas provoqué d’erreur de ce type.
C’est probablement ce qui bloque le démarrage de partman, l’outil de partitionnement de l’installateur Debian. Et apparemment toute tentative d’accès à ce disque par un autre programme est également bloquée comme on peut le voir avec blkid :
Jun 7 04:38:02 kernel: [ 846.816175] INFO: task blkid:6272 blocked for more than 120 seconds.
Tout ce blabla pour dire que je n’ai pas d’explication précise. Ce serait bien de pouvoir tester le disque dans une autre machine (et vice versa).