Sous Debian Buster (10.1, à jour)
-
Noyau 4.19.0-6-amd64
-
Machine: tour PC
-
i7 4790
-
20 GB RAM
-
carte-mère gigabyte z87 (je peux retrouver le modèle exact si nécessaire)
-
Disques durs: SSD Samsung 256GB ou 1TB, full disk encryption
Tout le matériel date de 2013-2014 (le CPU est peut-être plus récent), bon état, utilisation relativement modérée (jamais plus de quelques heures à la suite, la plupart du temps la machine est éteinte).
Description
Depuis quelques temps, j’ai des soucis permanents sur cette machine avec les disques (SDD). Les symptômes sont les suivants:
Peu après le démarrage (parfois tout de suite, parfois après une dizaine de minutes), le noyau commence à me bombarder de ce genre de messages:
[ 7711.979563] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 7711.981020] ata6.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[ 7711.981026] ata6.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[ 7711.981030] ata6.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[ 7711.981767] ata6.00: supports DRM functions and may not be fully accessible
[ 7711.986602] ata6.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[ 7711.986608] ata6.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[ 7711.986612] ata6.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[ 7711.987342] ata6.00: supports DRM functions and may not be fully accessible
[ 7711.990623] ata6.00: configured for UDMA/133
[ 7711.990641] ata6: EH complete
[ 7907.323583] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 7907.325089] ata6.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[ 7907.325093] ata6.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[ 7907.325096] ata6.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[ 7907.325836] ata6.00: supports DRM functions and may not be fully accessible
[ 7907.330632] ata6.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[ 7907.330636] ata6.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[ 7907.330638] ata6.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[ 7907.331378] ata6.00: supports DRM functions and may not be fully accessible
[ 7907.334570] ata6.00: configured for UDMA/133
[ 8022.811615] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
D’après ce que je comprends, le disque est en permanence réinitialisé?
Ca ne s’arrange jamais, et de temps en temps j’ai ceci:
[ 7711.263559] ata6.00: exception Emask 0x50 SAct 0xc0000000 SErr 0x4090800 action 0xe frozen
[ 7711.263563] ata6.00: irq_stat 0x00400040, connection status changed
[ 7711.263567] ata6: SError: { HostInt PHYRdyChg 10B8B DevExch }
[ 7711.263571] ata6.00: failed command: WRITE FPDMA QUEUED
[ 7711.263578] ata6.00: cmd 61/18:f0:18:19:55/00:00:0d:00:00/40 tag 30 ncq dma 12288 out
res 40/00:fc:30:19:55/00:00:0d:00:00/40 Emask 0x50 (ATA bus error)
[ 7711.263581] ata6.00: status: { DRDY }
[ 7711.263583] ata6.00: failed command: WRITE FPDMA QUEUED
[ 7711.263589] ata6.00: cmd 61/08:f8:30:19:55/00:00:0d:00:00/40 tag 31 ncq dma 4096 out
res 40/00:fc:30:19:55/00:00:0d:00:00/40 Emask 0x50 (ATA bus error)
[ 7711.263591] ata6.00: status: { DRDY }
[ 7711.263595] ata6: hard resetting link
Ou encore ceci (link down/link up, là ça freeze le temps que ça revienne en up, j’ai déjà eu des fichiers corrompus à cause de ça):
17820.977874] ata6: SATA link down (SStatus 0 SControl 300)
[17826.332780] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
Encore une précision: lorsqu’il y a plusieurs disques connectés à cette machine, le système les “réinitialise” tous en même temps (dans l’exemple ici il n’y a qu’un disque, mais s’il y en a plusieurs il y a les mêmes messages pour tous les disques).
Recherches et premiers éléments de réponse
-
Ce n’est pas lié à un disque en particulier: lorsque j’utilise une autre installation buster sur un autre SSD sur cette même machine, j’ai exactement les mêmes problèmes. A l’inverse, lorsque j’utilise le SSD utilisé en général avec cette machine sur une autre machine, je n’ai aucun problème. En conclusion, j’exclue la possibilité d’un disque fautif.
-
Ce n’est pas lié à une version du noyau en particulier: je suis actuellement sur 4.19.0-6, j’avais exactement le même problème sur les versions précédentes et sous stretch (j’ai d’ailleurs mis à jour la machine sous buster en espérant que ça résolve le problème)
-
Ce n’est probablement pas lié au cablâge: j’ai essayé les différents câble SATA et d’alimentation, le problème est toujours le même (à moins qu’ils soient TOUS défectueux, mais c’est quand même très improbable non?)
-
Ce n’est apparemment pas lié à une mauvaise configuration SATA au niveau du BIOS: les périphériques SATA y sont bien configurés en AHCI (j’ai vérifié suite à une suggestion trouvée sur un forum)
Autres recherches et pistes de réflexion
-
Sur Google, les quelques résultats obtenus font tous référence à des causes très différentes. Pour l’instant je n’ai rien trouvé de très fructueux.
-
J’ai pensé peut-être à un problème d’alimentation défectueuse? Comment vérifier cela?
-
Autre possibilité: un problème au niveau du driver SSD Samsung ou quelque chose comme ça (les deux SSD testés sont des Samsung)? -> je dois encore tester avec une installation Buster sur HDD classique, voir si ça change quelque chose. Mais il y a encore quelques mois je n’avais pas ce genre de problèmes, ce qui me fait quand même penser à une erreur matériel…
-
Se pourrait-il que la carte-mère soit défectueuse? Comment vérifier cela?
Voilà où j’en suis pour le moment, toute aide ou suggestion est bienvenue