Noyau Aptosid source d'instabilité ?

Bonjour,

En préparation d’un changement de portable, j’ai installé sur ma Debian Sid le noyau aptosid, actuellement en 3.6-9.slh.1-aptosid-amd64.

Depuis, mais cela n’a probablement rien à voir, j’ai au moins une fois par jour des problèmes d’accès disque, qui se soldent en général par un système de fichier qui passe en lecture seul, et donc un redémarrage avec vérification du système de fichier.

J’ai déjà eu ce genre de désagrément il y a quelques mois, et cela avait disparu comme c’était apparu.

J’ai fait les tests SMART simples et poussés sur le disque dur, rien à signaler.

Bien sûr, comme j’étais bien réveillé ce matin, je n’ai pas pensé à copier les logs sur une clé usb, les erreurs n’ayant pas pu être enregistrées pour cause de système de fichier en lecture seule :030

Je précise que parfois la lumière signalant que le portable est allumé baise d’intensité, et que cela s’accompagne par le rétro-éclairage de l’écran qui clignote :013 En appuyant sur la lumière cela revient à la normal.

Bref, je pense qu’il est temps de changer de portable, mais l’intendance a du mal à suivre, ah ces services informatiques ! :mrgreen:

Tout ça pour demander si un noyau peut être à l’origine d’un comportement bizarre du sous-système sata (je suppose), et si on a des moyens de le confirmer ou de l’écarter.

Ce soir je démarrerais mon portable sur le noyau 3.2.0 de Sid, je verrais si j’ai les mêmes soucis.

Usti

Bonjour,

Après une fin de semaine et un week-end sur le noyau Debian officiel, ce matin je repars sur le noyau aptosid, et paf, comme dirait le chien : le système de fichier se remonte en lecture seule !

Cette fois-ci j’ai copié les jounaux avant de redémarrer :

[quote=“dmesg”][ 2408.704087] ata1.00: exception Emask 0x0 SAct 0x3ff SErr 0x0 action 0x6 frozen
[ 2408.704094] ata1.00: failed command: WRITE FPDMA QUEUED
[ 2408.704101] ata1.00: cmd 61/00:00:68:d3:18/04:00:0e:00:00/40 tag 0 ncq 524288 out
[ 2408.704101] res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[ 2408.704105] ata1.00: status: { DRDY }
[ 2408.704108] ata1.00: failed command: WRITE FPDMA QUEUED
[ 2408.704115] ata1.00: cmd 61/00:08:68:d7:18/04:00:0e:00:00/40 tag 1 ncq 524288 out
[ 2408.704115] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)[/quote]

Puis plus loin :

[quote=“dmesg”][ 2408.704226] ata1: hard resetting link
[ 2414.058044] ata1: link is slow to respond, please be patient (ready=0)
[ 2418.750049] ata1: COMRESET failed (errno=-16)
[ 2418.750059] ata1: hard resetting link
[ 2424.104036] ata1: link is slow to respond, please be patient (ready=0)
[ 2428.796083] ata1: COMRESET failed (errno=-16)
[ 2428.796090] ata1: hard resetting link
[ 2434.150042] ata1: link is slow to respond, please be patient (ready=0)
[ 2463.832048] ata1: COMRESET failed (errno=-16)
[ 2463.832057] ata1: limiting SATA link speed to 1.5 Gbps
[ 2463.832059] ata1: hard resetting link
[ 2466.738080] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[ 2466.740694] ata1.00: ACPI cmd ef/10:03:00:00:00:a0 (SET FEATURES) filtered out
[ 2466.752437] ata1.00: ACPI cmd ef/10:03:00:00:00:a0 (SET FEATURES) filtered out
[ 2466.752620] ata1.00: configured for UDMA/133
[ 2466.763076] ata1.00: device reported invalid CHS sector 0
[ 2466.763084] ata1.00: device reported invalid CHS sector 0[/quote]

Et ensuite :

[quote=“dmesg”][ 2466.763195] Buffer I/O error on device sda5, logical block 18042880
[ 2466.763200] Buffer I/O error on device sda5, logical block 18042881
[ 2466.763202] Buffer I/O error on device sda5, logical block 18042882
[ 2466.763204] Buffer I/O error on device sda5, logical block 18042883
[ 2466.763207] Buffer I/O error on device sda5, logical block 18042884
[ 2466.763209] Buffer I/O error on device sda5, logical block 18042885
[ 2466.763211] Buffer I/O error on device sda5, logical block 18042886[/quote]

Et enfin encore plus loin :

[quote=“dmesg”][ 2466.765305] ata1: EH complete
[ 2466.919113] Aborting journal on device sda5-8.
[ 2466.990254] EXT4-fs (sda5): Remounting filesystem read-only
[ 2466.990261] EXT4-fs error (device sda5) in ext4_free_blocks:4702: IO failure
[ 2466.991399] EXT4-fs error (device sda5): ext4_journal_start_sb:349: Detected aborted journal
[ 2466.991554] EXT4-fs error (device sda5) in ext4_da_writepages:2398: IO failure
[ 2466.992836] EXT4-fs error (device sda5) in ext4_reserve_inode_write:4550: Journal has aborted
[ 2466.993001] EXT4-fs error (device sda5) in ext4_reserve_inode_write:4550: Journal has aborted
[ 2466.993182] EXT4-fs error (device sda5): ext4_journal_start_sb:349: Detected aborted journal
[ 2466.993369] EXT4-fs error (device sda5) in ext4_ext_remove_space:2793: Journal has aborted
[ 2466.993749] EXT4-fs error (device sda5) in ext4_reserve_inode_write:4550: Journal has aborted
[ 2466.993907] EXT4-fs error (device sda5) in ext4_ext_truncate:4343: Journal has aborted
[ 2466.994061] EXT4-fs error (device sda5) in ext4_reserve_inode_write:4550: Journal has aborted
[ 2466.994221] EXT4-fs (sda5): ext4_da_writepages: jbd2_start: 1024 pages, ino 2622911; err -30
[ 2466.994743] EXT4-fs error (device sda5) in ext4_orphan_del:2491: Journal has aborted
[ 2466.994907] EXT4-fs error (device sda5) in ext4_reserve_inode_write:4550: Journal has aborted
[ 2468.133344] JBD2: Detected IO errors while flushing file data on sda5-8[/quote]

Le fichier complet est sur http://paste.debian.net/hidden/69fc2297/ (pendant 90 jours)

Je précise que le disque ne semble pas en mauvais état, j’ai refais pendant le week-end les tests smart qu’il passe sans problème.

Bon, vivement que mon nouveau portable soit commandé … :114

Usti

Salut,

AMHA le noyau n’a pas grand chose à voir dans ce cas précis :slightly_smiling:
Tu es le premier à le signaler, à suivre !

Bonjour,

Mon titre était un peu provocateur, je le reconnais volontier, je ne pense pas non plus que le noyau soit en cause, au pire un bogue au niveau d’un pilote avec mon matériel, peut être exacerbé par une option de ce noyau non présente dans les noyaux Debian.

Je sais qu’en avril / mai dernier j’ai déjà eu des problème de gèle/dégèle pour cause de contrôleur sata qui partait à la pêche aux moules, puis revenait avec la marée, peut être lors de mon premier passage en 3.x.x.

À l’époque j’avais fini pas trouver des infos comme quoi cela devait provenir du bios qui n’était pas totalement conforme aux spécifications, et qui répondait de manière aléatoire aux demandes du noyaux quant à la vitesse du port sata, d’où le comportement bizarre ensuite.

Et puis un jour ce problème avait disparu, j’avais supposé que les développeurs du noyaux avaient trouvé un contournement.

L’objet initial de ce message était plutôt la curiosité, entre autre de savoir s’il existait des outils pour aller un peu plus loin que ces fichiers de log pour déterminer d’où provenait le problème, et éventuellement faire remonter l’info aux développeurs concernés.

Je marque donc le sujet comme résolu, d’autant que mon nouveau portable es maintenant commandé.

Usti

Salut,

Je ne suis ni développeur, ni sponsor d’aptosid et donc les provocations ne peuvent m’atteindre :slightly_smiling:
Mais tu connais le proverbe “médisez, médisez encore, il en restera toujours quelque chose”. Il est d’autant plus vrai depuis que nous avons inventé l’Internet et les réseaux sociaux.
Evitons donc les provocations inutiles :slightly_smiling:

Le 3.6.9 est un noyau de développement, si tu veux un noyau récent stable, prend le stable de kernel.org et compile le, tu n’auras pas ces soucis. Pour retrouver un noyau debian, tu peux intégrer aufs (que debian met d’office, j’ignore si aptosid le fait) et récupérer son fichier de configuration.

Oui, c’était pour essayer, je vais avoir besoin d’un noyau > 3.3, avec les outils ad-hoc pour compiler les modules virtualbox, ce qui n’existe pas chez Debian actuellement. Et j’avais la flemme de compiler mon propre noyau :116

Mais c’est un autre sujet :mrgreen:

Usti

Salut,

Je confirme que le 3.6.9 de aptosid supporte très bien VirtualBox :slightly_smiling:

J’ai fait la même constatation :023

En faisant le tri dans mes signets j’ai retrouvé le fil qui parlait du problème de bios et de vitesse sata : https://linuxfr.org/forums/g%C3%A9n%C3%A9ralhors-sujets/posts/carte-m%C3%A8re-hs

Usti