Message du kernel et méchant plantage sous Etch

Bonjour,

Je ne pense pas que mon problème soit spécifique à Debian, néanmoins, je ne sais pas d’où cela peut venir.
Depuis que j’ai fait la poussière dans les entrailles de mon ACER 5672, il a prit l’habitude de freezer un peu n’importe quand, sans prévenir et quelque soit la tâche sur laquelle je travaille, voire en idle.
Je crois que lorsque je l’ai remonté, j’ai omis de remettre de la pâte thermique et il est bien possible que l’évacuation de la chaleur ne fonctionne plus correctement. Fort de ce constat, et après avoir changé la ram et le disque dur (les deux étant aussi soupçonnables pour des raisons aussi diverses que barbares), j’ai remis de la pâte thermique sur le processeur, et sur le gpu, puisque le CPU, le GPU et le chipset (north-bridge et south-bridge il me semble) sont refroidis par le même dispositif. Sans succès.
Un peu déséspéré, et ayant remarqué qu’avant de planter, la console affiche des traces bien peu rassurantes comme celle jointe en fin de message, j’ai changé le processeur T2300 d’origine par un T2400 d’occasion sur ebay; ça a été une résurrection : plus un (peu de) plantage… jusqu’à hier soir.

Hier soir donc, après avoir fait ma petite mise à jour traditionnelle, et pendant une petite session de formation à Linux à ma maman qui n’a jamais touché un ordi et qui a bien du mal à saisir le concept de clic-gauche et clic-droit, je retrouve un freeze comme celui de mes cauchemars d’antan… et à nouveaux, plus rien à faire. Après un plantage, memtest ne peut même pas fonctionner plus de 3 minutes, même en ayant remplacé la ram par des barettes sans histoires.

Quelque autres infos :
[ul]
[li]La solution du windozien de base, la réinstall, ne fonctionne pas : plantage avant la fin.[/li]
[li]Le problème a commencé à apparaître lorsque j’utilisais le noyau normal de lenny, le 2.6.26, lorsque je passais des photos en diaporama avec fspot. Au début, redémarrer X avec ctrl-alt-backspace suffisait à repartir. Puis, ça a commencé à arriver un peu n’importe quand, mais immanquablement lors du diaporama fspot, et lorsqu’un plantage arrivait, il n’y avait rien à faire que de forcer l’arrêt du PC et attendre ou retirer batterie + alimentation; sans quoi même memtest refusait de fonctionner.[/li]
[li]Depuis que j’ai réutilisé le 2.6.18-4, ça a recommencé à bien fonctionner pendant un temps, puis ce matin, plus rien à faire.[/li]
[li]Le processeur reste à une température normale : le module thermal et /proc/acpi/thermal_zone/THM/temperature ne monte jamais au dela de 60°, même avec glxgears qui tourne (sans accélération graphique). Quid de la température du GPU.[/li][/ul]

J’ai la vague impression que le problème vient du kernel; ou tout du moins, que le problème se manifeste de différentes façon en fonction du kernel utilisé.
Le infos que j’ai eu en gougueulant en partant du message du kernel est un message qui se plaind de mm/slab.c:595, lorsqu’on branche par usb un téléphone portable; ce qui n’est absolument pas mon cas.

Après cette introduction, ma question : d’où cela peut-il bien venir ? Comment puis-je vérifier la température du gpu (ATI mobility radeon X1300) ? Où est-ce que je peux avoir plus d’info ?
Question subsidiaire : est-ce que mon ordi est définitivement kaputt ou est-ce que j’ai un espoir de pouvoir m’en servir à nouveau un jour, à peu près normalement ?

Et pour finir, les petites infos plus ou moins pratiques :

Message du kernel (2.6.18-4 de debian etch, sous debian lenny) :
Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: SMP

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: eax: 00000001 ebx: f79c9d80 ecx: f6c36900 edx: c1800000

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: EIP is at kfree+0x2e/0x65

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: esi: 00000202 edi: 00000001 ebp: 00000400 esp: f6433f3c

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: ------------[ cut here ]------------

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Call Trace:

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Process hald (pid: 3242, ti=f6432000 task=dffe5550 task.ti=f6432000)

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: 00000000 00000000 00000000 c0162120 00000000 00000000 f79c9d80 c0174a03

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: invalid opcode: 0000 [#1]

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: ds: 007b es: 007b ss: 0068

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: kernel BUG at mm/slab.c:595!

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: CPU: 0

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Stack: f79c9d80 f6342d80 00000001 c0174b14 08094c40 f79c9d80 f6342da0 c014f461

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Code: 56 89 c7 53 74 58 9c 5e fa 8d 90 00 00 00 40 c1 ea 0c c1 e2 05 03 15 70 03 37 c0 8b 02 f6 c4 40 74 03 8b 52 0c 8b 02 84 c0 78 08 <0f> 0b 53 02 a1 b0 29 c0 89 e0 8b 4a 18 25 00 e0 ff ff 8b 40 10

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: EIP: [] kfree+0x2e/0x65 SS:ESP 0068:f6433f3c

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: kernel BUG at mm/slab.c:595!

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: 08094c40 00000400 c015a71c f6433fa4 f79c9d80 fffffff7 00000400 f6432000

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: invalid opcode: 0000 [#2]

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: SMP

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: CPU: 0

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: 000037ff 00000010 c011ead3 00000000 00000000 df9bb780 dffe5550 00000001

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: EIP is at kfree+0x2e/0x65

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Stack: f6342d80 f6c36900 f66464a4 c01744b0 00000010 c01744ed 00000010 f79c9d80

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Code: 56 89 c7 53 74 58 9c 5e fa 8d 90 00 00 00 40 c1 ea 0c c1 e2 05 03 15 70 03 37 c0 8b 02 f6 c4 40 74 03 8b 52 0c 8b 02 84 c0 78 08 <0f> 0b 53 02 a1 b0 29 c0 89 e0 8b 4a 18 25 00 e0 ff ff 8b 40 10

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: EIP: [] kfree+0x2e/0x65 SS:ESP 0068:f6433d9c

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Process hald (pid: 3242, ti=f6432000 task=dffe5550 task.ti=f6432000)

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: esi: 00000202 edi: 00000001 ebp: f4c774b0 esp: f6433d9c

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: Call Trace:

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: eax: 00000001 ebx: f6342d80 ecx: f6342d80 edx: c1800000

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: ds: 007b es: 007b ss: 0068

Message from syslogd@ysalis at Fri Dec 26 13:29:51 2008 …
ysalis kernel: c015ae41 df826440 f79c9d80 df9bb780 00000000 df9bb788 c01589aa df9bb780

Machine : acer aspire 5672 wlmi
Noyau : Linux ysalis 2.6.18-4-686
OS : Debian lenny (bien propre : installation exclusivement par apt-get sur les dépôts officiels ou module-assistant, malgré quelques petits mélanges etch/lenny comme le noyau; absolument aucune installation à partir de sources brutes en tar.gz)
Activité lors du crash : n’importe quelle activité, voir rien du tout (gnome en idle)

Où pourrais-je en savoir plus sur ce qui m’arrive ?

hi,

Vu que tu as du matos récent, test en mettant un kernel plus récent.

La carte mère n’aurait pas pris un coup dans la tronche ?
Essaye une restauration par défaut du Bios ou regarde si le constructeur de ta carte mère ne fourni pas une mise à jour.
Etch fournie un kernel 2.6.24 (linux-image-2.6-486-etchnhalf), regarde aussi de ce côté.

Salut,

Personnellement, je vérifierais que tous les endroits où j’ai mis les doigts, les contacts sont bien à fond de gorge puis je lancerais un memtest avant d’aller me coucher.
Il faut que le lendemain matin tout fonctionne encore :slightly_smiling:

Et la prochaine fois il est inutile de tout démonter, le ménage n’est utile qu’au niveau des ventilos/radiateurs.

A ta place pour m’assurer qu’il sagît bien d’un problème hardware et non de mon kernel, je ferais un test prolongé de mon PC en installant un livecd (kaella, knoppix…).

Si le PC ne “freeze” pas, tu pourras en conclure que ton soft installé est responsable.

Et l’inverse bien sûr.