[Plantage] - Besoin d'un diagnostic

Bonjour,

J’ai récemment eu un problème avec mon PC sous Debian Wheezy :
https://www.debian-fr.org/plantages-brutaux-et-sans-traces-t51051.html

Cette fois, j’ai un autre problème, assez similaire :

Mon PC plante, parfois, brusquement.
Il n’y a rien dans les logs.
Je n’ai aucun moyen de provoquer le bug.
Cela est arrivé sous Chrome, sous Firefox, une fois sous Blender, et assez souvent (en général, après que ce soit arrivé), au log sur KDM.
Par exemple, je tape mon mot de passe, et au bout de quelques caractères, ça plante. Parfois, c’est quand ça commence à se logger.

Aujourd’hui, ça ne m’est pas arrivé, jusqu’à ce soir. Je regardais un film, j’ai mis pause, et impossible à relancer.

À chaque fois, c’est pareil : l’image reste telle quelle et plus rien ne répond. En revanche, je sais que ce n’est pas la souris ou le clavier qui se déconnectent parce que les pages “animées” (comme les smileys à gauche) restent fixe.

J’ai changé la pile de la CM ; aujourd’hui, j’ai beaucoup utilisé la carte graphique pour un rendu gourmand sous Blender, je n’ai eu aucun souci.

Là, j’essaie KDE avec Openbox et je vais garder ça pendant un moment histoire de voir si ce n’est pas Plasma qui fait planter.

J’ai le noyau 3.16 (j’avais le 3.14 avant) avec les drivers propriétaires nvidia.

J’ai changé l’alimentation récemment. Honnêtement, je ne vois pas d’où cela peut venir. Je fais donc appel à vos intuitions en attendant de poursuivre les tests de mon côté. Je vais essayer un stress-test, également.

Merci à vous pour votre attention. :slightly_smiling:

EDIT : Même avec Openbox, ça vient de replanter. Toutes mes températures sont normales.

EDIT FINAL : Le changement de carte-mère et de processeur a réglé tous les problèmes.

Vraiment rien du tout dans le /var/log/messages ? A l’heure précise du plantage ? Des fois on peut trouver quelque chose quelques secondes avant.

Non, rien du tout. Je viens d’éplucher les logs aux heures de plantage, et il n’y a rien du tout.

Petits détails :

J’ai eu le problème aussi avec le noyau 3.2.
Je n’avais pas le problème pendant des mois (ni avec le noyau 3.2, ni avec le 3.14)
Je dirais que KDE se comporte un peu “bizarrement”. C’est des détails, mais par exemple, krunner (altf2, l’appel de commande) n’affiche pas les résultats comme d’habitude. Je viens de lancer Chromium, et d’habitude, il me propose Chromium - Navigateur blabla avec l’icône et tout. Cette fois, il y avait juste “exécuter chromium”.

J’ai le problème avec plusieurs utilisateurs, la configuration d’un .kde n’est pas en cause, du coup. Je tente un stress-test ce matin. :slightly_smiling:

EDIT : Je tenais à signaler aussi que j’ai fait beaucoup de calculs CPU sous Blender (fluides, etc) pendant la journée, ça n’a causé aucun problème. Pourtant, ça prend beaucoup de RAM et de ressources.

EDIT 2 : Un stress CPU n’a rien donné. Il est temps d’un memtest (mais j’en ai fait un y’a 15 jours, sans problèmes).

Et tu viens de changer la carte graphique ! Bigre…

Une petite expérience qui m’est venue à l’esprit, as-tu le moyen d’écouter de la musique en permanence ? Je pense aux flux radio, si tu as l’habitude de les prendre, et très bas si cela te gêne ; le but de la manip serait de voir, ou plutôt plutôt d’entendre si la musique continue toute seule au prochain plantage ou non.

Si on retombe sur la carte graphique, ça se complique… Question de contrôleur, de bus, de compatibilité ?

Je peux déjà te dire que j’ai fait l’expérience avec de la musique : elle s’arrête simplement, suivi du souffle habituel dans les hauts-parleurs (léger souffle qui signifie qu’il y a un courant électrique, mais pas de données).

La carte graphique n’a pas été changée, mais elle n’a que quelques mois. Je pensais bien à elle, mais plusieurs drivers, noyaux, et même tests prolongés (par exemple, sous Blender, elle est demandée en permanence) ne la font pas flancher.

Merci pour tes suggestions. :slightly_smiling:

Hello !

Dommage de ne pas avoir relancé ta discussion d’il y a quelques jours, car nous t’avions tous donné bien d’autres pistes que nous allons devoir redévelopper ici sûrmeent, pas grave, t’en toujours ennuyé et c’est ça le vrai problème.

De ton message au dessus, je n’ai repris qu’un seul de tous les points que nous t’avions donc donné ; la carte graphique.

Tu as eu, dans cette autre discussion (je m’arrête de le dire maintenant), de très bons résultats de stabilités me semble-t-il avec une autre carte graphique : plantages-brutaux-et-sans-traces-t51051.html (tout en bas, à ton avant dernier message de la page 1, tu nous disais qu’avec ton autre carte graphique tu n’avais rencontré aucun bugs).

Je ne peux que te recommander la même chose, faire tes tests sur la durée, et bien sûr commencer par faire ces tests sur la durée, avec cette autre carte graphique qui ne déconne pas.

Ensuite tu l’auras compris, il se peut qu’avec cette autre carte graphique, moins puissante peut-être, elle tire moins sur la carte mère, et que du coup tu n’aies plus de plantage… Mais que ça vienne de la carte mère fianlement quand même.

Alors je te propose ce deal :

Tu fais ton test carte graphique disons sur six jours pleins, comme ça, si tu n’as aucun plantage tu peux passer à l’étape deux de mon plan :

_envoyer ta carte graphique à la garantie, car si ils voient qu’elle déconne plein pot, ils te la remplacent, et si ils voient qu’elle fonctionne à merveilles, tu te dirigeras vers la carte mère.

Mais au moins, ta carte graphique sera passée sur leur banc d’essais… Voili, voilou…

Il pourrait-être sympa d’installer monit (dans les dépot). ça te permetras de voir si au moment du plantage ou juste avant il y a eu une augmentation de mémoire/cpu/io/temperature

J’ai déjà vu ça sur des pc portable en ssd avec une partition cryptée, mais le problème n’a jamais été réglé…

SylvainMuller > Si j’ai fait un nouveau sujet, c’est parce que je considère que le problème est “différent” et que l’autre était “résolu”, en fait. Je n’ai pas oublié tout ce qui a été dit sur l’autre sujet, j’ai commencé par faire, toute la journée, tourner fortement la carte graphique “suspecte”, pour affiner le diagnostic et force est d’avouer que rien ne se passe. (Contrairement à l’autre problème où ça avait plus tendance à planter sous Blender)

Aussi, je comptais bien sûr la changer et tester avec l’autre pendant plusieurs jours, mais je n’utilise pas l’autre dans les mêmes conditions, donc, ça biaise un peu le test. Enfin, si le bug arrive avec l’autre, c’est sûr que la carte graphique sera mise hors de cause. Pour cela que j’ai préféré tester celle-ci un peu avant.

De plus, je préfère demander l’avis des gens, souvent il y a une bonne idée qui ressort, un diagnostic que quelqu’un n’avait pas vu, etc, c’est toujours mieux qui “répéter de mon côté la même erreur et ne pas m’en rendre compte”.

J’ai aussi fait quelque chose : j’ai débranché TOUS les trucs inutiles dans ma tour. Le bouton reset, les ports USB en façade, la sortie audio en façade, etc ! Je me suis dit qu’un court-circuit peut arriver et que c’est ce qui peut causer ce genre de bugs. Qu’en penses-tu ?

tof > Ah, je ne connaissais pas ! Je regarde ça, ça peut être bien utile au cas-où. Enfin, il n’y a aucun “signe”, ça arrive d’un coup, juste comme ça. Il n’y a rien dans les logs, donc, à voir, ça se teste, merci. :slightly_smiling:

Yep, c’est une bonne chose l’ami ! J’ai été un grand dézingueur de matos (cartes graphiques, carte mère, CPU qui partent en fumée !) quand j’étais pendant des années un overclockeur frapadingue, et un utilisateur H24/7 du logiciel Folding@Home(je possédai une ferme de calcul intensif avec ce logiciel de Calculs Partagés qui était branché sur chaque machine H24), et j’ai fréquenté leur forum (Folding@Home) des années…

On a vu toutes les causes, dont l’étage d’alim de la carte graphique qui bousillait les unes derrières les autres les alims qu’on lui collait, du coup, c’est vrai que rien que pour ça, je ne rechignerai pas devant un retour SAV direct en expliquant bien la panne (comme je t’avais dit dans ton autre discussion).

Comme je te l’ai expliqué dans mon précédent message (juste au dessus), les SAV constructeur ont leurs machines de bench bien spécifiques, ils vont te la tester dans tous les sens, et là soit ils l’identifient comme carrément overdosée et que c’est pas normal pour son âge et te la changent vu qu’elle est garantie, soit, ils te la renvoient et tu pourras être quand même beaucoup plus sûr, voir carrément certain, que ça vient pas d’elle.

Et dans ce cas, moi je dirais, carte mère qui coupe sec, (un condo malade), ça aussi, on la vu je ne sais pas combien de fois.

Je ne vois pas d’autre chose pour le moment, mais je surveille ta discussion, comme tu dis, à plusieurs cerveaux ça peut aller beaucoup plus vite (que dans le mien, et sans beaucoup forcer en plus, on s’en sera rendu compte :wink: )

@ toute !

J’ai eu un bug ce midi, malgré tous les composants débranchés, aussi, j’ai mis la nouvelle carte graphique (avec le driver libre mais le paquet firmware-linux-nonfree pour des performances correctes avec celui-ci). Je vous tiens au courant. :wink:

Le problème, c’est que j’habite assez loin du revendeur (ça engrange certains frais, mais surtout, c’est contraignant d’y aller, il y a presque 3 heures de route), du coup, je repoussais sans arrêt, mais si je n’ai aucun problème jusque samedi, j’irai leur ramener la carte graphique, t’as raison. :slightly_smiling:

En revanche, si d’ici samedi, ça replante, je crois que je devrai investir dans une nouvelle CM, voire un nouveau processeur.

Bon, ça a planté avec l’autre carte graphique.

Alors, pour résumer :

J’ai fait un rendu Blender qui n’utilise pas la carte graphique (juste le CPU), ça a planté.
Au démarrage, j’ai eu un kernel panic.

Ensuite, ça a replanté sous Iceweasel.
Je n’arrive plus provoquer le bug, mais comme d’hab’, je dirais…

Voilà. :slightly_smiling:

Bugs récurrents ce matin, après un memtest négatif.

Le PC coupe souvent, mais cette fois, il laisse un message (l’écran ne reste pas fixée sur une image).

Franchement, je ne sais plus quoi faire. :confused:

Je constate qu’il y a eu 4 nouvelles versions de BIOS proposées par ASUS :

1101 2010/11/12 -> Update LAN option ROM to 2.35
1102 2010/12/31 -> Fix the issue that CPU ratio may drop to 4x when Load line calibration is enabled.
1202 2011/03/18 -> Improve EPU function.
2001 2011/04/22 -> Improve the performance of SATA5/6 Ports under IDE Mode.

la version que tu utilise actuellement est la 1005.

Ah, pas bête, je vais essayer une mise à jour. Cependant, est-ce que cela explique que je n’ai pas eu de bugs pendant des mois/années et que d’un coup, ils surviennent ?

Je n’en sais rien du tout, les problèmes n’ayant pu être bien définis, mais ça ne coûte rien d’essayer.

En tout cas, la mise à jour est effectuée, je préviendrai si le bug réapparaît. :slightly_smiling:

Merci pour la piste. :wink:

Bon, le bug est réapparu…! :confused:

Personnellement, s’il y a la place sur le disque, je tenterai bien une deuxième installation d’un système tout neuf qui tiendra compte de cette nouvelle version du BIOS (sans écraser la première).
Grub permettra de choisir de démarrer la dernière installation ou l’ancienne.

Comme tu l’a déjà fait, au cas où le problème serait causé par la panne d’un des périphériques externe (Disque, clef USB, clavier, souris, cordon USB, etc), ça serait bien aussi de faire un test avec le minimum de périphériques connectés.

NOTE : Sur ma machine, je n’utilise en général pas plus de 10 Gio pour chaque système (dont 50% restent disponibles).
Puis j’ai créé des liens vers les répertoires d’une partition commune à chaque système pour les répertoires [mono]Téléchargements[/mono], [mono]Vidéos[/mono], [mono]Documents[/mono], [mono]Images[/mono], [mono]Musique[/mono].

Mais bon, on en est pas là : Il faudrait d’abord être sûr que ce ne soit pas un problème matériel, alors, juste pour tester si le problème est toujours là.

J’avais un vieux disque dur IDE, j’y ai installé Ubuntu, pour tester.

Je n’ai pas eu de bug pendant l’utilisation de celui-ci (pas utilisé assez longtemps, aussi), mais en revanche, j’en ai eu un pendant l’installation, donc, ça revient à peu près au même.

À noter que c’était au moment où j’ai débranché la clé USB (à la fin de l’installation).

Pas de bugs depuis plusieurs jours, sous le système avec la carte graphique remplaçante qui buggait il y a encore quelques jours. Court-circuit ?