Debian 11 XFCE: freeze et reboot aléatoires

Bonjour à tous,

Au mois d’août, j’ai installé Debian 11 sur mon PC dont voici la configuration:

  • Gigabyte B450M DS3H
  • AMD Ryzen 7 1700
  • 16 Go RAM DDR4-2666
  • Gigabyte Radeon RX460 4 Go
  • SSD NVMe 256 Go
  • HDD 2*2 To

Au départ, j’avais des soucis de freeze intempestifs du systèmes, en étant sous KDE. J’avais réinstallé le système, en en profitant pour passer sous XFCE, et il tournait alors correctement.

Cependant, depuis quelques semaines, il lui reprends la manie de freezer (redémarrage matériel obligatoire) ou de redémarrer directement de façon brute. Mais cela se produit aléatoirement, il peut fonctionner pendant 1 semaine, ou planter plusieurs fois dans la journée… Et ce, sans utilisation intensive, cela m’arrive en naviguant sur Internet ou même en inactivité…

J’ai regardé un certain nombre de sujets sur le forum, mais n’ai pas réussi à résoudre le soucis. Je vous joins donc des captures d’écrans de logs à un moment où il a freezé:
Capture d’écran_2022-02-02_12-20-04
Capture d’écran_2022-02-02_12-20-33

Je spécifie que j’ai testé tout les composants, et ne vois aucune erreur matérielle. Alors si certains d’entre vous ont des idées…

En vous remerciant par avance,
Bien cordialement.

Bonjour

Tu pourrais commencer par vérifier qu’il ne s’agit pas d’un problème de surchauffe dû à un troupeau de moutons qui serait caché dans le boîtier d’alimentation ou du côté de la carte graphique ou/et carte mère.
Ils sont fait d’accumulation de poussière qui ne se voit pas toujours de l’extérieur, puisque ces moutons aiment bien se cacher.
Par la même occasion, regarde aussi si tes ventilateurs de refroidissement tournent bien.


Ensuite, quand tu auras fait un bon dépoussiérage, et si ça ne s’est pas amélioré,
il te faudrait vérifier l’état de la RAM.
Pour ça, il te faudra installer le paquetage memtester
ou mieux, créer une clef USB de boot avec une image iso de memtest86+ ce qui t’évitera d’avoir à installer un paquetage sur ton système.


Si tout ça n’a encore rien donné, et si par un heureux hasard, tu as un boîtier d’alimentation de rechange, essaye de l’utiliser pour remplacer celui de ta machine.


Ça fait déjà pas mal de chose à faire, mais une fois fait, on aura écarté pas mal de pannes matérielles possibles.


D’autre part, envoie nous plutôt des copiés/collés au format texte, car ce sera plus facilement lisible par ceux qui n’ont pas de bon yeux et dont les machines n’arriveront pas à lire ce qu’il y a dans les images, et puis aussi pour ceux qui ont accès internet à faible débit qui ne pourront pas lire ce fil de discussion, d’autant qu’avec un copié/collé au format texte, les aidants peuvent faire des copiés/collés pour faire des recherches ou simplement pour te répondre, et un bloc de texte ça prends énormément moins de place que des images sur le serveur du forum.

Et puis, dans tes copiés/collés, ne mets pas seulement un extrait bloc de texte sans que l’on puisse savoir quelle a été la ligne de commande qui a retourné ce texte, quel était le prompt qui précédait cette ligne de commande, et quel était le prompt au retour de commande.

Ces informations sont très importantes pour que l’on puisse avoir une idée plus précise du contexte plutôt que de faire une bonne dizaine d’échanges juste pour rien sur un quiproquo stérile résultant de suppositions basées sur des implicites.

C’est donc beaucoup plus simple rapide et efficace de copier/coller de simples blocs de lignes complets.

Et surtout:

  • Tes firmwares sont à jour?
  • Tu n’as pas utilisé de modules kernel en dehors de la branche stable de ton installation?
  • Ton Pilote NVidia est lequel et venu d’où?

ce serait bien aussi d’avoir les logs avant la première image en fait, car il y a là des info qui manquent pour t’aider (et en mode texte plutôt qu’une capture d’écran).

Querl est le retour de la commadne:
cat /proc/sys/kernel/tainted .

Si ce n’est pas 0, utilise les info du lien ci-dessous (notamment l’utilitaire de décodage du tainted).

https://www.kernel.org/doc/html/latest/admin-guide/tainted-kernels.html

je doute qu’un message kernel tainted soit du à de la poussière dans le ventilateur.

Bonjour,

HS mais pas trop :

Chez moi c’est lié à VirtualBox (ligne 12) :
cat /proc/sys/kernel/tainted
6144
|11|_/I|2048|workaround for bug in platform firmware applied|
|12|_/O|4096|externally-built (“out-of-tree”) module was loaded|

Bonjour, je vous remercie pour toutes vos réponses.

Concernant la poussière, il n’y en a pas, j’ai vérifié et le PC ne chauffe pas, 60° en encodage vidéo. Les ventilateurs tournent bien.
J’ai bien sur déjà fais des memtest via une clef USB de boot, aucune erreur. Malheureusement, je ne possède en revanche pas d’autre alimentation (c’est une Corsair RM450 je crois la mienne).

Je vais faire des copier-coller des logs ce soir, n’étant pas chez moi la journée puisque je travaille. La commande était « cat /var/log/syslog ».

En ce qui concerne le firmware, parlez vous du BIOS? Si oui, il n’est pas à jour mais le mettre à jour perdrais la compatibilité avec mon CPU, donc j’ai la dernière version que je peux. Je n’ai pas modifié le noyau. Ce n’est pas une carte NVidia mais AMD Radeon RX460, et j’ai installé les paquets qui m’avaient été conseillés ici:

Donc j’ai installé les paquets suivants:

  • firmware-amd-graphics
  • firmware-linux-free
  • firmware-linux-nonfree
  • xserver-xorg-video-radeon

Concernant Virtualbox, il n’est pas installé sur ma machine (plus depuis que j’ai réinstallé le système), par contre j’utilise VMWare Workstation Pro 16.2. Et d’ailleurs, les crashs ont commencés à survenir lors de l’extinction de ma VM Windows 11, elle s’arrêtais proprement mais au moment de revenir sur l’affichage de la machine hôte elle freezait.
Peut être que cette information peut servir!

En ce qui concerne le retour de commande pour le noyau, je regarde ce soir en rentrant.

Bien cordialement.

Je suis de retour chez moi. Le retour de la commande cat est bien 0.

Concernant les logs, je ne vois pas grand chose du crash d’hier dont je ne me souviens pas de l’heure exacte… Je vous joins la copie de tout les logs:
DS3H-zacharie.log (287,4 Ko)

En vous remerciant par avance.

Arf ! Tu as fait comme moi, tu as lu trop vite ! Relis bien les captures (tout en haut de la première et tout en bas de la seconde), il est Not tainted, le kernel,

À vrai dire, je ne connais pas cette notion de kernel « tained ».

Bonjour,
juste pour dire : ce serait bien d’être sûr.
Et si c’est bien une 450, il est très possible qu’elle soit trop légère.

Rien que pour la carte graphique, il est recommandé 350 W !
(cf : https://www.gigabyte.com/fr/Graphics-Card/GV-RX460WF2OC-4GD/sp#sp)

Il est très probable qu’une 450 W soit trop légère, voire limite, pour la configuration matérielle, qui a en sus trois disques dur à gérer (un SSD et deux HD).

Rien trouvé de spécifique concernant la carte-mère, si ce n’est la mention en rouge, en fin de page, concernant Linux :

On va gager que les noyaux actuels sont capables de gérer correctement le CPU Ryzen et la DDR4 :wink:

Voilà.

Bonjour, je vous remercie de votre réponse.

J’avoue ne pas m’être posé la question, car la carte n’a pas d’alim dédiée… Il est possible qu’elle prenne 350W par le PCIe??

De plus, le PC crashe parfois en très faible utilisation…

Bien cordialement.

Salut,

Avec un « t » supplémentaire : What is a tainted Linux kernel? - Unix & Linux Stack Exchange

Et sinon, la machine, c’est toi qui l’a montée ?

Ça pourrait aussi être extérieur à la machine, genre des parasites importants sur la ligne électrique, et on ne connaît rien de son environnement.
Il y a une grosse différence entre habiter à la campagne et avoir la pièce pc collée à la colonne d’un vieil ascenseur fatigué en plein cœur de ville et cernée par la nouvelle clim’ de la boutique de fringues sur la même distribution électrique, tu vois le truc ?

Oui, c’est moi qui ai monté le PC.

Je suis à Strasbourg en appartement, mais je n’ai pas de soucis avec le réseau électrique, mes autres PC tournent parfaitement. D’ailleurs à l’époque où il freezait tout le temps, j’avais démarré Ubuntu en live-USB et il avait bien tourné.

Arghhh, j’ai oublié de demander « quand ? »

Et sinon, tu pourrais tenter de ne bosser qu’avec 8 Go, si ta machine supporte de n’avoir qu’une barrette.
Et quitte à tripoter les barrettes, un ch’tit coup de lingette à lunettes sur les contacts, en faisant bien attention à

  • ne pas laisser de peluches ;
  • se méfier comme la peste noire des décharges d’électricité statique : on ne travaille pas sur la moquette avec des fringues en synthétique, on se met pieds nus sur le carrelage et avec des fringues 100 % coton.

J’ai l’air de plaisanter mais non, pas du tout : qui ne s’est jamais pris une décharge en faisant une bise à quelqu’un qui est « chargé » ? Nous ça fait « tchic ! » quand le circuit intégré fait « aïe ! » et des fois il est mort, après…

Je l’ai assemblé en juillet, mis en service en août 2021 car ma RAM de base était défectueuse.

Par contre je n’ai qu’une barrette de 16 Go (je sais c’est une erreur)…

Sauf si tu habites à côté d’une usine fabriquant de la poussière, on peut considérer que ça va.
Ne cependant pas perdre de vue l’option « mauvaise série de condensateurs déjà tout gonflés sur la carte-mère » et si tu ne sais pas de quoi je parle, une petite recherche ggl va te faire tomber par terre.

Tu pourrais tenter de la mettre dans un autre slot, si la carte-mère le supporte ?

Combien ça coûte, aujourd’hui, 2x8 Go (oui, je suis un peu déconnecté de ces choses…) ?

Et il faut aussi vérifier que la carte graphique est fermement insérée dans son connecteur PCI, des fois on en voit qui ont envie de sortir.

Je vais essayer pour la RAM, mais je passerai peut être plutôt à 32 quitte à en racheter. Et je n’habite pas à côté d’une usine mais d’une Université!

Concernant la CG j’ai déjà vérifié! Pour l’alim t’en penses quoi toi? Qu’il faut que j’achète plus gros?

Je n’en pense rien pour le moment, il faudrait calculer les consommations de tous les périphériques (dd), de la mémoire, du cpu, et on se rendrait compte qu’ou bien on est limite ou bien on est dans les clous, si on est limite tu devrais avoir le problème depuis le début, si on est dans les clous ça me dépasse, il vient un moment où même le helpeur doit mettre les mains dans le cambouis sur place et à 800 km ça devient compliqué.
Juste être sûr que le pb ne se manifeste que si on branche un truc sur l’usb (= augmentation de conso) ou pas.
Alim neuve aussi ou vieux bouzin du fond du tiroir ?
Attendons d’autres avis…

L’alim n’est pas neuve mais n’avais servi que quelques jours en dépannage auparavant, et non le problème ne surviens pas en touchant au périphériques USB. Je me demande si je vais pas acheter un wattmètre, j’en avais vu a Action, si j’en trouve un pas cher ça permettrait de savoir…
En tout cas j’aurais pas les moyens d’acheter une alim ce mois ci.

la carte graphique est donné pour fonctionner sur une alim de 350w (pas d’ajout d’alimentation donc alimenté par le pci et de souvenir le pci de 3ème génération va jusque 75 w) tu ajoute à ça tes trois disques pour 10w en moyenne et un cpu avec un enveloppe thermique estimé à 65W.

Il n’y a aucun souci côté alimentation.

Par contre ton alimentation peux avoir un souci et les freeze et redémarrage brusque peuvent en être un signe.

Bonjour, je vous remercie également de votre réponse.

Côté software vous ne voyez rien d’anormal?