Freeze hardware

Bonjour,

J’ai un nouveau PC qui marche globalement bien mais qui me fait des freeze parfois temporaire, parfois complet (surtout au réveil).
Je viens d’en avoir un de partiel, ce qui m’a permis d’aller jeter un oeil au log à ce moment là, mais je ne sais pas interpreter ce que j’ai trouvé.

11:08:29 kernel: amdgpu 0000:0a:00.0: amdgpu: ring gfx_0.0.0 timeout, but soft recovered
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 RW: 0x0
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 MAPPING_ERROR: 0x0
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 PERMISSION_FAULTS: 0x3
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 WALKER_ERROR: 0x0
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 MORE_FAULTS: 0x0
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: 	 Faulty UTCL2 client ID: SQC (data) (0xa)
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00701430
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu:   in page starting at address 0x0000c169bd2c3000 from client 0x1b (UTCL2)
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu:  in process chromium pid 3086 thread chromium:cs0 pid 3113
11:08:19 kernel: amdgpu 0000:0a:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:24 vmid:7 pasid:60)

Il semble en effet que c’est surtout des freezes avec chromium, mais c’est peut-être juste qu’il est souvent ouvert.

J’apprécierait beaucoup si quelqu’un pouvais me donner une direction de recherche…

Merci

Il faudrait donc commencer par désactiver l’accélération matériel de Chromium.
Ça pourrait suffire.

Un peu de visibilité sur l’anatomie du malade serait bienvenue:

uname -a
glxinfo | grep OpenGL
dpkg-query -f '${Package;-30} ${Version}\n' --show xserver-xorg-video-amdgpu libdrm-amdgpu1 libglx-mesa0 firmware-amd-graphics | uniq
env |grep 'DESKTOP_SESSION\|XDG_SESSION_TYPE'
cat /proc/cmdline

Sinon, il faudrait essayer:
• désactiver dans le BIOS la carte graphique intégrée, si deuxième carte graphique (si = hypothèse)
• rajouter amdgpu.vm_update_mode=3 en option de noyau (voir grub ou autre boot-loader), ou en éditant grub (si grub) en l’arrêtant au boot au moins pour essai volatile.

Avant d’essayer quoique ce soit et de recommander à essayer quoique ce soit, il serait bien d’attendre le retour des commandes demandées :wink:

Ensuite, tu demandes à rajouter des commandes développeurs en option de noyau, sans expliquer quoique ce soit, sans donner une raison. Car en informant de cet usage, tu pars du prédicat qu’il a 2 GPU, un intégré, et un « externe ». Ce que tu ne peux pas savoir dans le contexte des informations données par @fdf

LA raison pour laquelle, il pourrait être intéressant de l’utiliser est de « dire au noyau lors du démarrage d’être capable de surcharger le mode de mise à jour de l’espace virtuel par l’utilisation des deux adressages de mémoire virtuelle des GPU » ; cette fonctionnalité du noyau est disponible seulement pour certains systèmes, sinon cette fonctionnalité sera tout simplement ignorée !

Only in large BAR(LB) systems Compute VM tables will be updated by CPU, otherwise 0, never.

Là, personnellement, je suis incapable de dire si c’est le cas de sa machine !
L’es-tu ?
Si oui, expliques, stp.

Ça fait beaucoup de prose tout ça.
‹ désactiver dans le BIOS la carte graphique intégrée, si deuxième carte graphique › n’est pas un prédicat, mais seulement une hypothèse.
Il n’y a strictement aucun danger ou risque à tester l’option ‹ amdgpu.vm_update_mode=3 ›, largement connue pour résoudre le problème du même type et connu.

Puisque l’option ‹ amdgpu.vm_update_mode=3 › t’intéresse à titre personnel:

It’s a driver bug related to updating the GPU’s virtual memory page table.
Setting the kernel parameter amdgpu.vm_update_mode=3 fixes the issue.
It forces the update to be done by the CPU, it seems it’s more reliable and has no visible performance issue.
[1] - [2]

Bonjour,
Merci pour la réponse. J’ai supprimé l’accelération matériel, c’était une approche très simple.

Un peu plus de détail maintenant. Il n’y a pas de deuxième GPU, seulement la carte intégrée.
et voici les résultats de commandes

root@Maison:~# uname -a
Linux Maison 6.12.86+deb13-amd64 #1 SMP PREEMPT_DYNAMIC Debian 6.12.86-1 (2026-05-08) x86_64 GNU/Linux
root@Maison:~# glxinfo | grep OpenGL
Error: unable to open display 

root@Maison:~# dpkg-query -f '${Package;-30} ${Version}\n' --show xserver-xorg-video-amdgpu libdrm-amdgpu1 libglx-mesa0 firmware-amd-graphics | uniq
firmware-amd-graphics          20250410-2
libdrm-amdgpu1                 2.4.124-2
libglx-mesa0                   25.0.7-2
xserver-xorg-video-amdgpu      23.0.0-1

root@Maison:~# env |grep 'DESKTOP_SESSION\|XDG_SESSION_TYPE'
XDG_SESSION_TYPE=tty
root@Maison:~# cat /proc/cmdline
BOOT_IMAGE=/boot/vmlinuz-6.12.86+deb13-amd64 root=UUID=3fe6ada8-0750-45f7-9e51-5beddb047a67 ro quiet

À l’instant, je suppose que la solution raisonnable est d’attendre de voir si la suppression de l’accelération matériel dans Chromium suffit à résoudre le problème,
Sinon, puisque tu me dis qu’il n’y a pas de risque, rajouter le amdgpu.vm_update_mode=3

À bien sur adapter si avec les détails de la config matérielle, d’autre options apparaissent.

Merci bien à tous les deux.

J’aurais préféré que tu testes uniquement la désactivation matérielle dans un premier temps pour voir si effet, et si pas d’effet complémenter avec amdgpu.vm_update_mode=3

Ça c’est normal puisque root n’a pas de display.
L’Opengl c’est pour le user uniquement.
Es-tu sous X11 ou Wayland ?

Il y a quelques points qui me surprennent pour le reste, mais pas le temps maintenant.

Wayland
Je n’ai pas encore amdgpu.vm… Ce sera dans un deuxième temps si probleme pas résolu.

nous@Maison:~$ glxinfo | grep OpenGL
OpenGL vendor string: AMD
OpenGL renderer string: AMD Radeon Graphics (radeonsi, raphael_mendocino, LLVM 19.1.7, DRM 3.61, 6.12.86+deb13-amd64)
OpenGL core profile version string: 4.6 (Core Profile) Mesa 25.0.7-2
OpenGL core profile shading language version string: 4.60
OpenGL core profile context flags: (none)
OpenGL core profile profile mask: core profile
OpenGL core profile extensions:
OpenGL version string: 4.6 (Compatibility Profile) Mesa 25.0.7-2
OpenGL shading language version string: 4.60
OpenGL context flags: (none)
OpenGL profile mask: compatibility profile
OpenGL extensions:
OpenGL ES profile version string: OpenGL ES 3.2 Mesa 25.0.7-2
OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20
OpenGL ES profile extensions:

Merci déjà.