Freeze à répétition


#1

Bonjour à toute la communauté,

Je suis sur Debian depuis 8 ans, d’habitude je me débrouille tout seul mais là j’ai besoin d’aide.

Sur mon PC qui date de mai 2015, j’ai régulièrement des problèmes de freeze du système, qui ont l’air de provenir du réseau car j’en ai bien plus souvent (voire presque systématiquement) lorsque je télécharge de gros fichiers.
Je n’ai aucun souci quand je passe (très rarement) sur Windows. Mais parfois je suis obligé de passer par cet OS quand je veux faire un téléchargement qui arrive au bout…

Jusq’ici ces problèmes de freeze étaient suffisamment peu fréquents pour que je vive avec.
Sauf que je suis passé sur Buster il y a quelques semaines, et avec la nouvelle version de noyau (4.19.0-6-amd64) ça devient ingérable.

Mon problème apparaît à la fois en Wifi et en RJ45, donc je suis peut-être sur une fausse piste ?

Au cas où, mon matériel est le suivant (lspci) :

00:00.0 Host bridge: Intel Corporation Atom Processor Z36xxx/Z37xxx Series SoC Transaction Register (rev 0e)
00:02.0 VGA compatible controller: Intel Corporation Atom Processor Z36xxx/Z37xxx Series Graphics & Display (rev 0e)
00:13.0 SATA controller: Intel Corporation Atom Processor E3800 Series SATA AHCI Controller (rev 0e)
00:14.0 USB controller: Intel Corporation Atom Processor Z36xxx/Z37xxx, Celeron N2000 Series USB xHCI (rev 0e)
00:1a.0 Encryption controller: Intel Corporation Atom Processor Z36xxx/Z37xxx Series Trusted Execution Engine (rev 0e)
00:1b.0 Audio device: Intel Corporation Atom Processor Z36xxx/Z37xxx Series High Definition Audio Controller (rev 0e)
00:1c.0 PCI bridge: Intel Corporation Atom Processor E3800 Series PCI Express Root Port 1 (rev 0e)
00:1c.1 PCI bridge: Intel Corporation Atom Processor E3800 Series PCI Express Root Port 2 (rev 0e)
00:1c.2 PCI bridge: Intel Corporation Atom Processor E3800 Series PCI Express Root Port 3 (rev 0e)
00:1c.3 PCI bridge: Intel Corporation Atom Processor E3800 Series PCI Express Root Port 4 (rev 0e)
00:1f.0 ISA bridge: Intel Corporation Atom Processor Z36xxx/Z37xxx Series Power Control Unit (rev 0e)
00:1f.3 SMBus: Intel Corporation Atom Processor E3800 Series SMBus Controller (rev 0e)
01:00.0 Unassigned class [ff00]: Realtek Semiconductor Co., Ltd. RTS5286 PCI Express Card Reader (rev 01)
01:00.2 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller (rev 06)
02:00.0 Network controller: Intel Corporation Wireless 7260 (rev c3)
03:00.0 Unassigned class [ff00]: Realtek Semiconductor Co., Ltd. RTS5229 PCI Express Card Reader (rev 01)

Quand je regarde la syslog après reboot, je ne trouve aucune trace.

Que me conseillez-vous pour avancer sur le diagnostic (et la résolution) de mon problème ?

Merci pour votre aide !


#2

Avant même d’ouvrir une session graphique, basculez dans une console par exemple tty2 en appuyant sur AltCtrlF2.
Avez-vous essayé ce genre de manipulation en cas de gel ? En ouvrant d’autre console, vous devriez pouvoir consulter les journaux au moment du gel.

sudo dmesg | less

Et pour pouvoir copier dans le presse papier depuis les consoles

sudo apt install gpm xclip

Pour un gros téléchargement, lancez-le depuis une console (avec wget ou curl).
Une piste à étudier : une alimentation électrique insuffisante. Pour limiter drastiquement les ressources utilisées ( et donc la consommation électrique )

sudo systemctl isolate multi-user.target

Mais attention, c’est radical, vous perdez vos fenêtres graphiques et vous vous retrouvez dans les consoles noires tty*.
Il se peut aussi que les barrettes mémoire commencent à fatiguer. ( memtest )

Cordialement,
Regards,
Mit freundlichen Grüßen,
مع تحياتي الخالصة


F. Petitjean
Ingénieur civil du Génie Maritime.

« L’arbre tombe toujours du côté où il penche. »
Proverbe français


#3

Et dans kernel.log ?
Autres éléments important, lors du boot dans le syslog et dmesg, il y a des messages concernant la config de la carte, notamment les partages d’irq, réservation de plage mémoire, ou tu peux peut être voir apparaître des conflits de réservation, des trucs comme ça.
Tu peux aussi regarder quels modules exploitent ta carte filaire et ton wifi avec:
lspci -k | grep -A3 “Ethernet controller” et lspci -k | grep -A3 "Network controller"
Et aprés, regarder quels arguments on peut leur passer avec modinfo
Ca, c’est si le problème vient d’un réglage matériel de tes cartes, ce dont comme toi je doute.

Par contre, les problémes de freeze sont en général bien liés à la gestion du matos par le noyau, donc je pose la question:
tu as essayé beaucoup de noyau ? Il n’y en a pas un qui ne pose pas de probléme ?
Parceque tu n’es pas non plus obligé de rester sur le noyau buster, non plus, tu peux en prendre un plus vieux ou plus récent.


#4

Et pour revenir à la session graphique sudo systemctl isolate graphical.target