Debian buster ne démarre pas la session graphique

Mon PC sous debian buster ne démarre pas la session graphique après un redémarrage suite à l’application du tuto de sebsauvage sur l’optimisation de Debian pour SSD.
dmesg | grep errors montre deux erreurs, une est

ext4-fs (dm-1):re-mounted. 0pts: errors=remount -ro

et la deuxième

nouveau direct firmware load for nvidia failed

J’ai installé firmware-misc-nonfree et eu le message

Possible missing firmware /lib/firmware/nvidia/gv100/acr/ucode_load.bin for module nouveau

mais au redémarrage je n’ai plus dans dmesg que l’erreur

ext4-fs (dm-1):re-mounted. 0pts: errors=remount -ro

mais par contre la session graphique ne marche toujours pas.

Par ailleurs j’ai enlevé toutes les modifications faites en suivant le tuto de Sebsauvage sauf le paquet zram-tools.
Et j’ai mis nomodeset comme paramètre grub, ça démarre la fenêtre de déverouillage du disque LUKS en mode graphique (contrairement à précédemment, où le déverrouillage se faisait en cli) mais ensuite la vraie session graphique ne démarre toujours pas, j’ai juste un « - » clignotant.
J’ai accès à la console tty1 (jusqu’à tt6) mais taper startx dans tty1 ne sert normalement à rien (et de façon prévisible, ça n’a rien donné).

Je voulais tester si c’est zram qui peut poser problème et zramctl me donne :

NAME ALGORITHM DISKSIZE DATA COMPR TOTAL STREAMS MOUNTPOINT
/dev/zram19 lzo 12,8M 4K 78B 12K 20 [SWAP]
/dev/zram18 lzo 12,8M 4K 78B 12K 20 [SWAP]"

(pareil pour les autres coeurs) comme avant le problème au redémarrage.
J’ai trouvé ici ces commandes pour arrêter zram :

On désactive le zram ;
Code BASH :

swapoff /dev/zram0

On réinitialise les paramètres :
Code BASH :

echo 1 >/sys/block/zram0/reset

On peut retirer le module noyau :
Code BASH :

rmmod zram

Mais je ne sais pas s’il faut les faire pour chaque coeur (donc swapoff/dev/zram*) et pas non plus si c’est une bonne idée de faire le rmmod zram ?

NB : à part les modifications faites en suivant le tuto de sebsauvage, entre le démarrage de la machine ce matin sans problèmes et le redémarrage qui plante j’ai uniquement fait (en root) apt install remmina, gvim, et unbound, ainsi qu’ajouté contrib et non-free dans le sources.list. Toutes chose qui ne devraient pas causer un tel plantage ?
En utilisateur j’ai également installé l’AppImage de Sengi sur laquelle j’ai fait un chmod +x et que j’ai tenté de lancer en tant qu’utilisateur.

J’avoue que je n’ai aucune idée de si le problème vient du driver Nvidia, de Zram ou de l’erreur Ext4 (mais j’ai comparé le fstab après avoir effacé ce que j’avais modifié avec un autre fstab d’un PC portable installé le même jour avec la même clé et je n’ai pas vu de différences; par ailleurs si le disque ne se monte pas je ne devrais pas pouvoir me connecter en tty1 ? De toutes façons c’est pas forcément une erreur de montage mais juste que grep a retrouvé le paramètre « errors=remount », non ?).

Il y a un autre mot-clé que « error » à rechercher dans dmesg ?
Les logs de la session graphique sont uniquement dans Xorg.0.log ?
En y cherchant « error » je ne trouve que

(EE) Server terminated with error (1). Closing log file.

et en cherchant sur le Canard avec cette erreur je trouve essentiellement un bug debian datant de 2015, donc je ne suis pas sûr que ça s’applique ici…

Es-tu sur que la perte du graphique vient de ton installation à la sebsauvage?

on dirait plutot un simple probleme entre nouveau et nvidia

Ben non j’en sais rien justement.
Les deux hypothèses sont possibles, notamment du fait que le tuto de sebsauvage ne parle pas de LUKS.
Mais c’est apparu juste après le paramétrage à la sebsauvage, d’où mon soupçon.

Et je ne trouve pas de ressources en ligne sur une possible incompatibilité entre Zram et LUKS.

LUKS chiffre aussi la swap, donc comme me le fait remarquer sebsauvage sur mastodon il est tout à fait possible qu’il n’aie pas aimé le montage de la swap en tmpfs.
Mais puisque j’ai commenté la ligne de fstab qui concerne tmpfs, ça n’aurait pas dû régler le problème ?
D’autant que c’est seulement la session graphique qui ne démarre pas…

Quels sont les symptomes précis? As tu vérifier que /var/run était un lien vers /run et que /run était un tmpfs existant? Xorg est désormais très sensible à ça et ça peut mettre la pagaille. Une autre raison peut être un mauvais propriétaire du fichier .Xauthority dans ton répertoire.

Au démarrage (après le déverouillage LUKS) j’ai juste un écran noir avec un « - » clignotant.
Et donc le message d’erreur

(EE) Server terminated with error (1). Closing log file. 

dans Xorg.0.log

/var/run est bien un lien vers /run
ls -l .Xauthority me donne lutech lutech comme propriétaire et -rw------ comme droits
mount | grep run me donne

tmpfs on /run type tmpfs (rw,nosuid,noexec,relatime,size=3264308k,mode=755)

ainsi que tmpfs on /run/lock et on /run/user/1000 et /run/user/0

Mais sinon comment désactiver le zram pour savoir si c’est ça qui pose problème ?
Et d’ailleurs pourquoi le paquet zram-config est absent de Buster ? Est-ce que zram-tools que j’ai installé à la place (et pour lequel je n’ai fait aucune configuration) le remplace à l’identique pour l’usage recommandé par sebsauvage ?

Et concernant le pilote nvidia, je trouve ça qui a eu le même problème de message « missing firmware » après avoir installé firmware-misc-nonfree et la commande dont il parle apt-file search /lib/firmware/nvidia/gv100/acr/ucode_load.bin ne me renvoie aucun résultat.

Le texte dit que le pilote n’est disponible que sur le paquet récent qu’il faut installer avec les backports, ce que j’ai fait sans que cela ne règle le problème.

Voilà le fichier Xorg.0.log si ça peut être utile.

[   166.340] 
X.Org X Server 1.20.4
X Protocol Version 11, Revision 0
[   166.340] Build Operating System: Linux 5.10.0-6-amd64 x86_64 Debian
[   166.340] Current Operating System: Linux luffy 4.19.0-16-amd64 #1 SMP Debian 4.19.181-1 (2021-03-19) x86_64
[   166.340] Kernel command line: BOOT_IMAGE=/vmlinuz-4.19.0-16-amd64 root=/dev/mapper/luffy--vg-root ro quiet splash nomodeset
[   166.340] Build Date: 19 April 2021  09:34:38AM
[   166.340] xorg-server 2:1.20.4-1+deb10u3 (https://www.debian.org/support) 
[   166.340] Current version of pixman: 0.36.0
[   166.340] 	Before reporting problems, check http://wiki.x.org
	to make sure that you have the latest version.
[   166.340] Markers: (--) probed, (**) from config file, (==) default setting,
	(++) from command line, (!!) notice, (II) informational,
	(WW) warning, (EE) error, (NI) not implemented, (??) unknown.
[   166.340] (==) Log file: "/var/log/Xorg.0.log", Time: Fri May  7 10:47:32 2021
[   166.340] (==) Using system config directory "/usr/share/X11/xorg.conf.d"
[   166.340] (==) No Layout section.  Using the first Screen section.
[   166.340] (==) No screen section available. Using defaults.
[   166.340] (**) |-->Screen "Default Screen Section" (0)
[   166.340] (**) |   |-->Monitor "<default monitor>"
[   166.340] (==) No monitor specified for screen "Default Screen Section".
	Using a default monitor configuration.
[   166.340] (==) Automatically adding devices
[   166.340] (==) Automatically enabling devices
[   166.340] (==) Automatically adding GPU devices
[   166.340] (==) Max clients allowed: 256, resource mask: 0x1fffff
[   166.340] (WW) The directory "/usr/share/fonts/X11/cyrillic" does not exist.
[   166.340] 	Entry deleted from font path.
[   166.340] (==) FontPath set to:
	/usr/share/fonts/X11/misc,
	/usr/share/fonts/X11/100dpi/:unscaled,
	/usr/share/fonts/X11/75dpi/:unscaled,
	/usr/share/fonts/X11/Type1,
	/usr/share/fonts/X11/100dpi,
	/usr/share/fonts/X11/75dpi,
	built-ins
[   166.340] (==) ModulePath set to "/usr/lib/xorg/modules"
[   166.340] (II) The server relies on udev to provide the list of input devices.
	If no devices become available, reconfigure udev or disable AutoAddDevices.
[   166.340] (II) Loader magic: 0x559526110e20
[   166.340] (II) Module ABI versions:
[   166.340] 	X.Org ANSI C Emulation: 0.4
[   166.340] 	X.Org Video Driver: 24.0
[   166.340] 	X.Org XInput driver : 24.1
[   166.340] 	X.Org Server Extension : 10.0
[   166.340] (++) using VT number 7

[   166.340] (II) systemd-logind: logind integration requires -keeptty and -keeptty was not provided, disabling logind integration
[   166.342] (--) PCI:*(0@0:2:0) 8086:9bc5:1028:098d rev 5, Mem @ 0xd3000000/16777216, 0x80000000/268435456, I/O @ 0x00004000/64, BIOS @ 0x????????/131072
[   166.342] (--) PCI: (1@0:0:0) 10de:1c31:1028:131b rev 161, Mem @ 0xd4000000/16777216, 0x90000000/268435456, 0xa0000000/33554432, I/O @ 0x00003000/128, BIOS @ 0x????????/524288
[   166.342] (II) LoadModule: "glx"
[   166.342] (II) Loading /usr/lib/xorg/modules/extensions/libglx.so
[   166.342] (II) Module glx: vendor="X.Org Foundation"
[   166.342] 	compiled for 1.20.4, module version = 1.0.0
[   166.342] 	ABI class: X.Org Server Extension, version 10.0
[   166.342] (==) Matched modesetting as autoconfigured driver 0
[   166.342] (==) Matched fbdev as autoconfigured driver 1
[   166.342] (==) Matched vesa as autoconfigured driver 2
[   166.342] (==) Assigned the driver to the xf86ConfigLayout
[   166.342] (II) LoadModule: "modesetting"
[   166.342] (II) Loading /usr/lib/xorg/modules/drivers/modesetting_drv.so
[   166.342] (II) Module modesetting: vendor="X.Org Foundation"
[   166.342] 	compiled for 1.20.4, module version = 1.20.4
[   166.342] 	Module class: X.Org Video Driver
[   166.342] 	ABI class: X.Org Video Driver, version 24.0
[   166.342] (II) LoadModule: "fbdev"
[   166.342] (II) Loading /usr/lib/xorg/modules/drivers/fbdev_drv.so
[   166.342] (II) Module fbdev: vendor="X.Org Foundation"
[   166.342] 	compiled for 1.20.0, module version = 0.5.0
[   166.342] 	Module class: X.Org Video Driver
[   166.342] 	ABI class: X.Org Video Driver, version 24.0
[   166.342] (II) LoadModule: "vesa"
[   166.342] (II) Loading /usr/lib/xorg/modules/drivers/vesa_drv.so
[   166.342] (II) Module vesa: vendor="X.Org Foundation"
[   166.342] 	compiled for 1.20.1, module version = 2.4.0
[   166.342] 	Module class: X.Org Video Driver
[   166.342] 	ABI class: X.Org Video Driver, version 24.0
[   166.342] (II) modesetting: Driver for Modesetting Kernel Drivers: kms
[   166.342] (II) FBDEV: driver for framebuffer: fbdev
[   166.342] (II) VESA: driver for VESA chipsets: vesa
[   166.342] xf86EnableIOPorts: failed to set IOPL for I/O (Operation not permitted)
[   166.342] (EE) open /dev/dri/card0: No such file or directory
[   166.342] (WW) Falling back to old probe method for modesetting
[   166.342] (EE) open /dev/dri/card0: No such file or directory
[   166.342] (II) Loading sub module "fbdevhw"
[   166.342] (II) LoadModule: "fbdevhw"
[   166.343] (II) Loading /usr/lib/xorg/modules/libfbdevhw.so
[   166.343] (II) Module fbdevhw: vendor="X.Org Foundation"
[   166.343] 	compiled for 1.20.4, module version = 0.0.2
[   166.343] 	ABI class: X.Org Video Driver, version 24.0
[   166.343] (EE) Unable to find a valid framebuffer device
[   166.343] (WW) Falling back to old probe method for fbdev
[   166.343] (II) Loading sub module "fbdevhw"
[   166.343] (II) LoadModule: "fbdevhw"
[   166.343] (II) Loading /usr/lib/xorg/modules/libfbdevhw.so
[   166.343] (II) Module fbdevhw: vendor="X.Org Foundation"
[   166.343] 	compiled for 1.20.4, module version = 0.0.2
[   166.343] 	ABI class: X.Org Video Driver, version 24.0
[   166.343] (II) FBDEV(2): using default device
[   166.343] (EE) Screen 0 deleted because of no matching config section.
[   166.343] (II) UnloadModule: "modesetting"
[   166.343] (EE) Screen 0 deleted because of no matching config section.
[   166.343] (II) UnloadModule: "fbdev"
[   166.343] (II) UnloadSubModule: "fbdevhw"
[   166.343] (EE) 
Fatal server error:
[   166.343] (EE) Cannot run in framebuffer mode. Please specify busIDs        for all framebuffer devices
[   166.343] (EE) 
[   166.343] (EE) 
Please consult the The X.Org Foundation support 
	 at http://wiki.x.org
 for help. 
[   166.343] (EE) Please also check the log file at "/var/log/Xorg.0.log" for additional information.
[   166.343] (EE) 
[   166.346] (EE) Server terminated with error (1). Closing log file.

Je remarque en particulier

> Cannot run in framebuffer mode. Please specify busIDs        for all framebuffer devices

En Canardant je trouve ça qui dit avoir résolu en récupérant un nouveau kernel depuis les backports.

Mais apt-file search linux-image me donne des centaines de réponse et même en greppant sur amd64 et bpo (puisque c’est apparement le label des kernels backports) j’en ai encore trop pour savoir laquelle choisir…
C’est quoi la différence entre bpo.3, bpo.4 et bpo.5 ? Juste des numéros de version ? Y’en a qui sont plus stables que d’autres ?

Bon j’ai installé le dernier noyau avec apt install -t buster-backports linux-image-amd64 et au redémarrage j’ai

[firmware bug] TPM interrupt not working, polling instead
hdaudio hdaudioC0D2 : unable to bind the codec

Puis un « - » clignotant et rien d’autre.

En fait j’aurais dû suivre les conseils de Boulet et appeler une grand-mère…

C’est probablement le manque de bicarbonate de soude qui empêche la machine de redémarrer !

Faute de grand-mère (et de bicarbonate) sous la main, j’abandonne et je réinstalle.
Par contre faire du LVM on LUKS en choisissant moi-même la taille de chaque partition, je ne vois pas comment faire.
Quand je passe en installation manuelle il me propose de chiffrer les partitions une à une au lieu de chiffrer tout le disque.
Et en installation assistée il ne me propose qu’un Go pour le swap par exemple, et je n’ai pas trouvé de moyen de le modifier.

Bon, apparemment c’est possible de modifier la taille des partitions en supprimant les groupes logiques LVM¹ un par un et en les recréant avec la taille voulue, après le chiffrement LUKS.
En espérant que je ne sois pas en train de tout casser !

¹Créés par le mode assisté

Même après réinstallation ça ne marche pas.

Ben en fait c’est le gars qui m’a confié la machine qui a trouvé la solution : quand on avait déplacé le bureau j’avais rebranché les câbles des écrans non pas sur le Display Port de la carte graphique dédiée mais sur celle intégrée à la carte-mère…

En rebranchant comme il faut ça marche !
Deux jours de dépannage, je sais pas combien de posts mastodon et sur le forum debian et une réinstallation complète pour ça…

héhé encore un problème de fil
mais normalement si tu vois le bios sur ton écran ça marche donc ça marche.

Oui c’est ça, si ça ne s’était pas allumé j’aurais pu y penser, mais comme j’avais accès aux consoles j’ai vraiment cru à un problème lié à Zram/LUKS ou un truc du genre…
Penser que j’avais pas rebranché au même endroit ET que le pilote n’était pas le même pour la carte dédiée et la carte intégrée, ça par contre ça ne m’est pas venu à l’esprit.