Driver nVidia et debian 9.5: Impossible de lancer serverX

Bonjour à tous!

Je galère depuis un petit moment déjà à (simplement) installer les drivers nVidia sur une fresh install de debian 9.5 avec gnome3… C’est un PC fixe avec Ubuntu 16.04 et Windows 10 où la GTX 970 fonctionne sans soucis.

  • J’ai suivi la doc (https://wiki.debian.org/fr/NvidiaGraphicsDrivers) et installé la version 390.48 (via stretch-backports).
  • Reboot pour blacklist nouveau et gnome3 crash (Ecran Oh no! Something has gone wrong!)
  • Lu les logs de Xorg: impossible de charger “nv”
  • Lancer nvidia-xconfig et reboot: La, l’écran clignote dans tous les sens durant le boot et il est difficile d’utiliser le clavier, même après avoir changé de terminal (ctrl + alt + f2). Tenté de placer la commande setpci dans le fichier /etc/rc.local mais ça ne fonctionne pas. (comme proposé dans la doc, section Dépannage)
  • Lu les logs de Xorg: impossible d’initialiser le module kernel de nVidia, pas de carte ni d’écran détecté.

Votre aide me serait bien utile!

Merci d’avance :smiley:

lspci

lspci
00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor DRAM Controller (rev 09)
00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
00:14.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller (rev 04)
00:16.0 Communication controller: Intel Corporation 7 Series/C216 Chipset Family MEI Controller #1 (rev 04)
00:1a.0 USB controller: Intel Corporation 7 Series/C216 Chipset Family USB Enhanced Host Controller #2 (rev 04)
00:1b.0 Audio device: Intel Corporation 7 Series/C216 Chipset Family High Definition Audio Controller (rev 04)
00:1c.0 PCI bridge: Intel Corporation 7 Series/C216 Chipset Family PCI Express Root Port 1 (rev c4)
00:1c.4 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 5 (rev c4)
00:1c.6 PCI bridge: Intel Corporation 82801 PCI Bridge (rev c4)
00:1d.0 USB controller: Intel Corporation 7 Series/C216 Chipset Family USB Enhanced Host Controller #1 (rev 04)
00:1f.0 ISA bridge: Intel Corporation Z77 Express Chipset LPC Controller (rev 04)
00:1f.2 SATA controller: Intel Corporation 7 Series/C210 Series Chipset Family 6-port SATA Controller [AHCI mode] (rev 04)
00:1f.3 SMBus: Intel Corporation 7 Series/C216 Chipset Family SMBus Controller (rev 04)
01:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller (rev a1)
03:00.0 Ethernet controller: Qualcomm Atheros AR8151 v2.0 Gigabit Ethernet (rev c0)
04:00.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev 41)

Logs sans fichier de config

 grep EE /var/log/Xorg.0.log
	(WW) warning, (EE) error, (NI) not implemented, (??) unknown.
[    52.957] (EE) Failed to load module "nv" (module does not exist, 0)
[    53.090] (EE) [drm] Failed to open DRM device for pci:0000:01:00.0: -19
[    53.090] (EE) open /dev/dri/card0: No such file or directory
[    53.090] (EE) open /dev/dri/card0: No such file or directory
[    53.093] (EE) open /dev/fb0: No such file or directory
[    53.093] (EE) open /dev/fb0: No such file or directory
[    53.093] (EE) Screen 0 deleted because of no matching config section.
[    53.093] (EE) Screen 0 deleted because of no matching config section.
[    53.546] (EE) Failed to initialize GLX extension (Compatible NVIDIA X driver not found)

Logs avec config (nvidia-xconfig)

grep EE /var/log/Xorg.0.log
	(WW) warning, (EE) error, (NI) not implemented, (??) unknown.
[    73.621] (EE) NVIDIA: Failed to initialize the NVIDIA kernel module. Please see the
[    73.621] (EE) NVIDIA:     system's kernel log for additional error messages and
[    73.621] (EE) NVIDIA:     consult the NVIDIA README for details.
[    73.621] (EE) No devices detected.
[    73.621] (EE) 
[    73.621] (EE) no screens found(EE) 
[    73.621] (EE) 
[    73.621] (EE) Please also check the log file at "/var/log/Xorg.0.log" for additional information.
[    73.621] (EE) 
[    73.623] (EE) Server terminated with error (1). Closing log file.

Fichier de config

# nvidia-xconfig: X configuration file generated by nvidia-xconfig
# nvidia-xconfig:  version 384.111  (buildd@debian)  Sun Feb 25 23:27:00 UTC 2018

Section "ServerLayout"
    Identifier     "Layout0"
    Screen      0  "Screen0" 0 0
    InputDevice    "Keyboard0" "CoreKeyboard"
    InputDevice    "Mouse0" "CorePointer"
EndSection

Section "Files"
EndSection

Section "InputDevice"

    # generated from default
    Identifier     "Mouse0"
    Driver         "mouse"
    Option         "Protocol" "auto"
    Option         "Device" "/dev/psaux"
    Option         "Emulate3Buttons" "no"
    Option         "ZAxisMapping" "4 5"
EndSection

Section "InputDevice"
    # generated from default
    Identifier     "Keyboard0"
    Driver         "kbd"
EndSection

Section "Monitor"
    Identifier     "Monitor0"
    VendorName     "Unknown"
    ModelName      "Unknown"
    HorizSync       28.0 - 33.0
    VertRefresh     43.0 - 72.0
    Option         "DPMS"
EndSection

Section "Device"
    Identifier     "Device0"
    Driver         "nvidia"
    VendorName     "NVIDIA Corporation"
EndSection

Section "Screen"
    Identifier     "Screen0"
    Device         "Device0"
    Monitor        "Monitor0"
    DefaultDepth    24
    SubSection     "Display"
        Depth       24
    EndSubSection
EndSection

la version actuelle des backports est la 390.87
https://packages.debian.org/search?keywords=nvidia-driver&searchon=names&suite=all&section=all

https://www.nvidia.fr/Download/Find.aspx?lang=fr

C’est un copier/coller de la version indiquée sur le wiki, mais j’imagine que @4lgar a installé la version qui se présentait en backports.

Par contre, es tu sûr que ton module nvidia ai bien été compilé par DKMS, comme il est dit dans le wiki ?

dkms status devrait te dire ce qui est configuré comme module à recompiler lors de l’install d’un noyau.
si tu n’es pas sur du statut d’install ou que tu as besoin de forcer, un dkms install nvidia-current/390.87

Sinon, théoriquement, nvidia-xconfig est obsolète, et le xorg.conf réservé à des usages spéciaux.

Suis je idiot…
Déjà modprobe nvidia, pour voir si le module existe ou s’il plante au chargement.

obligé car:
dep: nvidia-kernel-dkms (= 390.87-2~bpo9+1)

Oui, je sais, c’est obligé théoriquement, mais ça a pu mal se passer à la compil sans que tu fasses trop attention, donc est ce que ça s’est effectivement recompilé ?
Tu as vérifié le modprobe, pour voir si le module existe et s’insère bien ?