Pc qui se plante

Bonjour à tous.
Ci-joint ma configuration actuelle:

Carte mère Z68A-GD65 MSI
CPU Intel Core I7
4G de mémoire
1 lecteur /graveur DVD
1 disque pour le système
2 disques en raid0 pour les datas
Os installé Debian Buster AMD64 il y a deux jours

Le symptôme est le suivant:
Démarrage aléatoire des fois oui des fois non . Normalement si je suis dans la cas OUI , il bipe et démarre, sinon aucun bip écran noir calme plat.

Dans la mesure ou il a démarré, j’arrive sur mon greeter et là j’ai le choix entre gnome, mate et lxde . Quelque soit l’environnement graphique choisi, la machine se bloque assez rapidement j’ai un écran noir et là à part arrêter l’alimentation et redémarrer ( s’il veut bien) je n’ai pas d’autre possibilité.
J’ai consulté un certain nombre de log et je n’ai rien vu de bizarre sinon un pb I915 récurant. J’ai installé les firmware, les microcode Intel ainsi que les non-free, même combat.

Au moment du boot je suis passé en mode rescue et là la machine ne bloque pas et semble tourner correctement. J’ai passé un test mémoire il s’est bien déroulé. J’ai installé lm-sensor. J’ai mis un metrix et j’ai regardé la fluctuation du secteur il me semble correct ( varie entre 229,8 et 231,4 v).

Je suis dans la panade y a t’il quelqu’un qui puisse me donner un coup de main.

Ta machine ne me semble pas toute neuve.
As-tu vérifié l’état de la pâte thermique entre le processeur et le ventilateur ?

Non pas du tout.

Bonjour mariop31

En plus de vérifier et éventuellement changer la pâte thermique et dépoussiérer le ventilateur,
débranche tout ce qui n’est pas indispensable au démarrage de la machine, ce qui permettra d’écarter une panne provoquée par un périphérique défectueux.

En gros, ne laisse connecté que le clavier et l’écran et une seule barrette de RAM puis démarre la machine pour voir si le problème persiste.
Si le problème persiste, change de barrette de RAM, etc.

Le problème peut aussi être causé par un disque dur défectueux.

Ça m’est arrivé dernièrement avec un SSD Samsung 840 PRO que j’ai dû remplacer quand il est finalement devenu complètement inaccessible.

Quand je l’ai eu remplacé, ma machine s’est remise à fonctionner normalement alors que les démarrages normaux étaient devenus aléatoires, me faisant penser à une panne d’alimentation ou d’un autre périphérique. Je n’avais même pas envisagé que ce puisse être ce SSD qui provoquait ce fonctionnement erratique.

Cette méthode te permettra peut-être de trouver le ou les composants ou périphériques qui provoqueraient ce comportement erratique.

1 J'aime

Bonjour Micp.

J’ai booté avec un dvd « SystemRescue Cd » et j’ai bossé pendant une bonne heure aucun problème.
J’ai booté sur mon disque système en mode rescue je n’ai pas eu de problème.

Hier j’ai démonté mon CPU et ventilateur (que j’ai nettoyé) j’ai enlevé les résidus de pâte. Dans la foulée j’ai acheté de la pâte thermique.
Ce matin je l’ai mise sur le cpu et j’ai redémarré. Çà à bien fonctionné mais pas longtemps.

Au vue de ce que tu m’expliques il semblerait que j’ai un soucis avec un des deux disques 1 Tera associé en Raid0.
Je vais donc regarder ça.

Tu pourrais, avec smartctl
aller lire les données qui sont enregistrées dans la carte contrôleur intégrée au disque
histoire de voir l’état du ou des disques.

Voir : Self-Monitoring, Analysis and Reporting Technology

Je viens de booter en mode recovery. J’ai installé smartctl, je suis en train de faire les test sur les trois disques. Et je te tiens au courant.

Ben ça y est les tests ont été effectués (smartctl short and long) , ils ne présentent aucun défaut. De plus la machine qui je le rappelle a démarré en mode recovery sur le disque interne système ne s’est pas vautrée. La commande sensors m’indique que la température des quatre cœurs culmine à 35° celcius. Le phénomène d’écran noir et de blocage se passe quand je suis en mode multi-users (mode graphique) assez rapidement. Pour l’instant je ne comprends toujours pas d’où ça peut venir. Je vois pas où je peux chercher.

Il faudrait aussi voir la liste des attributs smart de chaque disque
pour vérifier si des erreurs n’ont pas été enregistrées
ce qui pourrait expliquer ce genre de pannes.

=======
Il y a aussi la ou les barrettes RAM qui pourraient être en cause
il existe le programme memtest du paquetage memtest86+ qui s’exécute avant le démarrage de tout système d’exploitation pour tester la RAM installée sur la machine.

En fait je me suis trompé je n’ai pas un raid 0 mais un raid1
J’ai installé memtest+, j’ai laissé tourner un peu plus d’une heure, pas d’erreurs.
En tapant la commande

dmesg

Je me retrouve avec une erreur:

[drm:fw_domains_get [i915]] *ERROR* render: timed out waiting for forcewake ack request.
[drm:gen6_read32 [i915]] ERROR GT thread status wait time out

J’ai relancé la machine en mode multi-users , s’affiche le greeter je ne me suis identifié et laissé la machine dans cet état. Ça fait environ une heure et elle ne s’est pas vautrée.

En fait le phénomène se produit après que je me sois identifié que ce soit avec « mate » « lxde » ou « gnome ».
Apparemment je pense avoir cerné le problème, gros soucis avec I915.
J’en suis ravi mais je ne sais pas comment m’en sortir.

Bonjour

Ça ressemble à un bug qui avait pourtant été corrigé en 2013

J’aimerai voir le retour de la ligne de commande suivante :

uname -a

Voilà.

Linux debian 4.19.0-10-amd64 #1 SMP Debian 4.19.132-1 (2020-07-24) x86_64 GNU/Linux

Pour info j’ai désinstallé en début d’après-midi, et là la machine semble fonctionner.

intel-media-va-driver

Au profit de

intel-media-va-driver-non-free

A partir d’une console en root j’ai tapé la commande:

tail -f /var/log/kern.log

Environ toutes les dix minutes j’ai des messages d’erreurs à propos de I915.

[drm:fw_domains_get [i915]] *ERROR* render: timed out waiting for forcewake ack request.
[drm:gen6_read32 [i915]] ERROR GT thread status wait time out

Quel est le fichier image ISO debian que tu as utilisé pour l’installation ? (un lien web vers le fichier)


Et pour connaître la version du BIOS de ta machine,
avec les privilèges du compte root
donne nous le retour de la ligne de commande suivante :

dmidecode -t bios

Le fichier image est un cd netinstall téléchargé sur le site debian officiel

Debian GNU/Linux 10.2.0 "Buster" - Official amd64 NETINST

Résultat de la commande

dmidecode -t bios

# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 2.7 present.

Handle 0x0000, DMI type 0, 24 bytes
BIOS Information
	Vendor: American Megatrends Inc.
	Version: V22.2
	Release Date: 05/31/2011
	Address: 0xF0000
	Runtime Size: 64 kB
	ROM Size: 8192 kB
	Characteristics:
		PCI is supported
		BIOS is upgradeable
		BIOS shadowing is allowed
		Boot from CD is supported
		Selectable boot is supported
		BIOS ROM is socketed
		EDD is supported
		5.25"/1.2 MB floppy services are supported (int 13h)
		3.5"/720 kB floppy services are supported (int 13h)
		3.5"/2.88 MB floppy services are supported (int 13h)
		Print screen service is supported (int 5h)
		8042 keyboard services are supported (int 9h)
		Serial services are supported (int 14h)
		Printer services are supported (int 17h)
		ACPI is supported
		USB legacy is supported
		BIOS boot specification is supported
		Targeted content distribution is supported
		UEFI is supported
	BIOS Revision: 4.6

Handle 0x006A, DMI type 13, 22 bytes
BIOS Language Information
	Language Description Format: Long
	Installable Languages: 9
		en|US|iso8859-1
		fr|FR|iso8859-1
		de|DE|iso8859-1
		ja|JP|unicode
		ko|KR|unicode
		es|ES|iso8859-1
		<BAD INDEX>
		<BAD INDEX>
		<BAD INDEX>
	Currently Installed Language: de|DE|iso8859-1

D’après cette page web :https://fr.msi.com/Motherboard/support/Z68AGD65_G3
ta version du BIOS est en retard de 12 versions
on dirait qu’il n’a jamais été mis à jour.

Je ne sais pas si une mise à jour du BIOS résoudra ce problème,
mais les différentes versions apportent quand même pas mal de corrections et améliorations.


La version debian 10 (buster) actuelle est la 10.5.0

Je te recommande d’utiliser ce fichier image ISO d’installation : firmware-10.5.0-amd64-netinst.iso
dans lequel sont inclus la plupart des fichiers firmwares nécessaires au fonctionnement de la machine pour son installation.

Au cours du déroulement du programme d’installation,
tu pourras choisir l’Environnement de Bureau que tu voudras utiliser sur ton système installé.

netinstEnvBureauDebian

Je peux effectivement mettre à jour le bios, mais je voudrais indiquer que jusqu’ à présent j’étais en debian 8 et je n’avais aucun soucis. La machine n’avait pas tourné au moins depuis deux ans, elle était stocké dans un placard, alors j’ai pris la décision de la mettre à jour quand même.
J’ai installé à partir du cd netinstall que j’avais quand j’ai mis à jour mon portable à savoir debian 10.2.
Au cours de l’installation il se met à jour automatiquement, actuellement je suis bien version 10.5

Impec, donc, côté version debian, pas besoin de réinstaller, c’est déjà ça de gagné. :slightly_smiling_face:

Hier soir j’ai réinstallé avec le cd firmware-10.5.0-amd64-netinst.iso

A peine installé première connexion environ 2 minutes après m’être identifié la machine s’est vautrée.

Je pense que mon problème est due au kernel actuel. Donc je sais pas comment faire.

As-tu fait la mise à jour du BIOS ?
Parce que la version du BIOS que tu utilises a été faîte il y a maintenant 9 ans

Non, mais je viens de changer de greeter à savoir gdm3 au lieu lightdm. Et là miracle plus d’erreur (pour l’instant) la machine semble se comporter normalement et du coup bien plus rapide qu’avant.