Erreur Kernel panic - not syncing

Bonjour,

J’ai un gros souci avec mon ordinateur qui me sert de serveur.
Depuis quelques temps, il plante complètement (donc les accès web, FTP et SSH ne marchent plus) et il m’affiche : Kernel panic - not syncing : Fatal machine check on current CPU. Avec une longue liste de “Call trace”.

Ce bug m’empèche de l’exploiter convenablement et une réinstallation complète du système n’y a rien fait.

Comment le remettre en état ?

Merci

[quote=“vodkaorange”]Bonjour,

J’ai un gros souci avec mon ordinateur qui me sert de serveur.
Depuis quelques temps, il plante complètement (donc les accès web, FTP et SSH ne marchent plus) et il m’affiche : Kernel panic - not syncing : Fatal machine check on current CPU. Avec une longue liste de “Call trace”.

Ce bug m’empèche de l’exploiter convenablement et une réinstallation complète du système n’y a rien fait.

Comment le remettre en état ?

Merci[/quote]

As-tu effectué un monitoring pour essayer de voir si une charge exceptionnelle ne serait pas la conséquence.

Tu parles d’accès web, si tu possède un apache regarde du côté des thread qui ne se ferme pas, si tu possède du Mysql monitor un peu la charge des requête.

Salut,

Le problème revient même avec la Debian fraichement réinstallé sans aucun “module” d’installé.

Comment effecuter un monitoring ?

[quote=“vodkaorange”]Salut,

Le problème revient même avec la Debian fraichement réinstallé sans aucun “module” d’installé.

Comment effecuter un monitoring ?[/quote]

Non mais après une installation fraîche, il est plus question de problème matériel que logiciel.

Commence par vérifier les températures, erreurs mémoires, erreurs disques etc …

MCE = Machine Check Exception = détection d’une erreur matérielle. Cf. en.wikipedia.org/wiki/Machine-check_exception (en anglais)
La seule fois où j’y ai été confronté, c’était lors d’accès disque intensifs avec DMA activé en associant une carte mère et un disque dur particuliers.

Le noyau a des options de démarrage pour désactiver les MCE, mais je ne sais pas quelle est leur efficacité.

  • sur noyau 32 bits (i386) : nomce
  • sur noyau 64 bits (amd64) : nomce ou mce=off, ainsi que les options suivantes (extrait de Documentation/x86/x86_64/boot-options.txt dans la documentation ou les sources du noyau) :

[code] mce=off disable machine check
mce=bootlog Enable logging of machine checks left over from booting.
Disabled by default on AMD because some BIOS leave bogus ones.
If your BIOS doesn’t do that it’s a good idea to enable though
to make sure you log even machine check events that result
in a reboot. On Intel systems it is enabled by default.
mce=nobootlog
Disable boot machine check logging.
mce=tolerancelevel (number)
0: always panic on uncorrected errors, log corrected errors
1: panic or SIGBUS on uncorrected errors, log corrected errors
2: SIGBUS or log uncorrected errors, log corrected errors
3: never panic or SIGBUS, log all errors (for testing only)
Default is 1
Can be also set using sysfs which is preferable.

nomce (for compatibility with i386): same as mce=off
[/code]
Voir aussi Documentation/x86/x86_64/machinecheck.

Salut, merci de ton aide :wink:

Cela peut venir de la mémoire vive ?