Erreurs ACPI qui saturent l'espace disque

Tags: #<Tag:0x00007efede9eaa00>

Bonjour,

Je gère dans mon entreprise, des afficheurs dynamiques (des mini-PCs Intel NUC qui diffusent des informations via un client Xibo-Player sur des écrans).
Nous avons décidé de migrer nos afficheurs de Windows 10 vers Linux Debian 10 à cause d’instabilités sous Windaube et car nous sommes attachés au monde libre.
Mais finalement nous n’avons pas gagné en stabilité et c’est même pire:

Les NUCs sont programmés avec cron pour hiberner la nuit grâce à rtcwake et c’est entre-autres la cause de mon problème.
En effet, les mini-PCs génèrent des erreurs ACPI en boucle quand ils sortent d’hibernation, ce qui crée des logs de plusieurs dizaines/centaines de Go, sature le disque et rend inutilisable l’afficheur.

Voici un extrait des logs:

root@afficheur:/var/log# head -n 6 syslog
kernel: [18626.421742] ACPI BIOS Error (bug): Could not resolve [\_GPE._L66._SB.ITBI], AE_NOT_FOUND (20180810/psargs-330)
kernel: [18626.421744] ACPI Error: Method parse/execution failed \_GPE._L66, AE_NOT_FOUND (20180810/psparse-516)
kernel: [18626.421746] ACPI Error: AE_NOT_FOUND, while evaluating GPE method [_L66] (20180810/evgpe-515)
kernel: [18626.421893] ACPI BIOS Error (bug): Could not resolve [\_GPE._L66._SB.ITBI], AE_NOT_FOUND (20180810/psargs-330)
kernel: [18626.421895] ACPI Error: Method parse/execution failed \_GPE._L66, AE_NOT_FOUND (20180810/psparse-516)
kernel: [18626.421897] ACPI Error: AE_NOT_FOUND, while evaluating GPE method [_L66] (20180810/evgpe-515)

Je n’ai pas réussi à trouver quelqu’un ayant le même cas que moi, d’autant plus que ces erreurs sont aléatoires.

L’erreur peut apparaitre sur plusieurs afficheurs de modèles différents mais n’apparaît pas sur tous les PCs d’un même modèle:
Les PCs en question sont des Intel NUC8i3BEK2, quasiment identiques niveau système car clonés avec CloneZilla, mais seulement quelques-uns ont été touchés.

J’ai déjà mis à jours à la dernière version les BIOS de ces PCs, mais l’erreur est revenue au démarrage d’un PC puis disparait après un redémarrage forcé…

Pour l’instant, j’ai retiré la tâche cron qui programme rtcwake mais ce n’est pas très écologique de laisser allumer ces PCs h24.
J’ai aussi programmé logrotate toutes les 10 minutes et restreint la taille des logs à 1Go mais je ne parviens pas à régler la cause du problème.

Auriez-vous donc des pistes ? Revenir à Windows :lol: ? Migrer vers une distrib compatible avec ces matériels ? Report le bug à Debian ?

Je reste à votre disposition pour toute demande d’infos complémentaires.
Merci par avance pour votre aide,
tintamarre

Deux façons de voir :

rmmod acpi_power_meter
echo blacklist acpi_power_meter >> /etc/modprobe.d/blacklist-power-meter.conf
modprobe ipmi_si
modprobe acpi_ipmi

ou trouver le firmwre qui manque mais tu l’as déjà surement fait.

  • garder cette information et empêcher son écriture dans syslog ( solution probablement suffisante )

Merci pour ta réponse, concernant ton lien, il s’agit d’un problème d’IPMI sur un serveur dont je ne pense pas être concerné ?

Comment puis-je savoir quel firmware chercher ? Je ne trouve pas en cherchant sur le web quel composant peut être relié à l’erreur « GPE._L66._SB.ITBI »

Les erreurs apparaissaient également au démarrage, la suppression des erreurs dans syslog n’évitera pas le blocage au démarrage, si ?

Tu peux essayer d’ajouter le paramètre suivant à la ligne de commande du noyau pour supprimer les messages :

acpi_mask_gpe=0x66

Cf. ce sujet précédent

cat /proc/acpi/wakeup

pourrait identifier le composant en cause.

A partir de là je ne vois pas ce qu’on peut faire. Vérifier que les installations sont vraiment identiques, programme par programme ?
Ou ça viendrait d’une différence entre machines, un bios update peut etre?