Arrêt de la séquence de boot

Bonjour sebB et merci de persévérer :slight_smile:

Je garde tes demandes d’information sous le coude car je suis en attente d’un nouveau cas de plantage. En désespoir de cause, j’ai upgradé vers wheezy et soit je bat les statistiques, soit c’est résolu… J’attends avant de vendre la peau de l’ours ! Si cela était résolu de cette façon, je ne sais pas si on aura de nouveau moyens d’analyser mon problème sans que je remette squeeze, à voir… En tout cas, cela voudrait au moins dire que ce n’était pas hardware.

Quoi qu’il en soit, j’aimerais élucider ce mystère et si possible remettre une squeeze donc je vous tiens tous au courant.

Pour ce qui est de l’OS qui était installé avant : Debian Lenny (toujours Debian). Je n’utilise pas LVM.

Bonjour,

Mauvaise nouvelle : le problème existe toujours bel et bien. Visiblement, je n’avais que de la chance car il se produit de nouveau tout à fait fréquemment.

Le PC ne sert que deux ou trois par jour, pour 20 minutes et aucune action étrange n’y est faite (pas d’action root, juste du web et du multimédia de base).

Je joins donc les informations demandées :

[code]root@laptop-na:~# fdisk -l

Disk /dev/sda: 160.0 GB, 160041885696 bytes
255 heads, 63 sectors/track, 19457 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00049898

Device Boot Start End Blocks Id System
/dev/sda1 1 122 975872 82 Linux swap / Solaris
Partition 1 does not end on cylinder boundary.
/dev/sda2 * 122 973 6836224 83 Linux
Partition 2 does not end on cylinder boundary.
/dev/sda3 973 19458 148476928 83 Linux
[/code]

sda1 est le swap
sda2 est le root
sda3 est le home

[code]root@laptop-na:~# cat /etc/fstab

proc /proc proc defaults 0 0

/ was on /dev/sda2 during installation

UUID=25cc51f9-ad3c-42c2-96fe-e2a364bde6fa / ext4 errors=remount-ro 0 1

/home was on /dev/sda3 during installation

UUID=47ee5a92-fa97-4ca3-a53d-97ac244ec0e8 /home ext4 defaults 0 2

swap was on /dev/sda1 during installation

UUID=2f2c331b-eacf-4f32-9bbd-ad409a859fb7 none swap sw 0 0
/dev/scd0 /media/cdrom1 udf,iso9660 user,noauto 0 0
server-bl:/srv/nfs/partage /media/partage nfs user,hard,intr 0 0
server-bl:/srv/nfs/public /media/public nfs user,hard,intr 0 0
[/code]

Merci pour l’aide.

Philippe.

T’as essayé en désinstallant nfs-kernel-server?

Pourquoi avoir installé openssh-server, rsync, nfs-kernel-server si c’est juste pour surfer sur internet.

A voir si c’est pas un probleme de config d’un prog.
Je tenterais de les purger, tu fais des essais de boot et tu vois s’il y a des améliorations.

EDIT: Essaye d’up le kernel pour voir

T’as essayé en désinstallant nfs-kernel-server?
Non, je ne suis pas contre faire le test (au point où j’en suis ^^) : je te tiens au courant.

Pourquoi avoir installé openssh-server, rsync, nfs-kernel-server si c’est juste pour surfer sur internet.

  • openssh-server car j’ai une solution de sauvegarde sur mon serveur qui doit se connecter tour à tour sur chaque poste à sauvegarder : ça se fait en SSH
  • rsync par habitude : je m’en sers de temps en temps et j’aime bien qu’il soit installé (en l’occurence, ce n’est pas mon poste mais je suis susceptible de faire quelques manipulations dessus de temps à autre).
  • nfs-kernel-server : je réalise que j’ai dû l’installer pour rien. J’allais te répondre pour accéder aux partages réseau de mon serveur mais le client NFS seul doit suffire. Non vraiment, je vais l’enlever et refaire quelques tests.

A voir si c’est pas un probleme de config d’un prog.
Je tenterais de les purger, tu fais des essais de boot et tu vois s’il y a des améliorations.

Encore une fois, je ne suis pas contre faire des tests : je vais sauvegarder le /home du portable ailleurs et retirer toute la configuration applicative qui s’y trouve pour faire quelques tests de boot. Je crois que ça bloque bien avant d’avoir besoin de ce genre de configuration mais bon…

EDIT: Essaye d’up le kernel pour voir
Ce sera donc mon test numéro 3.

Je vous tiens au courant. Merci encore.

1er test : sans nfs-kernel-server

J’ai retiré nfs-kernel-server qui est effectivement complètement inutile… Au premier reboot, ça a bloqué :confused: Voici les traces :

Sat Mar 12 09:27:34 2011: Setting parameters of disc: (none). Sat Mar 12 09:27:34 2011: Setting preliminary keymap...done. Sat Mar 12 09:27:34 2011: Activating swap...done. Sat Mar 12 09:27:34 2011: Checking root file system...fsck from util-linux-ng 2.17.2 Sat Mar 12 09:27:34 2011: /dev/sda2: clean, 94742/427392 files, 902890/1709056 blocks (check in 5 mounts) Sat Mar 12 09:27:34 2011: done. Sat Mar 12 09:27:34 2011: Starting early crypto disks...done. Sat Mar 12 09:27:34 2011: Cleaning up ifupdown.... Sat Mar 12 09:27:34 2011: Loading kernel modules...done. Sat Mar 12 09:27:34 2011: Setting up networking.... Sat Mar 12 09:27:34 2011: Setting up LVM Volume Groups Reading all physical volumes. This may take a while... Sat Mar 12 09:27:35 2011: No volume groups found Sat Mar 12 09:27:35 2011: No volume groups found Sat Mar 12 09:27:35 2011: No volume groups found Sat Mar 12 09:27:35 2011: . Sat Mar 12 09:27:35 2011: Starting remaining crypto disks...done. Sat Mar 12 09:27:35 2011: Activating lvm and md swap...done. Sat Mar 12 09:27:35 2011: Checking file systems...fsck from util-linux-ng 2.17.2 Sat Mar 12 09:27:35 2011: /dev/sda3: clean, 4167/9281536 files, 980068/37119232 blocks (check in 3 mounts) Sat Mar 12 09:27:35 2011: done. Sat Mar 12 09:27:35 2011: Mounting local filesystems...Segmentation fault Sat Mar 12 09:27:35 2011: ^[[31mfailed.^[[39;49m Sat Mar 12 09:27:35 2011: Activating swapfile swap...done. Sat Mar 12 09:27:35 2011: Cleaning up temporary files.... Sat Mar 12 09:27:35 2011: Starting ATM ARP Daemon: atmarpd. Sat Mar 12 09:27:35 2011: Setting kernel variables ...done. Sat Mar 12 09:27:35 2011: Configuring network interfaces...atmarpd: ARPD: Linux ATM ARP, version 2.5.1 Sat Mar 12 09:27:36 2011: atmarpd: IO: SVCs are not available Sat Mar 12 09:27:36 2011: Segmentation fault Sat Mar 12 09:27:36 2011: Failed to bring up lo. Sat Mar 12 09:27:36 2011: done. Sat Mar 12 09:27:36 2011: Starting portmap daemon....

On voit deux “segmentation fault” quand même :frowning: Tout n’apparaît pas dans le /var/log/boot mais à l’écran, avant le dernier segmentation fault, j’avais une sorte de pile affichée (finissant par un “end trace”, on trouve des trucs semblables en cherchant sur google). Je n’ai pas réussit à identifier ce qui explosait. On dirait que c’est l’un des modules chargés par le noyau car le boot en fait justement la liste avant l’affichage de la trace… Peut-être est-ce simplement pour information et que le segmentation fault concerne autre chose. Je n’en sais pas plus.

2me test : mise à jour logicielle

J’ai refait une mise à jour des paquets par aptitude maintenant que je suis sur wheezy. J’espère toujours que ça puisse être un bug applicatif qui serait corrigé lors d’une mise à jour. Je pourrais alors étudier la liste des paquets que j’aurais mis à jour. Malheureusement, le problème est toujours bien présent… Coup dans l’eau donc.

3me test : relecture de la fameuse pile affichée avant le segmentation fault

Je me suis attardé plus longuement sur la fameuse pile qui s’affiche. Lorsqu’elle s’affiche, ça “core dumpe” derrière. Je pense donc que c’est un gros indice pour mon problème.

Voici quelques mots clefs que je peux y lire :

Process kacpid
Call trace :
- acpi_ex_allocate_name_string
- acpi_ex_get_name_string
- acpi…
- acpi…
- …
- worker_thread
- acpi_os_execute_deferred
- autoremove_wake_function
- worker_thread
- kthread
- child_rip

Bilan : il semblerait que cela ait un lien avec acpi ^^ J’ai fait quelques recherches de ces mots clef sur un moteur de recherche mais je n’ai rien trouvé de très intéressant.

Au vu de ces nouvelles informations, je garde les tests 4 et 5 pour plus tard (nettoyage de la configuration des applications et utilisation d’un noyau plus récent).

Que pensez vous de cette pile de segfault ?

J’ai remarqué qu’acpi-support n’était pas installé : je l’ai mis pour tester mais ça n’a rien changé. Je l’ai donc retiré et ai ajouté acpi=off aux options de démarrage de mon noyau… Pour le moment ça fonctionne, j’attends de voir !

Cela ne fonctionne pas : je n’ai aucune solution… Si quelqu’un a une idée, je suis prêt à tester =)

[quote=“Phi”]Je me suis attardé plus longuement sur la fameuse pile qui s’affiche. Lorsqu’elle s’affiche, ça “core dumpe” derrière. Je pense donc que c’est un gros indice pour mon problème.

Voici quelques mots clefs que je peux y lire :

Process kacpid
Call trace :

  • acpi_ex_allocate_name_string
  • acpi_ex_get_name_string
  • acpi…
  • acpi…
  • worker_thread
  • acpi_os_execute_deferred
  • autoremove_wake_function
  • worker_thread
  • kthread
  • child_rip[/quote]
    Ca s’affiche a quel moment ca?
    Maintenant quand ca plante tu as toujours les meme messages d’erreur?
    Peux tu poster dmesg.
    Avant debian, ton ordi ne montrait pas de signes de faiblesses?

Ultime solution : Tu fais une réinstall mais en n’installant que le systeme de base + xfce puis tu vois si ca tiens. Ensuite tu rajoute tes progs si c’est bon.

Lors du démarrage des services et chargement des modules, dans le dernier “écran” avant que ça ne fige.

Oui, 99% du temps : je crois me rappeler une pile un peu différente une fois mais concentrons-nous sur ça.

Dès que le cas se reproduit, je reposte dmesg et boot log.

Avant Debian ? Bah à part quand le PC sort du carton et que je dois y enlever l’OS présent pour mettre Debian, il n’y a jamais rien eu d’autre.

Tu y crois ça ? Si tu retrouves ce que j’installe sur le poste (j’ai mis la liste plus tôt dans la conversation) : tu verras que c’est très léger… A part Debian et Xfce, le reste c’est juste 4 ou 5 “petits” utilitaires.

Je vais peut-être essayé une réinstallation comme tu me le conseillais (puis installer paquet par paquet en attendant de voir si le bug se reproduit).