[au secours!] réparer lilo ou le initrd

Bonjour,

Hier, j’ai fait un dist-upgrade sur mon serveur (squeeze x86), et l’installation du kernel image a planté. Pas de bol, j’ai eu un soucis matériel, m’obligeant à rebooter.

Depuis, mon serveur est en carafe.

En gros, Lilo arrete le chargement: il fait ses pointillés, ralentit sur la fin, pour s’arreter, sans rien afficher d’autre.
J’ai essayé de démarrer sur un de mes autres disques de l’array (raid1 mdadm & LVM), ça a presque marché, il a chargé, sauf qu’il n’a pas été capable de monter les partitions xfs, donc, en gros, bye bye /usr, /home, … (et évidemment, pas de xfs_check dans /sbin :013 )
J’ai essayé de rebooter sur vmlinuz.old et son initrd.old… mais ça ne reboote plus du tout

Donc, CD d’install en mode rescue…
Et boum: les arrays sont impossibles à monter, «cannot allocate memory» pour chaque partition.

Comment est-ce que je peux m’en sortir? C’est entres autres mon serveur de mails, donc, c’est la grosse mémer… :doh:

AU SECOUUUURS! :blush:

Il y a quand même fsck.xfs et xfs_repair. Ça ne peut pas faire l’affaire ?

Ben comme je n’arrive plus à le booter: :frowning:
(fsck.xfs ne fait rien d’autre que de dire «attention, il faut utiliser xfs_check et xfs_repair» ce dernier, je ne l’avais pas vu d’ailleurs, dans sbin)

Toujours en rade :frowning:

Ma suggestion : il faudrait préciser et éventuellement sérialiser les problèmes. Tu as trois couches empilées : RAID, LVM et XFS. Regarde à quel niveau ça coince en partant du bas, et ajuste le sujet de la discussion en conséquence. Parce que si le problème vient d’XFS par exemple, AMA ce n’est pas avec un sujet disant “réparer lilo ou l’initrd” que tu vas attirer des connaisseurs d’XFS (dont je ne fais pas partie).

Merci Pascal pour ton soutien :slightly_smiling:

Il y a du nouveau ce soir: avec une iso «stable» (j’avais une testing) je n’ai plus de soucis pour construire les raid, même en mode automatique, quel soulagement, maintenant, je peux commencer à bosser! :smiley:

Ensuite, j’ai pu monter toutes mes partitions sans aucun problème apparent.
Donc,
RAID OK
XFS OK
shell OK

J’ai pu lancer la commande lilo_find_mbr, qui trouve le bon disque, puis, la commande lilo, qui trouve les 2 disques actifs du raid de démarrage.

Et ça boote!
(comment perdre des jours, des nuits, et des nerfs, à cause d’une iso testing fuckée, j’ai honte)

Par contre, il y a des choses mystiques:

  • mes lettres de disques dur ont encore changé, tous les IDE sont désormais en hd* (avant, tout ce qui est derrière le controleur natif non raid IDE de la carte mère était en sd*)
  • mon réseau ne fonctionne plus, je retrouve une partie des paramètres de la conf que j’avais utilisé pour réinstaller le serveur (j’avais utilisé une autre machine en mulet, pour minimiser le temps d’arret, donc, une autre IP). Il n’y a plus de résolution de nom :open_mouth:
  • mysql ne démarre plus (erreurs mystiques, mais comme le ifup ne se fait plus au boot, ça peut peut-être expliquer des choses)
  • ma console n’est plus en résolution native de mon écran (1280x1024) (pas grave, ça)

Bref, ce soir, j’ai fait de grands pas, mais, je ne comprends pas ce qui se passe.
Est-ce que ça peut venir d’un initrd mauvais? (Je ne connais rien des mécanismes de initrd)
C’est le réseau et mysql qui m’ennuient, le reste, pas grave, mais je ne pige vraiment pas pourquoi c’est bancal…

Problème résolu, yesss!

L’origine est, à priori, une succession de défaillances matérielles et logicielles, ayant entrainé une corruption du MBR (qui s’est ensuite synchronisé sur l’autre disque!) et des problèmes lors de la mise à jour du initrd.
pfiouu!