Ssh ne veut pas redémarrer

Bonjour à tous,
Depuis qq semaines j’ai un soucis bizarre concernant ssh dans un container lxc sous debian 9.
Tout fonctionne correctement au démarrege / redémarrage du container et ceci pendant qq jours, puis je n’arrive plus à me connecter* en ssh.
*ou j’arrive à me connecter après un temps anormalement long (plus de 10mn)
Via lxc-attach j’ai arrêté le service mais je n’arrive pas à le redémarrer :

Job for ssh.service failed because a timeout was exceeded.
See "systemctl status ssh.service" and "journalctl -xe" for details.

Bien sûr je ne vois rien dans le status ou le journal!
Pour info le container a été créé à partir du template debian.
Toute idée pour analyser ce pb est la bienvenue.
Merci d’avance.

Salut,

J’ai eu des souci avec LXC lorsque je les ai configuré en DHCP (parti DHCP géré par la config LXC).
En fait, le baille était généré au démarrage du LXC mais jamais renouvelé.

J’ai réglé le problème en configurant correctement les interface en DHCP dans le container.

C’est peut-être une piste.

Pour t’aider un peu plus, peux-tu ajouter le fichier de config de ton LXC.
Il faudrai aussi le résultat de la commande

/usr/sbin/sshd -ddd

après avoir stopé / killé le process existant.

Salut Phazon,

Merci pour ta réponse, je réponds à tes questions en espérant que cela t’éclaire plus que moi.

Pour commencer une information nouvelle, lorque mon ssh est bloqué, le logger est également bloqué, cad, par exemple : logger -p DEBUG Essai ne rend pas la main. Avec strace le blocage est sur sendmsg.

Et les réponses à tes questions.

C’est une config en IP fixe. Le fichier de config est le suivant :

# Template used to create this container: /usr/share/lxc/templates/lxc-debian
# Network configuration
lxc.net.0.type = veth
lxc.net.0.flags = up
lxc.net.0.link = br0
lxc.net.0.hwaddr = 4a:49:43:49:80:25
lxc.net.0.ipv4.address = 192.168.0.225/24
lxc.net.0.ipv4.gateway = 192.168.0.1

lxc.rootfs.path = lvm:/dev/vg4/intranet5

# Common configuration
lxc.include = /usr/share/lxc/config/debian.common.conf
# Container specific configuration
lxc.tty.max = 4
lxc.uts.name = intranet5
lxc.arch = amd64
lxc.pty.max = 1024

et lxc-attach -n intranet5 – /usr/sbin/sshd -ddd

debug2: load_server_config: filename /etc/ssh/sshd_config
debug2: load_server_config: done config len = 468
debug2: parse_server_config: config /etc/ssh/sshd_config len 468
debug3: /etc/ssh/sshd_config:4 setting Port 22
debug3: /etc/ssh/sshd_config:6 setting Protocol 2
debug2: /etc/ssh/sshd_config line 6: Deprecated option Protocol
debug3: /etc/ssh/sshd_config:7 setting HostKey /etc/ssh/ssh_host_rsa_key
debug3: /etc/ssh/sshd_config:9 setting UsePrivilegeSeparation yes
debug3: /etc/ssh/sshd_config:12 setting SyslogFacility AUTH
debug3: /etc/ssh/sshd_config:13 setting LogLevel INFO
debug3: /etc/ssh/sshd_config:16 setting LoginGraceTime 120
debug3: /etc/ssh/sshd_config:17 setting PermitRootLogin no
debug3: /etc/ssh/sshd_config:19 setting PasswordAuthentication yes
debug3: /etc/ssh/sshd_config:20 setting AllowUsers moi lui
debug3: /etc/ssh/sshd_config:21 setting StrictModes yes
debug3: /etc/ssh/sshd_config:22 setting PubkeyAuthentication yes
debug3: /etc/ssh/sshd_config:23 setting IgnoreRhosts yes
debug3: /etc/ssh/sshd_config:24 setting HostbasedAuthentication no
debug3: /etc/ssh/sshd_config:28 setting X11Forwarding yes
debug3: /etc/ssh/sshd_config:29 setting X11DisplayOffset 10
debug3: /etc/ssh/sshd_config:30 setting PrintMotd no
debug3: /etc/ssh/sshd_config:31 setting PrintLastLog yes
debug3: /etc/ssh/sshd_config:32 setting TCPKeepAlive yes
debug3: /etc/ssh/sshd_config:35 setting AcceptEnv LANG LC_*
debug3: /etc/ssh/sshd_config:37 setting Subsystem sftp /usr/lib/openssh/sftp-server
debug3: /etc/ssh/sshd_config:39 setting UsePAM no
debug1: sshd version OpenSSH_7.4, OpenSSL 1.0.2l 25 May 2017
debug1: private host key #0: ssh-rsa SHA256:WQqJ/wtLLVW+rpRhqh+bYk3/04eF3o7PiU6bL/ujzUg
debug1: rexec_argv[0]='/usr/sbin/sshd'
debug1: rexec_argv[1]='-ddd'
debug3: oom_adjust_setup
debug1: Set /proc/self/oom_score_adj from 0 to -1000
debug2: fd 3 setting O_NONBLOCK
debug1: Bind to port 22 on 0.0.0.0.
Server listening on 0.0.0.0 port 22.
debug2: fd 4 setting O_NONBLOCK
debug3: sock_set_v6only: set socket 4 IPV6_V6ONLY
debug1: Bind to port 22 on ::.
Server listening on :: port 22.

bien vu pour logger.

J’ai déjà rencontré ce genre de souci.
Dans mon cas, rsyslog était configuré pour envoyer les logs vers une IP mais cette IP n’était pas joignable.
rsyslog accumule les message pendant un temps, et puis toute une partie du système se bloque:

  • Connexion SSH très longue
  • arrêt / redémarrage de service impossible

Ca ressemble beaucoup a ton cas.

Je n’ai rien changé au sytem de log.
Je viens de redémarrer le lxc avec systemd en mode debug, à suivre

Bonjour à tous, bonjour phazon,

La cause est effectivement le système de log, mais pas sa configuration.
J’ain un script bash qui écrit régulièrement dans /var/log/debug via la cde logger. Si je visualise ce fichier avec vi (par exemple) le script n’écrit plus les logs et manifestement il doit remplir un tampon* qui une fois plein pénalise grandement tout le système.
*je n’ai pas pris le temps de voir si l’on peut prévoir/résoudre ce pb, via l’examen de /dev/log par exemple.