OVH Community, your new community space.

Serveur ne reboot pas (Debian 8.1) : grub ? LXC ? autre ?


kiv
06/12/2015, 22h00
Bonjour à tous,

Mon serveur plante au reboot pour une raison qui m'échappe. Pour résumer les étapes depuis l'acquisition du serveur :
- installation d'une Debian 8.1 par l'installeur d'OVH (avec les options par défaut),
- `apt-get update` et `apt-get upgrade` sans ajouter aucune source supplémentaire,
- installation de LXC et ses dépendances,
- installation de quelques paquets utiles (htop, ncdu, rsnapshot...)
- configuration de 3 conteneurs pleinement fonctionnels (owncloud, dokuwiki, madsonic)
- début de tentative de limiter les ressources aux conteneurs : je modifie alors
Code:
/etc/default/grub

GRUB_CMDLINE_LINUX="cgroup_enable=memory swapaccount=1"
Sachant que ces deux options étaient déjà dans "GRUB_CMDLINE_LINUX_DEFAULT"
Puis reboot. Depuis le serveur n'a jamais redémarré : ssh dit "connection refused", ping OK mais les services ne répondent plus et le manager en ligne d'OVH affiche zero activité CPU, RAM, réseau.

En mode rescue : rétablissement de la conf d'origine dans /etc/default/grub
Code:
GRUB_DEFAULT=0
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR=`lsb_release -i -s 2> /dev/null || echo Debian`
GRUB_CMDLINE_LINUX_DEFAULT="quiet"
#supprimé : "cgroup_enable=memory swapaccount=1"
GRUB_CMDLINE_LINUX=""
GRUB_DISABLE_LINUX_UUID=true
Code:
root@rescue:/# update-grub2
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.16.0-4-amd64
Found initrd image: /boot/initrd.img-3.16.0-4-amd64
  No volume groups found
done
Mais pas mieux. Je précise que je n'ai pas remplacé ni modifié le noyau.
Le RTM n'est plus disponible dans l'interface OVH, mais n'a disparu qu'après plusieurs modes rescue...

J'ai quelques extraits de logs qui disent autre chose de tout va bien si ça peut vous aider à m'aider : le reboot fatal date du 4 décembre à 22h46, depuis il n'y a plus rien dans les logs.

Code:
root@rescue:/# cat /var/log/kern.log | grep "WARNING"
Dec  1 11:10:44 ns330173 kernel: [247940.497761] >>>WARNING<<< Wrong ufstype may corrupt your filesystem, default is ufstype=old
Dec  4 22:17:03 ns330173 kernel: [547369.766498] >>>WARNING<<< Wrong ufstype may corrupt your filesystem, default is ufstype=old
Code:
root@rescue:/# cat /var/log/kern.log | grep "ERROR"
Nov 28 14:22:04 stock kernel: [    0.339920] acpi PNP0A08:00: _OSC failed (AE_ERROR); disabling ASPM
J'ai lu que le systemd de Debian 8 posait problème avec les conteneurs LXC, mais est-ce aussi le cas avec l'hôte ?