Reboot intempestif
Pour information, réponse du support kimsufi (en 2 jours, comme quoi le support kimsufi est plus réactif qu'on le dit parfois) :
Je ne trouve aucune autre information concernant un reboot de votre serveur.
Conclusion, un serveur avec un uptime de près de 2 ans qui reboot sans explication et qui refonctionne sans souci depuis : mystère....
En rescue :
- SMART state OK
- partitions : No errors detected
- Memory : No errors detected
Une autre idée ?
Merci buddy, je n'avais pas pensé au mode "rescue" (pas encore eu réllement l'occasion de m'en servir :-) )
Cela dit, un "smartctl -a -d ata /dev/sda" ne révèle aucun problème et il n'y a pas de "... mce: [Hardware Error]: Machine check events logged" dans les logs
peut être une barrette de ram défaillante ... ou un disque défaillant, il faut les tester en rescue.
Merci pour ta réponse nowwhat,
Je ne m'attendait pas à avoir LA raison de ce reboot en postant sur ce forum, juste des idées de pistes à étudier.
Je ne vois pas trop comment l'identification précise de ce serveur pourrais aider un lecteur de ce forum, à moins que ce soit un technicien d'OVH. Pour cela, J'ai ouvert un ticket au support kimsufi en donnant l'identifiant du serveur mais je n'ai même pas eu de retour sur la prise en compte ou nom de ce ticket (numéro ?)...
Le serveur est dans GRA 1, baie G102B02 qui est en vert actuellement sur le graphe d'état des serveurs. S'il y a un historique, je ne sais comment y accéder.
Que conseilles-tu comme outils pour tracker un serveur qui aurait permis d'en savoir plus sur la cause d'un reboot intempestif ?
Bonjour,
Si toi tu ne trouve pas la raison, pour nous ça sera encore plus difficile. De plus, sans détails comme quel 'data center', emplacement, ou quoi que ce soit comme info pour identifier ton serveur ....... (mission impossible)
Sinon: oui, un server, c'est comme un PC - t'as un "écran bleu" des fois
De plus, OVH 'ping' ton serveur chaque 5 minutes. Si le redémarrage a eu lieu exactement entre deux ping, même OVH ne era pas au courant. Ce qui démontre que leur 'RTM' est utile sans plus - pour tracker ton serveur il est préférable d’utiliser ces propres outils.
Bonjour,
J'observe un reboot de mon serveur ce matin à 06:42 sans avoir reçu la moindre alerte ni trouver dans aucun log le moindre message suspect qui pourrait m'indiquer la raison de ce reboot...
Quelqu'un aurait une idée ?
Merci,
Laurent Barme.