OVH Community, your new community space.

Reboot intempestif


barme
30/05/2015, 11h58
Problème classé

barme
30/05/2015, 11h56
Pour information, réponse du support kimsufi (en 2 jours, comme quoi le support kimsufi est plus réactif qu'on le dit parfois) :

Je ne trouve aucune autre information concernant un reboot de votre serveur.


Conclusion, un serveur avec un uptime de près de 2 ans qui reboot sans explication et qui refonctionne sans souci depuis : mystère....

barme
25/05/2015, 16h26
En rescue :
- SMART state OK
- partitions : No errors detected
- Memory : No errors detected

Une autre idée ?

barme
25/05/2015, 15h29
Merci buddy, je n'avais pas pensé au mode "rescue" (pas encore eu réllement l'occasion de m'en servir :-) )

Cela dit, un "smartctl -a -d ata /dev/sda" ne révèle aucun problème et il n'y a pas de "... mce: [Hardware Error]: Machine check events logged" dans les logs

buddy
25/05/2015, 12h20
peut être une barrette de ram défaillante ... ou un disque défaillant, il faut les tester en rescue.

barme
25/05/2015, 12h04
Merci pour ta réponse nowwhat,

Je ne m'attendait pas à avoir LA raison de ce reboot en postant sur ce forum, juste des idées de pistes à étudier.

Je ne vois pas trop comment l'identification précise de ce serveur pourrais aider un lecteur de ce forum, à moins que ce soit un technicien d'OVH. Pour cela, J'ai ouvert un ticket au support kimsufi en donnant l'identifiant du serveur mais je n'ai même pas eu de retour sur la prise en compte ou nom de ce ticket (numéro ?)...

Le serveur est dans GRA 1, baie G102B02 qui est en vert actuellement sur le graphe d'état des serveurs. S'il y a un historique, je ne sais comment y accéder.

Que conseilles-tu comme outils pour tracker un serveur qui aurait permis d'en savoir plus sur la cause d'un reboot intempestif ?

nowwhat
25/05/2015, 11h04
Bonjour,

Si toi tu ne trouve pas la raison, pour nous ça sera encore plus difficile. De plus, sans détails comme quel 'data center', emplacement, ou quoi que ce soit comme info pour identifier ton serveur ....... (mission impossible)

Sinon: oui, un server, c'est comme un PC - t'as un "écran bleu" des fois
De plus, OVH 'ping' ton serveur chaque 5 minutes. Si le redémarrage a eu lieu exactement entre deux ping, même OVH ne era pas au courant. Ce qui démontre que leur 'RTM' est utile sans plus - pour tracker ton serveur il est préférable d’utiliser ces propres outils.

barme
25/05/2015, 10h04
Bonjour,

J'observe un reboot de mon serveur ce matin à 06:42 sans avoir reçu la moindre alerte ni trouver dans aucun log le moindre message suspect qui pourrait m'indiquer la raison de ce reboot...

Quelqu'un aurait une idée ?

Merci,
Laurent Barme.