Hébergements Web

Attached to Project: Hébergements Web
Opened by Nicolas - 26.09.2018
Last edited by Nicolas - 06.02.2019

FS#105 - Incident Cluster004 - Web

Une intervention a eu lieu cette nuit afin de changer un disque de la grappe du cluster qui était détecté comme Hors Service.
Ce changement s’est bien passé, et le RAID est en cours de resynchronisation.

Pour une raison que nous ignorons à cet instant, un des nœuds de la redondance s’est mis à saturer, sans pour autant donner la main aux autres machines de ce même nœud.
Nous allons relancer le nœud afin de comprendre la situation.

Veuillez nous excuser pour la gêne occasionnée,

Admin
Nicolas commented on 26 September 2018 20:08

Concernant le RAID, il est actuellement à 56% de synchronisation avec 0 pertes à cet instant.

Admin
Nicolas commented on 26 September 2018 20:09

Concernant le défaut du nœud, le problème ce centralise sur un nœud en défaut avec les deux cartes SAS.
Remplacement prévue rapidement

Admin
Nicolas commented on 26 September 2018 20:10

Concernant le HA, nous allons ajouter encore de la ressource afin de pouvoir fonctionner à 50% de machines en cas de nouveau scénario comme ce jour…

Admin
Nicolas commented on 26 September 2018 20:13

Actuellement des services fonctionnent en mode dégradé mais aucune perte à cet instant.
Un hard down aura lieu cette nuit, afin de relancer les synchronisations, après le changement des deux cartes SAS et de l’ajout de pools de ressources.

Admin
Nicolas commented on 27 September 2018 00:27

Actuellement des services fonctionnent en mode dégradé mais aucune perte à cet instant.
Un hard down aura lieu cette nuit, afin de relancer les synchronisations, après le changement des deux cartes SAS et de l’ajout de pools de ressources.

Admin
Nicolas commented on 27 September 2018 00:27

00h15 (utc+2). Intervention en cours

Admin
Nicolas commented on 27 September 2018 00:29

Les plateformes sont de nouveau en ligne.
Un nœud du pool de ressource ne souhaite pas redémarrer, nous changeons la machines dans les prochaines heures… Pas de coupure à prévoir

Admin
Nicolas commented on 27 September 2018 00:34

La synchronisation du RAID est actuellement à 70%…

Admin
Nicolas commented on 27 September 2018 07:59

La synchronisation du RAID est actuellement à 88%…

Admin
Nicolas commented on 27 September 2018 08:50

La synchronisation du RAID est actuellement à 90%…

Admin
Nicolas commented on 27 September 2018 11:37

La synchronisation du RAID est actuellement à 99%…

Admin
Nicolas commented on 27 September 2018 11:59

La synchronisation du RAID est actuellement à 100%… END

Loading...

Available keyboard shortcuts

Tasklist

Task Details

Task Editing