Spoedonderhoud shared filesysteem (CephFS)

Spoedonderhoud shared filesysteem (CephFS)

05-12-2019 23:00:00 - 06-12-2019 02:00:00

Urgentie: Spoed
Getroffen diensten:
- Shared Linux Hosting;
- Geen VNC (console) toegang op virtuele machines in de BIT-portal;
- Shared filesystems op CephFS.
Verwachte impact:
- Websites op het Shared Linux hostingplatform kunnen kortstondig onbereikbaar zijn;
- De uploadserver van het Shared Linux hostingplatform zal kortstondig onbereikbaar zijn;
- Op de BIT-portal zal het kortstondig niet mogelijk zijn om (VNC) console toegang te krijgen op virtuele machines;
- Klanten die gebruikmaken van het shared filesysteem zullen kortstondig hinder ondervinden.
Klantactie vereist: Nee
Referentienummer: 166031

Samenvatting:
Er zal op de Ceph Metadata (MDS) servers aangepaste software geïnstalleerd worden. We doen dit in samenspraak met de CephFS-ontwikkelaars om de ondervonden problemen met het CephFS-cluster te verhelpen. Het CephFS-cluster is tijdens dit onderhoud tijdelijk niet redundant en op bepaalde ogenblikken kortstondig niet beschikbaar.


Details:
Dit spoedonderhoud wordt uitgevoerd op een afwijkend onderhoudsmoment. Tijdens het normale onderhoudsvenster (00.00 - 07.00 uur) wordt CephFS (en de MDS-servers) het zwaarste belast (in verband met back-ups). We hebben daarom besloten om dit onderhoud uit te voeren op het moment dat er minder activiteit is op het shared filesysteem. Tijdens het onderhoud zal het shared filesysteem, CephFS, minimaal één keer, maar mogelijk meerdere malen, kortstondig niet beschikbaar zijn. De MDS-servers zullen worden voorzien van aangepaste software. De standby server zal tijdens dit onderhoud in zijn geheel opnieuw moeten worden geïnstalleerd zodat de aangepaste software kan functioneren. Bij ons vorige spoedonderhoud van 24 november j.l. hebben de we huidige actieve MDS-server al opnieuw geïnstalleerd, zodoende hoeft deze op dit moment alleen te worden voorzien van de aangepaste software. Dit alles doen we om de storingen van enige tijd geleden (Storing-storage-systemen) en gisterenavond (Verstoring-CephFS-storage) in te toekomst hopelijk te voorkomen. Tijdens het onderhoud aan de standby MDS-server is het CephFS-cluster tijdelijk niet redundant.