Spoedonderhoud shared filesysteem (cephfs)

Spoedonderhoud shared filesysteem (cephfs)

24-11-2019 15:24:10 - 24-11-2019 23:59:59

Urgentie: Spoedonderhoud
Getroffen diensten:
- Shared Linux Hosting
- VNC (console) access virtuele machines in BIT-portal
- Klanten met shared filesysteem op cephfs
Verwachte impact:
- Websites op het Shared Linux hostingplatform kunnen kortstondig onbereikbaar zijn.
- De uploadserver van het Shared Linux hostingplatform zal kortstondig onbereikbaar zijn.
- Op de BIT-portal zal het kortstondig niet mogelijk zijn om (VNC) console toegang te krijgen op virtuele machines.
- Klanten die gebruikmaken van het shared filesysteem zullen kortstondig hinder ondervinden.
Klantactie vereist: Nee
Referentienummer: 165777
Contact: 0318 648 688, support@bit.nl

Samenvatting:
De standby MDS-server (onderdeel van het cephfs cluster) zal opnieuw geïnstalleerd en voorzien worden van aangepaste cephfs software (MDS) t.b.v. het verkrijgen van extra debug informatie op het moment van een eventuele crash. Tijdens het onderhoud aan de standby MDS server is het cephfs cluster tijdelijk niet redundant.

Details:
Dit spoedonderhoud wordt uitgevoerd op een afwijkend onderhoudsmoment. Tijdens het normale onderhoudsvenster (twaalf uur 's nachts tot zeven uur 's ochtends) wordt cephfs (en de MDS servers) het zwaarste belast (in verband met back-ups). We hebben daarom besloten om dit onderhoud uit te voeren op het moment dat er het minste activiteit is op het shared filesysteem. Tijdens het onderhoud zal het shared filesysteem, cephfs, minimaal één keer, maar mogelijk meerdere malen, kortstondig niet beschikbaar zijn. De standby server zal tijdens dit onderhoud opnieuw worden geïnstalleerd en worden voorzien van een aangepaste versie van de Ceph software (MDS) welke het shared filesysteem serveert. Dit om in het geval van herhaling van de storing van enige tijd geleden (https://www.bit.nl/news/2510/93/Storing-storage-systemen) extra (debug) informatie te verkrijgen. Zodra deze volledig is geïnstalleerd en voorzien is van de juiste software zullen we de cache op de huidige actieve MDS-server, sterk naar beneden bijstellen. Dit zal gebeuren in kleine stapjes om de impact ervan zo klein mogelijk te laten zijn en om uiteindelijk een snelle(re) fail-over te kunnen doen naar de standby MDS-server. Tijdens het onderhoud aan de standby MDS-server is het cephfs cluster tijdelijk niet redundant.