Onderhoud Ceph cluster

Onderhoud Ceph cluster

19-12-2019 00:00:00 - 19-12-2019 07:00:00

Onderwerp: Onderhoud Ceph cluster

Urgentie: Gepland

Getroffen diensten:
- Shared Linux Hosting;
- Geen VNC (console) toegang op virtuele machines in de BIT-portal;
- Klanten met shared filesysteem op CephFS.

Verwachte impact:

- Websites op het Shared Linux hostingplatform kunnen kortstondig onbereikbaar zijn;
- De uploadserver van het Shared Linux hostingplatform zal kortstondig onbereikbaar zijn;
- Op de BIT-portal zal het kortstondig niet mogelijk zijn om (VNC) console toegang te krijgen op virtuele machines;
- Klanten die gebruikmaken van het shared filesysteem zullen kortstondig hinder ondervinden.

Klantactie vereist:
Nee

Referentienummer:
166004

Samenvatting:
Het cluster zal worden voorzien van de laatste (Ceph) updates. Er zal een "CRUSH"-regelwijziging worden doorgevoerd die alle metadata van CephFS naar NVMe-storage zal verplaatsen ten behoeve van performanceverbetering. Van een drietal storageservers zullen we het managementnetwerk omzetten naar een andere netwerkkaart.

Details:
Het Ceph-cluster zal worden geüpdatet naar Ceph versie 13.2.8. Tevens zullen we de laatste OS-updates installeren. Om de metadata van CephFS zo snel als mogelijk te maken zullen we een instelling wijzigen om deze "pool" naar NVMe-opslag te verplaatsen. Dit zal online gebeuren en zou geen impact moeten hebben. Tevens zullen we van een drietal storageservers de managementinterfaces verplaatsen naar onboard netwerkkaarten. Hiervoor zullen de servers om beurten worden herstart. Tijdens het onderhoud zal het shared filesysteem, CephFS-cluster, meerdere malen, kortstondig niet beschikbaar zijn. Er zijn verbeteringen gebackport die de stabiliteit van de MDS (en dus CephFS) moeten verbeteren tijdens verstoringen. De impact van het hebben van grote caches wordt hiermee gereduceerd. In de toekomst zou dit moeten betekenen dat CephFS-onderhoud (MDS) minder impacting is.