[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Sostituire disco LVM con GlusterFS



Il 20/08/2018 13:11, Marco Bertorello ha scritto:
Buongiorno a tutti,

ho due macchine identiche, rispettivamente con 1 disco SSD per OS e cache di LVM e 2 dischi da 3TB.

Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD :

└─sda4                      8:4    0 45.9G  0 part
   ├─VG01-LV01_cache_meta  253:0    0    8M  0 lvm
   ├─VG01-LV01_cache_cdata 253:3    0   40M  0 lvm
   │ └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
   └─VG01-LV01_cache_cmeta 253:4    0    8M  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
sdb                         8:16   0  2.7T  0 disk
└─sdb1                      8:17   0  2.7T  0 part
   └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
sdc                         8:32   0  2.7T  0 disk
└─sdc1                      8:33   0  2.7T  0 part
   └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated

Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un raspberry) il volume tra i due nodi.

Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe vorrei sostituirlo. Qual'è secondo voi la procedura migliore per evitare di perdere dati (va benissimo ricostruire dal nodo sano di gluster)?

grazie molte,

--
Marco Bertorello
System Administrator


Buongiorno Marco,
premetto che non ho mai avuto una problematica del genere.
Da quanto hai scritto non ci sono dischi in raid. Con il raid probabilmente avresti avuto meno problemi.

Non avendo mai usato gluster in produzione ma solo in ambiente di test non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1 (arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore. Potresti degradare (scollegare dalla rete credo basti) il nodo (brick) di gluster dove hai il problema, sostituire il disco danneggiato (magari se hai abbastanza spazio sposta i dati sul disco rimanente del volume LVM) e poi ricollegare il brick a gluster in modo tale che il nodo master risincronizzi quello appena collegato. Durante questa operazione gluster dovrebbe comunque funzionare e garantire l'accesso ai dati.

Penso che questo servizio sia funzionante in un'azienda per cui non stopperei tutte e due le macchine primo perche con gluster non avrebbe senso, se ha un problema su un host disattivare tutti gli host equivale ad avere solo un host. In secondo luogo lo eviterei per evitare, nel momento in cui riavvii gluster e nel caso in cui il primo brick sia desincronizzato rispetto al secondo, che si generino dei problemi nel mantenere i brick sincronizzati magari prende il brick meno aggiornato come master e rischi di perdere qualcosa.


Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche prova su macchine virtuali onde evitare disastri.


Magari qualche utente con più esperienza potrà fornirti maggiori indicazioni.

Un saluto.


Reply to: