Rimozione e reinserimento di un OSD Ceph in seguito al fallimento della RAM di un nodo Proxmox 8

da Marco Valle | Ott 23, 2024

Di recente si è cimita la RAM di uno dei nodi Proxmox 8 con Ceph del mio cluster casalingo.
Me ne sono accorto perché i servizi ceph-osd@ e ceph-mon@ fallivano e non era possibile riavviarli.
Nei logs erano presenti diverse Segmentation Faults e perciò ho deciso di effettuare dei test sulle memorie tramite MemTester che hanno confermato che un chip di una RAM era mal funzionante.
Ho sostituito la RAM difettosa e ho reinstallato in monitor e l’OSD sul nodo, infine il cluster ha ripreso a funzionare regolarmente.

IDENTIFICARE IL PROBLEMA

Tramite i seguenti comandi è possibile verificare i logs nel journal di systemd dei servizi Ceph falliti:

journalctl -xeu ceph-osd@*.service
journalctl -xeu ceph-mon@*.service

0 1	journalctl -xeu ceph-osd@.service journalctl -xeu ceph-mon@.service

Verificare se sono presenti degli errori che potrebbero indicare la corruzione di rocksdb.

Tramite il seguente comando è possibile visualizzare i logs del kernel:

dmesg

dmesg

Verificare se sono presenti degli errori simili ai seguenti:

[ 2114.575583] ceph[18054]: segfault at f10095a9f8 ip 0000000000517c44 sp 00007ffeb3b04350 error 4 in python3.11[41f000+2b5000] likely on CPU 3 (core 3, socket 0)
[ 2114.575602] Code: 48 83 ec 18 4c 8b 6f 10 4d 85 ed 0f 8e 45 05 00 00 48 bb c5 67 56 16 2f eb d4 27 49 89 ff 45 31 e4 4b 8b 6c e7 18 4c 8b 75 08 <49> 8b 46 78 48 85 c0 0f 84 2f 33 f1 ff 48 3d c0 e6 4f 00 0f 85 a3 1505589460992 bytes (1.5 TB, 1.4 TiB) copied, 951 s, 1.6 GB/s
[ 2964.412919] perf: interrupt took too long (2503 > 2500), lowering kernel.perf_event_max_sample_rate to 79000

[ 2114.575583] ceph[18054]: segfault at f10095a9f8 ip 0000000000517c44 sp 00007ffeb3b04350 error 4 in python3.11[41f000+2b5000] likely on CPU 3 (core 3, socket 0)

[ 2114.575602] Code: 48 83 ec 18 4c 8b 6f 10 4d 85 ed 0f 8e 45 05 00 00 48 bb c5 67 56 16 2f eb d4 27 49 89 ff 45 31 e4 4b 8b 6c e7 18 4c 8b 75 08 <49> 8b 46 78 48 85 c0 0f 84 2f 33 f1 ff 48 3d c0 e6 4f 00 0f 85 a3 1505589460992 bytes (1.5 TB, 1.4 TiB) copied, 951 s, 1.6 GB/s

[ 2964.412919] perf: interrupt took too long (2503 > 2500), lowering kernel.perf_event_max_sample_rate to 79000

Se non sono presenti errori di tipo Segmentation Fault è possibile verificare se sono presenti errori relativi all’IO del disco con l’OSD di Ceph fallito.
Se si dovessero riscontrare degli errori di IO, è possibile seguire questa guida per rimuovere l’OSD ed in seguito provare a verificare tramite delle scritture sul disco se si riscontrano ulteriori errori.
Anche l’utility smartctl può essere di aiuto per diagnosisticare dei problemi di disco.

EFFETTUARE DEI TEST ALLA MEMORIA

Se sono stati riscontrati degli errori di tipo Segmentation Fault nei logs, effettuare dei test della memoria per identificare quale RAM è difettosa, in seguito rimoverla o sostituirla.

Prima di riavviare il nodo, si consiglia aggiornale l’immagine initramfs, poiché è possibile essa che sia inconsistente:

update-initramfs -u

0	update-initramfs -u

Per effettuare i test riavviare il nodo e selezionare Memory Test nel grub prima che venga avviato Proxmox:

Se dovesse avviarsi con degli errori relativi alla firma invalida disabilitare momentaneamente il Secure Boot dal BIOS.

Se dovessero essere mostrati degli errori durante il test non è necessario farlo proseguire, rimuovere le RAM ed eseguire nuovemente il test, finché non si identifica quella difettosa.
Dopo aver sostituito la RAM difettosa, riavviare Proxmox e verificare se i servizi sono ancora falliti, se lo sono procedere alla rimozione dell’OSD e del monitor.

RIMUOVERE OSD

Identificare l’OSD con stato down con il comando:

ceph osd tree

0	ceph osd tree

Dovremmo visualizare il seguente output:

ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 5.45819 root default
-10 1.81940 host pve01
2 nvme 1.81940 osd.2 up 1.00000 1.00000
-3 1.81940 host pve02s
0 nvme 1.81940 osd.0 up 1.00000 1.00000
-5 1.81940 host pve03
1 nvme 1.81940 osd.1 down 0 1.00000

ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF

-1 5.45819 root default

-10 1.81940 host pve01

2 nvme 1.81940 osd.2 up 1.00000 1.00000

-3 1.81940 host pve02s

0 nvme 1.81940 osd.0 up 1.00000 1.00000

-5 1.81940 host pve03

1 nvme 1.81940 osd.1 down 0 1.00000

Oppure dalla web UI di Proxmox:

In questo caso l’OSD ha ID 1.

Procedere alla rimozione dell’OSD con i seguenti comandi: (sostituire 1 con l’ID dell’OSD da rimuovere)

ceph osd destroy 1
ceph osd purge 1
ceph auth del osd.1

ceph osd destroy 1

ceph osd purge 1

ceph auth del osd.1

Se si vuole rimuovere il nodo dalla Crush map, per esempio per reinstallarlo con un hostname diverso, è possibile eseguire il seguente comando (sostituire pve03 con il nome del nodo):

ceph osd crush remove pve03

0	ceph osd crush remove pve03

RIMOZIONE DEL VOLUME CEPH

Tramite lsblk è possibile verificare il nome del volume Ceph:

root@pve03:~# lsblk
nvme0n1 259:0 0 1.8T 0 disk
└─ceph--a07c107b--639b--45ab--9ed9--78b74b76591a-osd--block--6ac55207--ec76--4365--b381--a34c7f783d1a 252:2 0 1.8T 0 lvm

root@pve03:~# lsblk

nvme0n1 259:0 0 1.8T 0 disk

└─ceph--a07c107b--639b--45ab--9ed9--78b74b76591a-osd--block--6ac55207--ec76--4365--b381--a34c7f783d1a 252:2 0 1.8T 0 lvm

Procedere alla rimozione del volume (sostituire il path del volume Ceph con quello identificato tramite “lsblk”):

ceph-volume lvm zap --destroy /dev/ceph-a07c107b-639b-45ab-9ed9-78b74b76591a/osd-block-6ac55207-ec76-4365-b381-a34c7f783d1a

0	ceph-volume lvm zap --destroy /dev/ceph-a07c107b-639b-45ab-9ed9-78b74b76591a/osd-block-6ac55207-ec76-4365-b381-a34c7f783d1a

Infine, è possiible rimuovere eventuali signatures del filesystem rimaste (sostituire il path con quello del disco che conteneva il volume Ceph appena rimosso):

wipefs -a /dev/nvme0n1

0	wipefs -a /dev/nvme0n1

RIMOZIONE DEL MONITOR CEPH

È possibile rimuovere il monitor di Ceph dalla Web UI di Proxmox.

Navigare nella sezione Monitor di Ceph, selezionare il monitor da rimuovere e cliccare su Destroy:

Infine confermare cliccando Yes:

RIDURRE IL NUMERO DI REPLICHE

Se non si hanno nodi a sufficienza per mantenere il numero di repliche richiesto, è possibile ridurlo temporaneamente.

Navigare nella sezione Pools di Ceph, selezionare il Pool che si vuole modificare, cliccare su Edit e ridurre il numero di repliche:

Ripetere l’operazione per tutti i Pools.

Dopo poco dovrebbe essere possibile visualizzare il cluster nello stato HEALTH_OK:

AGGIUNGERE IL MONITOR CEPH

Navigare nella sezione Monitor di Ceph e cliccare Create:

Selezionare l’host su cui creare il monitor e cliccare su Create:

Verificare che il monitor appena creato sia attivo:

AGGIUNGERE OSD CEPH

Selezionare il nodo su cui è presente il disco dell’OSD da creare, navigare nella sezione OSD di Ceph e cliccare su Create: OSD:

Selezionare il disco, il tipo di disco e cliccare su Create:

Se dovessero venir mostrati errori che affermano il monitor Ceph già esiste, rimuovere il suo IP dalla direttiva “mon_host” nella sezione [global] del file /etc/ceph/ceph.conf:

[global]
...
mon_host = 10.10.110.11 10.10.110.12
...

[global]

...

mon_host = 10.10.110.11 10.10.110.12

...

Verificare che l’OSD appena creato sia attivo:

AUMENTARE IL NUMERO DI REPLICHE

Dopo aver ripristinato lo stato di salute del cluster Ceph è possibile aumentare il numero di repliche.
Per farlo tornare nella sezione Pools di Ceph, selezionare il Pool che si vuole modificare, cliccare su Edit e aumetare il numero di repliche:

Ripetere l’operazione per tutti i Pools.

Dopo poco dovrebbe essere possibile visualizzare dalla Web UI di Proxmox lo stato di avanzamento del ribilanciamento di Ceph:

CORREGGERE PG INCONSISTENTI

Nel caso in cui si verificassero errori relativi a PG (placement groups) incosistenti è possibili identificarli dalla Web UI di Proxmox:

Identificare l’ID del PG danneggiato tramite il seguente comando:

root@pve03:~# ceph health detail
HEALTH_ERR 7 scrub errors; Possible data damage: 1 pg inconsistent
[ERR] OSD_SCRUB_ERRORS: 7 scrub errors
[ERR] PG_DAMAGED: Possible data damage: 1 pg inconsistent
pg 1.c is active+clean+inconsistent, acting [0,2,1]

root@pve03:~# ceph health detail

HEALTH_ERR 7 scrub errors; Possible data damage: 1 pg inconsistent

[ERR] OSD_SCRUB_ERRORS: 7 scrub errors

[ERR] PG_DAMAGED: Possible data damage: 1 pg inconsistent

pg 1.c is active+clean+inconsistent, acting [0,2,1]

In questo caso l’ID è “1.c”.

Eseguire il seguente comando per riparare il placement group (sostituire “1.c” con l’ID del PG incosistente):

ceph pg repair 1.c

0	ceph pg repair 1.c

Dopo non molto il cluster dovrebbe tornare nello stato HEALTH_OK.

Articoli Recenti

Veeam Backup

Restore di una VM da VmWare ESXi a Proxmox con Veeam Backup and Replication

Upgrade di Veeam Backup & Replication dalla versione 12.0.0.1402 alla versione 12.1.1.56

Upgrade di Veeam Backup & Replication dalla versione 11 alla versione 12

Veeam Backup & Replication: Configurazione del Repository Google Cloud Storage

Configuration Backup in Veeam: Error Could not load file or assembly Microsoft.SqlServer.BatchParser

Aggiornamento della versione Microsoft SQL Server in Veeam Backup & Replication

Monitoring

Monitoraggio del Server Postfix con Grafana utilizzando Loki e Promtail

Monitoraggio del Server NTP Chrony con Grafana utilizzando Telegraf e InfluxDB

Installazione e Configurazione del Demone SNMP in PiKVM su Raspberry 4

phpIPAM: Please disable installation scripts: config.php: $disable_installer = true; docker: env IPAM_DISABLE_INSTALLER=1

LibreNMS Error: Composer detected issues in your platform: Your Composer dependencies require a PHP version “>= 8.2.0”

LibreNMS: FAIL: Failed to fetch version from local git: fatal: detected dubious ownership in repository at ‘/opt/librenms’ To add an exception for this directory, call: git config –global –add safe.directory /opt/librenms

Friends

My English Lab English School

ChrSystem Servizi ICT

Since 01 Kreative Graphics

Database

Monitoraggio del Server NTP Chrony con Grafana utilizzando Telegraf e InfluxDB

Installazione e Configurazione base di Nextcloud Community Edition su Ubuntu Server 24.04

Aggiornamento di MongoDB dalla versione 3.6 alla versione 7.0 su UniFi Network Server

Installazione e configurazione di Puppet server, PuppetDB e PostgreSQL su containers LXC con Debian 11

Installazione e Configurazione base di MySQL Server su Microsoft Windows Server 2022

Installazione e Configurazione base di Moodle 4.0.5 su Ubuntu Server 22.04

Networking

Prima configurazione di Unifi Dream Machine Pro in Modalità Offline

Configurazione ATA Grandstream HT802 per il funzionamento di telefoni analogici con VoIP FTTH di TIM

Lista di tutti i comandi utili per la gestione in SSH dei devices Unifi

Configurazione della Connessione FTTH di TIM su Unifi Dream Machine Pro

Installazione e Configurazione del demone SNMP su Unifi Dream Machine Pro

Configurazione del DNS Dinamico su Unifi Dream Machine Pro

Autori

Raffaele Chiatto Amministratore

Marco Valle Autore

Angelo Lauria Autore

Edoardo Prot Autore

Davide D’Urso Autore

Marco Valle

Mi chiamo Marco Valle e da sempre sono appassionato di Cybersicurezza e Linux. Per lavoro implemento soluzioni open source.

← Articoli precedenti Next →

Tag: Ceph | OSD | Proxmox

Categorie: Ceph | Proxmox

Installazione e Configurazione Base di OPNSense

Giu 30, 2025

Nel panorama delle soluzioni firewall open source, OPNsense si distingue per la sua combinazione di potenza, flessibilità e facilità d’uso. Basato su FreeBSD e con un'interfaccia grafica moderna e intuitiva, OPNsense è una scelta eccellente sia per ambienti...

Monitoraggio del Server Postfix con Grafana utilizzando Loki e Promtail

Giu 23, 2025

In un'infrastruttura IT affidabile ed efficiente, il monitoraggio continuo dei servizi è fondamentale. Tra i servizi critici per molte organizzazioni c'è Postfix, uno dei mail server più diffusi e apprezzati per la sua stabilità e configurabilità. Tuttavia, per...

Monitoraggio del Server NTP Chrony con Grafana utilizzando Telegraf e InfluxDB

Giu 19, 2025

La precisione dell'orario di sistema è fondamentale per la coerenza nei log, la sicurezza, la sincronizzazione dei processi distribuiti e il corretto funzionamento di molti servizi IT. Per questo motivo, monitorare l'efficienza e l'affidabilità di un server NTP è una...

Rimozione e reinserimento di un OSD Ceph in seguito al fallimento della RAM di un nodo Proxmox 8

IDENTIFICARE IL PROBLEMA

EFFETTUARE DEI TEST ALLA MEMORIA

RIMUOVERE OSD

RIMOZIONE DEL VOLUME CEPH

RIMOZIONE DEL MONITOR CEPH

RIDURRE IL NUMERO DI REPLICHE

AGGIUNGERE IL MONITOR CEPH

AGGIUNGERE OSD CEPH

AUMENTARE IL NUMERO DI REPLICHE

CORREGGERE PG INCONSISTENTI

Articoli Recenti

Veeam Backup

Monitoring

Friends

Database

Networking

Autori

Marco Valle

Related Post

0 commenti

Invia un commento

Virtualizzazione

Linux

Microsoft

Apple

Backup

Database

Security

Automazione