Controllo filesystem Debian

← HDD / SSD / SSD M.2

Se l’obiettivo è prevenire errori e perdita dati su un server Debian 11, ci sono tre livelli di controlli che puoi fare senza smontare la root:

Indice

1 Controllo hardware del disco (SMART)
2 Controllo del filesystem (senza smontare)
3 Controllo del filesystem più approfondito
- 3.1 Verifica i log SMART più profondi
- 3.2 Test di lettura a basso livello
4 3. Manutenzione preventiva
5 VM Debian 11
- 5.1 1. Controllo del filesystem nella VM Debian (fsck)
- 5.2 2. Controllo della salute del datastore su ESXi
  - 5.2.1 Via SSH/CLI su ESXi host

Controllo hardware del disco (SMART)

Per prima cosa, conviene verificare la salute fisica del disco con smartctl (pacchetto smartmontools):

apt update && apt install smartmontools -y
smartctl -a /dev/sda

Cose da guardare:

Reallocated_Sector_Ct (settori riallocati)
Pending_Sector o Offline_Uncorrectable (settori sospetti)
SMART overall-health self-assessment test result: PASSED (se è OK)

Puoi anche lanciare un test breve (pochi minuti):

smartctl -t short /dev/sda

E poi leggere i risultati con:

smartctl -l selftest /dev/sda

Controllo del filesystem (senza smontare)

Su filesystem ext4 puoi chiedere informazioni senza fare un vero fsck (che richiede smontaggio):

tune2fs -l /dev/sda1 | grep -E "Mount count|Check interval|Last checked"

Questo ti dice:

quante volte è stato montato da ultimo fsck,
quando è stato fatto l’ultimo controllo,
ogni quanto è programmato il check.

Controllo del filesystem più approfondito

Questi sono alcuni test (lenti) da effettuare con una live, ad esempio Putty.

Verifica i log SMART più profondi

Avvia un test esteso:

smartctl -t long /dev/sda

(ci vorrà tempo). Per avere lo stato di avanzamento:

smartctl -a /dev/sda

Poi leggi il risultato:

smartctl -l selftest /dev/sda

Test di lettura a basso livello

Per scovare settori lenti/difettosi:

badblocks -sv /dev/sda

molto lento, ma rivela se ci sono aree danneggiate

3. Manutenzione preventiva

Se vuoi programmare controlli automatici:

Debian fa fsck in automatico al boot se il contatore supera la soglia (tune2fs -c per definire ogni quanti mount).

Puoi anche forzare al prossimo riavvio:

touch /forcefsck
reboot

VM Debian 11

Non puoi controllare direttamente la salute fisica del disco: quello va fatto sull’host VMware (es. con esxcli, vSphere, o tool hardware).

Nella VM puoi solo controllare il filesystem e lo spazio:

Verificare che non ci siano errori I/O nei log:

dmesg | grep -i error
journalctl -k | grep -i sda

Monitorare spazio e inode:

df -h
df -i

Controllare quando è stato fatto l’ultimo fsck:

tune2fs -l /dev/sda1 | grep -E "Mount count|Last checked|Check interval"

1. Controllo del filesystem nella VM Debian (fsck)

Siccome il tuo / è montato da /dev/sda1, non puoi fare fsck a caldo. Devi pianificarlo per il prossimo riavvio:

Verifica il device corretto:

lsblk
(vedrai /dev/sda1 ? montato su /)

Programma il check al prossimo riavvio:

touch /forcefsck

Riavvia il server:

reboot

Al boot Debian lancerà automaticamente fsck su /dev/sda1 ? potresti vedere messaggi di correzione errori se ce ne sono.

Puoi controllare poi i log dopo il riavvio:

journalctl -b -1 | grep fsck

Se tutto è OK, dovresti vedere qualcosa tipo:

fsck.ext4: /dev/sda1: clean, 123456/1234567 files, 987654/9876543 blocks

2. Controllo della salute del datastore su ESXi

Questo va fatto dal lato host ESXi, non dalla VM.

Via SSH/CLI su ESXi host

Elenca i dischi:

esxcli storage core device list
-
esxcli storage vmfs extent list

Controllo SMART

esxcli storage core device smart get -d  t10.NVM....

 
Parameter                 Value  Threshold  Worst  Raw
------------------------  -----  ---------  -----  ---
Health Status             OK     N/A        N/A    N/A
Power-on Hours            4450   N/A        N/A    N/A
Power Cycle Count         8      N/A        N/A    N/A
Reallocated Sector Count  0      95         N/A    N/A
Drive Temperature         51     72         N/A    N/A

Vediamolo nel dettaglio:

Health Status: OK
Il disco non segnala errori critici.
Power-on Hours: 4450 (~185 giorni)
È il tempo di attività complessivo del disco. Quindi il tuo NVMe ha circa 6 mesi di accensione cumulata (può essere acceso di continuo o a cicli, dipende).
Power Cycle Count: 8
Il disco è stato acceso/spento solo 8 volte. Tipico di un server/host che resta quasi sempre acceso.
Reallocated Sector Count: 0
Nessun settore difettoso riallocato ? ottimo segno, l’SSD è sano a livello di celle.
Drive Temperature: 51 °C (limite 72 °C)
Sei ben sotto la soglia critica, anche se 51°C per un NVMe in un host è normale (gli NVMe scaldano più degli SSD SATA). Importante è restare sotto i 70 °C.

Conclusione

Il tuo datastore (disco NVMe Kioxia) è in buona salute:

Nessun settore riallocato.
SMART “OK”.
Temperatura sotto soglia.
Pochi power-cycle, molte ore di utilizzo continuo ? normale per un host.

Anonimo

Ricerca

Navigazione

Navigazione

Strumenti wiki

Strumenti wiki

Controllo filesystem Debian

Namespace

Azioni sulla pagina

Indice

Controllo hardware del disco (SMART)

Controllo del filesystem (senza smontare)

Controllo del filesystem più approfondito

Verifica i log SMART più profondi

Test di lettura a basso livello

3. Manutenzione preventiva

VM Debian 11

1. Controllo del filesystem nella VM Debian (fsck)

2. Controllo della salute del datastore su ESXi

Via SSH/CLI su ESXi host

Anonimo

Ricerca

Navigazione

Strumenti wiki

Strumenti pagine

Categorie

Controllo filesystem Debian

Indice

Controllo hardware del disco (SMART)

Controllo del filesystem (senza smontare)

Controllo del filesystem più approfondito

Verifica i log SMART più profondi

Test di lettura a basso livello

3. Manutenzione preventiva

VM Debian 11

1. Controllo del filesystem nella VM Debian (fsck)

2. Controllo della salute del datastore su ESXi

Via SSH/CLI su ESXi host