Controllo filesystem Debian

← HDD / SSD / SSD M.2

Se l’obiettivo è prevenire errori e perdita dati su un server Debian 11, ci sono tre livelli di controlli che puoi fare senza smontare la root:

Controllo hardware del disco (SMART)

Per prima cosa, conviene verificare la salute fisica del disco con smartctl (pacchetto smartmontools):

apt update && apt install smartmontools -y
smartctl -a /dev/sda

Cose da guardare:

  • Reallocated_Sector_Ct (settori riallocati)
  • Pending_Sector o Offline_Uncorrectable (settori sospetti)
  • SMART overall-health self-assessment test result: PASSED (se è OK)

Puoi anche lanciare un test breve (pochi minuti):

smartctl -t short /dev/sda

E poi leggere i risultati con:

smartctl -l selftest /dev/sda

Controllo del filesystem (senza smontare)

Su filesystem ext4 puoi chiedere informazioni senza fare un vero fsck (che richiede smontaggio):

tune2fs -l /dev/sda1 | grep -E "Mount count|Check interval|Last checked"

Questo ti dice:

  • quante volte è stato montato da ultimo fsck,
  • quando è stato fatto l’ultimo controllo,
  • ogni quanto è programmato il check.

Controllo del filesystem più approfondito

Questi sono alcuni test (lenti) da effettuare con una live, ad esempio Putty.

Verifica i log SMART più profondi

Avvia un test esteso:

smartctl -t long /dev/sda

(ci vorrà tempo). Per avere lo stato di avanzamento:

smartctl -a /dev/sda 

Poi leggi il risultato:

smartctl -l selftest /dev/sda

Test di lettura a basso livello

Per scovare settori lenti/difettosi:

badblocks -sv /dev/sda

molto lento, ma rivela se ci sono aree danneggiate

3. Manutenzione preventiva

Se vuoi programmare controlli automatici:

Debian fa fsck in automatico al boot se il contatore supera la soglia (tune2fs -c per definire ogni quanti mount).

Puoi anche forzare al prossimo riavvio:

touch /forcefsck
reboot


VM Debian 11

Non puoi controllare direttamente la salute fisica del disco: quello va fatto sull’host VMware (es. con esxcli, vSphere, o tool hardware).

Nella VM puoi solo controllare il filesystem e lo spazio:

Verificare che non ci siano errori I/O nei log:

dmesg | grep -i error
journalctl -k | grep -i sda

Monitorare spazio e inode:

df -h
df -i

Controllare quando è stato fatto l’ultimo fsck:

tune2fs -l /dev/sda1 | grep -E "Mount count|Last checked|Check interval"

1. Controllo del filesystem nella VM Debian (fsck)

Siccome il tuo / è montato da /dev/sda1, non puoi fare fsck a caldo. Devi pianificarlo per il prossimo riavvio:

Verifica il device corretto:

lsblk
(vedrai /dev/sda1 ? montato su /)

Programma il check al prossimo riavvio:

touch /forcefsck

Riavvia il server:

reboot

Al boot Debian lancerà automaticamente fsck su /dev/sda1 ? potresti vedere messaggi di correzione errori se ce ne sono.

Puoi controllare poi i log dopo il riavvio:

journalctl -b -1 | grep fsck

Se tutto è OK, dovresti vedere qualcosa tipo:

fsck.ext4: /dev/sda1: clean, 123456/1234567 files, 987654/9876543 blocks

2. Controllo della salute del datastore su ESXi

Questo va fatto dal lato host ESXi, non dalla VM.

Via SSH/CLI su ESXi host

Elenca i dischi:

esxcli storage core device list
-
esxcli storage vmfs extent list

Controllo SMART

esxcli storage core device smart get -d  t10.NVM....
 
Parameter                 Value  Threshold  Worst  Raw
------------------------  -----  ---------  -----  ---
Health Status             OK     N/A        N/A    N/A
Power-on Hours            4450   N/A        N/A    N/A
Power Cycle Count         8      N/A        N/A    N/A
Reallocated Sector Count  0      95         N/A    N/A
Drive Temperature         51     72         N/A    N/A

Vediamolo nel dettaglio:

  • Health Status: OK
    Il disco non segnala errori critici.
  • Power-on Hours: 4450 (~185 giorni)
    È il tempo di attività complessivo del disco. Quindi il tuo NVMe ha circa 6 mesi di accensione cumulata (può essere acceso di continuo o a cicli, dipende).
  • Power Cycle Count: 8
    Il disco è stato acceso/spento solo 8 volte. Tipico di un server/host che resta quasi sempre acceso.
  • Reallocated Sector Count: 0
    Nessun settore difettoso riallocato ? ottimo segno, l’SSD è sano a livello di celle.
  • Drive Temperature: 51 °C (limite 72 °C)
    Sei ben sotto la soglia critica, anche se 51°C per un NVMe in un host è normale (gli NVMe scaldano più degli SSD SATA). Importante è restare sotto i 70 °C.

Conclusione

Il tuo datastore (disco NVMe Kioxia) è in buona salute:

  • Nessun settore riallocato.
  • SMART “OK”.
  • Temperatura sotto soglia.
  • Pochi power-cycle, molte ore di utilizzo continuo ? normale per un host.