Controllo filesystem Debian
Se l’obiettivo è prevenire errori e perdita dati su un server Debian 11, ci sono tre livelli di controlli che puoi fare senza smontare la root:
Indice
Controllo hardware del disco (SMART)
Per prima cosa, conviene verificare la salute fisica del disco con smartctl (pacchetto smartmontools):
apt update && apt install smartmontools -y smartctl -a /dev/sda
Cose da guardare:
- Reallocated_Sector_Ct (settori riallocati)
- Pending_Sector o Offline_Uncorrectable (settori sospetti)
- SMART overall-health self-assessment test result: PASSED (se è OK)
Puoi anche lanciare un test breve (pochi minuti):
smartctl -t short /dev/sda
E poi leggere i risultati con:
smartctl -l selftest /dev/sda
Controllo del filesystem (senza smontare)
Su filesystem ext4 puoi chiedere informazioni senza fare un vero fsck (che richiede smontaggio):
tune2fs -l /dev/sda1 | grep -E "Mount count|Check interval|Last checked"
Questo ti dice:
- quante volte è stato montato da ultimo fsck,
- quando è stato fatto l’ultimo controllo,
- ogni quanto è programmato il check.
Controllo del filesystem più approfondito
Questi sono alcuni test (lenti) da effettuare con una live, ad esempio Putty.
Verifica i log SMART più profondi
Avvia un test esteso:
smartctl -t long /dev/sda
(ci vorrà tempo). Per avere lo stato di avanzamento:
smartctl -a /dev/sda
Poi leggi il risultato:
smartctl -l selftest /dev/sda
Test di lettura a basso livello
Per scovare settori lenti/difettosi:
badblocks -sv /dev/sda
molto lento, ma rivela se ci sono aree danneggiate
3. Manutenzione preventiva
Se vuoi programmare controlli automatici:
Debian fa fsck in automatico al boot se il contatore supera la soglia (tune2fs -c per definire ogni quanti mount).
Puoi anche forzare al prossimo riavvio:
touch /forcefsck reboot
VM Debian 11
Non puoi controllare direttamente la salute fisica del disco: quello va fatto sull’host VMware (es. con esxcli, vSphere, o tool hardware).
Nella VM puoi solo controllare il filesystem e lo spazio:
Verificare che non ci siano errori I/O nei log:
dmesg | grep -i error journalctl -k | grep -i sda
Monitorare spazio e inode:
df -h df -i
Controllare quando è stato fatto l’ultimo fsck:
tune2fs -l /dev/sda1 | grep -E "Mount count|Last checked|Check interval"
1. Controllo del filesystem nella VM Debian (fsck)
Siccome il tuo / è montato da /dev/sda1, non puoi fare fsck a caldo. Devi pianificarlo per il prossimo riavvio:
Verifica il device corretto:
lsblk (vedrai /dev/sda1 ? montato su /)
Programma il check al prossimo riavvio:
touch /forcefsck
Riavvia il server:
reboot
Al boot Debian lancerà automaticamente fsck su /dev/sda1 ? potresti vedere messaggi di correzione errori se ce ne sono.
Puoi controllare poi i log dopo il riavvio:
journalctl -b -1 | grep fsck
Se tutto è OK, dovresti vedere qualcosa tipo:
fsck.ext4: /dev/sda1: clean, 123456/1234567 files, 987654/9876543 blocks
2. Controllo della salute del datastore su ESXi
Questo va fatto dal lato host ESXi, non dalla VM.
Via SSH/CLI su ESXi host
Elenca i dischi:
esxcli storage core device list - esxcli storage vmfs extent list
Controllo SMART
esxcli storage core device smart get -d t10.NVM....
Parameter Value Threshold Worst Raw ------------------------ ----- --------- ----- --- Health Status OK N/A N/A N/A Power-on Hours 4450 N/A N/A N/A Power Cycle Count 8 N/A N/A N/A Reallocated Sector Count 0 95 N/A N/A Drive Temperature 51 72 N/A N/A
Vediamolo nel dettaglio:
- Health Status: OK
- Il disco non segnala errori critici.
- Power-on Hours: 4450 (~185 giorni)
- È il tempo di attività complessivo del disco. Quindi il tuo NVMe ha circa 6 mesi di accensione cumulata (può essere acceso di continuo o a cicli, dipende).
- Power Cycle Count: 8
- Il disco è stato acceso/spento solo 8 volte. Tipico di un server/host che resta quasi sempre acceso.
- Reallocated Sector Count: 0
- Nessun settore difettoso riallocato ? ottimo segno, l’SSD è sano a livello di celle.
- Drive Temperature: 51 °C (limite 72 °C)
- Sei ben sotto la soglia critica, anche se 51°C per un NVMe in un host è normale (gli NVMe scaldano più degli SSD SATA). Importante è restare sotto i 70 °C.
Conclusione
Il tuo datastore (disco NVMe Kioxia) è in buona salute:
- Nessun settore riallocato.
- SMART “OK”.
- Temperatura sotto soglia.
- Pochi power-cycle, molte ore di utilizzo continuo ? normale per un host.