Mentre l’utente domestico ha un volume di dati contenuto da archiviare, le aziende e le grandi organizzazioni hanno bisogno di gestire centinaia se non migliaia di terabyte di informazioni. Immaginate che d’un tratto queste diventino inaccessibili. È chiaro che è indispensabile avere dei backup o dei sistemi di protezione per evitare interruzioni o perdite di dati, che causerebbero danni economici consistenti.
Inoltre lo storage deve essere flessibile e scalabile, in grado di soddisfare le esigenze future in termini di capacità. Per questi motivi, uno o due dischi rigidi non sono sufficienti. Sono necessari molti dischi collegati e accessibili da locale e remoto, eventualmente integrati con delle unità che fungono da backup.
Per rispondere a queste esigenze la tecnologia propone alcune opzioni, di cui i RAID sono la più diffusa. Abbiamo già parlato di questa archiviazione con degli articoli dedicati ai vari livelli. Ma di seguito vogliamo presentare un’alternativa che sta guadagnando popolarità per lo storage su larga scala.
JBOD è un sistema che condivide alcune somiglianze con i RAID, tuttavia ha una propria logica e si pone come una versione semplificata e adattabile a diverse tipologie di utenti. Quale sia il sistema migliore lo vedremo discutendo le differenze, i vantaggi e gli svantaggi, con un focus particolare sulla sicurezza e il recupero dei dati.
JBOD, Just a Bunch Of Disks
JBOD è l’acronimo di Just a Bunch Of Disks o Just a Bunch of Drives, che in italiano significa “solo un mucchio di dischi”. Di fatto è proprio questo, un contenitore che funziona come molti dischi in serie. È una configurazione comune nei data center o nelle organizzazioni che hanno bisogno di espandere la capacità dello storage in base alle esigenze. Quando serve spazio, basta aggiungere delle unità o sostituire quelle in uso con altre più capienti. Oppure aggiungere altri contenitori.
Il principale vantaggio di un JBOD è la rapida scalabilità e flessibilità. Generalmente supporta anche l’hot-swap, cioè la sostituzione delle unità a caldo senza spegnere il sistema. Un secondo vantaggio è la semplicità di gestione, poiché l'espansione non richiede software complessi o riconfigurazioni.
Un sistema operativo che gestisce un JBOD scrive i file utilizzando la logica dello spanning, cioè salvando i dati sul primo disco fino ad esaurire lo spazio, poi passando al secondo e così via. È una configurazione che supporta dischi di dimensione diversa, sfruttandone al massimo la capacità.
L’unico punto debole è la vulnerabilità ai guasti, dato che le informazioni vengono salvate una sola volta e non sono previste forme di ridondanza. Per questo motivo, chi usa un JBOD implementa quasi sempre dei backup su storage separato. Nel caso di piccoli volumi di dati, un’alternativa è la copia manuale su unità esterne o su cloud.
Tuttavia, se la protezione è prioritaria rispetto alla capacità, con il giusto setup è quasi sempre possibile trasformare un JBOD in un RAID.
RAID, Redundant Array of Independent Disks
RAID è l’acronimo di Redundant Array of Independent Disks, ossia "Insieme ridondante di dischi indipendenti”. Se il JBOD scrive sulle unità in modo sequenziale, il RAID lo fa in parallelo, frammentando e distribuendo i dati sulle varie unità.
Il RAID 0 combina 2 dischi e utilizza lo striping, dividendo i dati in blocchi e distribuendo essi tra le due unità. L’obiettivo è incrementare le prestazioni a scapito della sicurezza. Infatti, se un disco si guasta tutti i dati vengono persi.
Il RAID 1 combina 2 dischi secondo la logica del mirroring. I dati vengono scritti e duplicati in modo da creare una copia speculare che serve come una sorta di backup, privilegiando la sicurezza anziché le prestazioni. Se un’unità si guasta, subentra l’altra contenente gli stessi file.
Il RAID 5 e il RAID 6 utilizzano invece la logica dello striping e della parità distribuita, utilizzando rispettivamente 3 e 4 dischi. Lo striping divide i dati in blocchi, che vengono scritti e distribuiti insieme alle informazioni di parità. Quest’ultima è una sorta di checksum che consente la ricostruzione dei file se i blocchi vengono persi. Il RAID 5 calcola una parità singola e tollera 1 solo guasto, mentre il RAID 6 calcola la doppia parità e tollera fino a 2 guasti.
Esistono anche livelli complessi come il RAID 10, RAID 50 e RAID 60 , chiamati anche livelli annidati poichè combinano i RAID 1, 5 e 6 con il RAID 0.
JBOD vs RAID: vantaggi e svantaggi
JBOD e RAID hanno entrambi vantaggi e svantaggi. Per quanto riguarda l’uso dello spazio, i JBOD sono migliori, in quanto dedicano tutta la memoria al salvataggio dei dati. Sono ideali per archiviare file di notevole dimensione, come video e immagini ad alta risoluzione. E se si sostituiscono gli hard disk con SSD, standard o NVMe, rendono la scrittura e la lettura ancora più rapida.
I JBOD hanno un vantaggio anche sulla semplicità di gestione poiché, supportando l' hot-swap, permettono la sostituzione a caldo delle unità. Lo stesso discorso vale anche in caso di espansione dello storage, basta aggiungere altri volumi in sequenza senza dover riconfigurare l’intero set di dischi.
Lo svantaggio dei JBOD sta nella protezione dei dati. Non offrendo nessuna forma di ridondanza, è sufficiente il guasto di un disco per rendere i file contenuti in esso inaccessibili e potenzialmente irrecuperabili.
Passando ai RAID, uno dei loro svantaggi è lo spazio di archiviazione, che viene in parte occupato dai dati speculari o dalle informazioni di parità. A livello di costi, significa che per ottenere la stessa capacità di un JBOD, sono necessarie più unità e quindi un investimento economico maggiore.
Nonostante alcuni controller supportino l’hot-swap, la sostituzione delle unità richede la ricostruzione dell'array, il che comporta una certa esperienza, tempo a disposizione e costi aggiuntivi. Anche per quanto riguarda l'espansione dello storage il grado di complessità è maggiore.
Quando si parla di sicurezza, i RAID, escluso il RAID 0, sono avvantaggiati. Infatti sono progettati proprio per questo, per offrire ridondanza dei dati e per funzionare anche se una o più unità si guastano. Inoltre, tramite le copie speculari o la parità, sono in grado di ricostruire automaticamente i dati.
Tuttavia, i RAID non vanno intesi come dei backup. In caso di guasti multipli, sono esposti alla perdita definitiva dei dati alla pari dei JBOD. Perciò, per quanto riguarda la protezione, per entrambe le soluzioni di storage è consigliato salvare e sincronizzare i file su unità esterne o in cloud.
JBOD | RAID 0 | RAID 1 | RAID 5 | RAID 6 | |
N.min. Unità | 2 | 2 | 2 | 3 | 4 |
Processo | Spanning | Striping | Mirroring | Striping + Parità | Striping + 2 Parità |
Tolleranza guasti | - | - | 1 disco | 1 disco | 2 dischi |
Velocità scrittura | Standard | Alta | Bassa | Bassa | Bassa |
Velocità lettura | Standard | Alta | Standard | Standard | Standard |
Capacità storage | Alta | Alta | Bassa | Media | Bassa |
Recupero dati da JBOD e RAID
JBOD e RAID sono esposti più o meno agli stessi guasti, che possono essere hardware, software o errori umani. In genere essi sono:
- danni fisici: i dischi si possono danneggiare a seguito di urti, incendi, allagamenti, surriscaldamento o interruzioni di corrente.
- usura: gli intensi carichi di lavoro provocano il consumo e, in alcuni casi, l’arresto improvviso dei dischi.
- corruzione del file system o di settori: i guasti logici sono dovuti a interruzioni di corrente, sbalzi di tensione o errori di gestione dello storage.
- virus e malware: JBOD e RAID sono solitamente collegati in rete in dispositivi come NAS, SAN e server. Essendo sempre connessi, sono esposti a varie minacce informatiche.
- errori umani: sono inclusi in questa categoria errori come la cancellazione involontaria dei file, formattazioni e partizionamenti incompleti, o arresti anomali del dispositivo.
I RAID in particolare sono esposti ad ulteriori rischi come:
- guasti al controller: il controller è il componente incaricato della frammentazione e distribuzione dei dati. Un guasto può provocare l'inaccessibilità allo storage o scritture errate.
- bug nel firmware: un firmware non aggiornato o difettoso provoca il malfunzionamento del controller o il mancato riconoscimento delle unità.
- rebuild errato: potrebbe verificarsi quando un utente non imposta correttamente i parametri di ricostruzione.
Se il sistema operativo rileva errori con le unità configurate in JBOD o RAID, è fondamentale interrompere l’uso. In caso contrario, i file originali potrebbero essere sovrascritti definitivamente. Se i dischi non vengono riconosciuti a causa di danni fisici, i tentativi di avviarli potrebbero danneggiare i dispositivi a tal punto da diventare irrecuperabili.
Consigliamo inoltre di non utilizzare software scaricati da Internet, specialmente se non si ha esperienza in questo campo. Operare sui file corrotti, senza avere idea di cosa si sta facendo, in genere peggiora la situazione. Meglio contattare un’azienda specializzata in grado di ripristinare con più probabilità le informazioni originali.
Recupero dati JBOD
Dato che il JBOD scrive in modo sequenziale, il guasto di un disco potrebbe non interessare i file contenuti negli altri. Tuttavia lo spanning lavora secondo la logica della massima efficienza e talvolta frammenta i dati per riempire spazi liberi sulle varie unità. Ciò significa che la gravità dello scenario dipende dall’algoritmo con cui è impostato il file system, in altre parole dal grado di frammentazione.
Un secondo fattore da considerare è la posizione del disco nella sequenza. Essendo i metadati del file system generalmente collocati sul primo, se esso si guasta la procedura diventa più complessa.
Per recuperare i dati da un JBOD, iniziamo creando le immagini delle unità per non modificare quelle originali. A questo punto le montiamo su un pc e utilizziamo un software in grado di leggere i metadati del file system. Se però tali informazioni sono corrotte, i volumi non vengono riconosciuti e bisogna aggiungerli manualmente.
Il software, una volta riconosciute le unità danneggiate, permette di selezionarle e avviare una scansione. Il risultato mostra quali file sono integri e quali è necessario recuperare.
Se invece le unità non vengono riconosciute, o non si avviano, è possibile che esista un danno fisico. In pratica non lavorano più ed è necessaria l’apertura in camera bianca. La procedura comporta la sostituzione dei componenti danneggiati oppure l’estrazione dei piatti e il loro inserimento in un disco donatore. Questo disco deve essere uguale, o il più possibile simile, all’originale poiché differenze minime possono impedire la lettura dei dati. Se il trasferimento va a buon fine, possiamo accedere ai file e avviare il recupero.
Recupero dati RAID
Nel RAID 0, l’unico livello non ridondante, se un volume si guasta i file diventano inaccessibili. L’unica eccezione sono i file di piccole dimensioni, i quali non vengono suddivisi sotto la dimensione minima di blocco. Perciò, se non esiste un backup esterno, bisogna procedere con un recupero RAID in laboratorio.
Lo stesso discorso vale per il RAID 1. Sebbene questo livello utilizzi un disco come copia speculare, se entrambe le unità sono danneggiate e non esiste altra copia dei dati, anch'esso diventa inaccessibile.
I RAID 5 e i RAID 6 utilizzano la parità distribuita che consente di tollerare rispettivamente 1 e 2 unità guaste. Ciò significa che, sostituendo le unità malfunzionanti, il sistema è in grado di funzionare e di ricostruire i blocchi di dati. Se però il numero di guasti supera la soglia di tolleranza, l’array passa in stato failed ed è possibile ricostruirlo solo con una procedura adeguata.
In modo simile ai JBOD, il recupero dati inizia con la clonazione delle unità o la creazione di immagini per lavorare su copie. Si monta l’array su un computer esterno, accedendo con un software in grado di leggere i volumi e i metadati. Se essi non sono corrotti, il software riconosce le unità e ricostruisce l’array, altrimenti bisogna aggiungere le unità manualmente. Questo passaggio richiede una certa competenza poichè, per ricostruire con successo il RAID, è necessario impostare la dimensione di stripe corretta.
Una volta montate le unità, si può esaminare il file system e successivamente avviare una scansione alla ricerca dei dati corrotti o mancanti. In base al risultato, vengono visualizzati i file con le relative informazioni e anteprime. A questo punto si procede con l'analisi e l'estrazione su un supporto esterno.
Se una delle unità è fisicamente danneggiata e non esistono backup, non rimane che tentare l’apertura in camera bianca. Se possibile, ripariamo l’unità sostituendo le parti danneggiate, altrimenti estraiamo i piatti e li inseriamo in un disco donatore. Solo quando il disco è funzionante possiamo creare un’immagine, analizzarlo con il software e procedere come visto in precedenza.
JBOD o RAID? Come scegliere il miglior sistema di storage
A conclusione dell’articolo, possiamo sintetizzare dicendo che il JBOD è una soluzione ideale per chi ha un budget limitato e non necessita di caratteristiche avanzate. Non offrendo alcuna protezione dei dati, è consigliato per archiviazioni non critiche, backup secondari o storage personale.
Al contrario i RAID sono utilizzabili in varie configurazioni che privilegiano la velocità (RAID 0) o la ridondanza (RAID 1,RAID 5, RAID 6). Sono ideali in circostanze in cui il downtime è critico, come server aziendali, data center, o sistemi di storage ad alte prestazioni. Anche se sono più costosi, l’investimento economico è giustificato dal grado di protezione offerto.
Dal punto di vista del recupero dati, il team DataLab opera sia su sistemi JBOD che RAID. Abbiamo esperienza nel ripristino di vari tipi di storage e recuperiamo dati da NAS, SAN e server. Se il tuo RAID o JBOD ti da problemi, non esitare a contattarci. Saremo in grado di analizzare la situazione e offrirti una soluzione in tempi rapidi.
Recupero Dati Professionale