| Red Hat Enterprise Linux 4: Introduzione al System Administration | ||
|---|---|---|
| Indietro | Capitolo 8. Pianificazione di un system disaster | Avanti |
I backup svolgono due compiti principali:
Permettere il ripristino di file individuali
Permettere il ripristino completo dei file system
Il primo compito rappresenta la base per la richiesta tipica di ripristino del file: un utente cancella accidentalmente un file e successivamente richiede di ripristinarlo direttamente dall'ultimo backup. Le esatte circostanze potrebbero variare, ma generalmente questo rappresenta un uso giornaliero dei backup.
La seconda situazione rappresenta l'incubo di tutti gli amministratori: l'hardware in questione una volta utilizzato come parte produttiva del centro dati, ora non è altro che un corpo estraneo. La parte non reperibile è composta dal software e dai dati che voi e i vostri utenti avete messo insieme durante gli anni. Teoricamente è stato eseguito il backup di tutto il materiale perduto. La domanda da fare è la seguente: effettivamente questo backup è stato eseguito?
Se si, potete ripristinare il tutto?
Notate il tipo di dati[1] processati e conservati da un computer generico. Notate che alcuni dati non sono stati quasi modificati, mentre altri variano costantemente.
La velocità con la quale vengono modificati i dati risulta essere importante per il design di una procedura di backup. Ecco elencati i motivi:
Un backup non è altro che una rappresentazione di dati ai quali è stato eseguito il backup. Rappresenta i dati in un particolare istante.
È possibile eseguire raramente il backup dei dati che non cambiano frequentemente, mentre è possibile eseguire un backup più frequente, per i dati che cambiano più spesso.
Gli amministratori che possiedono una buona conoscenza dei propri sistemi, dei propri utenti e delle applicazioni, dovrebbero essere in grado di raggruppare velocemente i diversi dati in categorie. Ecco alcuni esempi:
Questi dati cambiano normalmente solo durante i processi di aggiornamento, di installazione di bug fix, e qualsiasi modifiche specifiche al sito.
![]() | Suggerimento |
|---|---|
È necessario eseguire un backup del sistema operativo? Questa è una delle domande che ha perseguitato un amministratore durante gli anni. D'altro canto se un processo di installazione è relativamente semplice, e se le applicazioni del bug fix e le personalizzazioni sono documentate correttamente e facilmente riproducibili, l'opzione migliore potrebbe essere quella di installare nuovamente il sistema operativo. Se invece non vi sono dubbi che una nuova installazione è in grado di riprodurre l'ambiente originale del sistema, allora è meglio eseguire un backup del sistema operativo, anche se tale procedimento viene eseguito meno frequentemente dei backup dei dati di produzione. I backup occasionali del sistema operativo possono essere d'aiuto solo quando vi è la necessità di ripristinare alcuni file system (per esempio, a causa di cancellazioni accidentali). |
Questi dati cambiano ogni qualvolta vengono installate, rimosse o migliorate delle applicazioni.
Questi dati cambiano ogni qualvolta vengono eseguite le applicazioni assocciate. A seconda dell'applicazione specifica e della vostra organizzazione, questo può significare che i cambiamenti avvengono secondo dopo secondo oppure dopo la fine di ogni anno fiscale.
Questi dati cambiano a seconda dei modelli in uso nella vostra community. In molte organizzazioni questo significa che i cambiamenti avvengono in ogni momento.
In base a queste categorie (oppure ad altre categorie aggiuntive che sono specifiche alla vostra organizzazione), dovreste avere una buona idea riguardo la natura dei backup necessari per proteggere i vostri dati.
![]() | Nota Bene |
|---|---|
Ricordate che la maggior parte dei software di backup interagiscono con i dati, ad un livello di file system o di directory. In altre parole, la struttura della directory del vostro sistema risulta essere importante su come vengono eseguiti i backup. Questo è un altro motivo per affermare che è sempre una buona idea considerare attentamente la migliore struttura della directory per un nuovo sistema, group file e directory a seconda del loro utilizzo previsto. |
Per poter eseguire i backup è innanzitutto necessario avere il software corretto. Tale software non deve solo essere in grado di eseguire i compiti di base come per esempio eseguire copie di bit su media di backup, ma deve rappresentare una interfaccia idonea per il personale e per i requisiti della vostra organizzazione. Alcune delle caratteristiche da considerare sono:
Programmazione dei backup da eseguire nel momento appropriato
Gestione della posizione, della rotazione e del'utilizzo del media di backup
Coadiuvare gli operatori (e/o con i modificatori robotizzati dei media) per assicurare la disponibilità del media idoneo.
Assistenza degli operatori nell'individuazione del media contenente un backup specifico di un determinato file
Come potete notare, una soluzione effettiva di beckup richiede molto di più.
A questo punto molti amministratori vanno alla ricerca di una delle seguenti soluzioni:
Acquisto di una soluzione già sviluppata
Creazione di un sistema di backup (possibilmente integrando una o più tecnologie open source)
Ogni singolo approccio possiede un punto a favore ed uno a sfavore. Data la complessità dei compiti, una soluzione interna potrebbe non essere in grado di gestire al meglio alcuni aspetti (come ad esempio la gestione dei media, oppure avere una documentazione ed un supporto tecnico non completi). Tuttavia, per alcune organizzazioni quanto sopra descritto potrebbe essere una limitazione.
Una soluzione sviluppata commercialmente potrebbe essere altamente funzionale, ma allo stesso tempo potrebbe essere molto complessa per alcuni requisiti di una organizzazione. Detto questo, tale complessità potrebbe permettere di utilizzare sempre la stessa soluzione anche quando l'organizzazione và incontro ad alcuni cambiamenti.
Come potete notare, non vi è un metodo preciso per la scelta di un sistema di backup. L'unico avviso che possiamo offrirvi è quello di considerare i seguenti punti:
La sostituzione del software di backup è molto complessa; una volta implementato, dovrete usare il suddetto software per molto tempo. Dopo tutto, avrete dei backup dell'archivio per un periodo molto lungo che dovrete essere in grado di leggere. Cambiare il software di backup significherebbe mantenere il software originale (per accedere ai backup dell'archivio), oppure convertire i backup del vostro archivio in modo da essere compatibile con il nuovo software.
A seconda del software di backup, l'impegno necessario per convertire i backup di un archivio potrebbe essere uguale (ma con una perdita di tempo considerevole) all'impegno necessario per eseguire i backup tramite un programma di conversione già esistente, oppure potrebbe richiedere l'esecuzione di una procedura di 'reverse-engineering' del formato di backup, creando un software personale per eseguire il compito.
Il software deve essere affidabile al 100% — deve eseguire il backup di tutto ciò che è previsto, e quando gli è previsto.
Quando bisogna eseguire il ripristino dei dati — sia di un singolo file che di un file intero — il software di backup deve essere affidabile al 100%.
Se domandate ad una persona non molto esperta sui backup, egli potrebbe considerare il backup come una copia identica di tutti i dati presenti sul computer. In altre parole, se è stato eseguito un backup martedì sera, e niente è stato modificato mercoledì, il backup eseguito mercoledì sera sarà uguale a quello eseguito martedì.
Anche se è possibile configurare il backup in questo modo, è molto probabile che voi non lo userete. Per poter ottenere più informazioni, bisogna prima capire i diversi tipi di backup che possono essere creati. Essi sono:
Backup completi
Backup progressivi
Backup differenziali
Il tipo di backup affrontato all'inizio di questa sezione è conosciuto come backup completo. Un backup completo è quel backup dove ogni singolo file viene scritto sul media di backup. Come sopra riscontrato, se viene eseguito il backup di dati non modificati, ogni backup completo sarà uguale.
Questa somiglianza è dovuta al fatto che un backup completo non controlla se un file è stato modificato dall'ultimo backup; ma scrive ogni cosa sul media di backup senza tener in considerazione se il file è stato o meno modificato.
Ecco perchè il backup completo non viene sempre eseguito — ogni file viene scritto sui media di backup. Questo significa che vengono utilizzati molti media di backup anche quando niente è stato cambiato. Eseguire il backup di 100 gigabytes di dati ogni volta che in realtà sono stati modificati 10 megabytes non rappresenta un approccio corretto, ecco perchè i backup progressivi sono stati creati.
Diversamente dai backup completi, quelli progressivi controllano prima se l'orario di modifica del file sia più recente rispetto all'ultimo orario di backup. Se questo non è il caso, il file non è stato modificato dall'ultimo backup e quindi può essere saltato. Se la data della modifica è più recente rispetto alla data dell'ultimo backup, il file è stato modificato e quindi si può eseguire il suo backup.
I backup progressivi sono usati insieme con i backup completi (per esempio, un backup settimanale completo, insieme con backup progressivi giornalieri).
Il vantaggio primario riguardante l'uso dei backup progressivi è rappresentato dal fatto che questi ultimi sono più veloci dei backup completi. Mentre lo svantaggio primario è quello che il ripristino di ogni dato file potrebbe significare eseguire uno o più backup progressivi fino a che non viene trovato il file in questione. Quando si esegue il ripristino di un file system completo, è necessario ripristinare l'ultimo backup completo ed ogni successivo backup progressivo.
Per evitare il bisogno di adare attraverso ogni backup progressivo, è stato implementato un approccio leggermente diverso. Questo approccio è conosciuto come backup differenziale.
I backup differenziali sono simili a quelli progressivi e cioè essi modificano solo i file. Tuttavia, i backup differenziali sono cumulativi — in altre parole, con un backup differenziale, una volta che un file viene modificato esso continua ad essere incluso in tutti i backup differenziali successivi (fino ovviamente al successivo backup completo).
Ciò significa che ogni backup differenziale contiene tutti i file modificati fino all'ultimo backup completo, rendendo possibile l'esecuzione di un ripristino completo con solo l'ultimo backup completo e l'ultimo backup differenziale.
Come la strategia di backup utilizzata con i backup progressivi, normalmente i backup differenziali seguono lo stesso approccio: Un singolo backup periodico completo seguito da backup differenziali più frequenti.
L'effetto nell'uso in questo senso dei backup differenziali, è rappresentato dal fatto che i suddetti backup tendono ad aumentare attraverso il tempo (assumendo il fatto che diversi file possono essere stati modificati col tempo dall'ultimo backup). Questo posiziona i backup differenziali in una posizione compresa tra i backup progressivi e quelli completi, in termine di utilizzo dei media di backup e della relativa velocità, fornendo spesso file singoli più veloci ed un ripristino completo (dovuti ad un minor numero di backup da ricercare/ripristinare).
Date queste caratteristiche, vale la pena considerare i backup differenziali.
Durante le precedenti sezioni, abbiamo prestato molta attenzione nell'uso del termine "media di backup". Vi è una ragione per questo. Molti amministratori molto esperti generalmente considerano i backup, in termini di nastri di lettura e di scrittura, ma al giorno d'oggi vi sono altre opzioni.
I dispositivi a nastro rappresentavano i soli media disponibili in grado di essere rimossi, risultando quindi idonei all'uso per i processi di backup. Tuttavia, tutto questo è cambiato. Nelle sezioni seguenti affronteremo i media di backup più conosciuti, ed esamineremo i loro vantaggi insieme con i loro svantaggi.
Il nastro è stato il primo mezzo, molto diffuso, di conservazione dati. Presenta il beneficio di un basso costo e di una buona capacità. Tuttavia, esso presenta qualche svantaggio — è soggetto a logoramento, ed il suo accesso dati è per natura sequenziale.
Questi fattori rendono necessario il mantenimento di informazioni sull'utilizzo del nastro (non utilizzando più i nastri che hanno raggiunto la fine del proprio ciclo), ed anche la ricerca di un file specifico può rappresentare un processo molto lungo.
D'altro canto, esso rappresenta il media di conservazione dati molto capiente, meno costoso ed estremamente affidabile attualmente disponibile. Ciò significa che la creazione di una libreria idonea non consuma una larga fetta del vostro budget, considerando anche la sua affidabilità per il futuro.
Negli anni passati le unità disco non venivano mai usate come mezzi di backup. Tuttavia, a causa della riduzione dei costi, in alcuni casi, utilizzare le unità disco come mezzo di backup potrebbe risultare il procedimento più idoneo.
Il motivo principale per l'utilizzo delle unità disco come mezzi di backup è la loro velocità. Non vi è altro mezzo di mass storage disponibile più veloce. La velocità potrebbe rappresentare un fattore molto importante quando il vostro tempo di esecuzione di un backup è molto corto, e la quantità di dati da utilizzare per un backup è molto elevata.
Ma purtroppo tale mezzo di conservazione non rappresenta il mezzo ideale, questo è divuto per diversi motivi:
Generalmente le unità disco non possono essere rimosse. Un fattore importante per una strategia effettiva di backup, è quello di rimuovere i backup dal vostro centro dati e di inserirlo in un centro storage esterno. Un backup del vostro database di produzione che giace su di una unità disco vicina allo stesso database, non rappresenta un backup; è una copia. Generalmente le copie non sono molto utili se il centro dati ed il suo contenuto (incluso le vostre copie) vengono danneggiate o distrutte per qualche motivo.
Le unità disco sono molto costose (se paragonate ad altri media di backup). Vi sono alcune circostanze dove l'aspetto economico non rappresenta un problema, ma in tutti gli altri casi, i costi associati con l'utilizzo delle unità disco per il backup, fanno si che il numero di copie di backup siano il più basso possibile, in modo da mantenere al minimo i costi relativi. Un numero minore di copie di backup significa meno ridondanza se una copia dovesse risultare non leggibile.
Le unità disco sono fragili. Anche se utilizzate più soldi per acquistare unità disco rimovibili, la loro fragilità potrebbe rappresentare un problema. Se fate cadere tali unità, significa praticamente aver perso il vostro backup. È possibile acquistare dei contenitori o astucci in grado di ridurre (ma non eliminare completamente) questo pericolo, aumentando però ulteriormente i costi.
Le unità disco non rappresentano un media d'archiviazione. Anche se siete in grado di superare i problemi relativi ai backup sulle unità disco, è consigliato considerare quanto segue. Molte organizzazioni presentano diversi requisiti legali per mantenere le documentazioni per un tempo determinato. La possibilità di ottenere informazioni utili da un nastro vecchio di 20 anni, sono maggiori che ottenere informazioni da una unità disco vecchia di 20 anni
![]() | Nota Bene |
|---|---|
Alcuni centri dati eseguono un backup utilizzando unità disco e poi, una volta terminato il backup, essi vengono salvati su nastro e quindi archiviati. Questo permette di avere il backup più veloce possibile durante il periodo di backup stesso. Il salvataggio dei backup su nastro, può essere eseguito durante il promemoria della giornata lavorativa; solo però se la "registrazione su nastro" termini prima del backup del giorno seguente. |
Detto questo vi sono ancora alcuni esempi dove il backup su di una unità disco risulta essere l'alternativa migliore. Nella sezione successiva possiamo vedere come essi possono essere combinati con una rete creando una soluzione di backup fattibile (se costosa).
Da sola, una rete non è in grado di comportarsi come media di backup. Ma combinata con delle tecnologie di mass storage, potrebbe funzionare discretamente. Per esempio, combinando un link di una rete molto veloce, ad un centro dati remoto contenente grosse quantità di disk storage, gli svantaggi per un backup su dischi precedentemente indicati, non risulterebbero più essere dei veri e propri svantaggi.
Eseguendo un backup per mezzo della rete, le unità disco sono già esterne, in questo modo non vi è la necessità di trasportare le unità disco in un altro luogo. Con una larghezza di banda sufficiente, la velocità che potete ottenere dall'esecuzione del backup su di una unità disco viene conservata.
Tuttavia, questo approccio non è molto utile a risolvere il problema del mezzo di archiviazione (è possibile eseguire il "backup dei dati, passandoli successivamente su di un nastro", come indicato in precedenza). In aggiunta, i costi di un centro dati remoto con un link molto veloce per il centro dati principale, renderebbe questa soluzione molto costosa. Ma per il tipo di organizzazione che necessita questo tipo di soluzione, i costi potrebbero rappresentare un fattore secondario.
Una volta completati i backup, cosa fare? La risposta più scontata è che i backup vengano conservati. Tuttavia cosa bisogna conservare — e dove.
Per rispondere a queste domande, bisogna prima considerare le circostanze con le quali è necessario usare i backup. Sono presenti tre diversi scenari:
Piccola, richieste di ripristino ad-hoc fatte dagli utenti
Ripristini enormi per riprendersi da un disaster
Storage d'archiviazione che non verrà più usato in futuro
Sfortunatamente vi sono delle differenze sostanziali tra numeri 1 e numeri 2. Quando un utente cancella accidentalmente un file, successivamente desidera ripristinarlo il più presto possibile. Ciò implica che il media di backup sia il più vicino possibile al sistema sul quale i dati devono essere conservati.
Nel caso di un disaster che necessita di un ripristino completo di uno o più computer nel vostro centro dati, se il suddetto è stato un disaster di natura fisica, esso potrebbe aver distrutto anche le impostazioni di backup vicino ai computer interessati. Questa situazione risulta essere tra le peggiori che si possano presentare.
Lo storage d'archiviazione è la parte che suscita meno controversie; in quanto le possibilità che possa venir utilizzato per altri compiti sono molto basse, se la posizione del media di backup risulta essere molto distante dal centro dati, non si dovrebbe riscontrare alcun problema.
Gli approcci seguiti per risolvere queste differenze variano a seconda delle necessità dell'organizzazione interessata. Un approccio possibile è quello di conservare internamente il lavoro di backup; questi backup vengono successivamente trasferiti in un luogo più sicuro dopo aver creato nuovi backup.
Un altro approccio potrebbe essere quello di mantenere due diversi gruppi di media:
Un centro dati usato soltanto per richieste di ripristino ottimale
Un gruppo esterno utilizzato per uno storage 'off-site' e per il disaster recovery
Ovviamente avere due gruppi implica la necessità di eseguire tutti i backup due volte, oppure eseguire una copia dei backup stessi. Tutto questo può essere fatto senza alcun problema, ma è da ricordare che un backup doppio richiede un tempo di esecuzione molto lungo, e l'esecuzione di una copia necessita unità di backup multiple per poter processare le copie stesse (e probabilmente un sistema apposito per eseguire la copia).
Il compito di un amministratore è quello di eseguire la scelta più idonea in grado di soddisfare le esigenze di tutti, assicurando in ogni momento la disponibilità dei backup in caso di necessità.
Mentre i backup fanno parte di processi quotidiani, le fasi di ripristino invece risultano essere più rare. Tuttavia le suddette fasi sono necessarie, quindi è meglio farsi trovare sempre pronti.
La cosa più importante è quella di controllare tutti gli scenari possibili elencati in questa sezione, e determinare i modi per mettere alla prova la vostra abilità di risoluzione degli stessi. Ricordatevi che i più difficili sono sempre quelli che risultano essere i più critici.
Questo detto "ripristino totale o 'bare metal'" è il modo con il quale gli amministratori descrivono il processo di ripristino di un backup completo del sistema, su di un computer sprovvisto di dati di alcun genere — senza alcun sistema operativo, applicazioni ecc.
In generale vi sono due approcci per affrontare il suddetto tipo di ripristino:
Con questo tipo di approccio il sistema operativo di base viene installato come se un nuovo computer fosse stato implementato. Una volta implementato il sistema operativo e configurato correttamente, le unità disco restanti possono essere partizionate e formattate, ripristinando tutti i backup tramite i media di backup.
Un disco di ripristino del sistema rappresenta un tipo di media avviabile (spesso un CD-ROM), che contiene un ambiente minimo del sistema, in grado di eseguire compiti di amministrazione di base del sistema stesso. L'ambiente per il processo di ripristino contiene le utility necessarie per partizionare e formattare le unità disco, le unità del dispositivo necessarie per accedere al dispositivo di backup, ed il software necessario per ripristinare i dati da un media di backup.
![]() | Nota Bene |
|---|---|
Alcuni computer sono in grado di creare nastri di backup avviabili e di eseguire l'avvio degli stessi per iniziare il processo di ripristino. Tuttavia, questa capacità non è disponibile su tutti i computer. La maggior parte dei computer basati sull'architettura PC, non sono predisposti a tale approccio. |
Ogni tipo di backup deve essere testato periodicamente per assicurarsi che i dati in questione possano essere letti. In alcuni casi i backup, per qualche motivo, non risultano leggibili. La fase critica è rappresentata dal fatto che spesso questo processo viene ignorato fino a quando non si perdono effettivamente dei dati, avendo quindi il bisogno di ripristinarli tramite un processo di backup.
Tale errore si può verificare a causa di molteplici fattori, per esempio a causa di una modifica dell'allineamento della testina guida del nastro, oppure da una configurazione non corretta del software di backup, o da un errore dell'operatore. Non ha importanza quale sia la causa, senza una prova periodica, non sarete mai in grado di essere sicuri di generare dati di backup in grado di essere ripristinati in caso di necessità.
| [1] | Usiamo in questa sezione il termine dati per descrivere qualsiasi cosa che sia stata processata tramite il software di backup. Ciò include il software del sistema operativo, application software, ed anche i dati effettivi. Non ha importanza cosa sia, per quanto riguarda il software, sono tutti dei dati. |