Hierarchische Datensicherung

Zugriffsgeschwindigkeit, Sicherheit und Kosten vereint

26. September 2007, 10:29 Uhr |

Die Datenmengen wachsen rasant und die Anforderungen an die Verfügbarkeit und Sicherheit der Da-ten steigen. Ein hierarchisches Speicherkonzept trägt diesen unterschiedlichen Aspekten Rechnung. Im Einstiegs- und mittleren Serversegment kann ein NAS-System die zentrale Drehscheibe sein.

Neben einem NAS sollte immer auch eine tapebasierende Speicherlösung in das hierarchische Sicherungskonzept einbezogen werden.

´

Im Gegensatz zu »normalen« Servern sind Network-Attached-Storage-Systeme speziell für den File-Transfer optimiert. Dafür ist ein eigenes, allerdings sehr schlankes Betriebssystem notwenig, das auf die File-Dienste ausgerichtet ist. Es ist problemlos in ein bestehendes Netzwerk als Fileserver integrierbar und lässt sich zum Beispiel als Bestandteil einer existierenden Windows-2000-Domäne einsetzen. Die Benutzerrechteverwaltung kann der existierende Active-Directory-Service des Windows-Domain-Servers übernehmen. Die Vorteile liegen auf der Hand: verringerte I/O-Last der Netzwerk-Hosts sowie geringere Implementierungs- und Betriebskosten. Darüber hinaus sind NAS-Systeme nur mit den tatsächlich unverzichtbaren Schnittstellen zum Netzwerk und den Speicherlaufwerken ausgestattet.

Der Anschluss an das LAN erfolgt über eine Ethernet-Verbindung. Durch die einfache Installation und Administration sind NAS-Systeme eine ideale Alternative zu üblichen File-Servern. Sie wurden daher zunächst als optimierte Fileserver entwickelt und entsprechend eingesetzt. Der unschlagbare Vorteil ist dabei, dass die darauf gespeicherten Daten für alle Mitarbeiter gleichermaßen innerhalb kurzer Zeit zugänglich sind.

In einer hierarchischen Datensicherungsstruktur werden die Daten im ersten Schritt idealer Weise auf einem Festplattenvolume gespeichert, damit die Nutzer immer darauf zugreifen können. Am meisten profitiert der Anwender von einer NAS-Lösung, welche die Absicherung der gespeicherten Daten vom Netzwerk nahezu unabhängig macht. Durch den direkten »Kurzschluss« des Datenstroms zwischen Platten, Tape-Autoloader und NAS-Server erfolgt die Datenübertragung ohne zusätzliche Belastung des Netzwerks. Dem Betriebssystem des NAS-Servers – oftmals Linux-basierend – steht in der Regel eine Backup-Software für die Datensicherung auf Band zur Seite. Damit können verschiedene Arten von Backups wie volle, inkrementelle oder differentielle Sicherungen durchgeführt werden. Auch die zeitversetzte Sicherung und die Protokollierung der Sicherung erfolgen wie bei den üblichen Backup-Servern. Durch die integrierte Implementierung entstehen dem Anwender keine zusätzlichen Kosten.

NAS-Systeme bieten sich für die Speicherung aller Art von Daten an, die bei Bedarf schnell wieder zur Verfügung stehen müssen. Die integrierte RAID-Architektur schützt die Daten vor Festplattenausfällen und ist damit die erste Stufe der Datensicherungshierarchie. Viele der heute eingesetzten, einfachen RAID-Systeme, gerade in den Einstiegssegmenten, können als nur den Ausfall einer Festplatte kompensieren. Obgleich die Wahrscheinlichkeit des gleichzeitigen Defektes mehrerer Platten gering ist, lauern doch einige Gefahren. Während des Reorganisationsprozesses des RAID-Systems nach dem Austausch der defekten Platte gegen eine neue sind alle verwendeten Festplatten einer wesentlich höheren Beanspruchung ausgesetzt. Schließlich muss die mehrere Stunden lang dauernde Reorganisation während des laufenden Betriebs und damit zusätzlich zu den normalen Schreib- und Leseanforderungen durchgeführt werden. Die Performance eines so belasteten Systems nimmt extrem ab, was lange Wartezeiten für die mit dem NAS verbundenen Benutzer bedeutet. Oftmals gibt gerade in dieser Situation eine zweite »angeschlagene« Platte ihren Geist auf und der Datenbestand ist verloren. IT-Verantwortliche, die beim Austausch versehentlich die falsche Platte entnehmen, können im ungünstigsten Fall das RAID-System zerstören.

Schutz bei Festplattenausfällen

Mit Konzepten wie »RAIDn«, einer Entwicklung von Tandberg Data, steht ein neuer RAID-Algorithmus zur Verfügung, der eine wesentlich höhere Ausfallsicherheit von Festplattensystemen bietet als bisherige RAID-Lösungen. Hierdurch ist eine kostengünstige Absicherung gegen mehrfachen Festplattenausfall möglich. Während RAID-5 ausreichend Parity-Informationen in ein Festplattenarray verteilt, um den Ausfall eines einzelnen Laufwerks auszugleichen, lässt sich die Parity-Menge bei RAIDn variabel einstellen. Ein RAIDn-Array kann damit, je nach Konfiguration, auch noch mit zwei oder drei defekten Platten weiter arbeiten. Dadurch besteht auch keine Notwendigkeit, die Wiederherstellung des RAID-Arrays, die je nach RAID-Größe mehrere Stunden dauert, sofort einzuleiten. Dem Administrator steht es frei, diesen Prozess zu einem späteren Zeitpunkt zu starten. Hierdurch werden viele Fehler eliminiert, die bei der Reorganisation unterlaufen können.

Der gewaltige Unterschied zwischen klassischen RAID-Leveln und RAIDn liegt in der Tatsache, dass N, also die Anzahl der Spare-Drives, größer 1 sein kann. Das bedeutet in der Praxis, dass der Anwender zusätzliche Sicherheit durch das einfache Hinzufügen einer weiteren Festplatte zum RAID-Verbund erhält. Es können so zum Beispiel in einem RAID-System mit neun Festplatten, bei dem N = 2 definiert wurde, bis zu zwei Festplatten ausfallen, ohne dass Daten verloren gehen.

Im Vergleich zu RAID-5+1, also RAID-5 mit Hot-Spare-Drive, gewährleistet RAIDn eine doppelt so hohe Ausfallsicherheit. Fällt in diesem Beispiel für RAID-5+1 eine Festplatte aus, so springt automatisch und umgehend das Hot-Spare-Laufwerk ein, um den RAID-Verbund wieder herzustellen. Das ist auch zwingend erforderlich, da dieses RAID-System im Status »FAIL« ist und keinerlei Ausfallsicherheit mehr aufweist.

RAIDn greift genau dieses Problem auf und kompensiert es durch Einsatz eines weiteren Spare-Laufwerks. Fällt eine Festplatte aus, steht dem Anwender weiterhin ein System mit der Ausfallsicherheit eines RAID-5-Verbundes zur Verfügung. Es besteht folglich keinerlei Notwendigkeit, die Wiederherstellung sofort zu starten, das System kann weiterhin mit voller Zugriffsgeschwindigkeit genutzt werden. Der Administrator kann entscheiden, wann der RAIDn-Verband wiederhergestellt werden soll – beispielsweise über Nacht oder am Wochenende. Maximal kann eine Ausfallsicherheit von N = 3 definiert werden, was bedeutet, dass hier bis zu drei beliebige Festplatten ausfallen können, ohne dass Daten verloren gehen. Damit sind die Daten selbst dann noch verfügbar, wenn beim Wechsel einer Festplatte das falsche Laufwerk entfernt wird.

Vergleicht man RAID-10 oder RAID-1+0 mit RAIDn, dann fällt auf, dass hier mit wesentlich weniger Festplatten die gleiche Kapazität bei höherer Ausfallsicherheit erreicht wird. Ein Beispiel: Wenn der RAID-10-Anwender die Kapazität von sieben Festplatten benötigt, so muss er 14 Festplatten einsetzen, da jeder einzelnen Platte ein Spiegel zugeordnet ist. Fällt in diesem RAID-Verbund eine Festplatte aus, ist die Datensicherheit gewährleistet, beim Ausfall der zweiten Festplatte eines Spiegelverbandes ist das RAID-System zerstört.

RAIDn hingegen benötigt bei gleicher Nutzkapazität lediglich zwei Spare-Drives, um die Ausfallsicherheit von zwei Festplatten zu gewähren – es ist also doppelte Sicherheit vorhanden. Eine simple Rechnung: Wie bisher sind zwar zur Nettokapazität zusätzliche Platten hinzuzurechnen, diese ergeben jedoch einen weitaus höheren Sicherheitsvorteil als die bisherigen Systeme. Grundsätzlich erlaubt jede hinzugefügte Festplatte den Ausfall eines weiteren beliebigen Datenträgers.

NAS-System als Backup-Server

Experten schätzen, dass bis zu 62 Prozent kleinerer und mittlerer Unternehmen NAS-Systeme für Backup- und Archivierungszwecke einsetzen. Sie profitieren von dieser doppelten Funktionalität, die das NAS-System zu einer kostengünstigen Alternative zu traditionellen Backup-Servern macht. Hier spielt die einfache Installation und Verwaltung von NAS eine wesentliche Rolle. Die Systeme sind innerhalb kurzer Zeit einsatzbereit, benötigen für ihre Administration keinen besonderen IT-Background und ihre Speicherkapazität lässt sich in der Regel einfach und problemlos erweitern. So kann die jüngste Untersuchung der Analysten von Gartner Dataquest nicht verwundern, die ein jährliches Wachstum von rund 16 Prozent im Bereich der NAS-Systeme voraussagt.

Bei aller Sicherheit, die heutige NAS-Systeme bieten, lassen sich physikalische Ausfälle durch Brand oder andere Katastrophen nicht ausschließen. Daher sollte neben einem NAS-System immer auch auf eine tapebasierende Speicherlösung in das hierarchische Sicherungskonzept einbezogen werden. Diese stellt in der Datenhierarchie die Stufe 3 nach RAID-Volumes und Replikation dar. Hier bieten sich vor allem auf Grund der hohen Revisionssicherheit lineare Datenspeicherlösungen – zum Beispiel SLR-, DLT- oder LTO-Technologien – an.

Durch die implementierte Software kann ein NAS-System mit Backup-Funktionalität problemlos als Backup-Server im Netzwerk fungieren. Hierbei ist auch ein mehrstufiges Disk-to-Disk-to-Tape-Backup (D2D2T) möglich, bei dem die Daten auf dem NAS-System »gesammelt« und zeitgesteuert auf einen Autoloader gesichert werden.

Mit diesem dreistufigen Sicherheitskonzept – RAIDn, Replikation und Tape-Backup – sowie zusätzlichen Snapshots sind die Daten nicht nur gut geschützt, sondern auch stets verfügbar und im Notfall schnell wiederherstellbar. Die Sicherungsschritte sind außerdem mit Ausnahme einer Auslagerung der Bänder voll automatisierbar, so dass der korrekte Ablauf permanent Tag für Tag gewährleistet ist. Damit wissen auch kleinere und mittlere Unternehmen ohne IT-Abteilung ihre Daten bestens gesichert. Axel Böhme, Produktmarketing Manager, Tandberg Data


Jetzt kostenfreie Newsletter bestellen!

Matchmaker+