Herausforderung Backup und Archivierung

Den passenden Technikmix finden

17. September 2007, 23:26 Uhr | Christoph Lange/wg

Die Sicherung von Geschäftsdaten auf Band ist zwar noch nicht ausgestorben, aber immer mehr Unternehmen ergänzen dieses Verfahren durch leistungsfähige Backup-to-Disk-Lösungen. Auch bei der Archivierung sind neue Lösungen gefordert: Schließlich müssen die IT-Abteilungen den gesetzlichen Anforderungen an die Aufbewahrung von elektronischen Geschäftsdaten gerecht werden. Hier gilt es, die passende Methode für die jeweilige Anforderung zu wählen.

Noch hat die klassische Datensicherung auf Band nicht ausgedient. Viele Unternehmen sichern ihre
Geschäftsdaten nach wie vor mit traditionellen Methoden auf Tape-Drives, Auto-Loader oder
Bandbibliotheken. In den meisten Fällen kommt dafür eine Client-/Server-Backup-Software zum
Einsatz, die mehrere Methoden wie Vollsicherung, inkrementelle oder differenzielle Backups
unterstützt. Die traditionelle Sicherung auf Band stößt aber immer häufiger an ihre Grenzen, weil
das Backup-Zeitfenster nicht mehr ausreicht, um alle Daten zu sichern. Der Hauptgrund dafür sind
die seit Jahren stark steigenden Datenmengen, die in einer Nacht zu sichern sind. Der technische
Fortschritt bei den Bandlaufwerken, die mit jeder neuen Generation eine deutliche Steigerung der
Übertragungsgeschwindigkeit erzielen, wirkt dem ein Stück weit entgegen. Die vor kurzem auf den
Markt gekommenen LTO-4-Laufwerke sichern Daten mit bis zu 120 MByte/s, die Vorgängerversion LTO-3
erreicht maximal 80 MByte/s (jeweils unkomprimiert).

Die tatsächlich erzielbare Sicherungsgeschwindigkeit hängt aber auch von anderen Faktoren ab:
Sind viele kleine Dateien zu sichern, sinkt die Übertragungsgeschwindigkeit deutlich. Sichern alle
Server gleichzeitig, kann das Netzwerk sich als Engpass erweisen, sichern sehr viele Backup-Clients
auf denselben Backup-Server, kann dieser zum Flaschenhals werden. Wenn das Backup-Zeitfenster nicht
mehr ausreicht, müssen neue Techniken zum Einsatz kommen, um die Geschäftsdaten täglich vollständig
sichern zu können. Bereits seit einiger Zeit unterstützen die meisten Backup-Lösungen ein so
genanntes LAN-free Backup, bei dem die zu sichernden Daten vom Backup-Client über ein dediziertes
Netz wie zum Beispiel ein SAN auf die Sicherungssysteme gelangen. Noch einen Schritt weiter geht
das so genannte Serverless Backup: Es transferiert die zu sichernden Daten direkt von der
Festplatte des Backup-Clients zum Backup-System, ohne über den Backup-Server zu laufen. Im
NAS-Umfeld bietet NDMP (Network Data Management Protocol) ähnliche Funktionen.

Eine deutliche Verkürzung der Sicherungs- und Wiederherstellungszeiten lässt sich auch mit
Backup-to-Disk-Lösungen (B2D) erzielen. Die meisten Hersteller klassischer Backup-Software
unterstützen mittlerweile Backup-to-Disk standardmäßig, indem der Administrator als Ziel für den
Sicherungsjob kein Bandlaufwerk angibt, sondern ein Verzeichnis auf einer lokalen oder über das
Netzwerk angebundenen Festplatte des zu sichernden Servers. Eine noch bessere Performance bieten
Virtual Tape Libraries (VTLs). Dabei handelt es sich um spezialisierte Disk-Appliances, die
Bandbibliotheken per Software emulieren. So fügen sie sich nahtlos in vorhandene
Backup-Infrastrukturen ein. Da die Daten auf ein leistungsfähiges Festplattensystem gesichert
werden, lassen sich deutlich höhere Übertragungsraten erzielen als bei einer Sicherung auf Band
oder auf lokale Platten beziehungsweise Netzlaufwerke. Gleiches gilt für Rücksicherungen,
vorausgesetzt, die betroffenen Dateien befinden sich noch auf dem Disk-System. Wurden sie bereits
auf Band migriert, hängt es vom jeweiligen VTL-Produkt ab, ob sie sich direkt vom Band
zurücksichern lassen oder zuerst ein Restore vom Band auf die VTL erfolgen muss, bevor die
Rücksicherung an den ursprünglichen Ort möglich ist.

Deduplikation

Immer mehr VTL-Anbieter erweitern ihre Lösungen um eine so genannte Deduplikation. Hauptziel
dieser neuen Technik ist es, die im Backup gespeicherten Datenmengen drastisch zu reduzieren. Im
einfachsten Fall sorgen Single-Instancing-Mechanismen dafür, dass von einer Datei nur eine einzige
Version gesichert wird, selbst wenn sie im Unternehmen mehrfach vorhanden ist. Noch weiter gehen
Lösungen, die Dateimuster auf Byte-Ebene vergleichen. Damit sichert das System beispielsweise bei
einer Powerpoint-Präsentation, in der lediglich die Überschrift der ersten Folie geändert wurde,
nicht die gesamte Datei neu, sondern nur die veränderten Bytes. Die Hersteller derartiger Lösungen
versprechen eine Reduktion der auf den Backup-Systemen gespeicherten Datenmengen bis um den Faktor
50. Realistisch dürften Raten im Bereich von zehn bis 20 sein, wobei die mögliche Einsparung stark
von der Datenart abhängt.

Continuous Data Protection und IP-Replikation

Einen Ausweg aus dem Zeitfensterdilemma versprechen auch Backup-Lösungen, die Geschäftsdaten
fortlaufend sichern (Continuous Data Protection, CDP). Die Liste der Anbieter, die ihre
Backup-Software um deratige Funktionen erweitern, wird immer länger. Zu nennen sind hier
beispielsweise Symantec, Atempo oder Commvault. Die meisten Produkte verwenden Snapshot-Techniken,
um in bestimmten Zeitabständen, zum Beispiel jede Stunde, eine konsistente Sicherung der
Geschäftsdaten zu erstellen. Diese Snapshots lassen sich dann ohne Zeitdruck auf das Backup-System
sichern.

Für die Sicherung von Filialen kombinieren einige Hersteller ihre Backup-Produkte mit
IP-Replikationslösungen. So hat CA vor einiger Zeit Xosoft übernommen und deren Wansync-Software in
Brightstor Arcserve r11.5 integriert. Statt Daten in Filialen lokal auf Band zu sichern, können
Unternehmen die Daten per IP-Replikation fortlaufend oder zu einer bestimmten Zeit auf ein
Speichersystem in der Zentrale replizieren und dann mit dem jeweiligen Backup-Tool zentral sichern.
Die Seagate-Tochter Evault bietet mit Infostage ebenfalls eine Lösung für die zentrale Sicherung
der Daten von Außenstellen an. So genannte WAN-Beschleuniger bieten eine weitere Möglichkeit,
Filialdaten in der Zentrale zu sichern. Diese Appliances sind darauf spezialisiert, den
Datenaustausch mithilfe von Kompression, Protokolloptimierung und Caching-Mechanismen (File Cache
oder Bitmustererkennung) zu optimieren.

Wiederherstellung von Daten und Systemen

Das beste Backup nützt wenig, wenn die Wiederherstellung (Recovery) nicht funktioniert. Die
häufigste Fehlerursache bei der Wiederherstellung von Daten ist die Beschädigung der
Sicherungsbänder, sodass diese nur teilweise oder im schlimmsten Fall gar nicht mehr lesbar sind.
Hier helfen dann nur noch Datenrettungsspezialisten wie zum Beispiel Kroll Ontrack. Eine Sicherung
auf Festplattensysteme bietet demgegenüber den Vorteil, dass die Lesbarkeit der Backup-Daten in der
Regel sichergestellt ist.

Schwieriger wird es, wenn ein kompletter Server gecrasht ist und nicht nur die Daten, sondern
auch das Betriebssystem und alle darauf laufenden Anwendungen wiederherzustellen sind. Dafür gibt
es mehrere Lösungsansätze. Der klassische Weg besteht darin, alle Dateien und die
Systemstatusinformationen wie Registry-Settings etc. aus dem FileLevel-Backup zurückzuholen. Eine
deutlich schnellere Wiederherstellung ermöglichen spezielle Lösungen für das so genannte Bare Metal
Recovery, die bei vielen Anbietern als Option zum Backup-Produkt erhältlich sind. So wurden für
diesen Zweck Snapshot-Image-Techniken zum Beispiel in IBM TSM, CA Arcserve und Symantec Backup Exec
integriert. Ein einfaches, aber durchaus wirkungsvolles Tool für ein Disaster Recovery von
Windows-Servern ist Drive Snapshot von Tom Ehlert. Dabei handelt es sich um eine kleine .exe-Datei,
die sich auch per DOS-Kommandozeile ansprechen lässst.

Noch einen Schritt weiter gehen IP-Replikationslösungen, mit denen sich die Daten und
Anwendungen eines ausgefallenen Servers innerhalb kürzester Zeit über ein Ersatzsystem
bereitstellen lassen. Hier sind unter anderem Double Take, EMC Replistor und CA Wansync zu nennen.
Aber auch Anbieter von Speichervirtualisierungslösungen wie Datacore mit Sansymphony und Sanmelody
oder Falconstor bieten CDP- und IP-Replikationslösungen für einen schnellen Failover auf
Ersatzsysteme an. Neben Dateiervern lassen sich mit vielen Werkzeugen auch Mail- und
Datenbankserver wie Exchange oder SQL schützen.

Backup und Archivierung

Lange Zeit sahen viele Unternehmen Archivierung als Teilbereich des Backups, dessen einziger
Unterschied zum "normalen" Backup darin bestand, dass die Dateien über einen längeren Zeitraum im
Backup-System gespeichert bleiben. Eine Sonderrolle spielten Langzeitarchive, die regelmäßig
einzelne Dateien bereitstellen und deshalb kurze Zugriffszeiten bieten müssen. Für derartige
Anforderungen kamen bislang meist optische Speicherlösungen wie CD-/DVD-ROM-Libraries oder
magneto-optische (MO-)Bibliotheken zum Einsatz.

Mittlerweile sind neue Anforderungen an die Speicherung von elektronischen Geschäftsdaten
hinzugekommen, die sich oft nur noch durch spezialisierte Archivierungssysteme vollständig erfüllen
lassen. Zahlreiche gesetzliche Regelungen schreiben vor, dass Unternehmen ihre Daten zum Teil über
sehr lange Zeiträume vorhalten müssen. Dabei stehen die IT-Abteilungen in der Pflicht, dafür zu
sorgen, dass staatliche Institutionen auf Daten zugreifen können, sobald sie diese benötigen. Eine
von der SNIA (Storage Networking Industry Association) durchgeführte Umfrage hat ergeben, dass in
80 Prozent der Unternehmen Daten existieren, die länger als 50 Jahre aufbewahrt werden müssen.
Knapp 70 Prozent der Firmen müssen einzelne Datenarten sogar mindestens 100 Jahre vorhalten. Eine
Archivierungslösung sollte deshalb möglichst viele Standarddatenformate unterstützen und die Daten
reibungslos migrieren können, wenn diese im Lauf der Zeit auf neue Speicherplattformen übergehen
müssen.

Es kann sehr lange dauern und mit sehr großem Aufwand und Kosten verbunden sein, ältere Dateien
wie beispielsweise eine bestimmte, drei Jahre alte E-Mail von aus dem Tape-Backup wiederherstellen
zu müssen. Unternehmen bekommen dies zum Beispiel im Zuge rechtlicher Auseinandersetzungen bereits
heute immer häufiger schmerzlich zu spüren. Um derartigen Anforderungen besser gerecht zu werden,
führen immer mehr Unternehmen zusätzlich zur Backup-Lösung ein Archivierungssystem ein. Die Studie "
Information Lifecycle Management 2007" des Marktforschungsunternehmens Lünendonk hat ergeben, dass
Unternehmen das Thema "Enterprise Content Management, Archivierung und Datenmanagement" in
Deutschland bei den wichtigsten IT-Projekten der nächsten zwei Jahre bereits an dritter Stelle
nennen.

Setzt ein Unternehmen für Backup und Archivierung eigene Systeme ein, beschränkt sich deren
Zusammenspiel in der Regel darauf, dass ältere Daten nach Ablauf der definierten Frist automatisch
vom Backup-System zum Langzeitarchiv migriert werden. Das automatische Verschieben von Dateien von
der primären über die sekundäre zur tertiären Speicherebene heißt auch hierarchisches Storage
Management (HSM). Eine separate Archivierung von Dateien entlastet die Backup-Systeme, da diese für
die Datensicherung weniger Speicherplatz benötigen und während des Backups weniger Dateien
daraufhin überprüfen müssen, ob sie zu sichern sind.

Information-Lifecycle-Management

Die Anbieterschaft vermarktet Lösungen für eine regelbasierte Verwaltung von Dateien über deren
gesamten Lebenszyklus hinweg bereits seit einiger Zeit als Information-Lifecycle-Management (ILM).
Die Archivierung bildet dabei die vorletzte Station des Lifecycles einer Datei, bevor diese
endgültig vom System gelöscht wird. Zu den wichtigsten Bausteinen einer leistungsfähigen
Archivierungslösung zählen:

flexible Datenklassifizierungs-Tools zur automatischen regelbasierten
Archivierung anhand von Kriterien wie Alter, Dateityp, Größe oder Zugriffshäufigkeit;

leistungsfähige Suchfunktionen über alle Datenarten und Archivierungssysteme
hinweg;

Mechanismen zur Sicherstellung der Authentizität und Integrität der
archivierten Daten (Zugriffsschutz, digitale Signaturen etc.);

Unterstützung einer gesetzeskonformen Archivierung von Daten (unter anderem
WORM-Fähigkeit);

Retention- (also Beibehaltungs-) Regeln, um die Daten nach Ablauf ihrer
Aufbewahrungsfrist automatisch vom System zu löschen;

Tiered-Storage-Funktionen zur automatischen regelbasierten Migration von Daten
auf kostengünstigere Speichermedien;

die Möglichkeit, Daten aus mehreren Quellsystemen zu archivieren und zentral
zu verwalten.

Zu den Vorreitern bei Archivierungslösungen zählt Speicherspezialist EMC. Das Unternehmen hat
bereits vor einigen Jahren mit Centera ein Festplattenspeichersystem auf den Markt gebracht, das
die gesetzeskonforme Archivierung von Fixed Content ermöglicht, also von Daten, die sich in der
Regel nicht mehr verändern. In Unternehmen macht diese Datenart oft 80 bis 90 Prozent aller
gespeicherten Informationen aus. EMC hat das Datenmanagementgeschäft in den vergangenen Jahren vor
allem durch Übernahmen stark ausgebaut. Bei der E-Mail-Archivierung hat EMC Legato mit den
Produkten Email Xtender und Disk Xtender zugekauft, im Bereich Dokumentenmanagement Documentum mit
der gleichnamigen Content-Management-Plattform.

Die Konkurrenten waren nicht untätig und bieten mittlerweile ebenfalls intelligente
Archivierungslösungen an. Bei den großen Anbietern sind hier vor allem HP, IBM, Network Appliance
und Sun zu nennen. Network Appliance hat mit den Disk-Systemen der Nearline-Familie eine
Archivierungsplattform entwickelt, die sämtliche Anforderungen bezüglich gesetzeskonformer
Archivierung unterstützt. Da alle Funktionen über das hauseigene Ontap-Betriebssystem implementiert
sind, haben Unternehmen auch die Möglichkeit, ein primäres FAS-Speichersystem zusätzlich für die
Archivierung zu nutzen, was zum Beispiel für kleinere Zweigstellen sinnvoll sein kann. Hitachi Data
Systems hat mit der Content Archive Platform eine Komplettlösung aus Speichersystemen, Servern und
Archivierungssoftware von Archivas im Portfolio, die ebenfalls alle wichtigen Funktionen zur
gesetzeskonformen Archivierung inklusive E-Mail-Archivierung unterstützt. Gleiches gilt für
Hewlett-Packard mit RISS (Reference Information Storage System), für IBM mit dem System Storage
DR550 (Data Retention) und für Sun Storagetek SAM (Storage Archive Manager).

Im Markt für kleinere Unternehmen suchen Anbieter wie Gingcom, die mit einer einzigen Appliance
alle Anforderungen an Backup und Archivierung erfüllen wollen, ihre Chance. Die gleichnamige
Appliance sichert Daten auf Wunsch per CDP, wobei sie auch Notebooks unterstützt. Das Gerät bietet
eine File- und E-Mail-Archivierung mit Single Instancing/Deduplikation, Suchfunktionen und
hierarchischem Storage-Management. Zudem kann es Daten revisionssicher speichern. Softwarelösungen
für die Archivierung sind auch von zahlreichen anderen Anbietern erhältlich.

E-Mail-Archivierung im Trend

Zu den Top-Sellern der Archivierung zählen zur Zeit Speziallösungen für E-Mail-Systeme. Der
Grund liegt auf der Hand: Der E-Mail-Verkehr ist mittlerweile ein unverzichtbarer Bestandteil der
Geschäftskommunikation. E-Mails zählen in vielen Fällen zu den Dokumenten, die als
Vertragsbestandteile eine rechtlich verbindliche Wirkung entfalten. Deshalb müssen Unternehmen
dafür Sorge tragen, dass alle geschäftlich relevanten E-Mails gemäß den gesetzlichen Vorschriften
über einen längeren Zeitraum aufbewahrt und im Zugriff gehalten werden.

Durch leistungsfähige Indexierungs- und Suchfunktionen können E-Mail-Archivierungssysteme gerade
benötigte Daten schnell auffinden und wiederherstellen. Single Instancing sorgt auch hier dafür,
dass E-Mail-Anhänge nur einmal gespeichert werden, selbst wenn sie bei zahlreichen Mitarbeitern im
Posteingang gelandet sind. Noch mehr Plattenplatz sparen Lösungen, die eine
Byte-Level-Deduplizierung unterstützen.

Die meisten Hersteller haben mittlerweile auch Aufbewahrungsregeln implementiert, die es zum
Beispiel ermöglichen, E-Mails und Anhänge anhand von Kriterien wie Alter, Größe oder Dateiart
automatisch auf kostengünstigere Speichermedien zu migrieren oder endgültig vom System zu
löschen.

WORM für Revisionssicherheit

Eine wichtige Funktion, um gesetzliche Anforderungen an die Speicherung elektronischer
Geschäftsdaten zu erfüllen, ist die Unterstützung des WORM-Formats (Write Once Read Many). Denn die
Datenspeicherungstechnik muss sicherstellen, dass einmal gespeicherte Daten nicht mehr nachträglich
veränderbar sind. Bei nicht wiederbeschreibbaren CDs und DVDs war dies aufgrund des Medienformats
schon immer gegeben. Daten auch auf Bandlaufwerken oder Festplatten revisionssicher zu speichern,
erfordert dagegen spezielle Lösungen. Je nach Hersteller kommen Hardware- oder Softwarelösungen zum
Einsatz, die dafür sorgen, dass einmal gespeicherte Daten unveränderbar sind.

LTO-Laufwerke unterstützen eine Speicherung im WORM-Format seit Version 3. Andere
Bandlaufwerkhersteller wie Quantum, IBM oder Sun/Storagetek haben ebenfalls Modelle mit
WORM-Support im Portfolio. Die Anbieter WORM-fähiger Festplattensysteme wie zum Beispiel HDS, HP
oder Network Appliance unterstützen auch eine Retention-Periode, nach deren Ablauf die betroffenen
Daten automatisch unwiderruflich vom System gelöscht werden.

Ausblick

Es gibt kein einzelnes Produkt, das in größeren Unternehmen alle Anforderungen an Backup,
Recovery und Archivierung abdecken kann. Wenn ein Unternehmen eine leistungsfähige
Datensicherungs-, Archivierungs- und Wiederherstellungslösung aufbauen möchte, sollte es deshalb im
ersten Schritt ermitteln, welche Techniken es für die eigenen Anforderungen benötigt. Reicht das
Backup-Zeitfenster nicht mehr aus, können VTLs oder eine CDP-Software für kontinuierliche
Datensicherung die passende Lösung sein. Ist bei Serverausfällen eine sehr schnelle
Wiederherstellung gefordert, bieten sich Produkte für Bare Metal Recovery oder eine hochverfügbar
ausgelegte IP-Replikation an. Um gesetzliche Anforderungen an die Aufbewahrung elektronischer
Geschätsdaten zu erfüllen, dürften Systeme zur E-Mail-Archivierung schon bald unverzichtbar sein.
Umfassende Archivlösungen, die alle geschäftlichen Dokumente inklusive der Dokumentenmanagement-
und Workflow-Systeme revisionssicher aufbewahren können, werden dann der nächste Schritt sein.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+