Um Bandbreitenengpässe von Bandbibliotheken zu vermeiden, setzen Administratoren neue Sicherungs- und Verwaltungsverfahren sowie virtuelle Bibliotheken ein.
Das aktuelle Problem vieler Administratoren ist heutzutage nicht mehr, Bandbibliotheken mit ausreichender Kapazität für alle Unternehmensdaten zu bekommen. Die Portfolios der gängigen Anbieter umfassen Geräte mit Kapazitäten von einigen Terabyte bis hin zu mehreren Petabyte. Die Backup- und Restorezeiten bereiten den Systemverwaltern heute Kopfzerbrechen. Dabei stellen hierbei nicht die Streamer selbst den Flaschenhals dar. Moderne Laufwerke der Normen LTO-Ultrium-2, S-DTL-600 oder AIT-4 erreichen fast schon höhere Datendurchsätze, als sie einzelne Platten-Arrays liefern können. Aber es geht letzten Endes ja nicht um einzelne Server, die zur Sicherung anstehen, sondern um verteilte Umgebungen mit vielen Systemen. Dabei entpuppt sich häufig das Netzwerk selbst als der Flaschenhals. Die Architektur mit einem zentralen Backup-Server, der nacheinander die Daten der Systeme im LAN abruft und auf Cartridges schreibt, funktioniert heute vielerorts nicht mehr. Sicherungssysteme, die sequentiell die Daten der jeweiligen Laufwerke im LAN nacheinander sichern, nutzen die volle Bandbreite von Bibliotheken nicht aus und ziehen den Sicherungsvorgang unnötig in die Länge. Zudem adressieren sie Bibliotheken mit mehreren Laufwerken nicht optimal. Verschiedene Konzepte von Software-, Bibliotheksherstellern und Drittanbietern versuchen, diese Engpässe mit verschiedensten Ansätzen zu umgehen.
Parallelisierung
Um die bestehenden Bandbreiten von LAN, SAN oder lokalen SCSI-Kanälen optimal nutzen zu können, muss die verwendete Backup-Software dazu in der Lage sein, Backup-Prozeduren bestmöglich zu parallelisieren. Je nach verwendeter Applikation lässt sich das aber nur teilweise realisieren. Viele eingeführte Anwendungen können einzelne Quellen ebenso wenig verteilt auf mehrere Laufwerke sichern wie mehrere Quellen parallel auf ein Laufwerk. Ein Grund für diese Begrenzung ist das Format, welches die Software auf die Cartridge schreibt. Vor allem ältere Backup-Anwendungen organisieren Bänder derart, dass auf einander folgende Datenblöcke zwangsweise zu einem Sicherungsvorgang einer einzelnen Quelle gehören. Hier muss der Administrator im Zweifelsfall Backup-Aufträge und -Skripten so formulieren, dass einzelne Laufwerke einer Bibliothek fest zu einer Quelle gehören. In einem Backup-Zeitfenster lassen sich dann mehrere Quellen parallel auf das jeweils zugeordnete Drive sichern. Da verschiedene neuere Backup-Anwendungen oder optionale Plug-ins für bestehende Band-Software sehr wohl erlauben, parallel mehrere Quellen auf mehrere Streamer zu sichern, sollten IT-Verantwortliche auch in Erwägung ziehen, die bestehende Software gegen eine parallelisierbare auszutauschen, um Backup-Zeiten zu verringern und die Bibliotheken besser auszulasten.
Partitionierung
Nahezu jede moderne Bandbibliothek mit mehr als einem Laufwerk beherrscht heute die Partitionierung. Dabei tritt eine physisch vorhandene Bibliothek gegenüber den angebundenen Systemen als mehrere virtuelle Bibliotheken auf. Mit diesem Trick lässt sich ein Gerät simultan an mehrere Server anschließen, die dann auch gleichzeitig ihre Sicherung durchführen, ohne dabei andere Systeme oder das LAN zu behindern. Die Laufwerke einer Bibliothek lassen sich problemlos über individuelle SCSI- oder FC-Verbindungen an verschiedene Systeme anschließen. Das eigentliche Problem stellt hingegen der Library-Controller dar, der die Robotik der Bibliothek steuert. Da das System nur einmal vorliegt, muss der Hersteller einen Weg finden, einen Roboter, der beispielsweise 40 Slots ansprechen kann, über mehrere Kanäle als virtuelle Roboter mit einer begrenzten Zahl an Bandplätzen darzustellen. Bei größeren Bibliotheken trifft man hierbei in der Regel auf ein Verfahren mit mehreren externen Controllern. Jede Partition erfordert dabei ein eigenes Controller-Modul, das gegenüber dem Host als Robotik auftritt, in Wirklichkeit jedoch die bestehende Mechanik gemeinsam mit anderen Controllern nutzt. Bei kleineren Systemen kann der Hersteller hier trickreiche Lösungen implementieren. So blendet sich der Controller beispielsweise als LUN über den SCSI-Port des jeweiligen Laufwerks ein. Ein einzelner Controller kann somit mehrere Partitionen verwalten.
Die Partitionierung ist ein sehr einfacher Lösungsansatz. Jedes angebundene System sieht seine eigene Bibliothek. Der IT-Verwalter kann bestehende Software ohne Modifikationen verwenden, und es entsteht keine Last auf dem LAN. Zudem können Server mit gänzlich verschiedenen Betriebssystemen und Backup-Anwendungen parallel auf eine Bibliothek zugreifen. Im Gegenzug schränken partitionierte Libraries die Flexibilität ein und erhöhen den Verwaltungsaufwand, da der Administrator auf mehreren Systemen zur Not unterschiedliche Backup-Software pflegen muss. Je nach Hersteller gestalten sich Partitionsoptionen starr. Oft können Partitionen nur auf fest vorgegebene Slots zugreifen oder lassen nur geringfügige Variationen zu. Auch vermisst man bei einigen Bibliotheken die Möglichkeit, Reinigungsbänder und Mailslots mehreren Partitionen zur Verfügung zu stellen. Partitionierte Bibliotheken, die verschiedene Laufwerksnormen (LTO, DLT) unterstützen, erlauben Anwendern, sanft von einer Bandtechnologie auf eine andere umzusteigen.
Ein klarer Trend bei Bandbibliotheken geht zur vollständigen Virtualisierung. Dabei schalten die Backup-Systeme der eigentlichen Bandbibliothek ein oder mehrere Plattenarrays vor. Hier können der rohe Plattenplatz als Cache-Speicher dienen und HSM-Software (Hierarchisches Storage-Management) für das mehrstufige Backup sorgen. Wollen Anwender ihre Software-Infrastruktur für das Backup nicht grundlegend ändern, helfen virtuelle Bandbibliotheken.
Diese Technik ist wie so oft nicht neu, sondern stammt aus dem Mainframe-Umfeld. Je nach Hersteller kommen dabei unterschiedliche Konzepte zum Einsatz. Zum einen kann ein Plattenarray mit dem passenden Controller und der Tape-Virtualisierungssoftware eine Library bei Schreibzugriffen ersetzen. Die Backup-Anwendungen verschiedener Quellen adressieren die Plattenbibliothek wie eine einzelne oder partitionierte Bandbibliothek. Dank der Virtualisierung kann das Disk-Array als Library mit vielen Laufwerken bei verhältnismäßig wenig Cartridges erscheinen und somit vielen Servern parallelen Zugriff gestatten. Die Sicherungsprozeduren verlaufen sehr schnell, da die Bandbreite von Plattenarrays höher als bei Bandlaufwerken ausfällt und sämtliche Lade- und Umspulzeiten entfallen. Ein zusätzlicher Server muss dann die virtuellen Bänder später auf eine reale Tape-Library umkopieren. Dieser Vorgang kann ruhig Zeit in Anspruch nehmen, da er produktive Systeme nicht behindert. Nach dem Umkopieren gibt der virtuelle Bandserver die Plattenressourcen wieder frei.
Sehr hohe Datensicherheit
Dieses Konzept beschleunigt vor allem Sicherungsprozesse und liefert eine sehr hohe Datensicherheit. Die Architektur lagert virtuelle Bänder zügig auf echte Cartridges aus. Im Gegenzug fallen Restore-Prozeduren umständlicher aus. Durch die geringe Vorhaltezeit der Daten im virtuellen Tape-Server muss ein Restore-Vorgang direkt auf die echte Bandbibliothek zugreifen. Der Copy-Server kann auch ein Band komplett in die virtuelle Library zurücklesen und dann die Wiederherstellung starten, doch das dauert noch länger.
Andere Hersteller halten mit ihren Konzepten die virtuellen Bänder langfristig im Plattenarray. Die virtuelle Tape-Library enthält eine fest vorgegebene Zahl virtueller Cartridges und nutzt diese in ganz regulären Rotationszyklen. Erst wenn der Verwalter ein volles Band aus der Library entfernen möchte, um es längerfristig zu lagern, setzt ein Kopierprozess ein. Die Export-Funktion der virtuellen Bibliothek sichert die auszuwerfende virtuelle Cartridge auf einer echten Kassette.
Dieser Ansatz verspricht hohe Backup- und Restore-Geschwindigkeiten und stellt sehr geringe Anforderungen an die physische Bandbibliothek – sogar ein simpler Autoloader könnte diesen Job übernehmen. Dafür bleibt die Gefahr bestehen, dass das Plattenarray Schaden nimmt und damit alle virtuell gesicherten Cartridges auf einen Schlag vernichtet sind.
Kommende Generationen
Die Leistungsdaten der Bandbibliotheken verschiedener Hersteller nähern sich heute einander immer stärker an. Bald werden Vorteile einzelner Geräte nur noch minimal ausfallen – und auf lange Sicht spielt das nicht einmal eine Rolle. Wesentlich stärker müssen Anwender darauf achten, was sie heute als Puffer vor die Bandbibliothek hängen können und wie sie diesen Cache best-möglich ausnutzen. Dank virtueller Tape- und Library-Technologie sinken die Anforderungen an die realen Bibliotheken, denn diese können
ihren Job künftig in aller Ruhe erledigen, ohne dabei den produktiven Serverbetrieb zu behindern. Bei der Auswahl der richtigen Bandbibliothek steht heute im Vordergrund, welche virtuellen Tapeserver das System unterstützt und wie sich diese Lösungen an einzelne Libraries anbinden und diese unterstützen. Die eigentlichen Bibliotheksfunktionen werden zweitrangig. [ ast ]