Zum Inhalt springen
Datenrettung bei Speichersystemen

Physikalische und Virtualisierungsebene

Autor:Bernd Reder • 25.7.2008 • ca. 2:35 Min


Virtuelle Logiken

Die Virtualisierung, die sich im Server-Bereich immer weiter durchsetzt, macht diese Grundsatzprobleme immer komplexer. Wenn im schlimmsten Fall der zentrale Controller der Virtual-Machine aussetzt, beginnt unter Umständen eine umfassende Jagd auf Tables, Blocks und Parities, denn ein Scan der einzelnen Sektoren hätte wohl enorme Dimensionen.

Fatal wird es, wenn wieder die »Physik« in Form höherer Gewalt durchschlägt und die Logik aushebelt. Im virtuellen RAID 5 einer hochrangigen Behörde mit 80 Festplatten mit jeweils 320 GByte fielen nach einem Wasserschaden im Serverraum 24 Platten aus.

Ein unsachgemäßer Ausbau der Daten machte es Kunden wie Herstellern der Backup-Lösung endgültig unmöglich, die Informationen zu retten. Allein schon der prinzipielle Aufbau des Systems illustriert die Probleme, die Dateiorte wieder korrekt zu lokalisieren.

Rein physikalisch bestand das System aus 80 Festplatten. Die Gesamtheit der Platten war in zehn RAID-5-Verbunden organisiert. In der zweiten Ebene, der Virtualisierungsebene, wurden die Daten noch einmal umorganisiert.

Ein Drittel des Speicherbereichs wurde als erste logische Einheit (LUN) in RAID 1 gespiegelt, eine zweite LUN aus Gründen des schnellen Zugriffs mit RAID 0 »gestriped« und eine dritte LUN mit RAID 5 eingerichtet. Der Controller für das ganze virtuelle System teilte in einer zentralen Liste alle Bereiche den einzelnen LUNs zu und verteilte die logischen Einheiten physisch über alle 80 Platten.

Jede LUN für sich hat nun ihren Bereich zu verwalten und ebenso geschieht dies bei den zehn einzelnen RAID-5-Verbunden. Zusätzlich unübersichtlich wird dies in der Virtualisierung, weil hier nicht eine homogene MFT die Datenorganisation übernimmt, sondern zum Beispiel ein ESX-Server von Vmware virtuell verschiedene Dateisysteme synchron laufen lässt.

Um ein Verständnis für die Dimensionen zu erhalten: Allein das zentrale Verzeichnis des Controllers wurde aus Sicherheitsgründen auf Teilbereichen von vier einzelnen Festplatten gespeichert. Veränderungen im Aufbau und Zuordnung des Systems wurden hier immer neu angelegt und vermerkt.

Wenn man diese Zuordnung nicht kennt, erscheint das Puzzle schier unlösbar. Bei anderen virtuellen SAN-Systemen wäre das ganze noch aufwändiger gewesen, da die Daten hier direkt nacheinander aneinander gereiht werden, egal an welche Stelle im Dateisystem diese gehören.

Jede Änderung wird hier erst im Bedarfsfall durch einen eigenen Eintrag dokumentiert, welcher auf den realen Speicherort verweist. Bei Verlust der aktuellen, zuletzt angelegten Tabelle bleibt dann nur noch der Scan nach einzelnen Signaturmustern: Jede Datei hat einen typischen Aufbau. Bilder eines Computertomographie-Systems oder spezifische Kundeneinträge lassen sich anhand dieses Musters durchaus noch erkennen.

Wie sich ein logischer Fehler hier auswirken kann, kann man sich ausmalen. Die Suche nach einschlägigen Verzeichnissen, bestehenden Redundanzen und das Nachrechnen von Paritäten und der automatisierte Signaturscan einzelner Sektoren ermöglichen es aber, Daten wieder herzustellen.

Im Fall der Behörde war der Aufwand der Datenrettung beachtlich, was aber angesichts des enormen Wertes der Daten sicher zu rechtfertigen war. Nur durch die erfolgreiche Wiederherstellung der Informationen war die Behörde überhaupt in der Lage, ihre Arbeit weiterzuführen.

Hardwareausfälle und Bedienungsfehler bleiben – wie die Beispiele belegen – Hauptursache für vermeintlichen Datenverlust. Doch Rettung ist meistens möglich. Aufwändig wird es dann, wenn nicht adäquate Mittel die logische Zerstörung der Datenstrukturen fortführen. Lediglich die vollständige Überschreibung von Daten und Partitionierung oder ein Low-Level-Format kann aber Daten wirklich vernichten.

Wenn es im RAID-Verbund zu Ausfällen kommt, ist es für eine Rettung daher nicht zu spät, wenn man schnell professionelle Hilfe anfordert. Immer wichtiger aber wird im Vorfeld eine gewissenhafte und übersichtliche Datenorganisation. Ordentliche dokumentierte Strukturen und Protokolle beschleunigen gerade in virtuellen RAIDs die Datenrettung immens. Eine beruhigende Botschaft, die vor Kurzschlussaktionen schützen sollte.

Edmund Hilt ist Managing Director bei dem Datenrettungsspezialisten Kroll Ontrack.