Revisionssichere Langzeitarchivierung

Daten für die Ewigkeit

17. September 2007, 23:26 Uhr | Hans Peter Schmidt/wg Hans Peter Schmidt ist Abteilungsleiter Storage- Management beim IZB Informatik-Zentrum.

Gesetzliche Vorgaben verpflichten Unternehmen, bestimmte Daten sechs bis 30 oder mehr Jahre lang zu archivieren und dabei sicherzustellen, dass niemand die Daten verändern oder löschen kann. Doch wenn es um die Entwicklung einer entsprechenden Strategie zur revisionssicheren Langzeitarchivierung geht, gibt es bei vielen Anwendern mehr Fragen als Antworten.

Unter Langzeitarchivierung versteht man grundsätzlich die langfristige Aufbewahrung und
Erhaltung der dauerhaften Verfügbarkeit von Informationen. Der Begriff findet unterschiedliche
Verwendung. Von Langzeitarchivierung spricht man, wenn Informationen mindestens zehn Jahre
aufbewahrt und zugänglich gehalten werden sollen. Eine revisionssichere Archivierung liegt hingegen
dann vor, wenn ein Archivierungssystem unter anderem den Anforderungen an eine sichere,
ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entsprechend dem Handelsgesetzbuch
(Paragraphen 239 und 257), der Abgabenordnung und den Grundsätzen ordnungsgemäßer DV-gestützter
Buchführungssysteme entspricht.

Für Unternehmen sind heute in der Praxis Aufbewahrungsfristen von bis zu zehn Jahren für
handelsrechtlich und steuerlich relevante Daten und Dokumente gefordert. Im Finanzumfeld sind
aufgrund der Gewährleistungsfrist der Banken für bestimmte Unterlagen sogar 30 Jahre Aufbewahrung
vorgeschrieben. Zwar scheinen diese Fristen kurz, wenn man sie mit den Archivierungshorizonten von
Bibliotheken oder Museen vergleicht, deren Blick weit in die nächsten Jahrhunderte und das nächste
Jahrtausend reicht. Doch betrachtet man von heute aus, wie sich die Informationswelt in den letzten
30 Jahren verändert hat, so wird klar, dass schon die Archivierung von Daten für die nächsten zehn
Jahre eine große Herausforderung darstellt. Die erste Hürde ist dabei rein organisatorischer Art
und besteht in der Definition, welche Daten überhaupt archivierungspflichtig und/oder -würdig sind.
Dies sollte jedes Unternehmen in einer Richtlinie festlegen und allen betroffenen Mitarbeitern
kommunizieren.

Formatfrage

Neben der Art der Daten sollte in der Richtlinie auch festgehalten sein, in welchem Format
unternehmensrelevante Daten zu archivieren sind. Vor allem proprietäre Dateiformate lassen sich oft
nur mit einer bestimmten Version einer bestimmten Software lesen, die unter Umständen zudem nur auf
einer bestimmten Hardwareplattform läuft. Um sicherzustellen, dass sich Dateien von heute auch
zukünftig verarbeiten lassen, empfiehlt sich bei der Archivierung der Einsatz offener,
standardisierter Dateiformate. Zu den offenen Formaten für Grafiken zählen die Typen TIF, PNG und
JPG; bei der langfristigen Archivierung von Bilddaten sind verlustfreie Dateiformate vorzuziehen.
Für Dokumente hingegen bieten sich Stand heute XML, PDF/A oder Open Document an. Denn der Aufbau
dieser Formate ist bekannt, und daher ist die Wahrscheinlichkeit höher, dass dieser Art kodierte
Daten auch in einigen Jahren noch interpretierbar sind.

Microsoft bemüht sich derzeit, ihr Open-XML-Format für Office-Dokumente als ISO-Standard
anerkennen zu lassen. Doch bislang konnte der Hersteller nur die European Computer Manufacturers
Association (ECMA) davon überzeugen, Office Open XML als Standard anzunehmen. Schwierig wird es
auch bei Daten, die an eine bestimmte Anwendung gebunden sind. Dies kann beispielsweise ein
E-Mail-Server wie Exchange, eine Oracle-Datenbank oder ein SAP-System sein. Hier benötigen
Unternehmen Schnittstellen für die jeweilige Applikation, die die Daten in einem standardisierten
Format – meist XML, Komma-separierter Text (CSV) oder Nur-Text – für Archivierungszwecke zur
Verfügung stellen.

Migration oder Emulation

Doch was passiert, wenn ein Unternehmen nach zehn Jahren auf Daten zugreifen muss, für die es
keine aktuelle Anwendung mehr besitzt? Zur Sicherstellung der Verfügbarkeit archivierter
Informationen gibt es hier mehrere Strategien. Der erste Ansatz ist die Migration bestehender Daten
in eine neue Systemumgebung. Dies birgt allerdings das Risiko, dass Informationen nicht
nachweislich unverändert von einem System auf ein anderes gelangen. Zudem könnte eine Migration die
Originalität und Authentizität von Daten kompromittieren. Der technische Wandel zwingt Unternehmen
jedoch dazu, rechtzeitig auf neue Speicher- und Anwendungskomponenten zu wechseln, um ihre
Informationen verfügbar zu halten. Daher ist bereits bei der Ersteinrichtung eines langfristigen
Archiv- und Speichersystems eine mögliche zukünftige Migration zu berücksichtigen. Die
kontrollierte, verlustfreie, "kontinuierliche Migration" ist zurzeit der wichtigste Ansatz, um
Information über Jahrzehnte und Jahrhunderte verfügbar zu halten. Standardisierte Formate helfen
hier, die Migrationszyklen so weit wie möglich zu verlängern.

Als Alternative zur Migration wird zumindest in der wissenschaftlichen Welt das Modell der
Emulation diskutiert. Dabei geht es darum, die Eigenschaften eines älteren Systems so zu
simulieren, dass damit auch Daten mit neueren Computern und Betriebssystemen wieder nutzbar sind.
Ein Beispiel ist der C64-Emulator, der unter aktuellen Betriebssystemen den Einsatz von Software
des Commodore C-64 ermöglicht. Im Bereich der langfristigen Datenspeicherung kommt Emulation heute
noch nicht in größerem Ausmaß zum Einsatz. Zu ihren Nachteilen gehört, dass der Aufwand künftiger
Emulationsschritte nicht zu planen und eine Emulation bei einem zu großen Paradigmenwechsel eines
Tages vielleicht gar nicht mehr durchführbar ist.

Das richtige Medium

Neben der Interpretation des Datenformats muss natürlich auch das Speichermedium und damit die
Lesbarkeit der Daten an sich dem Zahn der Zeit widerstehen. Bei der revisionssicheren Archivierung
stellen dabei WORM-Medien (Write Once Read Many) sicher, dass einmal gespeicherte Daten nicht
nachträglich verändert oder gelöscht werden können. Optische Medien wie CD-WORM und DVD-WORM eignen
sich hier jedoch eher für den Hausgebrauch als für professionelle Archivierungslösungen. Denn deren
Speicherkapazität ist für Unternehmensansprüche zu gering und die Haltbarkeit der Rohlinge mit fünf
bis zehn Jahren zu kurz. Stand der Technik im optischen Bereich sind heute
Ultra-Density-Optical-(UDO-)Medien, die eine Speicherkapazität von bis zu 60 GByte bieten und deren
Datenintegrität für 50 Jahre zertifiziert ist.

Aus dem Lager der magnetischen Speichermedien mit weitaus höheren Speicherkapazitäten stammen
WORM-Festplatten mit ein TByte Größe – auch Content Addressed Storage (CAS) genannt – sowie
WORM-Tapes, die heute bis zu 800 GByte Speicherkapazität bieten. CAS-Systeme sind
Festplattensysteme, die durch spezielle Software dieselben Eigenschaften wie ein herkömmliches
WORM-Medium bieten. Eine Kodierung bei der Speicherung und eine spezielle Adressierung auf dem
Datenträger verhindern ein Überschreiben oder Ändern von Informationen auf dem Speichersystem.
WORM-Tapes hingegen sind Magnetbänder, die durch eine spezielle Kodierung der Bandmedien die
Einmalbeschreibbarkeit sicherstellen.

Besonders in Rechenzentren, in denen Bandroboter und Library-Systeme bereits vorhanden sind,
stellen WORM-Tapes eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Für
größere Unternehmen und Organisationen mit Rechenzentren sind Festplatten- oder WORM-Tape-Archive
heute das Medium der Wahl, da sie sich bei hoher Speicherkapazität einfach in den laufenden Betrieb
integrieren lassen. Die Hersteller von WORM-Tapes und -Festplatten garantieren zudem eine
Haltbarkeit von bis zu 30 Jahren. Während der Vorteil von WORM-Festplatten gegenüber Tapes vor
allem die Geschwindigkeit beim Zugriff auf Daten ist, punkten die Bandlaufwerke weiterhin mit
deutlich geringeren Gesamtbetriebskosten von zirka einem Drittel bis einem Viertel im Vergleich zur
Festplatte.

Fit für 4007 – nur über Migration

Bis in das übernächste Jahrtausend werden UDO-, CAS- und WORM-Tape-Systeme unternehmenswichtige
Daten nicht retten können. Archivare unserer digitalen Kulturgüter müssen sich also aller
Wahrscheinlichkeit nach auf zukünftige Migrationen ihrer Daten gut vorbereiten. Unternehmen mit
einem kürzeren Archivierungshorizont sollten zunächst festlegen, was sie wie lange archivieren
möchten, und dann geeignete Formate und Speichermedien auswählen. Wer sich nicht selbst mit der
technischen Seite der revisionssicheren Langzeitarchivierung auseinandersetzen möchte, kann sich an
einen spezialisierten Dienstleister wenden. Wenn dieser aus dem Finanzumfeld stammt und seine
Rechenzentren in Deutschland betreibt, sind die Daten dort zumindest auf absehbare Zeit so sicher
wie in der Bank.

Jedes Dokument muss unveränderbar archiviert werden.

Kein Dokument darf auf dem Weg ins Archiv oder im Archiv verloren gehen.

Jedes Dokument muss mit geeigneten Techniken wieder auffindbar sein.

Der Anwender muss genau das Dokument wiederfinden, das er gesucht hat.

Kein Dokument darf während seiner vorgesehenen Lebenszeit zerstörbar sein.

Jedes Dokument muss in genau der gleichen Form, wie es erfasst wurde, wieder anzeigbar und druckbar sein.

Der Anwender muss jedes Dokument zeitnah wiederfinden können.

Alle Aktionen im Archiv, die Veränderungen in der Organisation und Struktur bewirken, sind derart zu protokollieren, dass die Wiederherstellung des ursprünglichen Zustands möglich ist.

Elektronische Archive sind so auszulegen, dass eine Migration auf neue Plattformen, Medien, Softwareversionen und Komponenten ohne Informationsverlust möglich ist.

Das System muss dem Anwender die Möglichkeit bieten, die gesetzlichen Bestimmungen (BDSG, HGB/AO etc.) sowie die betrieblichen Bestimmungen des Anwenders hinsichtlich Datensicherheit und Datenschutz über die Lebensdauer des Archivs sicherzustellen.

Quelle: VOI Verband Organisations- und Informationssysteme e.V.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+