Zum Inhalt springen

Archivierung mit PDF/A

Archivierung mit PDF/A Die DAK, Deutschlands zweitgrößte Krankenkasse, hat ihr internes ­Informationsarchiv auf den neuen ISO-Standard PDF/A umgestellt.

Autor:Redaktion connect-professional • 22.2.2007 • ca. 2:30 Min

Die Krankenkasse DAK schätzt bei dem neuen Standard PDF/A für die Langzeitarchivierung vor allem die Möglichkeit zur Volltextsuche.

Die Krankenkasse DAK betreut unter dem Motto »Unternehmen Leben« mit 12000 Mitarbeitern bundesweit rund 4,7 Millionen Mitglieder und 6,2 Millionen Versicherte. Mit Blick auf eine über 230-jährige Tradition und Know-how im Bereich der Sozialversicherung hilft das Unternehmen nicht nur im Krankheitsfall. So will es außerdem mit Bonusprogrammen oder Gesundheitsreisen gesundes Verhalten fördern. Der in der Hamburger Zentrale ansässige interne Info-Dienst der DAK ist die Informationsplattform für die Mitarbeiter in den Geschäftsstellen. Hier fließt der Input aus allen relevanten Fachpublikationen ein. In der Regel sind dies juristisch oder medizinisch geprägte Texte wie Fachaufsätze zu rechtlichen Aspekten der Gesundheitsversorgung, zu Patientenrechten oder neuen Behandlungsmethoden. Diese Informationen werden in die Literatur-Datenbank namens DOR!Sonline (Dokumentations-Retrieval und -Informations-System) eingepflegt, wo sie dann dem hausinternen Info-Dienst zur Recherche zur Verfügung stehen. Die Mitarbeiter dieses Dienstes bearbeiten Anfragen aus den Geschäftsstellen zu Problemstellungen rechtlicher oder medizinischer Natur und überstellen ihnen recherchierte Informationen aus dem Archiv. »Außerdem haben wir eine Informationspflicht unseren Mitgliedern ge­genüber, was neue gesetzliche Regelungen oder sonstige, für sie relevante Entwicklungen betrifft«, erklärt Hans-Hinrich Harms, Dokumentar des Info-Dienstes. »Auch diese Informationen beziehen wir aus unserer Datenbank.« Nicht wenige der relevanten Texte – es sind rund 3000 pro Jahr – umfassen 50 Seiten oder mehr. Diese werden von dem externen Scan-Dienstleister Alphacom digitalisiert und an die DAK zurückgesendet. Kleinere Artikel werden mit Etagen-Scannern von Hewlett-Packard im Haus erfasst und abgelegt. Bisher wurden die eingescannten Informationen im TIFF-Format archiviert. Außerdem befanden sich in dem Archiv von Mikrofilm nach TIFF digitalisierte Dateien aus den Jahren 1988 bis 1995. Danach wurde im PDF-Format archiviert, das jedoch kein standardisiertes Format für die Langzeitarchivierung darstellt. Problematisch war, dass die TIFF-Dateien nicht volltextfähig und damit nur schwer recherchierbar sind. Daher entschied man sich, ein modernes Format und eine entsprechende Lösung für die Konvertierung des Archivbestands zu suchen. Im Kommen ist für die Langzeitarchivierung das neue, ISO-zertifizierte PDF/A-Format. PDF/A ist im Gegensatz zu TIFF volltextfähig, gibt Farben original wieder, und die Dateien sind kleiner. Im Vergleich zu nativen Formaten, die Anwendungsprogramme wie etwa Office-Systeme erzeugen, ist es langfristig lesbar und benötigt nur einen Viewer – den Adobe Reader. Bei dem Berliner Anbieter Luratech wurde die DAK schließlich fündig. Gescannte und digital erstellte Dokumente lassen sich mit den Produkten dieses Herstellers in PDF/A umwandeln und auf Konformität überprüfen. Letzteres ist notwendig, um sicherzustellen, dass ein zu archivierendes Dokument alle Anforderungen des Standards erfüllt. Die Syntax von PDF/A schreibt detailliert vor, welche Inhalte erlaubt sind und welche nicht. Mit dem PDF Compressor Version 4 von Luratech, der gescannte Dokumente in hoch komprimierte und im Volltext durchsuchbare PDF/A-Dokumente umwandelt, wurden innerhalb weniger Wochen die Dokumente nach PDF/A migriert. Die auf Mikrofilm gespeicherten Daten waren teilweise schlecht lesbar und führten zu wenig qualitätsvollen TIFFs. Durch die ausgereifte OCR-Technologie, mit der der PDF-Compressor arbeitet, konnte trotzdem eine sehr hohe Erkennungsrate erzielt werden. Jetzt, nach der Konvertierung und Kompression von rund 300000 Textseiten, haben die Nutzer des Info-Dienstes direkten Zugriff auf alle gespeicherten Informationen. Die Mitarbeiter dieses Dienstes profitieren von der schnellen Volltextrecherche. Geplant ist außerdem, die Informationen aus der Literatur-­Datenbank langfristig über ein Portal für sämtliche Mitarbeiter direkt abrufbar zu machen. Die Volltextfähigkeit ist der Hauptvorteil. Darüber hinaus prüft die Krankenkasse die Möglichkeiten, per PDF/A in Zukunft auch Farbdokumente in dem Info-System anzubieten.

Nicole Körber ist Journalistin in ­Stockelsdorf.