Tools für die PDF-Nachbearbeitung

Wider die Endgültigkeit

18. Juli 2007, 22:00 Uhr | Dr. Johannes Wiele

Der große Vorteil von PDF-Dateien: Sie sind gegen Veränderungen geschützt. Wenn genau dies aber zum Hindernis wird, helfen die hier vorgestellten Tools. Sie fügen PDFs zusammen, wandeln sie in Office-Dokumente um und knacken Verschlüsselungen.

Sollte man Werkzeuge, die die gewollte Unveränderlichkeit von PDF-Dateien in Frage stellen,
überhaupt besprechen? Ganz abgesehen davon, dass die "Guten" immer über das Arsenal der "Bösen"
informiert sein sollten: Wir denken bei unserer Tool-Sammlung an Einsatzszenarien, die einen "
Angriff" auf PDF-Dateien durchaus rechtfertigen. Möglicherweise müssen Sie für Ihr Unternehmen aus
vielen vorhandenen PDF-Handbüchern eine Notfalldokumentation zusammenstellen – dann hilft ein
Verkettungs-Tool, oder sie erstellen eben Word-Dokumente aus den Vorlagen, die sie dann zu einem
geschlossenen Werk zusammenfügen. In diesen Fällen lassen Sie die Originale sogar intakt, und die
Tools erleichtern nur Bearbeitungsschritte, die auch manuell durchzuführen wären. Nur übers
Copyright müssten Sie sich dann durchaus Gedanken machen. Vielleicht existieren von vorhandenen
PDFs aber auch die Originale nicht mehr, weil sie verloren gegangen sind oder ein zuständiger
Mitarbeiter das Unternehmen verlassen hat – dann ist sogar ein Angriff auf Sicherheitsbarrieren
gerechtfertigt.

Ein erstes hilfreiches Tool ist der PDF-Analyzer 3.0 von Ingo Schmökel. Das Freeware-Programm
zeigt alle Eigenschaften von PDF-Dateien wie Erstellungs- und Änderungsdaten, Sicherheitsmerkmale
und interne Informationen an, ohne dass der Reader oder gar Adobe Acrobat gestartet werden müsste.
Die Daten lassen sich zusätzlich im XML-Fomat exportieren. Außerdem ist eine Textanalyse möglich,
die Informationen über Textmenge und -aufbau ergibt. Das Tool lässt sich auch als Browser für PDFs
verwenden, wenn man häufig mit ihnen zu tun hat. Eine Pro-Version liefert weitere Funktionen wie
etwa das Zurücksetzen des Hauptkennworts.

Der PDF-Blender 1.1.2 von Spaceblue, ebenfalls kostenlos, hängt PDFs aneinander. Die Dateien
ruft man nacheinander über "Hinzufügen" auf, arrangiert eventuell die Reihenfolge um, wählt ein
Zielverzeichnis und eine Ausgabedatei und klickt auf "Start". Voraussetzung ist, dass man vorher
beispielsweise von der Website sourceforge.net das Freeware-Paket Ghostscript zum Handling von
Postscript- und PDF-Dateien installiert hat.

Einziger Ausrutscher bei der sonst hervorragend einfachen Bedienung des Blender-Tools: Die
Binary von Ghostscript muss man auf dem PC von Hand suchen, um den Pfad dorthin anzugeben. Im
verketteten PDF bleiben die Seitenformate der Ursprungsdokumente erhalten.

Zurück zu Office

Das erste kostenpflichtige Werkzeug unserer imaginären Suite wandelt PDF-Dateien in editierbare
Office-Dokumente um. Der Abbyy-PDF-Transformer 2.0 kostet 85 oder 89 Euro (Download- oder
CD-Version). Auch die Ausgabe reiner TXT-, RTF- oder HTML-Files ist möglich.

Die wichtigste Entscheidung, die man speziell beim Umformen von PDFs in Word-Texte vorab treffen
muss, ist, ob der Textfluss oder das Layout Priorität genießen soll. Ist ersteres der Fall, werden
Spalten, Kästen und andere Gestaltungselemente des Dokuments weitgehend verloren gehen, aber Sie
können zusammenhängenden Text als solchen weiter verarbeiten. Wollen Sie das Layout behalten, kommt
es im Extrem zu einem Ergebnis wie in unserem Screenshot: Jedes separate Textelement erhält in Word
sein eigenes Textfeld. Der Text fließt auch nicht vom Ende einer Seite weiter auf die nächste.
Diese Variante eignet sich somit nur dann, wenn am Ergebnis nur kleine Korrekturen vorgenommen
werden sollen. Wollten Sie das von uns gewählte komplexe, bunt gestaltete Datenblatt etwa nach der
Transformation direkt im erzeugten Word-Dokument in eine andere Sprache übersetzen oder anderweitig
stark verändern, hätten Sie keine Freude, da die neuen Texte abweichende Längen haben würden. Das
Gefüge der Textfelder geriete damit schnell durcheinander, und die Nacharbeit wäre mühsamer als ein
Neuaufbau des Layouts.

Beachtet man diese unvermeidlichen Einschränkungen beim Einsatz des Tools, bewährt es sich
hervorragend – speziell bei Texten, die nicht so aufwändig gestaltet sind wie unser
Extrem-Beispiel. Auch die Umwandlung von PDF-Tabellen in Excel-Dateien funktioniert gut, sofern
alle Tabellenzellen von Rahmen umgeben sind. Schade ist, dass der Transformer nicht auch das
Powerpoint-Format beherrscht – hier könnte man seine Dienste gut gebrauchen, weil immer häufiger
vertrauliche Präsentationen im PDF-Format gesichert werden. Der fehlende Entscheidungszwang
zwischen Layout- oder Textflusspriorität würde den Einsatz in diesem Bereich noch zusätzlich
erleichtern.

Ganz nebenbei beherrscht der Abbyy-PDF-Transformer auch die Kunst, aus beliebigen Office-Dateien
PDFs zu erstellen. Dazu installiert er sich wie so viele andere Tools dieser Art, als
Druckertreiber. Sie drucken dann einfach aus einem beliebigen Programm heraus und wählen den
Drucker "PDF-XChange for Abby PDF Transformer 2.0" aus. Die Optionen dabei reichen für die meisten
Aufgaben gelegentlicher PDF-Erzeugung voll und ganz aus, selbst die DRM-Optionen wie
Kennwortvergabe, 40-Bit- und 128-Bit-Verschlüsselung nach Adobe Acrobat 3.0, 4.0 und 5,0 sowie
DRM-Funktionen wie das Druckverbot sind enthalten.

PDF-DRM umgehen

Das letzte Tool im Test, Elcomsoft?s Advanced PDF Password Recovery 3.0, soll geschützte
PDF-Dateien frei zugänglich machen. Das Produkt beherrscht Wörterbuch-Attacken,
Brute-Force-Angriffe und spezielle Recovery-Methoden, die auf PDF-Besonderheiten zugeschnitten
sind. Das Werkzeug kostet 50 Euro in der StandardVersion, 100 in der Professional-Variante und 1000
als Enterprise-Edition.

PDF-Dateien können durch "Owner-" und "User"-Kennwörter geschützt sein. Der Schutz sorgt
entweder dafür, dass das gesamte PDF nur mit Kennwort geöffnet werden kann oder bewirkt Sperren
oder Einschränkungen für einzelne Nutzungsmöglichkeiten wie das Drucken oder das Herauskopieren von
Inhalten.

Legt der Anwender nur derartige Nutzungseinschränkungen fest und vergibt entweder gar kein
Kennwort oder nur ein Owner-Kennwort für Änderungen an den Nutzungsbedingungen, hat Advanced
Password Recovery extrem leichtes Spiel. Das Kennwort zu brechen, ist in diesem Fall sogar unnötig.
Die Einstellungen werden einfach in Sekundenbruchteilen zurückgesetzt, und der Anwender hat
uneingeschränkten Zugriff.

Der eigentliche Adobe-Kennwortschutz samt Verschlüsselung ist nicht so einfach zu umgehen. Adobe
3.x und 4.x arbeiteten mit 40-Bit-RC4-Verschlüsselung, ab Version 5.0 lassen sich auch 128 Bit
wählen. Um diese Schutzmechanismen zu knacken, muss das Elcomsoft-Programm auf Hacker-Techniken
zurückgreifen. Hier ein paar Ergebnisse:

Ein 40-Bit- oder 128-Bit-geschütztes PDF mit dem bewusst schwach gewählten
Kennwort "Emerald" war per Wörterbuch-Attacke schneller offen, als ich die Zeit messen konnte.
Offenbar verfügt die Software über eine gute englische Wortdatenbank. Nahm ich "Edelstein",
funktionierte der gleiche Angriff folgerichtig nicht – aber auf der Website von Elcomsoft gibt es
eine deutsche Wortliste zum Download.

Sinnlose Kennwörter sorgen für längere Wartezeiten, denn in diesem Fall muss
das Tool mit Brute Force arbeiten. Das einfache "MhGtr" zusammen mit 40-Bit-Verschlüsselung ließ
sich auf einem 1,6-GHz-PC in etwa sieben Minuten brechen, wenn man dem Tool die Länge des
unbekannten Kennworts angab. Kennt man die Länge nicht und sind neben Buchstaben auch andere
Zeichen im Spiel, steigt die Wartezeit schnell auf mehrere Stunden an. Mit einem professionell aus
beliebigen Zahlen, Buchstaben und Sonderzeichen konstruierten Kennwort landet man dann schon einmal
bei Prognosewerten von über 14 Tagen.

Solange nicht 128-Bit-Verschlüsselung im Spiel ist, hat Advanced PDF Password Recovery zumindest
in der Enterprise-Version noch eine Option zu bieten, die des Hackers Wartezeit erheblich verkürzt.
Dazu zunächst ein paar Grundlagen: In PDF-1.2/1.3-Dateien mit 40-Bit-Verschlüsselung von Acrobat
4.x oder älter ist die Zahl möglicher Schlüssel auf 240 oder 1.099.511.627.776 begrenzt, wobei der
Speicherraum in 65.536 Blocks mit je 16.777.216 Schlüsseln pro Block aufgeteilt ist. Laut Anbieter
lässt sich dieser Bereich mit einem langsamen PIII-450 in 30 Tagen komplett durchsuchen, während
moderne Intel-Core-2-Duo-Prozessoren sämtliche Möglichkeiten garantiert schon in drei bis fünf
Tagen ausprobiert haben.

Ab der Enterprise-Version liefert Elcomsoft zur weiteren Beschleunigung dieses "Key Search"
genannten Verfahrens auf der Programm-DVD vorberechnete Hash-"Rainbow"-Tables mit, die bei einer
Erfolgswahrscheinlichkeit von 99,9 Prozent die Entschlüsselung in wenigen Minuten erlauben. Im Test
wäre die Überprüfung dieses Versprechens fast gescheitert, weil zwei Elcomsoft-DVDs gleich auf zwei
Notebooks von Fujitsu-Siemens und IBM nicht vollständig lesbar waren – da wollten die 3,73 GByte an
Tabellen erst mühsam von einem weniger wählerischen Desktop-Rechnern aus übers Netz auf die Platte
des Hackertest-Rechners geschaufelt werden, weil sie tunlichst auf einer schnellen Festplatte zur
Verfügung stehen sollten. Der Aufwand lohnte sich allerdings: Selbst mit dem Kennwort "
w3$6jK0rtOv7#ß" war das PDF in einer Minute und 15 Sekunden offen, während das System ohne
Hash-Hilfe die schon erwähnten 15 Tage veranschlagt hatte.

Die Moral von der Geschicht: Man schütze PDFs nur, wenn dies wirklich notwendig ist. Dann
allerdings ist jedes Verfahren unterhalb der 128-Bit-Versionen mit richtig guten Kennwörtern für
die Katz?!

PDF-Analyzer 3.0 Web: www.is-soft.de

PDF-Blender Web: www.spaceblue.com/pdfblender/

Abby PDF-Transformer Web: www.pdftransformer.de

Elcomsoft Advanced PDF Password Recovery Web: www.elcomsoft.com


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+