Zum Inhalt springen

Kritische Recherchen (Fortsetzung)

Autor:Redaktion connect-professional • 25.5.2005 • ca. 2:55 Min

Inhalt
  1. Kritische Recherchen
  2. Kritische Recherchen (Fortsetzung)

Geschäftskritische ­Anwendung
Mit der Entwicklung von Digas in seiner heutigen Form begann der Verlag 1999. Ziel war, die Dossierstrukturen für ­einen größeren Personenkreis nutzbar zu machen und erweiterte Suchmöglichkeiten, Suchprofile sowie Verfahren zur Verwaltung von Ergebnislisten zur Verfügung zu stellen. So suchte IT-­Manager Ulrich beim Datenbank-Hersteller nach Lösungen für bestimmte Systemanforderungen. Oracle arbeitete zu dieser Zeit noch intensiv an der ­Entwicklung der Datenbank Oracle 10g, die wie schon ihre Vorläufer über umfangreiche Text- und Medienfunktionen verfügt. Ulrich traf sich mehrere Male mit den Entwicklungsteams von Oracle, um weitere Funktionen zu besprechen, die ein Medienunternehmen für seine Arbeit braucht. Denn Digas ist eine ­absolut geschäftskritische Applikation mit mehr als 1000 Nutzern und dient Online- und Print-Redakteuren als zentrale Anwendung für Recherche und ­Verifikation. Das System verwaltet und archiviert heute alle digitalen Assets aller Publikationen der Spiegel-Gruppe.
Die Anwenderwünsche sind in die Datenbankkomponente Oracle Intermedia eingeflossen und stehen dem ­Verlag seit der Migration auf die aktu­elle Datenbankversion im Jahr 2004 zur Verfügung. Die Intermedia-Komponente erlaubt es, Images, Audio- und Videodaten effizient zu verwalten und wieder zu finden. Es kennt die gängigen Multimedia-Formate und unterstützt die Extraktion von Metadaten und das ­Image Processing. Das wichtigste Ve­hikel ist indes Oracle Text. Diese Datenbankkomponente arbeitet mit SQL-Standards und indexiert jedes Dokument automatisch für die Volltextrecherche. Inhalte lassen sich aus allen nur denkbaren Dokumentenformaten herausfiltern und extrahieren, da Oracle Text mehr als 150 Dokumentenformate wie Microsoft DOC, Adobe PDF, HTML und XML unterstützt.
Diese Vorteile nutzen nun die Journalisten. An einem durchschnittlichen Arbeitstag greifen rund 500 Redakteure mit 5000 bis 8000 Anfragen auf Digas zu, etwa 30 davon parallel mit Antwortzeiten von drei bis vier Sekunden. Der technische Ablauf des Zugriffs führt über eine dreischichtige Architektur vom Servlet-Server, gestützt auf den quelloffenen Java-Applikationsserver JBoss, über den Recherche-Server auf die Datenbank.
Heute sind rund 30 Millionen Dokumente elektronisch gespeichert, teils eigene und teils fremde. Viele Dokumente sind mit Infografiken verknüpft oder werden auch als PDF-Dateien angezeigt. Täglich kommen bis zu 20000 externe Texte und Bilder hinzu. Insgesamt wächst der elektronische Bestand um drei bis vier Millionen Dokumente im Jahr. Da ständig neue Informationen hinzukommen, werden pro Stunde mehr als 2000 Dokumente aktualisiert. Die Aktualität des Indexes ist das A und O, weshalb neue oder geänderte Dokumente spätestens nach drei Minuten neu indexiert werden. Eine Besonderheit des Systems sind eigene Prozeduren zur Steuerung der Index-Aktualisierung und zur Erzeugung der Index-Dokumente.

Mehr Effizienz im Archiv
Agenturmeldungen, Tages- und Wochenzeitungen werden vollständig digital gespeichert. Früher, als das Archiv überwiegend aus Papierdokumenten bestand, waren Dutzende Mitarbeiter damit beschäftigt, bei Anfragen aus der Redaktion optimale Recherche-Ergebnisse in kürzester Zeit zu erzielen. Das gewünschte Material gelangte in Papierform per Hausboten oder sogar per Fax auf den Schreibtisch des Redakteurs. Das Ausmaß der Arbeitserleichterung durch den schnellen digitalen Zugriff auf das Archiv wird klar, wenn man bedenkt, dass die Anzahl der gleichzeitig recherchierten Artikel durchaus dreistellig sein kann. Und das allein bei dem gedruckten Medium Spiegel. Hinzu kommen die anderen Aktivitäten des Hauses: der Web-Auftritt Spiegel Online, der Fernsehableger Spiegel TV und die Wirtschaftszeitschrift Manager Magazin.

Kooperation mit ­Konkurrenten
Synergieeffekte lassen sich auch noch auf andere Weise erzielen: Anfang dieses Jahres ist der Spiegel-Verlag eine Kooperation mit dem Axel-Springer-Verlag eingegangen, dessen Redakteure Digas nun ebenfalls nutzen und auf das Archiv zugreifen können. »Das senkt die Kosten für den Betrieb und die Weiterentwicklung der Software«, begründet IT-Manager Ulrich die Zusammenarbeit mit der Konkurrenz. Für Effizienz sorgen außerdem eine gemeinsame Qualitätssicherung bei der Digitalisierung der Zeitungen und Zeitschriften für das Archiv und das gemeinsame Lesen der Texte.
Mit dem Springer-Konzern hat sich die Anzahl der möglichen Endbenutzer quasi über Nacht von 1000 auf 3000 erhöht. Das Systemumfeld verkraftet dieses Wachstum bislang ohne Probleme, weil die Datenbank-Umgebung skalierbar ist und sich der Spiegel-Verlag mit der Migration auf die Oracle-Version 10g auch für neue Hardware entschieden hatte. Der Wechsel von einem HP-Superdome-Umfeld auf Server der Baureihe IBM P960 hat einen deutlichen Leistungsschub gebracht.