Daten per Service
Daten per Service Geschäftsprozesse lassen sich mit Services implementieren, die einfacher gepflegt und wieder verwendet werden können. Neben der Verarbeitungslogik lassen sich auch Daten auf diese Weise bereitstellen.


Eine serviceorientierte Architektur (SOA) erleichtert die Integration modularer Anwendungen. SOA ist ein moderner Ansatz im Software Engineering für den Bau wieder verwendbarer Dienste und deren Orchestrierung in zusammengesetzten Applikationen. In den letzten Jahren haben Software-Hersteller eine Reihe von Werkzeugen dafür entwickelt, auch für die Bereitstellung von Daten in solchen Architekturen. Während mit Produkten der Kategorie Enterprise Information Integration (EII) kleinere strukturierte oder unstrukturierte Datenmengen in Echtzeit über unterschiedliche Datenquellen und Datenformate in virtuellen Sichten präsentiert werden, aggregieren Werkzeuge für Extraktion, Transformation und Laden (ETL) größere strukturierte Datenmengen aus operativen Datenbanken in ein Data Warehouse. Sowohl ETL als auch EII können mittlerweile SOA-konform operieren. Der EII-Markt ist noch relativ jung. Die meisten Hersteller kommen aus den USA, vertreten sind sowohl Start-ups als auch Veteranen. Mike Ferguson, Analyst bei dem Marktforschungs- und Beratungshaus Intelligent Business, nennt als wichtige EII-Produkte Business Objects Data Federator, BEAs Acqua Logic Data Services, den Information Server von Composite Software, IBMs Websphere Federation Server, Avaki von Sybase sowie die einschlägige Software der Hersteller Denodo, Ipedo und Metamatrix. In die Kategorie ETL reiht er die Software von Ab Initio ein, Business Objects Data Integrator, IBMs Websphere Data Stage SOA Edition, Informaticas Power Center, Microsofts SQL Server Integration Services, Oracles Warehouse Builder sowie Data Integration Studio von SAS.
Föderation und Web Services EII-Werkzeuge greifen in einer SOA auf verteilte, heterogene Daten- und Content-Quellen zu und aggregieren die Informationen so, dass sie dem Benutzer wie aus einer einzigen Quelle erscheinen. Dieses Verfahren wird auch als Föderation bezeichnet. Über Middleware lassen sich Zugriffssteuerung, Transformationsregeln und Mapping zentralisieren. Föderation ist allerdings ressourcenintensiv, weil der Zugriff auf operative Datenbanken erfolgt. EII ist ein wesentlicher Faktor in einer unternehmensweiten Informationsverarbeitung. Dazu zählen nämlich Abfragen von strukturierten (relationale Daten, XML-Formate, Spreadsheets) und unstrukturierten Informationen (Texte, Bilder, Multimedia) über verteilte heterogene Systeme, deren Integration sowie neuerdings deren Output als wieder verwendbare Web Services. Eine SOA virtualisiert im Hinblick auf die Datenverarbeitungsverfahren, indem die Anwendungen von Details wie Lokation der Services oder Implementierung der Prozesse abgeschirmt werden. Mit EII lassen sich in einer SOA auch die Datenbereitstellungsverfahren virtualisieren. Standardisierte Abfragesprachen wie SQL und XQuery greifen über Standardschnittstellen wie ODBC, JDBC oder XQJ (XQuery API für Java) auf die virtuelle Datenbank zu. Um Probleme zu vermeiden, kann die Belastung dieser Systeme über selektive Zugriffsberechtigungen und vordefinierte Abfragen verringert werden. »Föderation heißt für uns, dass in einer DB2-Datenbank virtuelle Tabellen erstellt werden, die auf heterogene Quellen wie XML- oder Oracle-Datenbanken zugreifen. Dem Anwender erscheinen diese virtuellen Tabellen wie native DB2-Tabellen, daher lassen sich diese unterschiedlichen Datenquellen mit DB2-SQL sozusagen anfassen«, erläutert IT-Architekt Kai Shen von IBM in Deutschland. Im Kontext von SOA kommt für den Output als wieder verwendbare Services der Websphere Information Services Director ins Spiel, der mit Hilfe der früheren Ascential-Werkzeuge Data Stage oder Quality Stage oder des Federation Servers Dienste publiziert. Im Websphere Information Services Director wird dieser Dienst erstellt, implementiert wird er im Federation Server. Der Information Server von Composite Software (CIS) ist laut Wayne Kernochan, Consultant bei dem Marktforschungs- und Beratungshaus Illuminata, das wichtigste Konkurrenzprodukt zu IBMs Federation Server: »Composite Software war schon lange im EII-Geschäft, bevor IBM das erste EII-Produkt, den damaligen DB2 Information Integrator (heute Federation Server genannt) auf den Markt brachte.« Der CIS beinhaltet eine Entwicklungsumgebung (Composite Studio), mit deren Hilfe sich verbundene Sichten der verteilten Datenquellen erzeugen lassen. Ein interner Transaktionsmanager sorgt für Integrität der Daten per Recovery- und Log-Management über verteilte Datenquellen. Mehrere CIS-Instanzen lassen sich als Cluster für höhere Verfügbarkeit und Performance parallel einsetzen. SOA wird durch Schnittstellen für Web Services unterstützt. Ein dritter wichtiger EII-Anbieter mit SOA-Ambitionen ist Ipedo. Web-Services-Erweiterungen in der EII-Software XIP 4.2 erleichtern die Einbettung in eine entsprechende Architektur. »Immer mehr potenzielle Anwender gehen in Richtung SOA, ihre Anforderungen an die Erzeugung und Verwaltung von Daten-Services steigen daher schnell. Unsere erweiterte EII-Plattform verbindet die alte und die neue IT-Welt«, meint Ipedos CEO Nick Zhang. »Im neuen Release haben wir Data Services realisiert, mit denen alle Views publiziert und als Services verfügbar gemacht werden. Wir erfüllen damit die Anforderungen sowohl der Entwicklung im Team als auch der erweiterten Unterstützung der SOA«, ergänzt Entwicklungschefin Jamie Wang. Die Data Services unterstützen die Typen Web Services (SOAP Binding und WSDL), SQL Data Services (JDBC-Zugriff) sowie XQuery Data Services (XQuery 1.0). Die Dual Caching Option kann die View eines Web Service nativ in XML, in relationaler Form oder parallel in beiden Varianten zwischenspeichern. Natives Caching verbessert die Performance und erlaubt eine Versionierung der XML-Resultate. Die relationale Option kann XML automatisch in ein relationales Format zur Verwendung in anderen Anwendungen umsetzen. XQuery for SOA schließlich bietet eine tiefere Einbettung in eine SOA.
EII, ETL und BI Obwohl Business Intelligence (BI) und EII unterschiedliche Einsatzschwerpunkte haben, gibt es doch wesentliche Zusammenhänge. Zentral ist die Datenkonsolidierung, indem aus operationalen Datenquellen per ETL ein Operational Data Store (ODS), ein Data Mart (DM) oder ein Data Warehouse (DW) befüllt wird. Etablierte Anbieter wie Business Objects (setzt auf Metamatrix), Cognos oder Informatica haben mittlerweile ihre Produktpalette um EII-Technologie ergänzt. »Die Erweiterung des Data Warehouse um dynamische Daten unterschiedlichen Ursprungs ist eine wichtige Anforderung und die Einbindung von EII ist daher eine natürliche Erweiterung der BI-Technologie«, stellt Analyst Eric Rogge von Ventana Research dazu fest. Die EII-Software CIS würde kürzlich in Report Net von Cognos eingebettet, sodass dieser Hersteller neben ETL nun auch EII anbietet. Report Net selber basiert auf einer Web-Services-Architektur und kann mit EII-Unterstützung nun historische Daten aus Warehouses mit operativen Echtzeit-Informationen kombinieren. Auch Informatica erweitert seine Produktlinie Power Center um EII durch Einbindung des Composite Information Servers. »EII erweitert das Data Warehouse um heterogene Datenquellen im Echtzeitzugriff, während parallel die Transformationsengine für Metadaten und Datenbereinigung einsetzbar ist. Da beide Komponenten auf SOA basieren, ist eine erhebliche Wiederverwendung von Objekten, Sichten und Services möglich«, sagt Girish Pancha, Informaticas Vice President Products. Power Center 8 will eine SOA-basierte Plattform mit Services für Datenzugriff, -qualität, -transformation und -lieferung zur Verfügung stellen. Auch die interne Architektur basiert auf einer SOA mit Web-Services-Standards.
Achim Scharf ist Fachjournalist in München.