Erfolgsfaktor Zeit
Die ersten Gedanken an Echtzeit-BI riefen sofort Skeptiker auf den Plan. Brauchen Verkaufsleiter oder die meisten Führungskräfte im Allgemeinen wirklich sekundenaktuelle Informationen? Oder versuchen die Anbieter, nur noch mehr teuren Schnickschnack zu verkaufen? Schnell wurde jedoch klar, dass BI-Anwendungen auf einer Reihe von Gebieten wie etwa der Preisbildung, der Herstellung, dem Ertragsmanagement, dem Aufdecken von Betrug, der Planung der Zulieferkette und dem Callcenter-Management die Latenzzeit deutlich verkürzen, die zwischen dem Moment der Datenerfassung und dem Zeitpunkt vergeht, an dem die Daten zur Analyse verfügbar sind. Das kann für das Geschäft nur positiv sein. Dieser Bedarf an Bearbeitung in Echtzeit traf die Data-Warehouse-Gemeinde an einem wunden Punkt. Man könnte es als Kollateralschaden bezeichnen: Mit gestiegenem Datenvolumen stieg auch der Schwierigkeitsgrad, enorme, manchmal viele Terabyte große Datenmengen in Data Warehouses zu laden. Die meisten Systeme müssen für einige Zeit offline genommen werden, bis der aktualisierte Zustand hergestellt ist und die BI-Werkzeuge Zugriff auf die Daten bekommen. Darüber hinaus wurde der Update-Rhythmus schrittweise von monatlich auf wöchentlich umgestellt. In vielen Firmen wird mittlerweile mehr als ein tägliches Update als nah genug an Echtzeit angesehen, was zur Folge hat, dass wegen der zunehmend operativen Rolle, die BI spielt, die Unternehmen durch die regelmäßigen Ausfallzeiten extrem gefährdet sind. Um den Prozess zu beschleunigen, gehen manche Unternehmen dazu über, die Updates häppchenweise statt in einer großen Portion durchzuführen. Andere verändern ihre Architektur und installieren eine Zwischenschicht mit Servern, die ähnlich wie Anwendungsserver funktionieren, um die Datenzufuhr zu regeln. Unternehmen wie der Casinobetreiber Harrah’s Entertainment nutzen aktive Konzepte mit zentralisierten Data Warehouses. Dort werden gespeicherte Kundendaten mit Echtzeitdaten kombiniert, um das Casinoerlebnis für die Besucher zu personalisieren und ihre Wünsche zu erfüllen, bevor sie diese überhaupt äußern. Passend zu den Vorlieben des Kunden – welche Spiele bevorzugt er, was bestellt er im Hotelrestaurant, welche Shows sieht er sich an – werden die Kunden mit adäquaten Angeboten, Werbeaktionen und Nachrichten versorgt.
Schneller dank Shared-Nothing Unter einer Shared-Nothing-Architektur (SN) versteht man eine Distributed-Computing-Architektur, bei der jeder Knoten unabhängig und eigenständig seine Aufgaben mit seinem eigenen Prozessor und den zugeordneten Speicherkomponenten wie Festplatte und Hauptspeicher erfüllen kann und kein bestimmter, einzelner Knoten für die Verbindung zu einer Datenbank notwendig ist. SN führt zu einfach skalierbaren Systemen, die – zumindest in der Theorie – keinen Single Point of Failure haben. Schon immer wurden parallele SN-Architekturen für skalierbarer und schneller gehalten. Deshalb sollten sie auch am besten geeignet für Analytik und Data Warehousing sein, doch bisher konnte sich damit nur Teradata auf dem Markt durchsetzen. Data-Warehouse-Anwendungen bringen die Architektur nun in den Mainstream, setzen Teradata damit unter Preisdruck und bieten eine Alternative zu gewöhnlichen Shared-Memory- oder Shared-Disk-Technologien, wie sie von Microsoft und Oracle angeboten werden. IBM steckt die Mitte für sich ab und bietet einige Datenbank-Systeme mit paralleler SN-Architektur an. Doch auch hier gibt es eine Kehrseite. Diese Anwendungen sind für spezielle Zwecke angepasst und weder für wechselnde Lasten ausgelegt, wie sie zum Beispiel beim Online Transaction Processing (OLAP) in Verbindung mit komplexen Datenabfragen entstehen, noch für Lasten, die spezielle Einstellungen erfordern, wenn ungewöhnliche Zielvorgaben erfüllt werden sollen. Das könnte zum Problem werden, falls »ungewöhnlich« eine Innovation bedeutet, die einen großen geschäftlichen Vorteil mit sich bringt. Dennoch sind sie genau das Richtige für Data Marts mit hoher Leistung, also Data Warehouses die speziell für eine Abteilung oder einen bestimmten Zweck eingerichtet werden, wie beispielsweise dem Tracking von Online-Shopkunden.