Auch Unternehmen, die keine enormen Datenmengen haben und nicht über spezialisierte Datenwissenschaftler und ein riesiges Budget verfügen, können erfolgreich in Big-Data einsteigen. Jürgen Urbanski erörtet die Wahrheit hinter den drei großen Big-Data-Mythen.
Die Vorteile von Big-Data sind unbestritten: Neukundengewinnung und Kundenservice lassen sich effizient und erfolgreich gestalten, Geschäftsprozesse optimieren und völlig neue Märkte erschließen. Kurz: Big-Data verwandelt den Überfluss an Informationen in zusätzlichen Gewinn.
Viele Entscheider meinen aber, dass ihr Unternehmen noch nicht in Big-Data einsteigen kann. Drei häufig vorgebrachte Argumente sind: Wir haben gar nicht so viele Daten, wir haben kein Budget und uns fehlen Datenwissenschaftler. Diese drei Einwände erweisen sich jedoch als Mythen, wenn man die ausgereifte Technologie des Ökosystems "Open-Source Hadoop" in Betracht zieht.
Mythos Nr. 1: Bei uns gibt es gar keine Big-Data
Die meisten Unternehmen haben Schwierigkeiten mit dem Daten-Management, selbst wenn der Datenbestand nur etwa 10 bis 50 Terabyte umfasst. Das Problem kann darin bestehen, dass vorhandene Datenbanken an ihre Kapazitätsgrenzen stoßen oder ältere Daten in einem dunklen Archiv schlummern, wo sie nicht abgefragt oder ausgewertet werden können.
Viele Unternehmen schöpfen das Potenzial an Daten nicht aus, die sie am Point of Sale, bei Online-Transaktionen oder durch Sensoren an Maschinen generieren. Möglicherweise werden potenziell wertvolle Daten gar nicht gesammelt oder zu früh gelöscht.
Zweitens verfügt ein durchschnittliches Fortune-1000-Unternehmen zwar über einen Gesamtdatenbestand in Petabyte-Höhe (1 Petabyte entspricht 1.024 Terabytes.), doch diese Daten werden in getrennten Silos aufbewahrt und nicht gesamtheitlich professionell bewirtschaftet.
Drittens – und dies ist der wichtigste Punkt: Viele Unternehmen sammeln beziehungsweise unterhalten allein deshalb keine großen Datenmengen, weil schon die zugrundeliegende IT-Architektur zu teuer ist. Die Anschaffungskosten eines herkömmlichen Enterprise-Data-Warehouses (EDW) belaufen sich auf 20.000 bis 80.000 Dollar pro Terabyte. Das bedeutet: Das Budget des Unternehmens ist schnell erschöpft.