Datenwissenschaftler sind wie weiße Einhörner: seltene Wesen mit sagenumwobenen Kräften. Ein Datenwissenschaftler verbindet die Fähigkeiten und Erfahrungen eines Software-Entwicklers mit denen eines anwendungsbezogenen Wissenschaftlers. Unternehmen, die auf Big-Data verzichten, weil ihnen die erfahrenen Spezialisten fehlen, zäumen jedoch das Pferd von hinten auf.
Die meisten Unternehmen setzen Hadoop zunächst als günstige, hoch skalierende Datenquelle für existierende Business-Intelligence-Tools ein. So können etablierte Fragen, ausgedrückt als Structured-Query-Language (SQL), auf größeren Datenbeständen laufen. Einige fangen im zweiten Schritt an, neue analytische Anwendungen für Hadoop zu entwickeln, meist um aus neuen, unstrukturierten Datenquellen Wert zu schöpfen. Erst wenn das Unternehmen beträchtliche Kosten eingespart und Erfahrungen mit Hadoop gesammelt hat, ist es sinnvoll so genannte Data-Scientists einzustellen. Dieser neue Beruf hat zur Aufgabe, fortgeschrittene Auswertungen mittels statistischer Algorithmen zu erstellen.
Unternehmen, die Big-Data schrittweise einführen, stellen fest, dass sich die Investition selbst trägt. Um nur ein Beispiel aus der Telekommunikations-Branche anzuführen: Wenn die jährlichen Investitionskosten für den Ausbau des 4G-Mobilfunknetzes mehr als eine Milliarde Euro betragen, und ein einzelner Datenwissenschaftler in der Lage ist, diese Investitionen um nur einen Prozentpunkt zu senken, dann hat er in diesem Jahr bereits mehr Geld eingespart, als seine eigene Stelle über 20 Jahre hinweg kostet.
Fazit und Prognose
Unternehmen, die sich heute für Hadoop entscheiden, werden schon bald all jene hinter sich lassen, die zu spät in die Welt von Big-Data einsteigen.