Datenhaltung neuer Art erforderlich
Dass Hadoop auf dem Weg zum Mainstream ist, lässt sich daran ablesen, dass sich die drei marktbeherrschenden Datenbankanbieter IBM, Microsoft und Oracle unisono hinter Hadoop stellen. Oracle hat im Januar Clouderas Hadoop-Distribution in seine neue Big-Data-Appliance gepackt. Microsoft bietet über die Azure-Plattform Hadoop-Dienste in der Cloud an und hat ähnliche Funktionen für die Version 2012 des relationalen Datenbanksystems SQL Server angekündigt. IBM hatte schon im Mai vergangenen Jahres das Produkt Infosphere BigInsights auf den Markt gebracht, das die Apache-Distribution von Hadoop nutzt und Konnektoren zu IBMs relationalem Datenbanksystem DB2 umfasst. Datenanalysen sind über die Benutzeroberfläche BigSheets möglich.
Der Hauptakteur in Sachen Hadoop und das Pendant zu Red Hat bei Linux ist in der Big-Data-Welt indes das Startup-Unternehmen Cloudera aus dem kalifornischen Silicon Valley. Seit 2008 bietet Cloudera eine Hadoop-Distribution und zugehörige Dienstleistungen für Unternehmen an. Bislang hat diese IT-Firma nur gut 100 Kunden, aber das könnte sich durch die unlängst mit Oracle geschlossene Partnerschaft bald ändern. Cloudera fügt dem Apache-Code eine Administrationskonsole hinzu, um den Einsatz der Software zu managen, und bietet rund um die Uhr Support, außerdem Schulung und Beratung.
Rund 50 der ursprünglichen Programmierer von Hadoop haben sich mittlerweile in einer Firma namens Hortonworks zusammengeschlossen. Sie ist wie die meisten anderen Hadoop-Startups im Süden von San Francisco zu Hause und wird von Risikokapitalgebern finanziert. Hortonworks entwickelt vor allem die Basistechnologien von Hadoop weiter, will deren Zukunft prägen und steht im Wettbewerb zu Cloudera. Im Oktober hat man eine Partnerschaft mit Microsoft geschlossen, um diesem Softwareriesen zu helfen, eine für Windows optimierte und mit dem Apache-Code kompatible Variante von Hadoop zu entwickeln.