Neben den etablierten Datenbank- und Business-Intelligence-Anbietern sind auch zahlreiche Start-ups auf den Plan getreten. Zum Beispiel Cloudera, Hadapt, Hortonworks und MapR, die von der quelloffenen Datenverwaltungssoftware Hadoop der Apache Software Foundation ausgehen.
»Das Ziel von Hortonworks ist es, eine Hadoop-Variante anzubieten, die den Anforderungen von Unternehmen genügt«, sagt Shaun Connolly, Vice President Corporate Strategy bei Hortonworks, gegenüber CRN. »Die Hälfte der Daten auf der Welt könnte über Hadoop verarbeitet werden«, meint er. Etwa 250 Mitarbeiter beschäftigt das in Kalifornien ansässige Unternehmen derzeit, vor zwei Jahren war es mit 25 Leuten gegründet worden, gestützt auf ausreichendes Venture Capital. Die maßgeblichen Software-Ingenieure hatten zuvor bei Yahoo gearbeitet. Sie wollten sich ganz auf die Arbeit an Hadoop in einem reinen Open-Source-Rahmen konzentrieren und machten sich selbstständig.
In Europa ist das Unternehmen erst vor einigen Monaten mit einer eigenen Niederlassung vertreten. Den Markt erschließen will Hortonworks mit eigenen Kräften, über Technologiepartnerschaften sowie durch Zusammenarbeit mit Systemintegratoren. Auch Reselling über diese Partner ist möglich. Gegenwärtig verspricht sich Connolly die größte Hebelwirkung durch Partnerschaften mit Größen wie Microsoft und Teradata. Nächstes Jahr könnte der indirekte Vertrieb durch Channel-Unternehmen wichtiger werden.
Hadoop wurde für x86-Server gebaut und läuft unter dem quelloffenen Betriebssystem Linux. Die Hadoop-Distribution von Hortonworks läuft auch unter Windows Server und ist mit Microsofts relationalem Datenbanksystem SQL Server integriert. Auch im Rahmen des Azure-Angebots von Microsoft ist das Hortonworks-Hadoop verfügbar. Außerdem findet es in den Cloud-Services des Hosting-Riesen Rackspace Verwendung. An der Integration mit dem Open Stack für Cloud-Lösungen wird ebenfalls gearbeitet.
Enge Integration wurde ferner mit der Software von Teradata erreicht: Die quelloffene Datenbank läuft in einer Teradata-Appliance. Auf der Seite der Integration und Auswertung der Daten gibt es Konnektoren zu Business-Intelligence-Werkzeugen großer Anbieter wie SAP (Business Objects), SAS oder Microstrategy, aber auch zu kleineren Angeboten wie Pablo.
»Die meisten Kunden starten mit Hadoop, wenn sie neue Informationsquellen wie Clickstreams, Weblogs, soziale Medien, mobile Geräte oder Sensoren nutzen wollen«, berichtet Connolly. Diese Daten haben eine andere Struktur als die kaufmännischen Zahlen, die traditionell in relationalen Daten abgelegt sind.
Hadoop bietet jedenfalls die Möglichkeit, große Daten kostengünstiger zu speichern als mit relationalen Datenbanken. »Für uns ist das eine Datenquelle von vielen«, relativiert allerdings SAS-Manager Mahnkopf. In der Tat bieten die meisten Hersteller von Datenbanken und Business-Intelligence-Werkzeugen inzwischen Schnittstellen zu Hadoop.