Zum Inhalt springen
Linux wächst weiter

Hadoop ist ein Baustein für Big-Data-Lösungen

Autor:Werner Fritsch • 27.6.2013 • ca. 1:15 Min

»Hadoop ist noch in den Kinderschuhen.« Zeljko Dodlek, Sales Director DACH bei MapR (Foto: MapR)
»Hadoop ist noch in den Kinderschuhen.« Zeljko Dodlek, Sales Director DACH bei MapR (Foto: MapR)

Neben dem Open Stack gibt es ein weiteres quelloffenes Projekt, das gegenwärtig viel Aufmerksamkeit findet: die Software Hadoop zur Verwaltung sehr großer Datenmengen. In den letzten zwei Jahren verkündete ein Business-Intelligence-Hersteller nach dem anderen seine Unterstützung für dieses System. Auch die Datenbankhersteller bieten inzwischen entsprechende Schnittstellen. Nach Einschätzung des IDC-Analysten Carter sind diese Konnektoren allerdings oft recht teuer, was die Ausbreitung behindere.

Ähnlich wie bei Linux und Open Stack gibt es mittlerweile Firmen, die Hadoop selbst in einer kontrollierten Version im Portfolio haben und darauf ein Geschäft aufzubauen versuchen. Beispiele sind die amerikanischen Start-ups Cloudera, Hortonworks und MapR. Die Geschäfte stehen jedoch noch am Anfang, in Deutschland erst recht. Das gilt für den Vertrieb der Software ebenso wie für darauf beruhende Dienstleistungen und für die zugehörigen Channel-Ökosysteme.

Zeljko Dodlek, Sales Director DACH bei MapR und zuständig für Endkunden und Partner gleichermaßen, räumt ein: »Hadoop ist noch in den Kinderschuhen.« Der Software mangele es an technischer Stabilität. Es gebe rasch viele Änderungen, die dann auch bei Anwendungen angepasst werden müssten. Partner hat er bislang vier gewonnen: Die Düsseldorfer Beratungsfirma Zimt, die vor allem im Telekommunikationssektor tätig ist, die in den Branchen Medien und Automobilbau aktive Münchner Firma Norcom sowie die Münchner Unternehmen Comsysto und YMC, die für ihre Kunden Individualsoftware entwickeln.

In den Unternehmen gibt es große Mengen von Daten, die nicht gut in die Tabellen relationaler Datenbanken passen. Die Auswertung der Clickstreams, die Besucher auf der Website eines Unternehmens hinterlassen, weckt Erwartungen. Ähnliches gilt für die Auswertung von Äußerungen in sozialen Netzwerken. Hadoop ist nach Carters Einschätzung vor allem für semistrukturierte Informationen wie Texte geeignet, weniger hingegen für die ebenfalls massenhaft anfallenden, aber strukturierten Sensordaten. »Hadoop ist ein Schlüsseltechnologie für Big Data, aber nur eine Komponente«, relativiert der Analyst.