Open Source wird zuweilen als Gratis-Lösung verstanden oder wenigstens als deutlich günstiger im Vergleich zu kommerziellen Alternativen. Im Hinblick auf die Kosten scheint Hadoop damit eine ideale Lösung für Unternehmen mit großen Datenmengen zu sein. Die Kostenersparnis gilt gegebenenfalls für die reine Software, nicht aber im Hinblick auf die gesamte Infrastruktur. Mit kommerziellen Lösungen, die auf Hadoop aufsetzen, benötigen Telekommunikationsunternehmen für die gleiche Leistung häufig weniger Hardware und verringern zusätzlich ihren Energieverbrauch. Darüber hinaus sinkt der administrative Aufwand durch Vorkonfigurationen und zusätzliche Serviceleistungen.
Telekommunikationsunternehmen sollten sich daher für eine Infrastruktur entscheiden, die über die gleichen Schnittstellen wie die Open-Source-Variante verfügt und alle Hadoop-Komponenten unterstützt. Dies bietet zusätzlich den Vorteil, dass sich Gratis-Lösungen beliebig einsetzen und bei Bedarf an der richtigen Stelle durch weitere Funktionen ergänzen lassen. Die Unterstützung des Protokollformats NFS (Network File System) ist z.B. hilfreich, da viele Anwendungen und Entwicklertools dieses Format verwenden, um über ein Netzwerk auf ihre Daten zuzugreifen.
Standardmäßig bietet Hadoop kein mehrstufiges Verschlüsselungsverfahren. Außerdem sind die Daten auf mehrere Cluster verteilt. Backup-Funktionen für Hadoop-Cluster sorgen dafür, dass ein Produktivsystem ununterbrochen in Betrieb bleibt, selbst wenn beispielsweise beim Rollout einer neuen Softwareversion Probleme auftreten.
Das Hadoop Distributed File System (HDFS) behebt zwar Festplattenfehler, beschädigte Dateien reproduzieren sich jedoch von einem Cluster zum anderen. Telekommunikations- und Service-Provider sollten daher auf eine Lösung zurückgreifen, die konsistente Snapshots bereitstellt und die Daten beim Datentransfer durch zusätzliche Verschlüsselung sichern kann.
Entsprechende IT-Dienstleister haben Hadoop-basierte Infrastrukturen entwickelt, mit denen Telekommunikationsanbieter ihre Informationen angemessen steuern, speichern und analysieren können. So haben sie die Möglichkeit, effektive Data Lakes zu erschaffen, in denen Informationen aller Formate zusammenlaufen. Zugleich profitieren sie von hochleistungsfähigem parallelem Rechnen. Auf diese Weise steigern Telekommunikationsunternehmen ihre Übertragungsgeschwindigkeit und reduzieren Kosten im Hinblick auf die Datenspeicherung. Zudem lassen sich anhand der Datenanalyse betrügerische Aktivitäten schnell erkennen und entsprechende Maßnahmen einleiten.
Fazit
Telekommunikations- und Service-Provider kommen heute nicht mehr umhin, ihren Kunden individuelle Leistungen anzubieten. Indem sie mit Hadoop-Distributionen unterschiedliche Datentypen parallel in Echtzeit verarbeiten und analysieren, können sie das Verhalten ihrer Kunden nachzeichnen. Bei dem Gedanken an eine bereits über mehrere Jahre und Verträge andauernde Kundenbeziehung rund um drahtlose und drahtgebundene Angebote ist eine umfangreiche Infrastruktur unbedingt notwendig. Diese muss sich auf den Umgang mit einer Vielzahl unterschiedlicher Datentypen verstehen, um einen qualitativen, schnellen sowie personalisierten Kundenservice über alle Kanäle hinweg ermöglichen zu können.