EMC bringt mit der »Greenplum Modular Data Computing Appliance« (DCA) die erste Komplettplattform für die Analyse großer Datenmengen auf den Markt. Die Greenplum DCA verbindet eine massiv-parallele Verarbeitungsarchitektur mit Apache Hadoop in einer einheitlichen Anwendung.
Die Infrastruktur der DCA-Plattform besteht aus vier Modulen. Unternehmen können diese entsprechend ihrer Anforderung zusammenstellen. Zusätzlich können Business Intelligence Lösungen sowie Data Warehousing Anwendung durch den Einsatz des Greenplum Data Integration Accelerators integriert werden. Das Ergebnis ist eine einheitliche Big Data-Plattform, die strukturierte und unstrukturierte Daten und Applikationen zu einer Infrastruktur zusammenführt, die von EMC auch kontrolliert, verwaltet und unterstützt wird.
Diese vier Module stehen derzeit zur Verfügung:
· Das Greenplum Database Modul ist ein skalierbares Data-Warehousing-Appliance-Modul, das mit seiner Architektur Datenbank-, Computing-, Storage- und Netzwerk-Funktionalitäten in einem System vereint.
· Das Greenplum Database High Capacity Modul wurde für das Hosting von mehreren Petabyte Daten entwickelt. Dabei sollen der Stromverbrauch, die Kosten und der Platzbedarf im Rahmen bleiben.
· Das Greenplum HD Modul bietet ein Appliance-Modul auf Hadoop-Basis für das Co-Processing von Daten. Es verbindet Hadoop mit der Greenplum Database und ermöglicht damit das Co-Processing von strukturierten und unstrukturierten Daten innerhalb einer Lösung.
· Das Greenplum Data Integration Accelerator (DIA) Modul dient als Hostsystem für Analyse-Applikationen von Partnern, wobei diese denselben Interconnect mit niedriger Latenz wie die anderen Appliance-Module nutzen.
Für den Einstieg benötigen Unternehmen ein Primär-Rack, das ein Standard- bzw. ein »High-Capacity-Greenplum Database Quarter-Rack«-Modul enthält und Platz für drei weitere Module bietet. Zusätzlich sind zwei Master-Server nötig, die folgende Aufgabe übernehmen: Authentifizierung, Anfrageoptimierung, Workload-Balancing zwischen den verschiedenen Segment-Servern, Management des Fehlertoleranzmechanismus für Daten und für andere Aufgaben für den Cluster. Anschließend lässt sich die Appliance in Viertel-Rack-Schritten mit Greenplum Database, Greenplum HD oder Greenplum DIA Modulen in beliebiger Reihenfolge und Anzahl erweitern.