Pentaho mit vier Komponenten
- Datenintegration mit Open Source
- Pentaho mit vier Komponenten
- Talend in drei Varianten
- Starke Communities in Europa
- Schneller ROI und gute TCO
- Open Source holt auf
Das Produkt Pentaho Data Integration setzt sich aus vier Komponenten zusammen. Spoon dient als Editor zur grafischen Definition von Schritten, die den Datenfluss und seine Transformationen enthalten. Diese Definitionen werden im XML-Format in einem zentralen Datenbank-Repository abgelegt, wodurch sich die Metadaten besser pflegen lassen. Als Programmiersprache wird hier JavaScript oder Java verwendet. Die Schritte werden in der Kitchen-Komponente ausgeführt, wobei die Transformationen in der Pan-Komponente stattfinden. Die Carte-Komponente startet einen Remote-Webserver zur verteilten Transformationsausführung. Während in Transformationen jeder einzelne Schritt durch einen eigenen Thread bedient wird, können die Jobs nicht parallel ausgeführt werden. Um bei großen oder langlaufenden Jobketten eine bessere Skalierbarkeit zu erzielen, sollten diese auf kleinere Jobs aufgeteilt werden. Pentaho Data Integration unterstützt über 25 Datenbanken, 35 verschiedene Transformationsschritte (auch die Kimbal-Dimensionen I-III) und zehn Jobtypen. Dafür werden 95 ausführbare Beispiele mitgeliefert. Auch einen SAP-Konnektor und eine Kettle-Transformation für einen Pentaho-Bericht gibt es.