Zum Inhalt springen

Pentaho mit vier Komponenten

Autor: Redaktion connect-professional • 20.11.2008 • ca. 0:40 Min

Das Produkt Pentaho Data Integration setzt sich aus vier Komponenten zusammen. Spoon dient als Editor zur grafischen Definition von Schritten, die den Datenfluss und seine Transformationen enthalten. Diese Definitionen werden im XML-Format in einem zentralen Datenbank-Repository abgelegt, wodurch sich die Metadaten besser pflegen lassen. Als Programmiersprache wird hier JavaScript oder Java verwendet. Die Schritte werden in der Kitchen-Komponente ausgeführt, wobei die Transformationen in der Pan-Komponente stattfinden. Die Carte-Komponente startet ­einen Remote-Webserver zur verteilten Transformationsausführung. Während in Transformationen jeder einzelne Schritt durch einen eigenen Thread bedient wird, können die Jobs nicht parallel ausgeführt werden. Um bei großen oder langlaufenden Jobketten eine bessere Skalierbarkeit zu erzielen, sollten diese auf kleinere Jobs auf­geteilt werden. Pentaho Data Integration unterstützt über 25 Datenbanken, 35 verschiedene Transformationsschritte (auch die Kimbal-Dimensionen I-III) und zehn Job­typen. Dafür werden 95 ausführbare Beispiele mitge­liefert. Auch einen SAP-Konnektor und eine Kettle-Transformation für einen Pentaho-Bericht gibt es.