Zum Inhalt springen

Bereichsneutrale Werkzeuge

Autor:Redaktion connect-professional • 15.11.2007 • ca. 1:10 Min

Eine andere Gruppe von Software-Werkzeugen konzentriert sich auf die Prüfung und Korrektur von Informationen. Hier steht Datenqualität in einem primären Sinn im Fokus. In der Anfangszeit ging es vornehmlich um Kundenadressen, und kleine regionale Anbieter wie die deutsche Firma Omikron sind auch weiterhin so ausgerichtet. Andere Hersteller wie Business Objects (mit den übernommenen Firmen First Logic und Fuzzy Informatik), die SAS-Tochter Dataflux, IBM (nach der Akquisition von Ascential), Informatica (durch die Übernahme von Similarity) oder Trillium (zu Harte-Hanks gehörend) sind inzwischen technologisch vorangeschritten und haben nun bereichsneutrale Werkzeuge, die eine breite Funktionspalette umfassen. Beim Profiling (Profilerstellung und Analyse) werden statistische Informationen gesammelt, um einen Eindruck von der Datenqualität zu bekommen und etwaige Probleme zutage zu fördern. Metadaten dienen dabei als Bezugspunkt. Ferner gibt es Werkzeuge für das Parsing: Durch syntaktische Analyse werden die Textfelder in Teile zerlegt, die in dem Unternehmen oder der Branche geltenden Konventionen entsprechen. Unter Matching versteht man die Identifikation und Verbindung von Einträgen, die offenbar zusammengehören. Cleansing (Bereinigung und Konsolidierung) betrifft die Änderung von Angaben, um sie in Einklang mit den formulierten Regeln zu bringen. Mit Werkzeugen zum Enrichment (Anreicherung) werden fehlende Werte aus unterschiedlichen Quellen ergänzt. Durch Monitoring schließlich kann Software die Qualität der Daten ständig überwachen, einschließlich gerade ablaufender Eingaben (real time). IBM und Informatica gehen noch einen Schritt weiter und offerieren Datenqualitätswerkzeuge als Bausteine eines umfangreichen Produktarsenals zur Datenbereitstellung. Dazu gehören dann auch Werkzeuge zum Befüllen von Warehouses und Marts (ETL – Extract, Transform, Load) und zur Echtzeitabfrage von Daten unterschiedlicher Quellen (EII – Enterprise Information Integration). Information wird dieser Vision zufolge nach Bedarf über einen Service geliefert.