Um die Datenqualität in ausreichendem Maß zu verbessern, müssen Unternehmen effizient investieren. Die Kosten hierfür lassen sich in drei Kategorien einteilen.
1. Präventivkosten
Grundsätzlich gibt es zwei Vorgehensweisen, um die Eingabe falscher Daten vorab zu minimieren: manuell oder systemgestützt. Beide führen zu erhöhten Kosten, die ganzheitlich betrachtet jedoch gut investiert sind. Um die Mitarbeiter für das Thema Datenqualität zu sensibilisieren, sind beispielsweise Schulungen und die ständige Verdeutlichung der Folgen schlechter Datenqualität sinnvoll.
2. Entdeckungskosten
Hierbei geht um das Messen der Datenqualität. Mit Hilfe von Plausibilitätsberichten lassen sich Unstimmigkeiten schnell erkennen. Beispiel: Ist das monatliche Bestellvolumen einer Warengruppe ungefähr bekannt, können Bestellungen mit überdimensional großen Bestellmengen sofort als Fehlbuchungen identifiziert werden. Die Investition in die Einrichtung eines Qualitätskennzahlensystems ist daher zu empfehlen.
3. Bereinigungskosten
Um falsche Daten in einem Data Warehouse zu bereinigen, die nicht mehr durch Korrektureingaben in den Quellsystemen richtiggestellt werden können, müssen Update-Routinen implementiert werden. Nicht immer ist dies über automatische Routinen (Update-Statement über eine bestimmte Tabelle) möglich. In der Praxis wird die Korrektur immer eine Kombination von manuellen und automatisierbaren Tätigkeiten sein.
Um sich abschließend ein Bild über die gesamten Datenqualitätskosten zu machen, müssen die geschätzten Kosten einer schlechten Datenqualität den errechneten Kosten zur Verbesserung der Datenqualität gegenübergestellt und analysiert werden. Ziel ist, die kostengünstigste Kombination zu finden.