Wachsende Datenmengen in Unternehmen werden an vielen Orten abgespeichert und stammen aus verschiedenen Quellen. Unternehmen haben so über die Informationen nur bedingt Überblick. Es braucht Ansätze, die das Datenmanagement standardisieren und vereinfachen, um die IT-Komplexität zu entwirren.
Die Digitalisierung und die Industrie 4.0 generieren immer mehr Daten. Jeder Sensor, jeder neue Workload und jede Big-Data-Analyse erzeugen weitere und neue Typen von Informationen. Unternehmen müssen diese speichern, auswerten, verknüpfen, juristischen Vorgaben entsprechend pflegen und archivieren. Um die wachsenden Datenmengen in den Griff zu bekommen, erweitern viele Unternehmen ihre Storage-Systeme. Eine Maßnahme, die nicht unbedingt ökonomisch oder ökologisch erfüllend ist. Das Problem der Datenmassen: Wenn nicht bekannt ist, welche Daten überhaupt vorhanden oder wo bestimmte Informationen gespeichert sind, können Unternehmen sie auch nicht löschen.
Risikoquelle: Dark Data
Die Datenflut wird von Tag zu Tag unüberschaubarer. Somit auch die Mengen an “Dark Data”, sogenannten dunklen Daten, deren Inhalt nicht bekannt ist. Bei diesen dunklen Daten ist für die IT-Abteilungen in der Regel nicht ganz ersichtlich, aus welcher Quelle sie stammen oder wo sie abgelegt sind, vom Inhalt ganz zu schweigen. So können sie hochsensible Finanzinformationen oder Forschungsergebnisse enthalten – oder auch völlig belanglose Themen. Niemand im Unternehmen kann mit Sicherheit sagen, ob es sich um bahnbrechende Erkenntnisse handelt oder ob sie risikofrei gelöscht werden können.
Hintergrund dieser Entwicklung ist die wachsende Komplexität der IT-Umgebungen im Zuge der Digitalisierung: Bei der heutigen Vielzahl an Anwendungen, Systemen und Datenquellen wird es für Unternehmen und deren IT-Abteilungen immer schwieriger, sich einen Überblick über die vorhandenen Daten zu verschaffen, sie zu klassifizieren und zu kennzeichnen.
Das Marktforschungsinstitut Vanson Bourne hat im Rahmen der Studie “The Databerg Report: See What Others Don‘t” 1.475 IT-Verantwortliche zu deren Datenmanagement befragt. Dies hat gezeigt, dass Unternehmensdaten weltweit im Durchschnitt zu 52 Prozent aus dunklen Daten bestehen. Deutschland ist mit 66 Prozent führend in diesem Problem. Überflüssige oder gar redundante Informationen zu sichern, bindet enorme Ressourcen, ohne dass irgendein Wert daraus gezogen wird.
Neben der Tatsache, dass der Überblick über die Informationen durch Dark Data getrübt und Speicherplatz verschwendet wird, beeinträchtigt eine fehlende Datentransparenz die verfügbaren Ressourcen und hat damit auch negative finanzielle Folgen. Laut der von Vanson Bourne durchgeführten Studie „Realizing the Power of Enterprise Data“ verbringen IT-Entscheider täglich zwei Stunden damit, nach bestimmten Datensätzen zu suchen. Ein solche Ressourcenverschwendung kann sich fatal auf die Produktivität auswirken. Zusätzliche Kosten können durch die fehlende Datentransparenz entstehen, wenn Unternehmen gegen Compliance-Vorgaben wie die Europäische Datenschutz-Grundverordnung (EU-DSGVO) verstoßen: Wer nicht darüber Auskunft geben kann, welchen Geschäftswert seine Daten haben, ob sie personenbezogene Angaben enthalten und wo sie gespeichert sind, muss mit hohen Geldstrafen rechnen.