Das Thema Big Data ist bei den Publikumsmedien und auf den Stammtischen angekommen. Doch die Phänomene und auch die Technologien, sie in den Griff zu bekommen, sind nicht ganz neu.
Oft braucht es ein griffiges Schlagwort und ein paar günstige Zufälle, damit ein Thema in breiteren Kreisen Interesse findet. Die erhöhte Aufmerksamkeit führt dann oft zu einer Verstärkung der betreffenden Aktivitäten. Ein Beispiel dafür stellt der gegenwärtige Hype um »Big Data« dar. Schon sehr lange erheben Regierungsstellen und Behörden enorme Datenmengen, um für die Bürger adäquate Daseinsvorsorge betreiben zu können. Das gilt etwa für die Planung von Schulen, Wohnungen und Verkehrswegen. Meteorologen tragen riesige Datenmengen zusammen, um das Wetter und das Klima abschätzen zu können. Mediziner sammeln viele Informationen, um die Entwicklung und Verbreitung von Krankheiten zu erforschen. Seit langer Zeit speichern Unternehmen viele Daten, um geschäftlichen Entscheidungen auf einer guten Grundlage treffen zu können. Bei der Auswertung solcher Datenmengen spielt seit jeher Statistik eine wesentliche Rolle.
In den letzten zwanzig Jahren wurde die IT für die Verwaltung und Auswertung von Daten verfeinert, und sie hat weite Verbreitung gefunden. Versicherungen kalkulieren ihre Tarife selbstverständlich mit Softwarewerkzeugen, Banken überwachen Online-Transaktionen häufig, um Betrugsversuche zu erkennen. Doch Begriffe wie Data Warehousing, Data Mining und Business Intelligence sind nur wenigen Spezialisten vertraut geworden.
Seit über zehn Jahren ist das Internet ein Massenphänomen, und so lange werden auch schon Clickstreams erfasst und ausgewertet, etwa von E-Commerce-Website-Betreibern. Solche Daten haben eine andere Struktur als die betriebswirtschaftlichen Zahlen, die in traditionellen Unternehmensdatenbanken abgelegt werden. Auch Sensordaten sind keine Neuigkeit: RFID-Verfahren etwa werden seit rund zwanzig Jahren in Handel und Logistik vielfach eingesetzt. Vor zehn Jahren schon haben IT-Marktforscher das rasante Datenwachstum mit drei Vs beschrieben: Volume, Velocity und Variety.
Alle diese geschilderten Fälle werden seit einiger Zeit unter den Begriff Big Data subsumiert und finden jetzt größte Aufmerksamkeit. Das Thema hat es vor einigen Monaten sogar auf die Titelseite des Nachrichtenmagazins »Der Spiegel« geschafft. Der mündige Bürger solle sich Gedanken machen, ob er die daraus resultierende Fremdbestimmung wolle. Eine neue Wendung in der öffentlichen Wahrnehmung hat das Thema vor einigen Wochen erfahren, als die Spionageaktivitäten der Vereinigten Staaten und des Vereinigten Königreichs enthüllt wurden. Dass die Überwachung der digitalen Kommunikation zum Auftrag von Geheimdiensten gehört und dass solche Organisationen jenseits von Knigge und Gesetz agieren, war eigentlich bekannt, allenfalls der Umfang mag nun überraschen.