Wie Daten dazu beitragen können, dem Virus Herr zu werden.
Bei der Bekämpfung der aktuellen Pandemie spielen Daten an vielen Stellen eine wichtige Rolle. Wissenschaftler werten automatisiert Testergebnisse aus Simulationen aus und versuchen schnellstmöglich einen Impfstoff zu entwickeln. Politiker treffen ihre Entscheidung zur Lockerung des Lockdowns auf Basis aktueller Zahlen zur Reproduktionsrate. Nie zuvor wurde es so deutlich, welche zentrale Rolle zuverlässige Daten für die Menschheit haben.
Richtige Entscheidungen gelingen nur auf Grundlage belastbarer Daten. So werden in Deutschland die Corona-Infektionen an das Robert Koch-Institut gemeldet (RKI), das die Zahlen täglich aktualisiert veröffentlicht. Dabei kommt es zu verzerrten Angaben, da beispielsweise manche Gesundheitsämter am Wochenende keine Daten übermitteln oder die Meldung an technischen Problemen scheitert. Diese Lücken beziehungsweise die verspätet gemeldeten Angaben verzerren den tatsächlichen Stand der Ausbreitung. Korrekte und aktuelle Daten sind wichtig, da die Angaben des RKI für die Bundesregierung eine zentrale Rolle bei der Entscheidung über strengere Maßnahmen oder ihre Lockerung spielen.
Mit Daten das Virus verstehen und erkennen
Im Gesundheitswesen haben Daten in vielen Bereichen eine kritische Bedeutung und können sogar über Leben und Tod entscheiden. Das gilt auch für die aktuelle Corona-Pandemie. Mit fast drei Millionen Infizierten weltweit verfügen Forscher bereits über eine große Anzahl an Datensätzen, um Rückschlüsse über die Ausbreitung und Ansteckung des Virus ziehen zu können. So hat das Boston Children’s Hospital die Plattform Health Map entwickelt, das die Verbreitung des Virus mit Künstlicher Intelligenz verfolgt. Dabei werden auch Google-Suchen sowie Social Media- und Blog-Posts integriert, um einen ständig aktualisierten Überblick über die Reichweite der Pandemie zu ermöglichen.
Inzwischen existieren Datensätze verschiedener Organisationen, die auf dem Filehosting-Dienst Git Hub Forschern zur Verfügung stehen. Allerdings unterscheiden sich die Formate, in denen diese Daten vorhanden sind. Selbst kleine Unterschiede sorgen für erheblichen Mehraufwand bei der Bereinigung und Standardisierung der Daten, um sie miteinander verbinden zu können. Hier setzt ein Projekt von Talend und Bytecode in Zusammenarbeit mit Entwicklern der Singer Open Source-Community an. Sie haben ein ETL-Tool entwickelt, mit dem die Covid-19-Datensätze standardisiert, mit Metadaten versehen und schließlich in ein Data Warehouse oder einen Data Lake weitergeleitet werden können. So erhalten Forscher und Analysten einheitliche Daten und können sich auf ihre eigentliche Arbeit konzentrieren.
Mithilfe von Daten können KI und Machine Learning in der Diagnostik eingesetzt werden, um Prozesse zu beschleunigen. So konnte das Molekular-Biotech-Unternehmen Seegene aus Südkorea durch KI einen zuverlässigen Corona-Test innerhalb weniger Wochen statt mehrerer Monate entwickeln. In der Folge war Südkorea in der Lage, seine Bewohner frühzeitig und flächendeckend zu testen, sodass sich die Infektionskurve abflachte. In China werden KI-Systeme eingesetzt, um Covid-19-Erkrankungen zu erkennen. Dafür haben verschiedene Firmen ihre Software darauf geschult, Veränderungen an den Lungen in CT-Scans zu erkennen. Verdachtsfälle werden so schneller identifiziert.
Hilfsmittel und Lösungen finden
Der nächste Schritt für die Mediziner ist nun die Erforschung möglicher Medikamente und eines wirksamen Impfstoffes. Auch hierbei beschleunigen IT-Systeme die Entwicklung: Deep Mind, ein auf KI-spezialisiertes Tochterunternehmen von Google, versucht durch seine KI-gestützte Software zur Proteinprognose die Struktur des Virus zu analysieren. Dies soll Forschern aufwendige monatelange Experimente ersparen und schneller zu effektiven Behandlungsmöglichkeiten führen.