Im Internet ist es nicht einfach, zwischen Fake und Wahrheit zu unterscheiden. Doch schreitet neben der Qualität auch die Art der Fälschungen voran. Sogenannte Deepfakes werden immer besser. Was passiert also, wenn einem nicht mehr die Person in einem Videotelefonat gegenübersitzt, die zu sehen ist?
Ein einfaches Video von Obama während seiner Zeit im Oval Office zeigt auf, wie einfach es ist, auf eine digitale Maske hereinzufallen. Er scheint eine Botschaft zu übermitteln und gerade in dem Moment, in dem der Zuschauer auf die Illusion hereingefallen ist, entpuppt sich der wahre „Sprecher“ hinter dem Video. Die Gefahr im Internet wird schlagartig klar. Die amerikanischen Plattform Reddit zeigte 2017 die ersten modifizierten Clips. Diese Gruppe erreichte sehr schnell mehr als 10.000 Abonnenten. Im Februar 2018 wurde sie gesperrt. Seither werden die Clips „Deepfake“ genannt, nach dem Pseudonym des ersten Nutzers, der ein gefälschtes Video hochgeladen hatte. In diesem Video waren die Gesichter von Prominenten glaubhaft in schlüpfrige Szenen eingebaut worden. Dafür hat der anonyme Absender einen Algorithmus erstellt, der auf frei verfügbaren Applikationen beruht wie die Open-Source-Deep-Learning-Bibliothek Keras und Googles TensorFlow. Während diese Art der Manipulation auf vielen Plattformen wie Twitter oder Discord verboten ist, schreitet die Technologie hinter den Deepfakes dennoch weiter ungebremst voran. Es handelt sich um eine fortschrittliche Form der Täuschungstechnologie. Machine Learning (ML) wird genutzt, um Videomaterial beziehungsweise Audiospuren so zu modifizieren, dass sie etwas darstellen, was nicht passiert ist. Sehr häufig werden vorhandene Medien – Clips und Ton – verwendet, um die Machine zu füttern. Daraufhin erstellt sie ein virtuelles Modell des zu ändernden Elements, das Medium wird schlussendlich manipuliert und wirkt täuschend echt.
Während diese Art von Videofakes in der Vergangenheit nur sehr mühsam angefertigt werden konnten, ist das mittlerweile mit einer Vielzahl an kostenlosen Apps für jeden Laien möglich. Ein gutes Beispiel für eine solche App ist „Wombo“. Ein einfaches Foto ist ausreichend und die KI erstellt einen simplen Deepfake davon. Die Qualität ist zwar noch sehr gering, aber es ist dennoch ein gutes Beispiel dafür, dass diese Art von Technologie bereits für jeden mit einem Smartphone verfügbar ist. Die Zeit naht also, wenn diese Technologie für Live-Videokonferenzen verwendet wird. Die Zeit, die es braucht, um zu beweisen, dass beispielsweise ein Politiker eine Aussage nicht getroffen hat, welche womöglich einigermaßen zu dessen Persönlichkeit passt, reicht nicht aus, um beispielsweise einen Shitstorm in den sozialen Medien zu verhindern.
Deepfakes verdanken ihren Namen dem Fakt, dass diese auf Deep Learning basieren. Das ist eine besondere Art des Machine Learnings. Die den Deepfakes zu Grunde liegenden Algorithmen werden mit großen Mengen an Bild- und Videomaterial gefüttert. Je mehr Daten von einer Person vorliegen, desto besser und genauer fällt das Ergebnis aus. Videos erweisen sich als das perfekte Ausgangsmaterial, da sie sich in Hunderte Einzelbilder aufteilen lassen und die Person aus den unterschiedlichsten Perspektiven zeigen. Schon wenige Hundert Bilder der Zielperson reichen aus, um einen realitätsnahen und plausiblen Deepfake zu erzeugen.
Die Technologie kann für Betrüger sehr hilfreich sein. Es ist vorstellbar, dass der Anruf einer Führungskraft simuliert wird, der die Buchhaltung zu einer Überweisung auffordert. Im Glauben, die Person sei real, sind Nachfragen zur Autorisierung unwahrscheinlich. Das hat zur Folge, dass sich viele Abläufe beispielsweise für die Freigabe von Zahlungsläufen in Zukunft grundlegend ändern müssen, um Menschen vor Fehlern zu schützen. Nicht nur Unternehmen, sondern auch Privatpersonen wurden in der Vergangenheit geschädigt. So sind bereits zahlreiche Schauspieler in pornografische Szenen geschnitten worden. Situationen zu schaffen, in welchen der Ruf einer Person geschädigt wird, ist der Schlüsselfaktor für den erfolgreichen Angriff. Die kriminellen Möglichkeiten reichen von traditioneller Erpressung bis hin zur Wahlbeeinflussung durch die Veröffentlichung gefälschter Videos der Kandidaten, die Dinge zeigen, die ihren Kampagnen schaden könnten.
Kurz gefasst: Deepfakes |
---|
„Deepfake“ ist ein englisches Kofferwort, das sich aus den Begriffen „Deep Learning“ und „Fake“ zusammensetzt. Es beschreibt realistisch wirkende Medieninhalte (Foto, Audio und Video), welche durch Techniken der Künstlichen Intelligenz abgeändert und verfälscht worden sind. Obwohl Medienmanipulation kein neues Phänomen darstellt, ergeben sich mit Deepfakes Methoden des Maschinellen Lernens, genauer künstliche neuronale Netzwerke, um Fälschungen weitgehend autonom zu erzeugen. Die Fälschungen sind mit bloßem Auge (oder Ohr) kaum noch vom Original zu unterscheiden. (DK) |