Kommentare

Deutsche Software schafft Deepfakes in Echtzeit

Das deutsche IT-Consulting Unternehmen TNG Technology Consulting GmbH schafft Deepfakes in Echtzeit. Das ist gleichermaßen beeindruckend, aber natürlich auch gruselig.

von Carsten Drees am 29. August 2019

Manchmal staune ich, was für unglaublich intelligente Menschen ich in meinem Freundeskreis habe. Martin Förtsch ist dafür ein Paradebeispiel. Er ist IT-Consultant der TNG Technology Consulting GmbH aus Unterföhring bei München und hat Informatik und angewandte Naturwissenschaften studiert. Mit seinen Kollegen befasst er sich aktuell auch mit Deepfakes, über die wir ja hier auf dem Blog auch schon oft berichtet haben.

Bei dieser Berichterstattung über Deepfakes komme ich zumeist nicht umhin, in einem Atemzug sowohl die Vokabel “beeindruckend” als auch “gruselig” zu verwenden. Es ist in der Tat höchst beeindruckend, was mit künstlicher Intelligenz und entsprechend trainierten neuronalen Netzen möglich ist. Ebenso ist es aber eben auch creepy, weil man zwangsläufig darüber nachdenkt, was für unschöne Dinge mit dieser Technologie angestellt werden könnten. In Zeiten, in denen auch die allerdümmste und simpelste Fake-News von unzähligen Schwachköpfen als Wahrheit verkauft wird, mag man nicht darüber nachdenken, was erst geschehen wird, wenn vermeintliche Nachrichten-Videos mit Deepfakes die Runde machen.

Versuchen wir das aber mal auszublenden und denken wieder über die Technologie an sich nach. Schon im Laufe kürzester Zeit haben wir beobachten können, dass es leichter und leichter wird, diese Deepfakes zu erstellen. Am Anfang war es noch so, dass man sehr tief in dieser Materie stecken und sehr viel Fachwissen mitbringen musste, um in einem recht komplexen Verfahren annehmbare Ergebnisse zu erzielen. Mittlerweile ist es deutlich unkomplizierter und lässt uns binnen weniger Stunden Deepfakes erstellen, auch wenn man selbst nicht gerade Raketen-Wissenschaftler ist.

Die TNG Technology Consulting GmbH hat sich jetzt mal intensiv mit dieser Technologie auseinandergesetzt. Das hieß zunächst mal, sich das Wissen dahinter draufzupacken, um nachvollziehen zu können, was da genau passiert und wie es passiert. Als das Team das dann verinnerlicht hatte, hat man schlicht einen Schritt weitergedacht: Kann man diese Deepfakes, die man binnen Stunden erschaffen kann, nicht vielleicht auch in Echtzeit erzeugen?

Das Ergebnis dieser Überlegungen sind Deepfakes, die man praktisch wie eine Maske über euer Gesicht legen kann, während ihr beispielsweise per Webcam chattet. Und nein, dabei reden wir natürlich nicht über die Spielereien, die beispielsweise bei Snapchat oder im Facebook-Messenger möglich sind und die mit neuronalen Netzen so überhaupt nichts zu tun haben. Martin Förtsch erklärt, was da genau passiert:

Durch die Anwendung verschiedener Techniken aus dem Bereich der Computer Vision und der neuronalen Netze werden hier Gesichter in der Videoeingabe erkannt, übersetzt und zurück in die Videoausgabe integriert. Durch diese Technik ist es möglich, täuschend echte Imitationen auf andere Personen zu projizieren.

Zum Einsatz kamen in dem Projekt in Keras trainierte Autoencoder-Netze. Trainiert wurden diese mittels so genannter GANs (Generative Adversarial Networks). Zusätzlich verwendeten die Forscher verschiedene andere neuronale Netze zur Gesichtserkennung und Gesichtssegmentierung.

Im folgenden Video seht ihr, wie diese Geschichte dann in der Praxis aussieht:

Dem Unternehmen ist es wichtig herauszustellen, dass es bei den Forschungen darum geht, mittels verschiedener Ansätze aufzuzeigen, was mit künstlicher Intelligenz und Computer Vision machbar ist. Es handelt sich hier also um ein forschungsbasiertes Demo-Video. Gleichzeitig wird darauf hingewiesen, dass mit diesem GAN-Ansatz auch Deepfake-Clips identifiziert werden können.

Falls ihr euch anhand des Videos daran stoßt, dass die Illusion noch nicht perfekt ist: Die neuronalen Netze wurden im Vorfeld lediglich fünf Tage lang trainiert und zwar auf einem handelsüblichen Intel i7 6-Core-Prozessor mit 2 GTX TI 1080 NVIDIA und mit Videos niedriger und mittlerer Auflösung. Rechnet euch also selbst aus, wie so ein Video aussehen kann bei 4K-Clips und mit neuronalen Netzen, die monatelang trainiert wurden.

Falls ihr euch für das Thema interessiert, möchte ich euch noch folgendes Video wärmstens ans Herz legen. Martin bröselt in dem knapp einstündigen Clip mit seinen Kollegen Jonas Mayer und Thomas Endres das Thema Deepfakes fein säuberlich auf. Die drei erzählen euch ganz grundsätzliche Dinge zum Thema, weisen darauf hin, was tatsächlich ein echter Deepfake ist und was nicht und später tauchen sie dann tief in die Materie ein. Hier werden also diejenigen abgeholt, die noch gar nicht im Thema sind und sich einen Überblick verschaffen wollen, aber auch die Tech-Interessierten dürften viel Neues im Video finden, wenn nämlich explizit darüber gesprochen wird, wie diese Deepfakes erzeugt werden.