Deepfake: KI fälscht Stimmen nach fünf Sekunden zuhören

von Jan Gruber
20. November 2019

Im Bereich Deepfakes gab es in diesem Jahr viele Fortschritte, die meisten davon nahmen sich Videos oder Bildern an. Auch im Bereich der Stimmen gab es enorme Fortschritte, so publizierte die BBC kürzlich neue Clips, in denen der Troy-Chef Johnson und der Labour-Chef Corbyn gegenseitige Wahlempfehlungen füreinander aussprachen.

Ein wichtiger Punkt ist häufig das Lernmaterial. Bisher galt die Annahme, dass gerade bei Stimme auch viel Videomaterial – zur Nachahmung von Gesichtszügen und der damit verbundenen Betonung – vorliegen muss. Ein Projekt von Google stellt diese Annahme jetzt auf den Kopf, die Stimmerkennung soll lediglich fünf Sekunden Training benötigen. Das System hört auf den Namen Tacotron und wird unter anderem an der TU Wien entwickelt.

More
Kommentare