• Folge Uns
    • Facebook
    • Twitter
    • Youtube
    • Flipboard
  • ENG
Mobilegeeks
  • Videos
  • Cars
  • Connected Life
  • IoT
  • Smartphones
  • Hardware
  • Tests
  • Podcast
  • Videos
  • Cars
  • Connected Life
  • IoT
  • Smartphones
  • Hardware
  • Tests
  • Podcast
Previous Story
Forbes: Das passiert 2019 im "Internet of Things"

von Korbinian

Next Story
Apple - das einzige Billionen-Dollar-Unternehmen d ...

von Carsten Drees

Lippenlesen mit KI – Von Gehörlosen und Spionen

Technik soll das Leben leichter machen - das gilt vor allem für Menschen mit Einschränkungen. Für Gehörlose gibt es hier interessante Anwendungen, die mittels KI umgesetzt werden sollen. Abgesehen von Zeichensprache, die nur wenige Menschen beherrschen, muss sich diese Bevölkerungsgruppe vor allem auf Lippenlesen verlassen. Hier soll in Zukunft auch die Maschine helfen können.

von Jan Gruber am 3. August 2018
  • Email
  • @Finariel

Erste technische Versuche in diese Richtung gibt es seit einiger Zeit – die Ergebnisse lassen aber mehr als zu wünschen übrig. Jetzt berichten Forscher über eine neue KI, die professionelle Lippenleser und die bisher beste technische Umsetzung in den Schatten stellt. Sie soll nur die Hälfte der Fehlerquote des bisher besten Algorithmus aufweisen.

„Es ist eine fantastische Arbeit“, sagt Helen Bear, eine Informatikerin an der Queen Mary University of London, die nicht an dem Projekt beteiligt war.

Die Umsetzung des Prozesses in einen Programmcode erwies sich in der Vergangenheit als äußerst schwierig, dementsprechend versuchten die Wissenschaftler es mit einem neuen Ansatz. Statt ein Programm zu schreiben, wurde eine KI trainiert. Sie wurde mit tausenden Stunden Videos, und den dazugehörigen Transkripten, gefüttert.

Die Forscher begannen mit 140.000 Stunden YouTube-Videos von Menschen, die in verschiedenen Situationen sprechen. Dann wurde ein Programm generiert, das Videos der Lippenbewegung einzelner Wortteile herausgreift, nicht-englische Wörter sowie nicht sprechende Gesichter wurden herausgefiltert. Danach wurden die Videos auf den Mund konzentriert und der Rest abgeschnitten. Das ergab fast 4.000 Stunden Filmmaterial, darunter mehr als 127.000 englische Wörter. Der daraus gewonnene Datensatz ist sieben Mal größer als alle bisher gesammelten Daten.

Nach dem Training testeten die Forscher ihr System an einem 37-minütigen Video, das es zuvor nicht gesehen hatte. Die KI identifizierte nur 41% der Wörter falsch. Zugegeben ist eine derartig hohe Fehlerquote für eine reale Anwendung zu hoch, der Fortschritt ist aber im Vergleich zu bisheriger Software enorm. Systeme die sich auf Buchstaben statt ganze Wörter konzentrieren, liefern eine Fehlerquote von 77 Prozent, professionelle Lippenleser kommen gar auf eine Quote von 93 Prozent.

Der wesentliche Durchbruch liegt an der Erweiterung auf ganze Wortteile. Zum Beispiel macht der Mund eine andere Form, um das „t“ im „Stiefel“ zu sagen, als bei „Beet“. Damit kann das Programm auch neue Wörter einfacher und zuverlässiger lernen.

Die Integration des Programms in ein Telefon würde es den Schwerhörigen ermöglichen, einen „Übersetzer“ mitzunehmen, wohin sie auch gehen, sagt eine Wissenschaftlerin des Projekts. Ein solcher Übersetzer könnte auch Menschen helfen, die nicht sprechen können, zum Beispiel aufgrund beschädigter Stimmbänder.

Es gibt aber auch andere Anwendungen, wie die Analyse von Sicherheitsvideos, die Interpretation von historischem Filmmaterial oder das Anhören eines Skype-Partners, wenn der Ton ausfällt. Der neue KI-Ansatz könnte sogar eines der „größten Rätsel“ der Welt lösen: Im WM-Finale 2002 wurde der französische Fußballspieler Zinédine Zidane wegen eines dramatischen Kopfstoßes gegen die Brust eines Gegners ausgeschlossen. Angeblich wurde er durch eine Beschimpfung provoziert. Was wurde gesagt? Noch wissen wir es nicht.

Wie bei jeder neuen Technologie – die Anwendung kann auch über diese positiven Aspekte hinausgehen und stark ins Negative umschlagen. Mit derartigen Techniken erreicht Spionage ein neues Level, sei es bei profanen Dingen wie der NFL (also im Sport) oder bei wichtigen politischen Gesprächen.

Via ScienceMag

Trending Cars
  • Tesla Model 3
  • Opel Ampera-e
  • Tesla Model X
  • Porsche Mission E
Automarken
  • Mercedes-Benz
  • Tesla
  • Audi
  • Volkswagen – VW
  • BMW
  • Ford
  • Porsche
  • Opel
Related Video
video
Forschungsprojekt: Gameboy ohne Batterien
Wissenschaft
Ähnliche Artikel
Neu erforschtes Material ist leicht wie Plastik und stabil wie Stahl
7. Februar 2022
Neu erforschtes Material ist leicht wie Plastik und stabil wie Stahl
Neues KI-System von Meta soll Umwelt identifizieren und interpretieren
25. Januar 2022
Neues KI-System von Meta soll Umwelt identifizieren und interpretieren
Forscher:innen in Stanford wiederbeleben gängige Batteriezellen
11. Januar 2022
Forscher:innen in Stanford wiederbeleben gängige Batteriezellen
Tiere haben einen eigenen Algorithmus für die Entscheidungsfindung
24. Dezember 2021
Tiere haben einen eigenen Algorithmus für die Entscheidungsfindung

Fernweh

Wir beschäftigen uns mit den Themen und der Technik von Morgen und Übermorgen - Von Smartcities über Sharing-Economy bishin zur Mobilität der Zukunft

Hubs
  • Laptops
  • Magazin
  • Smart Cars
  • Smartphone
  • Tablets
  • Wearables
Weitere Themen
  • OnePlus 5
  • Samsung Galaxy S8
  • LG G6
  • Microsoft Surface Laptop
  • Amazon Blitzangebote
  • Adblock Plus
  • Testberichte (Archiv)
  • ASUS
  • Microsoft
  • Apple
  • Sitemap
Intern
  • Sponsoring und Werbung
  • Über uns
  • Sponsorenübersicht
  • Impressum
  • Datenschutzerklärung
FOLGE UNS
Copyright © 2022 Mobilegeeks.de, Alle Rechte vorbehalten
 Tweet
 Teilen
 Tweet
 Teilen
 Tweet
 Teilen
 Xing