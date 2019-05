Gestern ist in Kalifornien die diesjährige Google I/O gestartet, Googles Entwicklerkonferenz. Wie immer, durften wir bei der Keynote in die nahe Zukunft von Android blicken und bekamen diverse neue Features und Services präsentiert, die uns künftig das Leben noch leichter machen sollen.

Dabei vergegenwärtigen wir uns wohl viel zu selten, dass es unter uns so viele Millionen Menschen gibt, für die es so viel wichtiger ist, dass mit Technologie ihr Leben einfacher gemacht wird. Ich rede hier von Menschen mit Beeinträchtigungen, für die es alles andere als selbstverständlich ist, am “normalen” Leben teilzuhaben.

Ganz konkret hat sich Google in der gestrigen Keynote mit Menschen beschäftigt, die eine Sprachbehinderung haben. Egal, ob Schlaganfall, ALS, Multiple Sklerose, traumatische Hirnverletzungen oder Parkinson: Es gibt leider sehr viele Befunde, die die betroffenen Menschen von jeder Form der alltäglichen Kommunikation abschneiden. Logisch, dass Google versucht, sich auch diesem Problem mit der Hilfe von künstlicher Intelligenz zu nähern. Ein Beispiel ist die Spracherkennung, die für die meisten von uns immer besser und besser funktioniert. Was ist aber, wenn ihr aufgrund einer Beeinträchtigung eben nicht so sprechen könnt wie die Mehrheit der Menschen?

Um dieses Problem zu lösen, nutzt das Projekt Euphonia, Teil von Googles “KI for Social Good”-Programm, die KI, um die Fähigkeiten der Computer zum Verständnis verschiedener Sprachmuster, wie z.B. gestörter Sprache, zu verbessern. Gestern stellte man uns Dimitri Kanevsky vor, der als Sprachforscher bei Google beschäftigt ist. Er lernte Englisch, nachdem er als kleines Kind in Russland taub geworden war. Dimitri verwendet Googles “Live Transcribe”-Feature mit einem maßgeschneiderten Modell, das speziell darauf trainiert wurde, seine Stimme zu erkennen.

In vielen Stunden hat er tausende Phrasen eingesprochen, ohne dass vorher absehbar war, wie gut das dann letztendlich funktionieren würde. Das Ergebnis allerdings ist überragend: Die Spracherkennung erkennt nun auch seine selbst für uns schwer verständliche Sprache, eine deutliche Verbesserung von Dimitris Lebensqualität.

Auch ALS-Patienten hat man sich ausgiebigst gewidmet. Auf dem Google-Blog erklärt man dazu:

Wir haben mit den gemeinnützigen Organisationen ALS Therapy Development Institute (ALS TDI) und ALS Residence Initiative (ALSRI) zusammengearbeitet, um die Stimmen von Menschen aufzunehmen, die ALS haben, eine neurodegenerative Erkrankung, die zu einer Unfähigkeit zu sprechen und sich zu bewegen führen kann. Wir arbeiteten eng mit diesen Gruppen zusammen, um mehr über die Kommunikationsbedürfnisse von Menschen mit ALS zu erfahren, und arbeiteten daran, KI-basierte Algorithmen zu optimieren, damit Mobiltelefone und Computer Wörter, die von Menschen mit diesen Sprachproblemen gesprochen werden, zuverlässiger transkribieren können.

Wie funktioniert das Trainieren der künstlichen Intelligenz in diesem Fall? Die Google-Software wandelt die aufgenommenen Sprachproben in ein Spektrogramm oder eine visuelle Darstellung des Klangs um. Der Computer verwendet dann gemeinsame transkribierte Spektrogramme, um damit dann das System zu trainieren.

Aktuell sind diese KI-Algorithmen so ausgerichtet, dass Personen aufgenommen werden, die Englisch sprechen und Beeinträchtigungen haben, die typischerweise mit ALS verbunden sind. Aber natürlich ist man bei Google guter Dinge, dass diese Forschung in Zukunft ausgeweitet werden kann auf andere Sprachen und auch auf die verschiedensten Sprachstörungen.

Aber es gibt leider auch Menschen, die selbst dazu nicht mehr in der Lage sind, ihre Sprache in einer schwerer verständlichen Form zu nutzen. Auch die hat man bei Google im Blick. Eine personalisierte KI kann so lernen, auf Non-Speech-Sounds zu reagieren. Im folgenden Video seht ihr nicht nur den oben erwähnten Dimitri, sondern auch Steve Sailing, bei dem bereits vor 13 Jahren ALS diagnostiziert wurde.

Er sitzt im Rollstuhl und ist nicht mehr in der Lage zu sprechen. Wie viele andere ALS-Patienten auch kommuniziert er, indem er mühevoll mit seinen Augen eine Software-Tastatur bedient. Dank KI wird es ihm auch möglich, über bestimmte Geräusche das Licht in seinem Smart Home zu kontrollieren, oder auch durch Gesten bei einer Sportveranstaltung sein Team anfeuern zu können.

Das sind erst noch kleine Verbesserungen im Leben der Menschen mit dieser Erkrankung, wie Google klar macht. Man befindet sich hier noch ganz am Anfang der Entwicklung und kratzt lediglich an der Oberfläche der Möglichkeiten, die sich daraus noch ergeben werden. Aus diesem Grund weist Google darauf hin, dass diese Verbesserungen der Spracherkennung nur dann möglich sind, wenn möglichst viele Sprachproben für die Schulung des Systems genutzt werden können. Menschen, die undeutlich oder schwer verständlich sprechen, werden dazu aufgefordert, ein kurzes Formular auszufüllen, wenn sie Google bei diesem Projekt unterstützen wollen.

Dieses Formular findet ihr hier und wie Dimitri können die Freiwilligen dann einige Sätze aufnehmen, um die künstliche Intelligenz zu trainieren.

Google hat gestern gleich mehrere Beispiele dafür gebracht, wie man sein Wissen dazu einsetzt, die Teilhabe von Menschen zu ermöglichen, die heute noch oftmals aus der Gesellschaft ausgeschlossen werden. Dazu gehören Funktionen wie die Live Captions, die es Analphabeten möglich macht zu verstehen, was in einem Text steht, aber eben natürlich auch die hier beschriebenen Wege, um Menschen mit sprachlichen Handicaps vom Rand der Gesellschaft in unsere Mitte zu holen. Mehr davon bitte, Google!

Quelle: Google