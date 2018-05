Es begann mit einem schnöden Foto. Im Jahr 2015 machte das nun berühmte Bild eines Kleides die Runde und trieb einen Keil zwischen die Internetcommunity. War das Kleid nun weiß/gold oder blau/schwarz? Eine Grundsatzfrage, so schien es. Jetzt gibt es abermals Gesprächsstoff – nicht etwa um eine weitere optische Täuschung, sondern um einen kurzen Soundclip. Wer in den letzten Tagen die aufkeimende Debatte über die „Yanny or Laurel“ Geschichte nicht mitbekommen hat, hat wohl noch ein Leben außerhalb der Social Media Blase. Gratulation dazu!

What do you hear?! Yanny or Laurel pic.twitter.com/jvHhCbMc8I — Cloe Feldman (@CloeCouture) May 15, 2018

In dem viersekündigen Soundclip sagt eine Männerstimme einen Frauennamen. Manche Leute hören dabei ganz deutlich den Namen Laurel, während andere den Namen Yanny wahrnehmen. Der Grund dafür ist, dass verschiedene Menschen Klänge und Frequenzen unterschiedlich verarbeiten. Da die Tonfrequenzmuster beider Wörter relativ ähnlich sind, können kleine Unterschiede zwischen den einzelnen Wörtern Verwirrung stiften. Wer den Namen „Yanny“ hört, kann höhere Frequenzen besser wahrnehmen als Menschen, die den Namen „Laurel“ verstehen.

Nun hat die Debatte auch die künstliche Intelligenz erreicht. Sonix, ein Unternehmen, das KI-basierte Spracherkennungssoftware herstellt, hat den zweideutigen Soundclip über die Transkriptionstools von Google, Amazon, IBM und natürlich auch über seine eigenen laufen lassen. Doch auch hier scheiden sich die Geister, oder besser gesagt die Codezeilen.

Die Sprachtools von Google und Sonix erkannten auf Anhieb den Namen „Laurel“. Die Software aus dem Hause Amazon verstand immer wieder die Worte „Year Old“, was wohl eindeutig mehr in die „Yanny“ Richtung geht und IBM schwankt stark zwischen „Yeah role“ und „Laurel“, was man als Mischung beider Namen zählen kann.

„Wie Sie sich vorstellen können, ist die menschliche Stimme komplex und es gibt so viele Variationen von Lautstärke, Kadenz, Akzent und Frequenz. Die Realität ist, dass verschiedene Unternehmen ihre KI für verschiedene Anwendungsfälle optimieren, so dass die Ergebnisse variieren können. Für ein Spracherkennungsmodell ist es eine Herausforderung, alles unterzubringen.“ Sonix CEO Jamie Sutherland

Es ist eigentlich ziemlich absurd, eine Antwort von einer Software zu verlangen, die der Mensch selber programmiert hat. Somit basiert das Programm im Endeffekt auf dem eigenen Gehör und der eigenen Erkenntnis. Lustig ist es trotzdem. Wen die Frage nach Yanny oder Laurel dennoch nachts wach hält, für den habe ich eine beruhigende Nachricht: Der Sprecher im Originalclip appelliert an den Namen „Laurel“.

