Ich habe mich mittlerweile so stark an die Autokorrektur und Vorhersage von Wörtern auf der Handytastatur gewöhnt, dass ich mich schon öfter dabei ertappt habe, dieses Feature auch am Laptop nutzen zu wollen. Das ist den Entwicklern von Google wohl auch passiert, denn in der vergangenen Woche haben sie die Smart Compose-Funktion für Gmail angekündigt. Vor ein paar Tagen zeigte man dann, wie dieses Feature funktioniert und was dahinter steckt.

Smart Compose nutzt maschinelles Lernen, um interaktiv Vorschläge zur Satzvervollständigung zu geben. Damit sollen E-Mails schneller geschrieben sein. Es ist übrigens egal, ob man auf eine empfangene Nachricht antwortet oder eine Mail von Grund auf neu verfasst. Anders als bei der Vorhersage am Handy, bei der meist nur einzelne Wörter oder Wortgruppen vorgeschlagen werden, soll die Smart Compose Funktion ganze Sätze formulieren können.

GIF

In einem Blogeintrag erklärt das AI-Team welche drei Herausforderung sie bei der Entwicklung des Tools zu bewältigen hatten. Zum einen war da der Punkt der Geschwindigkeit, denn natürlich soll die Funktion den Nutzer bei der Eingabe unterstützen und ihn nicht auf die Vorschläge warten lassen. Deshalb wurde die maximale Antwortzeit auf 100 Millisekunden gesetzt.

Zum anderen ging es um die Skalierbarkeit, denn Gmail wird von mehr als 1,4 Milliarden Menschen verwendet. Das Programm muss also sowohl der breiten Maße gerecht werden als auch auf jeden einzelnen Nutzer individuell eingehen können. Das Thema Datenschutz schließt an diesen Punkt nahtlos an. Das Tool lernt nämlich durch die Eingabe der Nutzer, wobei gewährleistet werden muss, dass keine persönlichen Informationen mit in die Datenbank fließen.

Alle drei Punkte unterzubringen, war für die Entwickler kein leichtes Stück Arbeit. Man probierte viele etablierte Technologien aus, wobei keine von ihnen innerhalb der maximalen Antwortzeit von 100 Millisekunden reagierte. In einem veröffentlichten Diagramm ist nun die am besten funktionierende Lösung zu sehen. Es ist eine Kombination aus Bag of Words und RNN, die nach jeder Eingabe einen neuen Vorschlag macht.

Um die Schnelligkeit weiter zu optimieren, ließ man das System nicht auf einer CPU sondern einer TPU laufen. Dies ist ein sogenannter Tensorprozessor, der von Google auch in den AlphaGo-Wettkämpfen eingesetzt und speziell für maschinelle Lernanwendungen entwickelt wurde. Weitere Details zu den einzelnen Entwicklungsschritten findet ihr im Blogeintrag von Google.

via: googleblog