Im letzten Frühjahr konnte die Welt einem ganz besonderen Wettkampf zwischen Mensch und Maschine zuschauen. Der weltbeste Go-Spieler Lee Sedol trat damals gegen AlphaGo Master an, eine Hochleistungs-Software zur Erforschung Künstlicher Intelligenz. Bei dem Spiel Go handelt es sich um ein Jahrhunderte altes chinesisches Brettspiel, dass zwar ein einfaches Regelwerk hat, jedoch unfassbar viele und komplexe Spielvarianten bietet. AlphaGo wurde von Googles Tochter Deep-Mind entwickelt und schlug Lee Sedol mit Leichtigkeit.

Mit ihrem neusten Aufsatz „Mastering the game of Go without human knowledge“ in der Wissenschaftszeitschrift Nature sprengt das Team die Grenzen einer selbstlernenden künstlichen Intelligenz. Denn ihre neuste Version namens AlphaGo Zero ist noch intelligenter und der stärkste Go-Spieler der Geschichte. Das Besondere: Die Software hat sich das Spiel selbstständig beigebracht.

Frühere Versionen von AlphaGo trainierten anfänglich mit Tausenden von menschlichen Amateur- und Profispielern, um zu lernen, wie das Game zu spielen ist. AlphaGo Zero überspringt diesen Schritt komplett – es ist auf sich alleine gestellt. Die Software lernt, indem sie einfach gegen sich selbst spielt. Dabei übertraf sie schnell das menschliche Spielniveau und besiegte die zuvor veröffentlichte Version von AlphaGo Master.

AlphaGo Zero nutzt dazu eine neuartige Form des Verstärkungslernens, bei der die Software zum eigenen Lehrer wird. Das System beginnt mit einem neuronalen Netz, das nichts über das Spiel von Go weiß. Während es spielt, wird das neuronale Netz immer wieder aktualisiert – dadurch lernt es.

Dieses aktualisierte neuronale Netz wird dann mit einem Suchalgorithmus kombiniert, um eine neue, stärkere Version von AlphaGo Zero zu erstellen. Danach beginnt der Vorgang erneut. In jedem Prozess verbessert sich die Leistung des Systems und die Lernkurve steigt. Das führt zu immer genaueren neuronalen Netzen und immer stärkeren Versionen von AlphaGo Zero. Am Ende brachte sich die Software das Go Spiel in 40 Tagen bis zur Perfektion bei. Eine beeindruckende Leistung!

via: deepmind