X

In Stunden selbst gelernt:
KI spielt Schach, Go & Shogi wie Weltmeister

Die Fortschritte in der KI-Forschung bleiben weiter beeindruckend. Mit AlphaZero wurde jetzt ein System entwickelt, das sich in kürzester Zeit die Strategiespiel-Klassiker Schach, Go und Shogi selbst beigebracht hat - und zwar so gut, dass die KI auf Weltmeister-Niveau bestehen konnte.
07.12.2018  15:45 Uhr

Die Künstliche Intelligenz, die in wenigen Stunden zum Meisterstrategen wird

Um Profispieler von komplexen Strategiespielen zuverlässig mit künstlicher Intelligenz schlagen zu können, hatten Entwickler bisher auf spezialisierte Systeme gesetzt, die jenseits ihres Einsatzgebiets keine Aufgaben erledigen konnten. Das berühmteste Beispiel ist hier wohl Alpha Go, mit dem es gelang, einen Großmeister im asiatischen Brettspiel Go zu besiegen. Mit AlphaGo Zero konnte gezeigt werden, dass dieses Niveau auch ganz ohne menschlichen Lehrer erreicht werden kann. Jetzt geht man einen Schritt weiter.
DeepMind AlphaZero
AlphaZero war schnell so gut wie die Besten

Abermals war es dabei ein Team der Alphabet-Tochter Deepmind, die sich der neuen Herausforderung angenommen hatte, ein KI-System zu entwickeln, das sich gleich in drei komplexen Strategiespielen behaupten kann. "Wir setzen AlphaZero auf Schach, Go und Shogi an, dabei nutzt es die gleichen Algorithmen und Netzwerk-Architektur für alle drei Spiele", so der Teamleiter David Silver laut Scinexx.

Als Input wurden dem System dabei nur die Regeln der drei Spiele zur Verfügung gestellt. "AlphaZero hat, abgesehen von den Regeln, keinerlei Vorwissen über die Spiele", erklärt Demis Hassabis von Deepmind. "Beginnend mit zufälligen Spielzügen lernt AlphaZero nach und nach, was eine gute Partie ausmacht und bildet sich seine eigenen Bewertungsmaßstäbe über das Spiel."

So hat Google den Vorgänger AlphaGo Zero entwickelt
videoplayer02:13

Go ist sehr komplex

AlphaZero nutzt dabei eine Kombination von neuronalen Netzwerken mit einer sogenannten Monte-Carlo-Suche, die eine Überprüfung der möglichen Spielzüge erlaubt. Dazu kommt dann noch ein Algorithmus, der das Lernen durch "positive Verstärkung" ermöglicht. Bei den Spielen Schach und Shogi konnte die KI nach neun beziehungsweise zwölf Stunden das Training abschließen, diese Phase dauerte bei Go wegen der hohen Komplexität dagegen 13 Tage.

Im Anschluss musste sich AlphaZero dann gegen die besten spezialisierten Computerprogramme für diese Spiele behaupten: Bei Schach kam Stockfisch zum Einsatz, Shogi wurde gegen Elmo gespielt, für Go lies man den eigenen Vorgänger AlphaGo Zero antreten. Das Ergebnis: Shogi konnte AlphaZero in mehr als 90 Prozent aller Partien gewinnen, bei Go lag die Gewinnqoute gegen den spezialisierten Vorgänger immerhin bei 61 Prozent. Beim Schach konnte AlphaZero 155 von 1.000 Partien für sich entscheiden, sechs gingen verloren und beim Rest wurde ein Patt erzielt.

Mit diesem Ergebnis zeigt AlphaZero, dass ein KI-System gleich in mehreren Spielen Meisterschaftsniveau erreichen kann - und das in einem selbstständigen, kurzen Lernprozess. Von diesem Ergebnis zeigen sich dann auch echte Meister begeistert: "AlphaZero hat eigenes Wissen erschaffen - und das in nur wenigen Stunden. Er spielt mit einem sehr dynamischen Stil - sehr ähnlich meinem eigenen", so der ehemalige Schachweltmeister Garry Kasparov.

☀ Tag- / 🌙 Nacht-Modus
Desktop-Version anzeigen
Impressum
Datenschutz
Cookies
© 2024 WinFuture