Screenshot des Computerspiels „Montezuma’s Revenge“
Screenshot Youtube
Screenshot Youtube
Lernfähig

Videospiel: KI bricht Weltrekord

In Strategiespielen wie Schach oder Go hat die Künstliche Intelligenz (KI) den Menschen längst überflügelt. Mittlerweile sind KI-Systeme auch beim „Zocken“ kaum mehr zu schlagen: Im Videospielklassiker „Montezuma’s Revenge“ fiel kürzlich der Weltrekord.

Panama Joe läuft durch die Gänge eines Aztekentempels und muss bei seiner Suche nach dem Schatz über Feuergruben springen und Schlangen ausweichen: Die Spielidee von „Montezuma’s Revenge“ ist denkbar einfach und vielleicht gerade deswegen so anziehend. Grafik und Sound? Nach heutigen Maßstäben naiv bis vorsintflutlich.

So war das eben in den frühen 1980ern: Der Arbeitsspeicher eines typischen Heimcomputers hatte 48 bis 64 Kilobyte Arbeitsspeicher, Festplatten gab es keine, Programme mussten über Steckmodule oder 5¼-Zoll-Disketten geladen werden.

Die damals übliche Hardware ist natürlich längst Geschichte, aber die Jump ’n’ Run-Spiele aus dieser Zeit haben sich einen gewissen Reiz bewahrt – auch für Wissenschaftler: Denn die Videospiele sind ein gutes Testfeld für die Erprobung von Algorithmen im Bereich der Künstlichen Intelligenz.

Praxistest mit 2.600 Spielen

Von einem Durchbruch auf diesem Gebiet berichtet jetzt ein Team um Adrien Ecoffet und Joost Huizinga im Fachblatt „Nature“: Die Forscher von den Uber AI Labs in San Francisco haben ihr Programm „GoExplore“ bei insgesamt 2.600 Videospielen aus dem Hause Atari antreten lassen – und offenbar eine beeindruckende Bilanz erzielt.

Beim Spiel „Pitfall“ etwa, wo KI-Systeme bislang überhaupt keine Punkte einfahren konnten, war „GoExplore“ besser als durchschnittliche menschliche Spieler. Und beim Klassiker „Montezuma’s Revenge“ erzielte das Programm sogar Weltrekord (siehe Video).

Womit die Künstliche Intelligenz den Menschen nach Strategiespielen wie Go und Schach nun auch beim „Zocken“ am Computer überflügelt hat. Das war freilich nur ein Nebeneffekt der Studie, eigentlich hatten Ecoffet und Huizinga etwas anderes im Sinn, nämlich die Weiterentwicklung von Lernstrategien. „GoExplore“ findet sich in der Umgebung der Videospiele deshalb so gut zurecht, weil es Lernen durch Versuch und Irrtum („reinforcement learning“) mit einem Bestand an Vorwissen („domain knowledge“) kombiniert.

Zwei Verfahren vereint

„Menschliche Experten in so vielen Problemen zu schlagen, ist ein eindrucksvoller Erfolg“, kommentiert Jan Peters vom Max-Planck-Institut für Intelligente Systeme die Studie. Er sieht nun einen „Zeitenwechsel“ angebrochen, „wo die beiden KI-Familien der statistisch-neuronalen Verfahren und des ‚Domain Knowledge‘-Engineering sich endlich vereinen. Für viele KI-Forscher wäre dies ein fast 70 Jahre alter Traum.“

Laut Ecoffet und Huizinga könnte „GoExplore“ auch Robotern zu neuem Feingefühl verhelfen, in Simulationen gelang es dem Programm etwa, Tassen auf einem Regal abzustellen, ohne dabei etwas kaputt zu machen. Bei dieser Ankündigung könnte es sich allerdings auch um den Versuch handeln, Grundlagenforschung frühzeitig den Anstrich praktischer Verwertbarkeit zu geben, wie das in Technik und Medizin häufig passiert – auch wenn sich die Folgerungen noch gar nicht absehen lassen. So sieht das jedenfalls Jan Peters, der Mehrwert für die Robotik sei „an den Haaren herbeigezogen“. Anwendungen in der Medizin und beim autonomen Fahren hält indes auch er für realistisch.