Ein Gamer spielt Minecraft auf seinem Notebook
Ein Gamer spielt Minecraft auf seinem Notebook
Bildquelle: rokas91, Lizenz

MineDojo: Nvidias KI-Agent macht in Minecraft was Du sagst

Nach dem Training mit unzähligen Videos, Reddit-Threads und Wiki-Artikeln kann MineDojo sprachliche Befehle in Minecraft-Aktionen umwandeln.

Mit MineDojo haben Forscher von Nvidia eine künstliche Intelligenz entwickelt, die sprachliche Befehle in Aktionen innerhalb des beliebten Spiels Minecraft verwandelt. Der mit unzähligen YouTube-Videos, Reddit-Threads und Wiki-Einträgen trainierte Agent gewann damit kürzlich sogar NeurIPS-Awards.

Nvidia-Forscher räumen mit MineDojo NeurIPS 2022 Awards ab

Wie Nvidia am Montag mitteilte, gewannen zwei Forschungsarbeiten des Unternehmens NeurIPS 2022 Awards für ihre Beiträge auf dem Gebiet der künstlichen Intelligenz (KI) und des maschinellen Lernens. Dabei ging es mitunter um MineDojo, einen KI-Agenten, der auf Basis sprachlicher Eingaben Aktionen im Spiel Minecraft ausführen kann.

Um MineDojo zu trainieren, fütterten die Forscher die KI laut Ars Technica mit Gameplay-Material aus 730.000 YouTube-Videos mit mehr als 2,2 Milliarden transkribierten Wörtern. Weiterhin flossen die Inhalte von 7.000 Webseiten aus dem Minecraft-Wiki, 340.000 Reddit-Beiträgen sowie 6,6 Millionen Kommentaren von derselben Plattform ein.

MineDojo beim Training
MineDojo beim Training (Quelle: Screenshot)

Die gesammelten Daten ließen die Forscher daraufhin in ein Basismodell mit dem Namen MineCLIP einfließen. Dieses stellt schließlich eine Verbindung zwischen gesprochenen Inhalten eines Videos und den Aktivitäten innerhalb des Spiels Minecraft her. Denn gerade in Gameplay-Videos kommentieren Spieler oftmals die Handlungen, die sie vollziehen, was für das Training besonders nützlich ist.

KI-Agent führt sprachliche Befehle in Minecraft aus

Als Resultat kann ein Mensch MineDojo in natürlicher Sprache sagen, was genau die KI im Spiel tun soll. Dies können beispielsweise Befehle sein wie „Baue ein Netherportal und betrete es“ oder „Finde eine Wüstenpyramide„. Daraufhin führt der Algorithmus die nötigen Schritte aus, um das genannte Ziel in Minecraft zu erreichen.

Ziel des Projektes ist es, dass MineDojo gelernte Aktionen verallgemeinern und auf verschiedene Spielsituationen übertragen kann. Laut Nvidia gibt es zwar schon seit längerer Zeit KI-Agenten für Spiele wie StarCraft oder Dota. Doch seien diese „in der Regel nur auf einige wenige Aufgaben spezialisiert.

Die Forscher von Nvidia hingegen wollten ein skalierbares Trainings-Framework für einen generalistischen Agenten entwickeln, „der eine Vielzahl von Aufgaben mit offenem Ende erfolgreich ausführen kann.“ Daher habe sich das Team Minecraft, dem weltweit beliebtesten Spiel, zugewandt.

Wer MineDojo in Aktion sehen möchte, kann dies auf der offiziellen Webseite des Projektes tun. Der Quellcode für den KI-Agenten, ebenso wie der für MineCLIP, steht auf GitHub zur Verfügung.

Über

Marc Stöckel hat nach seiner Ausbildung zum IT-Systemelektroniker und einem Studium im Bereich der technischen Informatik rund 5 Jahre als Softwareentwickler gearbeitet. Um seine technische Expertise sowie seine Sprachfertigkeiten weiter auszubauen, schreibt er seit dem Sommer 2022 regelmäßig Artikel zu den Themenbereichen Software, IT-Sicherheit, Datenschutz, Cyberkriminalität und Kryptowährungen.