米NVIDIAや米カリフォルニア工科大学等に属する研究者らは、最新の大規模言語モデル(LLM)「GPT-4」を使って『マインクラフト』を探索し、ゲームの達人になるAIモデル「Voyager」の研究論文を発表しました。
このVoyagerは「具現化エージェント」、すなわちシミュレーション世界や現実環境の中で自由に動き、目的を持って行動できるAIの一種です。音声アシスタントやチャットボットは現実に行動する必要がなく、複雑な世界を知らなくても問題ありません。しかし、家庭用ロボットは将来的に、まさに現実世界での行動が求められると思われ、それに備えて多くの研究が進められています。
そしてマイクラ(略称)は現実を大まかに再現しており、ルールはシンプルで分かりやすいものの、やはり複雑で広大な世界を備えているため、AIを鍛えるにはもってこいというわけです。
Voyagerはゲームの中でいろいろな事態に出会うと、GPT-4と少しずつ会話を積み重ねながら「何をどうすべきか」を考えるというもの。たとえば夜が明けて、スケルトンが出てきたとすると「近くにモンスターがいるとき、腕の良いプレイヤーはどうするのか」と自問。
するとGPT-4からは、安全に世界を探検したいなら、剣を作って装備し、それで骸骨を攻撃し、あちらの攻撃には当たらないようにすべきという答が返ってくる。そこで「石や木を集めて、作業台で剣を作り、装備してスケルトンと戦う」という目標が設定。それに基づき、GPT-4に必要なプログラムを書かせることになります。
そうした戦い方はスキルライブラリに登録され、「洞窟の奥に鉄鉱石を探しに行く」ことを目指すときにも、また一から学ぶ必要がなくなります。どんどん経験が積み重ねられて、ますます賢くなっていくという流れです。
他にもマイクラを自動的にプレイするエージェントはありますが、Voyagerはかなり賢いようです。研究者らが公開したグラフでは、同じく自動的にプレイするAIモデルAutoGPTやReActに圧倒的な差が付けられたと報告されています。
この研究のポイントは、まだ発展途上にあるAIでも、経験に基づいて自らの行動を改良していく方法を見つけられることです。いずれ家庭や病院、職場でも、人間から教えられずに独りで賢くなっていくロボットが活躍するのかもしれません。
Source:Voyager: An Open-Ended Embodied Agent with Large Language Models
via:TechCrunch