米OpenAIの研究チームは、『Minecraft(マインクラフト/略称「マイクラ」)」のプレイ動画を7万時間も見続けたAIがプレイのやり方を学習し、熟練した人でも20分以上はかかるダイヤモンド製アイテムを10分程度で作れる」ほどの達人になった成果を公開しています。
マイクラのプレイ動画はネットに大量にありますが、そこには「何が起こったか」が記録されているだけで「どうやって操作したか」の情報はありません。つまり「ラベル」が付いていないため、それをAIがどれだけ観ても何も学ぶことはできないわけです。
そこでOpenAIは半教師あり模倣学習「Video PreTraining 」(VPT)を開発し、どうやって操作するかのラベル付き動画を使い、映像の各ステップで行われるキー入力やマウス操作を予測するモデル「Inverse Dynamics Model」(IDM)を学習。それから7000時間のラベルなし動画を見せ、効率的にプレイを学ばせたというしくみです。
これによりAIは木を切り倒して道具を作り、ツルハシで石を採掘し、洞窟の奥でダイヤモンドを発見して、人間のエキスパートでも20分以上はかかるダイアモンド製アイテム作りを10分程度でやり遂げた……という動画がTwitterで公開されています。
We trained a neural network to competently play Minecraft by pre-training on a large unlabeled video dataset of human Minecraft play and a small amount of labeled contractor data. https://t.co/a2pyBqvLvg pic.twitter.com/XbqtwQSTwU
— OpenAI (@OpenAI) June 23, 2022
ほか、このAIは水泳や狩り、料理などの他の仕事もこなせるそうです。さらにジャンプして下にブロックを積み重ね、より高い場所に行ける「ピラー・ジャンプ」のテクニックも完ぺきに使いこなせるそうです。
これまでAIがチェスや囲碁などをマスターすることはありましたが、マイクラのようなオープンワールドのゲームを人間と同じように(あるいは人間以上に)プレイできるのは驚くべきことでしょう。あまりにムダがないプレイはすぐに機械だと気づかれそうですが、逆に人間の失敗も学んだドジで人間くさいAIも、いつの日か誕生するのかもしれません。
Source:OpenAI
via:Gamesradar