今年5月に開催された「Google I/O 2024」において、Googleは独自開発AIの「Gemini」とChromeブラウザが連携すると予告していました。この取り組みは「Project Jarvis」と呼ばれ、まもなくプレビュー版が公開されるとの噂が報じられています。
ニュースメディアのThe Informationによると、Googleは「ウェブブラウザの操作を交代して、研究資料の収集や商品の購入、航空券の予約などのタスクを行う人工知能を開発している」とのこと。
プロジェクト名は、映画『アイアンマン』のJ.A.R.V.I.S.にちなんで名付けられたそうです。Chromeブラウザ上で動き、企業向けというより消費者向けの機能として、「ウェブベースの日常的な作業を自動化」すると言われています。もっとも、モバイル用なのかデスクトップ用なのかは明らかにされていません。
コマンドを指示されると、Jarvisは「コンピュータの画面に表示されているものを頻繁にスクリーンショットで撮影し、その画像を理解してから、ボタンをクリックしたりテキストフィールドに入力したりするなどのアクションを起こす」という仕組みとのこと。
もっとも、今のところJarvisは「各アクションを起こす前に数秒間考える必要があるため、動作が比較的遅い」と言います。そのため、まだオンデバイス(端末内で処理する)で動作しておらず、クラウドサーバーを必要とする可能性が高いそう。
JarvisはGemini 2.0(次世代のマルチモーダルAIモデル。テキストや画像、音声などを同時に処理できる)を搭載していると言われており、「早ければ12月」にもプレビューされるかもしれないとのことです。
Jarvisが実用化すれば、例えば、オンラインストアで靴を買ったもののサイズが合わない場合、「受信箱を検索して領収書を探す」「メールから注文番号を確認する」「返品フォームに記入する」などの作業を肩代わりしてくれるとうたわれています。
まずは英語がサポートされ、日本語はしばらく後になりそうですが、楽しみに待ちたいところです。
Source: The Information
via: 9to5Google