この夏「Mac版Gemini」が進化！ 24時間稼働のAIエージェント「Spark」と新しい音声入力を追加へ

Google

ink_pen 2026/5/26

この夏「Mac版Gemini」が進化！ 24時間稼働のAIエージェント「Spark」と新しい音声入力を追加へ

多根清史

たねきよし

IT / ゲーム / アニメライター。著書に『宇宙政治の政治経済学』（宝島社）、『ガンダムと日本人』（文春新書）、『教養としてのゲーム史』（ちくま新書）、『PS3はなぜ失敗したのか』（晋遊舎）、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』（以上、太田出版）がある。

もっと見る arrow_forward

Googleは「I/O 2026」イベントにおいて、macOS版Geminiアプリに2つの新機能を2026年夏に提供すると発表しました。同アプリは今年4月にリリースされたばかりですが、さらに高度な処理や操作が可能になる見込みです。

1つ目は「Gemini Spark」の導入です。これは「ユーザーのデジタルライフをナビゲートする」24時間稼働のAIエージェントとして位置づけられており、ユーザーに代わってアクションを実行します。GmailやGoogleドキュメントなどのGoogle Workspaceアプリとの統合だけでなく、サードパーティ製サービスとの連携も可能とのことです。

こちらは、まずGoogle AI Ultra（月額100ドル）の加入者向けに、Android、iOS、およびWeb版のGeminiアプリでベータ提供が開始されます。その後、少し遅れてmacOSにも提供される形となるようです。

Mac版Geminiアプリでは、この「ローカルファイルを含むタスクの実行や、デスクトップ全体にまたがるワークフローの自動化」を行えるようになると以前から報じられていました。これは、現在すでに利用可能な「開いている任意のウィンドウをプロンプトの文脈として使用する機能」に加わる形となります。

2つ目は「新しい音声体験」です。これはユーザーが「えーと」や「そういえば」などと言い淀んでも気にする必要がなくなり、思いつくままに喋れる音声入力を想定しています。Macのファンクションキー（fn）を長押しすると画面下部にフローティング型のピル状（丸薬型）UIが現れて音声入力が始まり、キーを離すとプロンプトが送信される仕組みです。

Geminiは画面のコンテキストを活用しながら、とりとめのない自由な発話からユーザーの意図を正確に汲み取り、適切な下書きテキストに変換して、現在カーソルがある位置に直接挿入してくれるとのことです。

これらは最初に高額プランのユーザーのみに提供されるため、誰もがすぐに使えるわけではありません。とはいえ、GoogleのAIサービスは数か月遅れで低額プランや無料プランに開放されることもあるため、今後の動きを見守りたいところです。