デジタル
2025/4/16 11:30

【西田宗千佳連載】Amazonには「Alexaを生成AIで作り直す技術基盤」があった

Vol.148-4

本連載では、ジャーナリスト・西田宗千佳氏がデジタル業界の最新動向をレポートする。今回はAmazonが発表した新たな音声アシスタント「Alexa+」の話題。生成AI時代に生まれ変わるサービスにはどんな変化があるのかを探る。

 

今月の注目アイテム

Amazon

Echo Show 15(第2世代)

実売価格4万7980円

↑音声での対話による情報の提供には欠かせない、ディスプレイ付きのスマートスピーカー。Echo Show 15は15インチの画面で文字などの視覚情報により、スムーズな対話が可能になるデバイスと期待されている。

 

Amazonは「Alexa」を生み出したが、音声アシスタントを運営する企業としては少々特殊だ。

 

音声アシスタントをリードしているのは、スマートフォン・プラットフォームを持つAppleとGoogleと言っていい。生成AIの時代になり、アップルは「Siri」をApple Intelligenceで進化させ、GoogleはGoogleアシスタントから「Gemini」に切り換えて、より使い勝手の良い音声アシスタントを実現しようとしている。

 

Amazonはスマホを持っておらず、スマホ向けの生成AIも作ってはいない。生成AI自体でも「競争の最前線で戦っている」印象を持つ人は少ないだろう。そんな状況もあって、Alexa+を発表するまでは「Amazonは生成AI時代に遅れをとっている」と言われることが多かった。

 

だが、その認識は必ずしも正しくない。

 

AmazonはOpenAIやGoogleのように“生成AIの賢さを最前線で競っている”わけではない。だがAmazonのウェブサービス部門である「AWS」は、複数の生成AIモデルを動作させられる「Amazon Bedrock」というサービスを持っている。多くの生成AIサービスは、実際にBedrockの上で動作しているし、AWSの持つNVIDIAのGPUサーバーを借りている企業も多い。生成AIの賢さでトップを競っているAnthropicもAWSと提携し、AIの学習とサービス提供に使っている。

 

Alexaの改良版である「Alexa+」は、Amazon Bedrockの上で動く複数の生成AIを使っている。主に使われるのは、Amazonが昨年末に発表した「Amazon Nova」と、Anthropicの「Claude」を活用する。

 

GeminiにしろSiriにしろ、音声で「賢く便利に使える」状態には至っていない。まだまだ改善途上だ。Amazonは生成AIを使ったサービスを構築する基盤を持っており、その上で一気にサービス立ち上げを進めたわけだ。短期間でサービス構築をするのは大変なことだが、Amazonは「人とコストを集中的に投下する」ことで、より良いサービスを構築できたのだろう。

 

生成AIで“誰もが便利だと感じるサービス”を作るのはまだ難しい。GeminiもSiriも、OpenAIのChatGPTも課題を抱えている。Amazonだって、何の問題もなく便利かどうかを断言できる状況にはない。

 

しかし少なくともデモを見る限りは、“声で人と対話するように日常求められる作業をやってもらう”ことを実現しているように見える。そもそもAlexa+の場合、用途が“家庭内で求められること”“買い物が関わること”に限定される……という点は、他社より有利なところなのかもしれない。“生成AIで便利なサービスを作る”という意味では、Amazonは相当に有利な立場に立てた、と言えそうだ。

 

もう1つ重要なのは、生成AIをベースにしているため、“多言語対応が容易である”点だろう。おそらくだが、単に日本語で対話するだけなら、そこまで難しいことではないはずだ。

 

ただし実際には「連動するサービス」の面でもローカライズが必須だ。買い物などAmazon社内のサービスはもちろん、タクシー配車など、国内のパートナーとの連携は必須と言える。そうした部分まで考えると、日本でAlexa+が使えるようになるには、もうしばらく時間がかかるだろう。

 

週刊GetNavi、バックナンバーはこちら