TVS REGZAは、米ラスベガスで2025年1月7日(現地時間)から開催されているテクノロジー見本市「CES 2025」で、AI技術によってユーザーが見たいコンテンツを提案する次世代技術構想「レグザインテリジェンス」を出展しています。その出展に先立って開催された内覧会の内容を紹介しましょう。
生成AIを活用して新しいコンテンツとの出合いを作り出す
TVS REGZA 取締役副社長の石橋泰博氏はレグザインテリジェンスの概要について「生成AIと今まで我々が培ってきた技術などを組み合わせて、視聴者の関心や興味などを加味して新しいコンテンツとの出合いを作り出したいと考えています」と語りました。
「生成AIとディープラーニング、ミリ波センサー、色や目の感性などの人間工学を技術のベースに、視聴者のプロファイルを融合することで、最適なコンテンツや新しい気付き、新しい出合いを提供したいと思っています。ユーザーごとにパーソナライズし、その時その時の環境によって新しいトレンドを取り入れるなど新規性を持たせつつ、興味関心の幅を広げるように多様性も持たせます。また、その時に合わせたリアルタイム性も組み合わせて多様なコンテンツを推薦したいと考えています」(石橋氏)
「AIボイスナビゲータ」があいまいな言葉と会話でぴったりな番組をオススメ
開発中の新技術として石橋氏は、あいまいな言葉を使った場合でも見たいコンテンツにたどり着ける「AIボイスナビゲータ」を紹介しました。
「今までのコンテンツ検索では、番組タイトルやアーティストなど具体的なものを入れたり、検索ワードを工夫したりしてヒット率を上げていました。そういったユーザーの具体化作業を代行するというものです。あいまいな検索ワードでも、その人が見たいものに最短でリーチするような機能です」(石橋氏)
説明会場では技術デモも行われました。テレビにはミリ波センサーが内蔵されており、人が近付くと目のようなアイコンがその人を追いかけるように反応します。
「ハロー」と声をかけると対話が始まり、話しかけると非常にクイックなレスポンスで会話が進みます。
「『今30分ぐらい時間あるんだけど何かおすすめのコンテンツありますか?』などと聞くと、『今SNSで話題になっている番組はどうですか』とか、『途中まで見たコンテンツの続きはどうですか』などと、AIがお客様の情報を把握した上で適切に推薦するというUX(ユーザー体験)を表現しています」(担当者)
「今話題の作品」と「続きを視聴したい作品」の2つの選択肢に対してザックリと「話題のやつお願い」と答えると、今回のCES 2025でコンテンツ提供の協力を得ているバンダイチャンネルの作品から『GUNDAM』と『LOVE LIVE! SUPERSTAR!!』の2つが提案されました。
『GUNDAM』が選択された状態で、「それで」と答えると『ガンダム』シリーズの再生リストが表示されます。
再生リストが表示される場合、画面上に表示した番号を発音して選択する場合が多いですが、AIボイスナビゲータでは「左から2番目」と答えるだけで選択できます。
「再生が始まるとバンダイチャンネルの再生アプリケーションによって再生が始まるのですが、そこでもボイスで再生操作が行えるようになっています。再生が終了すると最初の対話画面に戻り、引き続きインタラクティブな対話を楽しめるようになっています」(担当者)
スタジアムの歓声か、実況か…どちらかの音を強調できる「AIオーディオリミックス」
もう一つ注目したい開発中の新技術が、AIによって声と環境音を分離し、聞きたいサウンド環境にリミックスする「AIオーディオリミックス」です。
「例えばサッカー中継の場合、実況の音声とプレーの音、スタジアムの歓声がミックスされた形でテレビに届きます。テレビの中に入っているAIエンジンが声とプレーの音や環境音に分離し、スタジアムの歓声を聞きたいのか、アナウンサーの解説だけを聞きたいのか、いずれかに合わせてどちらかの音を強調するというものです」(石橋氏)
AIオーディオリミックスでは通常の音声モードである「Normal」に加えて、環境音を消して声を強調する「Voice」、環境音に加えて実況音声も少しだけ残す「Stadium」の3モードを用意していました。サッカー中継でStadiumモードにすると、スタジアムの観客席にいるような臨場感が感じられるだけでなく、わずかながらアナウンサーの実況音声も聞こえてきます。
「実況音声を全部消してしまうと違和感があるため、あえて約10%だけ声を残すように聞こえ方のチューニングをしています」(担当者)
雑踏の中でレポーターがニュースを報じるニュース映像のデモでは、Voiceモードを選択することで、周囲の環境音が消えてレポーターの声だけが聞こえてきました。ノイズキャンセリングヘッドホンを装着したように、きれいに環境音が消えるのが驚きです。
なお、StadiumモードとVoiceモード、どちらのモードでもNormalと切り替えたときに声色や環境音が変化するように感じることはありませんでした。
音楽ライブ映像の臨場感を増幅する「AI音楽ライブステージ高画質技術」
3つ目の技術として紹介されたのが「AI音楽ライブステージ高画質技術」です。以前から取り組んでいるAIシーン判別を使った高画質化をさらに進化させ、今回はAIシーン判別にライブステージのシーンを追加したとのことです。
「テレビがどんどん大画面になり、特に音楽ライブなどの臨場感が非常に増してきたこともあって、音楽ライブを皆さんに楽しんでいただきたいと考えて『ライブステージ』を追加しました」(石橋氏)
こちらもデモが行われたので紹介しましょう。まずは従来のAIシーン判別から踏襲する花火のシーンでは、花火のまばゆい光が強烈に目に飛び込んでくるような印象を受けました。一見すると「オフ」の方が緻密で破綻のない映像に見えますが、花火大会の会場で見るような感動は「オン」の方があるように思えます。
音楽ライブのシーンでは、明るく照らされたステージの中から、ステージ上の演出装置や中央にいるアーティストをより強調するようなコントラスト感が感じられました。
「引きの映像ではアーティストをよりクリアに見えること、アップではキラキラした衣装がよりきれいに見えること、衣装や顔の一体感が出るようにしています」(担当者)
今回のCES 2025での展示は技術展示であって、今後いつレグザシリーズに搭載されるのか、現行の製品にも対応する予定なのかといったことは現時点ではわかりません。しかし、AIを利用して見たいコンテンツに素早くアクセスする、AIで高音質化や高画質化を実現するといった技術には確かな効果が感じられました。今後、いちはやくレグザシリーズに搭載されることを期待したいところです。