乗り物
2017/3/15 16:57

【カーナビの素朴な疑問】最新カーナビの音声認識は、どこまで進化しているの?

最近、スマホやパソコンへの入力に“音声認識”を使うケースが増えています。以前までは、複雑な単語や固有名詞を認識することは難しく、思わず笑ってしまうような珍回答を導くことも少なくありませんでした。しかし、音声認識機能の向上によって正確に判断し、細かなイントネーションまで聞き分けるようになっています。そこで、今回は最新のカーナビを実験材料に音声認識の正確さと、ドライブにおける音声認識の重要性について紹介していきましょう。

 

そもそも、音声認識ってどんな仕組みなの?

音声認識とはキーボードやタッチパネルを使わず、人間の声を使ってコンピュータに認識させる機能。単語だけでなく会話を識別することも可能で、音声を認識し、そのデータをキーボードでの入力と同様にアプリケーションを使って操作すること。要するに、コンピュータを会話によって操作し、目的の情報を実行させるということです。

 

この音声認識は1970年代を起源とし、膨大な時間と投資を行って開発が続けられてきましたが、その開発には数多くの企業が参入し、群雄割拠の戦国時代を迎えています。音声認識のソフトのシェアを掌握することはスマホやパソコンを制することと同じであり、そこには莫大な利益を生む可能性があるのです。

 

では、スマホやパソコンでは当たり前になりつつある音声認識ですが、カーナビの世界ではどうなのでしょうか? 目的地を入力する場合、カーナビのタッチパネルは意外と面倒で、五十音表を行ったり来たりするのにイライラした経験はありませんか? そうなると、頼りになるのが音声入力。マイクに向かって目的地や施設名を告げるだけで検索し、案内してくれるのは大きな魅力。でも、長い住所や珍しい施設名など、複雑な言葉を認識しなくてはならないカーナビの音声認識ですから、意外と「誤認識」が多いのではないかという疑問が芽生えます。そこで、今回は最新カーナビであるカロッツェリア「サイバーナビ」の「フリーワード音声検索」を使い、実際にテストを行ってみました!

 

PART1:実際に音声認識を試してみよう!

発音しにくい……ということは、認識しづらいのでは?

↑Pioneer carrozzeria/音声認識「きゃりーぱみゅぱみゅ」

 

発音しにくい言葉は、音声認識が進歩しても伝わり辛いのでは……というイジワルな気持ちで選んだのが「きゃりーぱみゅぱみゅ」。日ごろの会話でも、なかなか正確に発音することが難しく、少し“カミ気味”になってしまいましたが、何度チャレンジしても正確に認識してくれました。同様にバラエティ番組で“滑舌悪い芸人“に、毎回出題され、アカシャカシャカス…になってしまう「赤坂サカス」も問題なく認識。発音しづらいワードでも難なく認識してくれる正確性はさすがです!

↑Pioneer carrozzeria/音声認識「赤坂サカス」

 

また「音声認識で誤認識」としてネットで検索し、出てきた「アナと雪の女王」、「松竹ビル」、「歌舞伎町」を試すも、笑いのひとつも起こらずサクサクと認識…(涙)。

↑Pioneer carrozzeria/音声認識「アナ雪」

 

聞き取り難い言葉は正確に判断できるのか?

先ほどは発音し難い言葉でしたが、逆に聞き取り難い言葉はどうなのでしょうか? そこで考えたのが「警視庁」と「錦糸町」。漢字にするとまったく異なりますが、言葉としては前後の脈絡がなければ意外と判断しにくく、ちょっと東北訛が入ってしまうと、ほとんど同じに聞こえるそうです。実際にテストをしてみると、標準語では完璧に認識してくれたのですが、少しずつ東北訛へ変えてゆくと途中から判別が付かなくなるようで「警視庁」と「錦糸町」の両ワードを表示するようになりました(笑)。ということは、首都圏では問題なく音声認識は役立つはずですが、方言の強い地方では誤認識を起す可能性もありそうです。

↑Pioneer carrozzeria/音声認識「警視庁」-標準語/訛言葉、「錦糸町」-標準語/訛言葉

 

認識力の最終テストは「長いワード」への対応力!

今回、音声認識の正確さに舌を巻いた取材陣ですが、これで諦めるほど柔ではありません。最終テストとして選んだのは“ワードの長さ“です。長ければ長いほど認識することが難しくなるだろうと考え、ビートルズの名曲であり、その長い曲名(23文字)を日本語英語発音で入力した「サージェント・ペパーズ・ロンリー・ハーツ・クラブ・バンド」。これは誤変換を…と思ったのですが、何事も無かったように一発クリア。本格的な英語ならまだしも、カタカナ英語的な発音でもしっかりと対応する優秀さはさすがであります。

 

続いては長い駅名として有名な「長者ケ浜潮騒はまなす公園前駅」、「リゾートゲートウェイステーション」、「南阿蘇水の生まれる里白水高原駅」の3つ。かなり苦労するだろうという予想を覆して簡単にクリア。

↑Pioneer carrozzeria/音声認識「長者ケ浜潮騒はまなす公園前駅」

 

最後の難問。カーナビゲーションとして、住所検索と施設名検索は最も重要な機能ですから、日本一長い住所として知られる「愛知県海部郡飛島村大字飛島新田字竹之郷ヨタレ南ノ割」と、日本一長い施設名である「高知県宿毛市愛媛県南宇和島郡愛南篠山町小中学校組合立篠山小学校」のふたつに挑戦してみました。すると、ここで問題発生! カーナビの音声入力には決まった時間があり、画面に表示される時間経過バーの制限時間内に音声入力をしなければならないのです。最初は住所や施設名が長すぎて、時間内に音声を入力することができずに失敗。かなりの早口で入力しようとすると、今度は言葉を間違えてしまい失敗…。苦労の末、時間内に音声を入力すると、日本一長い住所、日本一長い施設名も間違えることなく正しく認識してくれたのです。

↑Pioneer carrozzeria/音声認識「愛知県海部郡飛島村大字飛島新田字竹之郷ヨタレ南ノ割」

 

↑Pioneer carrozzeria/音声認識「高知県宿毛市愛媛県南宇和島郡愛南篠山町小中学校組合立篠山小学校」

 

実際には「フリーワード音声検索」は目的地の検索に使う機能ですが、このテストでは地名だけでなくワードとしての認識率が高いことが検証できました。ただし、長すぎるワードは“かなりの早口“が求められそうです。といっても、普段の生活でこれほど長い音声入力をすることはなく、逆にいえば、日本一長い住所や施設名を驚くような早口で入力しても正しく認識する高性能さが証明されたといえるでしょう。

 

PART2:カーナビの音声認識ってどんな使い方ができるの?

音声で入力できることがカーナビには必須になる!

カーナビの音声認識機能は、安全運転にも貢献します。毎日のように新聞やテレビで報道されているように、スマホを操作しながら運転をして交通事故を起すケースが急増している昨今、運転中でも視線を離すことなく目的地や情報を得ることができるカーナビの音声認識は“重要な安全装備”といえるかもしれません。そして、路肩に停車して文字を入力する手間や時間も必要ないので「時短」にも貢献します。

 

カロッツェリアは2013年に外部サーバーで音声を認識する「フリーワード音声検索」を搭載。このシステムは通信モジュールを利用して外部サーバーとオンラインでつながることで、ネットワーク上にある膨大な情報から検索を行うのですが、高度な音声認識技術により、普段の会話感覚で発話しても正確な情報だけをサクサクと選別してくれます。例えば、正式名称を知らなくても「近くのコンビニに行きたいなぁ」とか「えっと…品川の水族館」、「シーパラ」など、頭に浮かんだワードやうろ覚えの言葉でも検索することができるのです。音声入力は意外と恥ずかしくて使っていないという人も多く、緊張して「えっと…」や「あ~」など余計な言葉を発してしまっても、検索に不要な言葉は自動的に除去してくれるので心配不要。事前に言葉を頭の中でまとめて、滑舌を気にしながらロボットのように発音する必要もありません! 助手席の友人に話し掛けるような気軽さで使えるのは嬉しい限り(笑)。カロッツェリアの検索エンジンは、そこまで進化を遂げているのです!

 

ドライブ中によく使いそうなシーンとしては、走りながらコンビニやガソリンスタンドに立ち寄りたいと思いつくことも多いはず。そんな時、「近くのコンビニ」と発するだけで検索できるのは、運転中のドライバーにぜひ使って欲しい機能。

 

外部サーバーに検索エンジンを持つメリットは、新しく開店したお店やスポットなど情報量が膨大であることと随時情報が更新される点。個人的に嬉しいのがサイバーナビのサーバーには、2万4000軒以上の人気ラーメン店情報を網羅した「ラーメンバンク」というデータが入っていて、名店や専門店も、系列や味、クチコミ情報まで簡単に検索できるのです。ラーメンが食べたいと思ったら、走っている「場所」と「ラーメン」のキーワードを音声で入力するだけでOK。例えば「世田谷のラーメン」とか「渋谷のみそラーメン」というように店名を知らなくても探すことができるのです。

2017_ya-koba_pastedImage_2

今や音声認識機能は多忙を極める現代人の必須アイテム。今後、音声認識機能はカーナビやスマホ、パソコンだけでなく、社会生活を司る重要な機能として進化を遂げるに違いありません。そして、AI(人工知能)と音声入力の進化によって、私たちの生活はますます便利になることは間違いなさそうです。



pioneer