デジタル
デジタル周辺機器
2021/5/28 20:40

世界一と話題の音声認識の実力は!? AI文字起こしツール「VOITER」を使ってみた

音質は上々。再生速度や文字サイズも調整可能

録音した音源は、Bluetoothで接続したワイヤレスイヤホン(別売)で聴けます。アップルのAirPods Proで聴いてみましたが、ノイズキャンセリング機能の効果か、雑音は少なく、音質はクリア。会話の音声にフォーカスして録音されていることを実感できました。なお、オーディオジャックは搭載していませんが、USB-Type-Cポートから出力することもできます。

↑録音した音声はワイヤレスイヤホンで聴くのが便利

 

再生速度は5段階(0.75倍、1倍、1.25倍、1.5倍、2倍)に切り替えられます。一般的なボイスレコーダーでは、自分で文字起こしをするために、ゆっくりした速度で再生したいことがあります。ですが、VOITERは自動で文字起こしをしてくれるので、むしろ、再度確認したい個所を見つけるために、速めの速度で再生することが多くなりそうです。なお、確認したい個所は、キーワードを入力して探すこともできます。

 

録音したデータはクラウドで管理できる

録音した音声データは、日本国内にあるサーバにアップロードされ、再び文字起こしが行われます。ただし、リアルタイムでの文字起こし結果と、サーバでも文字起こし結果を比べたところ、文の区切りが整えられたりする程度で、さほど大きな差はない印象。

 

サーバにアップするには、ファイルサイズによっては若干時間がかかり、文字起こしにはさらに時間を要します。例えば、取材した日の夕方に音声をアップロードすると、翌朝に専用ページにアクセスして確認できるという感じ。ただし、先述の通り、端末での文字起こしで、十分な精度の結果が得られるので、必ずしもサーバにアップする必要はありません。自動アップロードはオン・オフの設定が可能ですので、必要に応じて使い分けてもいいでしょう。

 

サーバにアップしたデータは、「RECORDER STATION」というサイトで確認できます。録音した音声を再生したり、文字起こしデータを見たり、編集したりでき、ダウンロードすることもできます。サーバには10GBまで保存できるので、管理場所として使うのが便利そうです。

 

AIによる文字起こしの精度は高いとは言え、固有名詞や専門用語が不自然なカタカナ表記になっていたり、不要な余談や相槌などが含まれていたりもします。「RECORDER STATION」は、音声を聴きながら、テキストの修正ができるので、仕事仲間などと共有したいデータの編集には便利でしょう。

↑自分のアカウントで「RECORDER STATION」というサイトにログインして、アップロードしたファイルを確認できる

 

↑オリジナルの文字起こしデータを残しつつ、編集が可能

 

文字起こしが無料で使い放題なのは1年目だけ

VOITERの最大のセールスポイントといえる文字起こしは、無料で使える時間に制約があります。「ベーシックプラン」では毎月3時間が無料で使えて、月額2180円の「使い放題プラン」に加入すると、時間無制限で使えます。ただし、1年目は無料で「使い放題プラン」が利用可能。

 

頻繁に文字起こしが必要な場合、月額2180円は、お手頃な料金設定といえそうですが、たまに使う程度の人には高く感じられるかもしれません。今後、プランの変更や追加の可能性もあるとのことなので、必要な時にだけ追加料金で使えるオプションサービスも追加してほしいと思いました。

 

VOITERの一般販売予定価格は5万4780円ですが、Makuakeでの先行販売(6月13日まで)では、約20%オフの4万3800円で購入できます。同サイトでは、ディスプレイを搭載しないコンパクトな「VOITER mini」(応援購入価格は1万6280円)も販売されており、スマホの専用アプリと連携させて、文字起こしサービスを利用できる仕組みです。予算を抑えたい人は、VOITER miniも選択肢に加えて、検討してみることをおすすめします。

 

【フォトギャラリー(画像をタップするとご覧いただけます)】

  1. 1
  2. 2