もう議事録はいらない？日本語の書き起こし精度を試してみた

AWS（Amazon Web Service）は、11/21、音声をテキストに書き起こす「Amazon Transcribe」というサービスの日本語対応を発表した。

７言語が新しく対応され、アラビア湾、スイスドイツ語、ヘブライ語、日本語、マレー語、テルグ語、トルコ語でも使えるようになったということだ。

こういった音声をテキストに書き起こすサービスは、すでに、IBMやマイクロソフト、googleなどでは、日本語も含め対応済みとなっている。音声認識自体は、スマートフォンなどでも手軽に試せるので、試したことがある方も多いのではないだろうか。

クラウドベンダーが提供する、こういったサービスは、ビジネスで使う場合は、自社のアプリケーションの中に組み込むことでいろんなサービスに使うことができる。

よく言われるのは議事録書き起こしサービスだが、他にもコールセンターでの顧客の声をテキストにする、会話をマイクで取得して関連する映像を表示する、など様々な利用が期待されているのだ。

しかし、仕事で音声認識技術を使う場合、その認識精度如何によっては期待通りの結果が出ない場合がある。

そこで、ブラウザでも認識精度を試すことができる、IBM Watsonを使って日本語の書き起こしを実際に試してみた。

日本語の書き起こし精度をIBM Watsonで試してみた

IBM　Watsonでは、以下のページで実際の性能を試すことができる。言語を「Japanese Broadband」に変えて話して見て欲しい。

☆出典は：