もう議事録はいらない?日本語の書き起こし精度を試してみた
AWS(Amazon Web Service)は、11/21、音声をテキストに書き起こす「Amazon Transcribe」というサービスの日本語対応を発表した。
※Amazon Web Servicesとは、Amazon.comにより提供されているクラウドコンピューティングサービスのこと。
7言語が新しく対応され、アラビア湾、スイスドイツ語、ヘブライ語、日本語、マレー語、テルグ語、トルコ語でも使えるようになったということだ。
こういった音声をテキストに書き起こすサービスは、すでに、IBMやマイクロソフト、googleなどでは、日本語も含め対応済みとなっている。音声認識自体は、スマートフォンなどでも手軽に試せるので、試したことがある方も多いのではないだろうか。
クラウドベンダーが提供する、こういったサービスは、ビジネスで使う場合は、自社のアプリケーションの中に組み込むことでいろんなサービスに使うことができる。
よく言われるのは議事録書き起こしサービスだが、他にもコールセンターでの顧客の声をテキストにする、会話をマイクで取得して関連する映像を表示する、など様々な利用が期待されているのだ。
しかし、仕事で音声認識技術を使う場合、その認識精度如何によっては期待通りの結果が出ない場合がある。
そこで、ブラウザでも認識精度を試すことができる、IBM Watsonを使って日本語の書き起こしを実際に試してみた。
日本語の書き起こし精度をIBM Watsonで試してみた
IBM Watsonでは、以下のページで実際の性能を試すことができる。言語を「Japanese Broadband」に変えて話して見て欲しい。
☆出典は: