世界の新製品とビジネストレンド情報

広範囲のweb情報を検索し常に新鮮な情報をお届けします。事業の新企画、スタートアップに活用下さい。

グーグルの書き起こし機能「音声文字変換(Live Transcribe)」の秘密を聞く

グーグルが2月に発表した「音声文字変換(Live Transcribe)」という新機能をご存じだろうか。現在はベータ版として、Android向けに提供されており、話した内容をそのまま文字へ書き起こしてくれるようになっている。

日本語を含む70以上の言語に対応する「音声文字変換(Live Transcribe)」について、プロダクトマネージャーのサガー・サブラ(Sagar Savla)氏が来日、開発に至った背景や、その技術を語った。

音声文字変換でできること

 ライブトランスクライブ、つまりリアルタイムで音声をテキスト化してくれるという本機能は、現在、Androidでのみ利用できる。

 アプリをインストールし(Pixel 3/3 XLでは設定メニューのユーザー補助でON)、アプリ一覧から起動すると、いつでも音声をテキストにする状態になる。そのままスマートフォンの近くで話していると、拾った音声をそのまま文字にしてくれる。

70もの言語に対応しているとのことで、設定から、認識したい言語を2つ選べる。認識中は、その2つを手動で切り替えて利用する形だ。

 音声認識をしているものの、その録音はされない。また、文字になった内容はコピーできず、いったん「音声文字変換(Live Transcribe)」を終了すると、文字化した内容は消える。

 音声をテキスト化するといった用途はビジネスシーンでもニーズがあると見られ、今後の展開に向けてGSuiteのチームと検討中という。またテキストを保存する機能は今後数カ月以内に発表される。

 また同時通訳技術も構想はあるものの、音声からの書き起こしする際の精度や、書き起こしたテキストを翻訳する際の誤りといった点が今後の課題になる。

 

☆出典は:

k-tai.watch.impress.co.jp