世界の新製品とビジネストレンド情報

広範囲のweb情報を検索し常に新鮮な情報をお届けします。事業の新企画、スタートアップに活用下さい。

マスコミの味方!? 音声・映像をAIで「自動文字起こし」 手作業の時間を3分の1以下に

パナソニック システムソリューションズ ジャパンは10月28日、AIとクラウドの技術を活用し、撮影・録音したデータを自動でテキスト化するサービス「P-VoT」(ピーボット)を11月13日にリリースすると発表した。放送・新聞・出版といったメディア企業のコンテンツ制作を効率化する狙い。

 メディア業界では、コンテンツを制作する下準備として、インタビューなどの録音データをスタッフが聞き直し、手作業で書き起こすケースが多い。だが同社の試算によると、1時間分の音声・動画をテキスト化する作業の所要時間は約5時間掛かることもあり、長時間労働の一因になっているという。P-VoTでこれを約1.5時間にまで短縮し、業務改善につなげるとしている。

 P-VoTはブラウザベースのサービス。ユーザーが取材現場で記録した音声・動画のファイルをクラウド上にアップロードすると、同社の高精度音声認識装置が内容を分析し、専用Webサイトにテキストを表示する。音声認識には、ディープニューラルネットワーク(DNN)技術を使用している。

 

☆出典は:

www.itmedia.co.jp