マスコミの味方!?　音声・映像をAIで「自動文字起こし」　手作業の時間を3分の1以下に

パナソニックシステムソリューションズジャパンは10月28日、AIとクラウドの技術を活用し、撮影・録音したデータを自動でテキスト化するサービス「P-VoT」（ピーボット）を11月13日にリリースすると発表した。放送・新聞・出版といったメディア企業のコンテンツ制作を効率化する狙い。

　メディア業界では、コンテンツを制作する下準備として、インタビューなどの録音データをスタッフが聞き直し、手作業で書き起こすケースが多い。だが同社の試算によると、1時間分の音声・動画をテキスト化する作業の所要時間は約5時間掛かることもあり、長時間労働の一因になっているという。P-VoTでこれを約1.5時間にまで短縮し、業務改善につなげるとしている。

　P-VoTはブラウザベースのサービス。ユーザーが取材現場で記録した音声・動画のファイルをクラウド上にアップロードすると、同社の高精度音声認識装置が内容を分析し、専用Webサイトにテキストを表示する。音声認識には、ディープニューラルネットワーク（DNN）技術を使用している。

☆出典は：

世界の新製品とビジネストレンド情報

広範囲のweb情報を検索し常に新鮮な情報をお届けします。事業の新企画、スタートアップに活用下さい。

マスコミの味方!?　音声・映像をAIで「自動文字起こし」　手作業の時間を3分の1以下に