音声合成は「落語」で人を笑わせられるのか?
人間の声を人工的に作る「音声合成」で、日本の伝統話芸「落語」を再現できるのか――国立情報学研究所(NII)が主催する、研究発表・公開イベント「国立情報学研究所オープンハウス2018」(6月22~23日、学術総合センター)で、こんな研究成果が展示された。
ディープラーニング技術の活用で、ここ数年で音声合成の品質は飛躍的に向上した。人間の肉声と区別がつかないような音声合成も現れている。
しかし、AI(人工知能)アナウンサーのような情報伝達の役割を重視する音声合成が実用化される一方で、小説の読み上げなど感情表現が必要になってくるものはまだ発展の余地が大きい。
特に落語は、しゃべり方、間の取り方などが独特で音声合成では再現しにくい領域だ。なぜ加藤さんは研究対象に落語を選んだのか。研究内容の詳細や課題、研究を通して見えてくるものは何なのかを聞いた。
なぜ「落語」なのか
総合研究大学院大学博士課程の加藤集平さん(山岸順一准教授の研究室に所属)は、「落語の目的はお客さんを笑わせること。落語を研究することで、まだ解明されていない音声の役割を明らかにしたい」と話す。
「人を楽しませる音声合成」の可能性を探る上で、漫才、漫談、舞台なども研究候補として挙がったという。漫才や漫談ほどアドリブがなく、落語家が1人で話す伝統話芸の落語が適切と判断した。
☆出典は: