BMS

即時性と音声品質について

2009 年 12 月 21 日 このページを印刷 このページを印刷

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ」その3

 テキストファイルからの自動解析処理によって即時に生成された音声ファイルの読みは、元の文章に文法的な誤りがなく、固有名詞が少ないものであれば、誤差なく高い精度で認識された

 このために、即時性を優先させるような場合にもスピーディーに対応できると思われ、また、そのような使用時に際しても各機能の操作方法は理解しやすい。

 総じて、この製品で生成されたWAV形式の音声は、かつてのロボットのような機械的な合成音声の質とは一線を画し、DVDの音声データを吹き替えるといった使用目的においては文言の部分的なカスタマイズを行うことにより使用に耐えうる品質であった。

微妙な音の長さ / 高さ調整機能

微妙な音の長さ / 高さ調整機能

 ただし、文章の内容によって、また原文テキストの区切り方、あるいは連続した1つの長文などの場合は多少不自然な発音の箇所が見受けられたが、これも、後処理での各種設定により若干の変更を施せば、ナレーター代わりの音声データとして使用することが可能と思われる。

 音声に感情を込めて話をする用途ではなく、淡々とした話し方をするようなニュース番組や、決まった尺に音声を収めるといった利用方法で、映像と文字テロップが主体の深夜番組などの制作ニーズが最も適した使用方法であろう。

 現状でも使用目的によってプロユースに耐えうる品質であり、業界内でのより一層の利用が見込まれる。

コメントは受け付けていません。