アーカイブ

2009 年 11 月 のアーカイブ

即時性と音声品質について

2009 年 11 月 1 日 admin コメントはありません

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ」その3

 テキストファイルからの自動解析処理によって即時に生成された音声ファイルの読みは、元の文章に文法的な誤りがなく、固有名詞が少ないものであれば、誤差なく高い精度で認識された

 このために、即時性を優先させるような場合にもスピーディーに対応できると思われ、また、そのような使用時に際しても各機能の操作方法は理解しやすい。

 総じて、この製品で生成されたWAV形式の音声は、かつてのロボットのような機械的な合成音声の質とは一線を画し、DVDの音声データを吹き替えるといった使用目的においては文言の部分的なカスタマイズを行うことにより使用に耐えうる品質であった。

微妙な音の長さ / 高さ調整機能

微妙な音の長さ / 高さ調整機能

 ただし、文章の内容によって、また原文テキストの区切り方、あるいは連続した1つの長文などの場合は多少不自然な発音の箇所が見受けられたが、これも、後処理での各種設定により若干の変更を施せば、ナレーター代わりの音声データとして使用することが可能と思われる。

 音声に感情を込めて話をする用途ではなく、淡々とした話し方をするようなニュース番組や、決まった尺に音声を収めるといった利用方法で、映像と文字テロップが主体の深夜番組などの制作ニーズが最も適した使用方法であろう。

 現状でも使用目的によってプロユースに耐えうる品質であり、業界内でのより一層の利用が見込まれる。

音声合成システム、「ボイスソムリエ」を使用してみて

2009 年 11 月 1 日 admin コメントはありません

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ」その2

使用したソフトは日立製作所中央研究所が開発し、日立ビジネスソリューションが2007年春に発売を開始した「ボイスソムリエVer.1.0」(注・現在はVer2.4)で、Windows XPで動作するテキストファイルからの音声合成ソフトウェアである。

ボイスソムリエの提供モデル

既に英語で録音されているDVD映像から日本語版への音声の吹き替えのためのWAVデータを制作するのに使用した。 用いたのは女性3種類、男性2種類の音声が出力できる「ビジネスユースモデル」で、DVDにてインストーラが供給され、USBキーをコピープロテクトとして付属している製品である。

続きを読む…

音声合成技術の歴史と現状

2009 年 11 月 1 日 admin コメントはありません

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ

ボイスソムリエ

 人間の声を機械的に発声する、いわゆる合成音声の技術は、電気信号による処理が発明されたはるか以前の西暦1000年頃から様々な方法で試みられていた模様で、電子式ではあるが、デジタル処理によらない音声分析・音声合成のマシンと呼べるものは、今からおよそ70年ほど前のベル研究所のヴォコーダー(Vocoder)にさかのぼる。

フォルマント合成」による合成音声の技術については、今から20年以上前からPC(パーソナルコンピュータ)上、あるいはPCベースのハードウェアで動作する音声合成システムの技術があり、その一部はパッケージソフトとして売られたり、OSに予め付属されて販売されていた。 

 しかし、PC上で作られた当初の合成音声は、明らかに機械的・ロボット的な「音の羅列」のような聴感で、およそ人間の肉声とは程遠いものが多く、プロのナレーターの代わりに使用するとなると、大変難しい状況であった。

 ところが、この数年のうちに開発された日本語の合成音声の技術はめざましい発展をとげ、肉声との区別が付きにくいばかりか、「アクセントやイントネーションが編集できる製品」や、「男女5種類の声が使い分けられるといった製品」も出現し、昨年あたりからパッケージとして販売されている。

続きを読む…