BMS
ホーム > 取り扱い製品 > 音声合成技術の歴史と現状

音声合成技術の歴史と現状

2009 年 11 月 1 日 admin

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ

ボイスソムリエ

 人間の声を機械的に発声する、いわゆる合成音声の技術は、電気信号による処理が発明されたはるか以前の西暦1000年頃から様々な方法で試みられていた模様で、電子式ではあるが、デジタル処理によらない音声分析・音声合成のマシンと呼べるものは、今からおよそ70年ほど前のベル研究所のヴォコーダー(Vocoder)にさかのぼる。

フォルマント合成」による合成音声の技術については、今から20年以上前からPC(パーソナルコンピュータ)上、あるいはPCベースのハードウェアで動作する音声合成システムの技術があり、その一部はパッケージソフトとして売られたり、OSに予め付属されて販売されていた。 

 しかし、PC上で作られた当初の合成音声は、明らかに機械的・ロボット的な「音の羅列」のような聴感で、およそ人間の肉声とは程遠いものが多く、プロのナレーターの代わりに使用するとなると、大変難しい状況であった。

 ところが、この数年のうちに開発された日本語の合成音声の技術はめざましい発展をとげ、肉声との区別が付きにくいばかりか、「アクセントやイントネーションが編集できる製品」や、「男女5種類の声が使い分けられるといった製品」も出現し、昨年あたりからパッケージとして販売されている。


onair

 実際に音声合成技術は、電話の音声自動応答システムや公共施設やデパート、ショッピングセンターなどの大規模店舗での店内アナウンス、またWEBストリーミングでの利用など、各業界のジャンルで幅広く普及してきているようである。

 つまり合成音声でナレーターの代役が務まるほどの違和感のない合成音声が生成されるようになるということは、例えば、読み上げ原稿がテキストファイル形式で作成されているとPCを用いてすぐに音声データになる訳で、テレビ番組ではテロップとシンクロさせて合成音声を流すようなことが容易にできたり、また、ラジオ局においては、将来的には今までのようなスタジオを不要のものにしてしまうかもしれないといった、多用途で将来性のある製品カテゴリーである。

 今までも既に数十のメーカーから様々な合成音声の生成ソフトが発売されているが、放送業界でのプロユースに耐え得る製品となると、そのうちの数種類の製品に限られてくる。その中で、1種類を選定して実際に使用してみた。

No related posts.

コメントは受け付けていません。