BMS
ホーム > 取り扱い製品 > 音声合成システム、「ボイスソムリエ」を使用してみて

音声合成システム、「ボイスソムリエ」を使用してみて

2009 年 11 月 1 日 admin

月刊FDI 2008. 3月号の記事より抜粋です  月刊FDIホームページはこちら

プロダクツ最前線探訪 音声合成システム「ボイスソムリエ」その2

使用したソフトは日立製作所中央研究所が開発し、日立ビジネスソリューションが2007年春に発売を開始した「ボイスソムリエVer.1.0」(注・現在はVer2.4)で、Windows XPで動作するテキストファイルからの音声合成ソフトウェアである。

ボイスソムリエの提供モデル

既に英語で録音されているDVD映像から日本語版への音声の吹き替えのためのWAVデータを制作するのに使用した。 用いたのは女性3種類、男性2種類の音声が出力できる「ビジネスユースモデル」で、DVDにてインストーラが供給され、USBキーをコピープロテクトとして付属している製品である。

 インストールして立ち上げた直後の画面上のインターフェイスは、プルダウンのメニュー表示も含めて、一見して理解しやすい日本語の表記となっている。

 読み上げのための文字データは、MSワードなどで作成した文章ファイルをコピーして読み込んだり、ボイスソムリエの読み上げテキストの画面上で直接入力することも可能である。

 登録してある文章を読み出し、データ保存あるいはWAV形式の音声データにする一連の操作は、ほとんどマニュアル類を見なくても作業が進められるほど至ってシンプルで、文字を入力した後に、「再生」というボタンをクリックすると、すぐに自動的に「読み解析」が始まり、ひと通り文章の最後まで解析が終わると合成音声が流れてくる。

 一度に処理出来る文字数は20,000文字もしくは300行であり、それを超えた場合には超えた分の文章は削除されるが、20,000文字以上の長い文章の場合でも、WAV形式のデータを映像編集ソフトなどで接合すれば問題はない。

GUIによる発音調整機能

 また、漢字仮名まじりの状態の元のテキストファイルデータがどのような音声ファイルとして認識されているかは赤い文字で表示され、よくありがちな名前などの固有名詞の読み間違いも発見しやすく、また特筆すべきは数字の読み上げで、単純に「123456」などと入力しても、読み方が「じゅうにまんさんぜんよんひゃくごじゅうろく」という認識がなされるなど、設定により日本語独特の読み方に自動的に変換される。

 男女5種類の声の種類の設定のほかに、「話速」「アクセント」「声の高さ」「声の抑揚」などの調整機能は全文にわたって一括で行う事も、または単文や文節単位でも設定が可能である。

 簡単な操作でとりあえず音声としてWAVまでの出力が出来るだけでなく、また、1文字ずつを母音と子音に分けて周波数や長さなどを変更する等のカスタマイズができる機能も備わっている。

No related posts.

コメントは受け付けていません。