BMS
ホーム > 取り扱い製品 > プロダクツ最前線探訪(2) 汎用知的音声合成システム ”ボイスソムリエ ネオ” 

プロダクツ最前線探訪(2) 汎用知的音声合成システム ”ボイスソムリエ ネオ” 

2010 年 10 月 4 日 admin

月刊FDI 2010. 10月号の記事より一部抜粋です  月刊FDIホームページはこちら

◆音声合成システム、「ボイスソムリエ ネオ」を使用してみて

使用したソフトは日立製作所中央研究所が開発し、日立ビジネスソリューションが2010年9月に発表、10月より2音声版の製品リリースを開始する「ボイスソムリエ ネオ」で、WindowsXP以上のOSで動作するテキストファイルからの音声合成ソフトウェアである。

この製品は、従来の「ボイスソムリエ」と、インターフェースや操作性は殆ど同じであるものの、製品の心臓部ともいえる「音声合成エンジン」においては、最適な音声素片(音声を細分化したもの)を効率良く選択し滑らかに接続する研究がなされた製品で、その意味においてはまったく別物であり、以前の製品と比較すると、聴感上において、驚異的な音質の改善がなされている。

筆者は、試しに、既に文書化されている、幾つかのテキストファイルからWAVデータを制作するのに使用した。インストールして立ち上げた直後の画面上のインターフェイスは、従来の「ボイスソムリエ」と同様、プルダウンのメニュー表示も含めて、一見して理解しやすい日本語の表記となっている。読み上げのための文字データは、MSワードなどで作成した文章ファイルをコピーして読み込んだり、ボイスソムリエの読み上げテキストの画面上で直接入力することも可能である。

登録してある文章を読み出し、データ保存あるいはWAV形式の音声データにする一連の操作は、日頃PCを使い慣れている人であれば、ほとんどマニュアル類を見なくても作業が進められるほど至ってわかり易く、文字を入力した後に、「再生」というボタンをクリックすると、すぐに自動的に「読み解析」が始まり、ひと通り文章の最後まで解析が終わると合成音声が流れてくる。

また、漢字仮名まじりの状態の元のテキストファイルデータがどのような音声ファイルとして認識されているかは赤い文字で表示され、よくありがちな名前などの固有名詞の読み間違いも発見しやすく、数字の読み上げにおいては、単純に「123456」などと入力しても、読み方が「じゅうにまんさんぜんよんひゃくごじゅうろく」という認識がなされる機能が付いており、日本語の読み分けの辞書も強力で、「東京の日本橋」「大阪の日本橋」というような文を入力した場合においては、前者を「とうきょうのにほんばし」と読み、後者を「おおさかのにっぽんばし」と読むなど、様々な設定により日本語独特の読み方に自動的に変換される。

男女2種類の声の種類の設定のほかに、「話速」「アクセント」「声の高さ」「声の抑揚」などの調整機能は全文にわたって一括で行う事も、または単文や文節単位でも設定が可能である。簡単な操作でとりあえず音声としてWAVまでの出力が出来るだけでなく、また、1文字ずつを母音と子音に分けて周波数や長さなどを変更する等のカスタマイズができる機能も備わっている。

Related posts:

  1. 音声合成システム、「ボイスソムリエ」を使用してみて
  2. ボイスソムリエ ネオ Ver.1.1 販売開始
コメントは受け付けていません。