HOME    PRODUCTS    TECHNOLOGY    COMPANY    SUPPORT
TECHNOLOGY
規則音声合成(3)

AquesTalkのターゲット

現在、コーパスベースと呼ばれる方式を用いた音声合成製品が多数あります。
このコーパスベースの音声合成とは、大雑把に言えば、人間の声を大量に録音してデータベース化(コーパス化)しておき、 合成するときには、ここから出来るだけ長くマッチする部分を抜き出して、それを連結して文章を生成するという方式です。 現状で最も高い合成品質が得られ、特に元の話者の声質の再現性においては抜群です。
この方式のデメリットはコーパスのデータサイズがどうしても巨大になる点です。 通常、数100Mバイトはあるでしょう。したがって、ターゲットプラットフォームはパソコンあるいはサーバー用途になると思われます。

これに対して、AquesTalkは組み込み用途をターゲットにデザインされています。
AquesTalkでは、音節程度の短い音声素片を音韻の種類ごとに用意し、音声情報をパラメータ化することで、 約100Kバイトと他に例を見ない少ないデータサイズを実現し、リソース量と音質のバランスがとれた音声合成エンジンを実現しています。







   1 /  2 /  3