システムに音声合成機能を載せる場合、まず「言語処理」が必要か否かを検討する必要があります。
言語処理ライブラリは、漢字かな混じりのテキストを解析して、読みにアクセントを付与した音声記号列を出力します。 刻々変化するWeb情報やメールの内容を読み上げる場合には、言語処理ライブラリが必要となります。
一方、規則音声合成ライブラリは、音声記号列を入力として実際に音声波形データを生成出力します。
言語処理ライブラリは漢字に読みやアクセントを付与するために大きな辞書データが必要になりますので、どうしてもシステムの規模が大きくなってしまいます。
そのシステムで発声させるメッセージが有限個であったり、部分的な単語の差し替えですむ場合も多く、このような場合は、言語処理ライブラリを使わず規則音声合成ライブラリだけでシステムを構築することをお勧めします。メッセージをあらかじめ音声記号列に変換しておき、必要に応じて人名や商品名など一部分をプログラムで差し替えることで、非常に簡易にコンパクトでかつ柔軟な音声合成機能を実現することができます。
当社のメイン製品である、音声合成を行うためのソフトウェアライブラリです。
組み込み用途向けに開発された、テキスト情報(音声記号列)を音声波形に変換出力する、日本語の規則音声合成ライブラリです。
メールやウェブ情報の読み上げなど、動的に変化する漢字を含んだ文字列をリアルタイムに音声合成する場合には、言語処理ライブラリAqKanji2Koeを使用します。
この場合、AqKanji2Koeで任意の漢字を含んだテキストを一度音声記号列に変換してから、AquesTalkで音声波形を生成するという2段階の処理になります。
当社の言語処理および規則音声合成処理ライブラリは、それぞれ完全に独立したモジュールになっていますので、言語処理をLinuxサーバで行い、クライアントに音声記号列をネットワーク配信し、AquesTalkを内蔵したクライアント端末で音声合成を行うなどといった、複数のプラットフォーム混在など、さまざまなシステム形態に柔軟にも対応することができます。