AquesTalkPlayer マニュアル
「AquesTalkPlayer」は、AquesTalk音声合成エンジンを使ったWindowsアプリです。
簡単な操作でテキストの読み上げや、WAVファイルに書き出すことができます。
このアプリの概要は、こちらを参照してください。
はじめに
- インストール
- ダウンロードしたパッケージ(aquestalkplayer_yymmdd.zip)を任意のフォルダに展開します。
- 実行
- AquesTalkPlayer.exe をダブルクリック等で実行します。また、コマンド実行を使ってバッチや他のアプリから画面を開かずに実行することもできます。
- アンインストール
- インストール時に展開した aquestalkplayer フォルダを削除します
メニュー
- ファイル/開く
- 既存のテキストファイルを開きます。テキストファイルの文字コードはSJIS、改行はCR+LFです。
- ファイル/上書き保存
- テキストボックスの内容をテキストファイルに出力します。
- ファイル/名前を付けて保存
- テキストボックスの内容をテキストファイルに名前を付けて出力します。
- 編集/音声記号列に変換
- テキストボックスのテキストを音声記号列に一括変換します。音声記号列は行頭に"#>"が付与されます。
- 編集/アクセント記号を追加
- アクセント記号や区切り記号などの特殊記号をテキスト欄のキャレット位置に1文字挿入します。
- 再生/Play
- 読み上げを開始します。
- 再生/Stop
- 読み上げを終了します。
- 再生/Wav Save
- WAVEファイルに保存します。
*同名のボタンと同じ動作です。
- その他/ユーザ辞書設定
- ユーザー辞書を編集する画面が開きます
- その他/環境設定
- WAVファイルのフォルダ指定や前後の無音区間の長さを設定します
- その他/ライセンス設定
- 使用ライセンスキーを設定します
- その他/バージョン情報
- バージョンを表示します
- その他/オンラインヘルプ
- マニュアルページをブラウザで開きます
基本画面
- テキストボックス
- 読み上げるテキストを入力します。キーボードやマウスで編集が可能です。 Ctrl+C Ctrl+V Ctrl+X Ctrl+A などコピペの主だったショートカットが使えます。 マウスや矢印キーで範囲選択ができます。 行単位で音声記号列を指定することもできます。 音声記号列は行頭に"#>"を付与することでテキストと区別します。
- Playボタン(F5)
- テキストの先頭から読み上げを開始します。 範囲が選択されている場合は、選択範囲を読み上げます。
- Stopボタン(F6)
- 読み上げを終了します。
- Wav Saveボタン(F10)
- テキストが選択されている場合は選択部分を、それ以外はテキスト全体をWAVファイルに出力します。 環境設定の「WAV出力時に自動でファイル名を付ける」がチェックされているときは、環境設定の「WAV出力」のフォルダに出力されます。チェックされていないときは、出力ファイルを指定する画面が表示されます。
- プリセット名
- 設定済みのプリセット(パラメータ設定を登録したもの)を選択します。 これにより、パラメータの内容がプリセットの内容で反映されます。なお、プリセットは修正・追加・削除できます。
- Setボタン
- 現在のパラメータを、表示されているプリセット名で設定します。
- Addボタン
- 現在のパラメータを、新しいプリセット名で追加します。プリセット名を入力する画面が表示されます。
- Delボタン
- 表示されているプリセットを削除します。なお、プリセット名「デフォルト」は削除できません。
- 声種
- 音声合成エンジンと声種の組み合わせのリストの中から選択します。
- 棒読み
- これをチェックすると、アクセント記号が無視されます。
アクセントがすべて平板型になり、棒読みらしくなります。 - 話速
- 読み上げの速度を指定(50-300 標準100)
- 音量
- 音量を指定(0-300 標準100)
100以上は歪みます。これを効果として使うのも良いでしょう。 - 高さ
- 声の高さを指定(20-200 標準100)AquesTalk10のみ
- アクセント
- アクセントの大きさを指定(0-200 標準100)AquesTalk10のみ
- 声質
- 声質を指定(0-200 標準100)AquesTalk10のみ。
体の大きさのようなイメージです。 - 音程
- テープの早回しのような効果を指定(50-200 標準100)
実際は、サンプリング周波数を変更しているため、話速にも影響します。 - メモ
- 任意のテキストを記入します。プリセットの覚書としてお使いください。
- ステータスバー
- WAVファイルの出力完了時やエラーメッセージを最下部に表示します。
ユーザ辞書設定画面
メニュー その他/ユーザ辞書設定 より
- リスト
- 表記:単語の表記を指定
読み:単語の読みを音声記号列で指定。アクセント記号も付与可能
品詞:単語の品詞を指定。品詞を指定することにより形態素解析の精度が高まります。
左クリックで1単語選択
右クリックでポップアップメニュー表示 - 追加ボタン
- 単語を追加します。単語の編集画面が表示されます。
- 編集ボタン
- 選択している単語を編集します。単語の編集画面が表示されます。
- 削除ボタン
- 選択している単語を1つ削除します。
- インポートボタン
- CSVファイルからリスト一覧を読み込みます。
あらかじめ外部で構築されたユーザ辞書の情報を取り込むのに使用します。 - エクスポートボタン
- リスト一覧をCSVファイルとして出力します。
ユーザ辞書情報を共有したり外部アプリで編集するのに使用します。 - 保存ボタン
- リストの内容でユーザ辞書(aq_user.dic)を更新します。
リストの内容を編集しただけで、保存ボタンを押下しないと、ユーザ辞書に反映されません。 - 戻るボタン
- ユーザ辞書設定を終了します。
単語編集(追加)画面
ユーザ辞書設定画面 「編集」/「追加」ボタン より
- 表記
- 単語の表記を指定します。
- 読み
- 単語の読みを音声記号列で指定します。アクセント記号も付与可能。「ヂ」「グァ」など指定できない文字があるので注意。詳しくは音声記号列仕様書を参照。
- 品詞
- 単語の品詞を選択します。
- Playボタン
- 読みに指定した音声記号列を音声で再生。発音やアクセントのチェックに使用できます。
環境設定画面
メニュー その他/環境設定 より
- 長文でポーズを自動挿入する
- チェックすると、テキスト解析時に読点(ポーズ)を適宜挿入して音声合成します(デフォルト)。
チェックしないときは自動挿入しません。極端に長い文ではエラーになる場合があります。 - WAV出力時に自動でファイル名をつける
- チェックすると、"Wav Save"時にファイル名を自動で付与して出力します。
チェックしないときは、出力ファイル名を指定する画面を表示します。 - WAV出力先フォルダ
- WAVファイルを出力するフォルダ(ディレクトリ)を指定します。
- 先頭の無音区間
- 先頭に指定長さの無音区間を挿入します。文単位ではなく音声合成の単位で挿入します。
サウンド再生環境によって頭が途切れる場合は、適当な値を指定します。 - 最後の無音区間
- 最後に指定長さの無音区間を挿入します。文単位ではなく音声合成の単位で挿入します。
読み上げ、WAVファイルとも影響します。 - サンプリング周波数を一定にする
- チェックを外すと、声種や音程パラメータによってサンプリング周波数が異なります(デフォルト)。
チェックすると、下のサンプリング周波数になるようにサンプリング周波数変換を行います。 - サンプリング周波数
*「サンプリング周波数を一定にする」チェック時に有効
ここで指定したサンプリング周波数で出力されます。
44.1KHzと48KHzのいずれかを選択します。- リサンプリング手法
*「サンプリング周波数を一定にする」チェック時に有効
サンプリング周波数変換のアルゴリズムを下記から選択します。
Sinc (デフォルト):オリジナルの音質を維持したままリサンプリングします。
AqResampleライブラリを使っています。
Qubic:3次多項式で補間します。高域の折り返し雑音が増えます。
YMM4のデフォルト設定と同等です。
Linear:線形補間します。
高域の折り返し雑音が多く、特に元のサンプリング周波数が低いAquesTalk1/2ではオリジナルの声質と異なりシャリシャリした印象になります。AviUtilと同等です。
多重起動について
複数起動できますので、パラメータの調整の際に、複数開いて聞き比べを行うことができます。
コマンド実行
AquesTalkPlayer.exeを引数を指定して呼び出すことで、画面を表示せずに読み上げやWAVファイル出力ができます。バッチコマンドや他のアプリケーションから呼び出して使用できます。
引数
- /T "テキスト"
- 読み上げるテキストを指定。 音声記号列で指定する場合は先頭行に"#>" を指定
- /F "テキストファイル名"
- 読み上げるテキストファイル名を指定。
- /P "プリセット名"
- プリセットを使用する場合に指定する。指定しない場合は、最後にGUIで指定したプリセット名が使われる。
- /W "WAVファイル名"
- 読み上げないで、WAVファイルに出力。
/Tなどのオプションと"テキスト"などの間は半角スペースを入れる
/Tまたは/F が指定された場合は、起動後に読み上げ開始し、読み上げ終了後にアプリ終了 ウインドウは開かない
/P /Wは /Tまたは/F が指定された場合に限り有効
ファイル名はフルパスで指定する。
使用例
- GUIが開く通常の起動(画面が開く)
- >AquesTalkPlayer.exe
- 起動してテキストファイルを開く(画面が開く)
- >AquesTalkPlayer.exe C:¥sample.txt
- 引数に指定のテキストを読み上げる(画面は開かない)
- >AquesTalkPlayer.exe /T "ゆっくりしていってね"
- 引数に指定の音声記号列を、プリセット名"機械"の声で読み上げる
- >AquesTalkPlayer.exe /P "機械" /T "#>カブ_シキガ'イシャ/アクエ'_スト。"
- 引数に指定のテキストファイルを、プリセット名"まりさ"の声で、指定のWAVファイルに出力
- >AquesTalkPlayer.exe /F "C:¥sample.txt" /P "まりさ" /W "C:\output.wav"
コマンド実行の場合、読み上げやWAVファイル出力が終了した時点で終了します。
ただし、近年のコマンドプロンプトはコマンドを非同期(別プロセス)で実行するので、同期を試す場合は以下のように指定します。
- >start /wait AquesTalkPlayer.exe /T "ゆっくりしていってね"
コマンド実行でエラーが生じたときは、アプリの戻り値にエラーコードが返ります
- >start /wait AquesTalkPlayer.exe /P "hoge" /T "ゆっくりしていってね"
>echo %ERRORLEVEL%
2021
エラーコード(戻り値)
戻り値 | 説明 |
---|---|
2000 | 予期せぬエラー |
2001 | システム辞書(aqdic.bin)が不正 |
2002 | ユーザ辞書(aq_user.dic)が不正 |
2003 | AqKanji2Koe初期化エラー |
2004 | 音声記号列が指定されていない |
2005 | DLLのロード失敗 |
2006 | 不正なDLL |
2007 | PHONTファイルの読み込み失敗 |
2008 | 音声記号列に未定義の読み記号が指定された |
2009 | 音声記号列のタグの指定が正しくない |
2010 | 発話文が長すぎる |
2011 | Phontファイルが不正 |
2012 | 音声記号列が正しくない? |
2013 | メモリ不足 |
2014 | テキストが空文 |
2015 | AqKanji2Koe変換エラー |
2016 | WAVファイルの書き込みができない |
2017 | プリセットファイルが壊れてる |
2018 | プリセットファイルが開けない |
2019 | プリセット名の指定が正しくない |
2020 | プリセットファイルの書き込み失敗 |
2021 | 指定のプリセット名が見つからない |
2022 | 指定のテキストファイルが開けない |
サポート
不具合、要望等は、以下の掲示板にお寄せください。