TOP
> 記事閲覧
エラーを返す発音記号等について
| 件名 | : Re: エラーを返す発音記号等について |
| 投稿日 | : 2021/06/08 21:54 |
| 投稿者 | : さえ |
| 参照先 | : |
返信ありがとうございます。
!等記号は、DLLに渡す前に変換しています。以下変換表です。
static char *ZENERRKIGOU = "! # * , . / : ; < = > ^ _ 〜";
static char *YOMIERRKIGOU[] = { "びっく\'り", "しゃ\'ーぷ", "あ\'すた",
"か\'んま", "どっと", "すら\'っしゅ",
"こ\'ろん", "せみこ\'ろん", "しょ\'ーなり",
"いこ\'ーる", "だ\'いなり", "は\'っと",
"あ\'んだー", "から" };
!は、結構うるさいくらい びっくり と発音されています。 !!!など重なると辛いくらい
DLLに渡している発音バッファには”チョ”だけでした。その際のスクリーンショットが残っています。
文章は形態素解析LibのMeCabで語彙単位に分解、あまり長くならないように御社DLLに渡しています。
まだ、辞書のチューニングに苦労しています。
御社の日本語テキストから音声記号に変換するライブラリは 行った(いった) と 行った(おこなった)の
適切な判別は可能ですか? 区別方法が知りたいです。たぶん1文字前が'に''へ'ならいった、'を'ならおこなったとか?
最初Softalkを試したのですが、xx様(さま)をxxよう と発音し、ユーザー辞書登録しても治らなかったのと、
ユーザ辞書のソートが用途に合ってなかった(同じ文字列で始まる語彙は、長い語彙を優先しないといけないのに、
短い方が先になっているので、短い語彙の読みしか出てこない、手動並び替えで改善できるがソートしたら元通り・・・)
ので自作に走っています。
Windows用ライブラリを、ユニコード(UTF-16LE)で渡せるようになりませんか?
!等記号は、DLLに渡す前に変換しています。以下変換表です。
static char *ZENERRKIGOU = "! # * , . / : ; < = > ^ _ 〜";
static char *YOMIERRKIGOU[] = { "びっく\'り", "しゃ\'ーぷ", "あ\'すた",
"か\'んま", "どっと", "すら\'っしゅ",
"こ\'ろん", "せみこ\'ろん", "しょ\'ーなり",
"いこ\'ーる", "だ\'いなり", "は\'っと",
"あ\'んだー", "から" };
!は、結構うるさいくらい びっくり と発音されています。 !!!など重なると辛いくらい
DLLに渡している発音バッファには”チョ”だけでした。その際のスクリーンショットが残っています。
文章は形態素解析LibのMeCabで語彙単位に分解、あまり長くならないように御社DLLに渡しています。
まだ、辞書のチューニングに苦労しています。
御社の日本語テキストから音声記号に変換するライブラリは 行った(いった) と 行った(おこなった)の
適切な判別は可能ですか? 区別方法が知りたいです。たぶん1文字前が'に''へ'ならいった、'を'ならおこなったとか?
最初Softalkを試したのですが、xx様(さま)をxxよう と発音し、ユーザー辞書登録しても治らなかったのと、
ユーザ辞書のソートが用途に合ってなかった(同じ文字列で始まる語彙は、長い語彙を優先しないといけないのに、
短い方が先になっているので、短い語彙の読みしか出てこない、手動並び替えで改善できるがソートしたら元通り・・・)
ので自作に走っています。
Windows用ライブラリを、ユニコード(UTF-16LE)で渡せるようになりませんか?

・「ちょ、え!?」 この文章の”ちょ”の部分でエラーになります。 発音記号表に”ちょ”は記載されているようです。
たぶん、”ちょ”の後が’、’のためと思いますが、ちょだけでも発音できないのでしょうか?
・ちかづく ヅ でもエラーになるのですが、こちらは発音記号表に記載されていません。 ぢとヅを発音記号から外す理由があるのですか? 発音は ズ=ヅ ということでしょうか?