Re: エラーを返す発音記号等について ( No.1 ) |
- 日時: 2021/06/08 16:53
- 名前: 管理人
- 「ちょ」は発音できます。
エラーは、「!」が原因だとおもいます。
音声記号列は、表記のための日本語テキストとは 根本的に異なるとの認識でお使いください。
日本語テキストから音声記号列への変換には、 AqKanji2Koeライブラリが用意されています。
|
Re: エラーを返す発音記号等について ( No.2 ) |
- 日時: 2021/06/08 21:54
- 名前: さえ
- 返信ありがとうございます。
!等記号は、DLLに渡す前に変換しています。以下変換表です。 static char *ZENERRKIGOU = "! # * , . / : ; < = > ^ _ 〜"; static char *YOMIERRKIGOU[] = { "びっく\'り", "しゃ\'ーぷ", "あ\'すた", "か\'んま", "どっと", "すら\'っしゅ", "こ\'ろん", "せみこ\'ろん", "しょ\'ーなり", "いこ\'ーる", "だ\'いなり", "は\'っと", "あ\'んだー", "から" }; !は、結構うるさいくらい びっくり と発音されています。 !!!など重なると辛いくらい
DLLに渡している発音バッファには”チョ”だけでした。その際のスクリーンショットが残っています。 文章は形態素解析LibのMeCabで語彙単位に分解、あまり長くならないように御社DLLに渡しています。 まだ、辞書のチューニングに苦労しています。 御社の日本語テキストから音声記号に変換するライブラリは 行った(いった) と 行った(おこなった)の 適切な判別は可能ですか? 区別方法が知りたいです。たぶん1文字前が'に''へ'ならいった、'を'ならおこなったとか? 最初Softalkを試したのですが、xx様(さま)をxxよう と発音し、ユーザー辞書登録しても治らなかったのと、 ユーザ辞書のソートが用途に合ってなかった(同じ文字列で始まる語彙は、長い語彙を優先しないといけないのに、 短い方が先になっているので、短い語彙の読みしか出てこない、手動並び替えで改善できるがソートしたら元通り・・・) ので自作に走っています。
Windows用ライブラリを、ユニコード(UTF-16LE)で渡せるようになりませんか?
|
|