トップページ > 記事閲覧
エラーを返す発音記号等について
日時: 2021/06/08 11:42
名前: さえ

長文テキストファイルを読んでくれるアプリを試作中なんですが何点かエラーNULLが返ってきます。
・「ちょ、え!?」 この文章の”ちょ”の部分でエラーになります。 発音記号表に”ちょ”は記載されているようです。
 たぶん、”ちょ”の後が’、’のためと思いますが、ちょだけでも発音できないのでしょうか?
・ちかづく ヅ でもエラーになるのですが、こちらは発音記号表に記載されていません。 ぢとヅを発音記号から外す理由があるのですか? 発音は ズ=ヅ ということでしょうか?
メンテ

Page: 1 |

Re: エラーを返す発音記号等について ( No.1 )
日時: 2021/06/08 16:53
名前: 管理人

「ちょ」は発音できます。
エラーは、「!」が原因だとおもいます。

音声記号列は、表記のための日本語テキストとは
根本的に異なるとの認識でお使いください。

日本語テキストから音声記号列への変換には、
AqKanji2Koeライブラリが用意されています。

メンテ
Re: エラーを返す発音記号等について ( No.2 )
日時: 2021/06/08 21:54
名前: さえ

返信ありがとうございます。

!等記号は、DLLに渡す前に変換しています。以下変換表です。
static char *ZENERRKIGOU = "! # * , . / : ; < = > ^ _ 〜";
static char *YOMIERRKIGOU[] = { "びっく\'り", "しゃ\'ーぷ", "あ\'すた",
"か\'んま", "どっと", "すら\'っしゅ",
"こ\'ろん", "せみこ\'ろん", "しょ\'ーなり",
"いこ\'ーる", "だ\'いなり", "は\'っと",
"あ\'んだー", "から" };
!は、結構うるさいくらい びっくり と発音されています。 !!!など重なると辛いくらい

 DLLに渡している発音バッファには”チョ”だけでした。その際のスクリーンショットが残っています。
文章は形態素解析LibのMeCabで語彙単位に分解、あまり長くならないように御社DLLに渡しています。
まだ、辞書のチューニングに苦労しています。
御社の日本語テキストから音声記号に変換するライブラリは 行った(いった) と 行った(おこなった)の
適切な判別は可能ですか? 区別方法が知りたいです。たぶん1文字前が'に''へ'ならいった、'を'ならおこなったとか?
 最初Softalkを試したのですが、xx様(さま)をxxよう と発音し、ユーザー辞書登録しても治らなかったのと、
ユーザ辞書のソートが用途に合ってなかった(同じ文字列で始まる語彙は、長い語彙を優先しないといけないのに、
短い方が先になっているので、短い語彙の読みしか出てこない、手動並び替えで改善できるがソートしたら元通り・・・)
ので自作に走っています。

Windows用ライブラリを、ユニコード(UTF-16LE)で渡せるようになりませんか?


メンテ

Page: 1 |

題名 スレッドをトップへソート
名前
URL
パスワード (記事メンテ時に使用)
コメント
CAPTCHA captcha画像 ←英数字を入力

   クッキー保存