トップページ > 過去ログ > 記事閲覧
促音、長音の扱い
日時: 2007/08/06 16:09
名前: ラッキー

Linux版を購入して使用しているラッキーと申します。
こんにちは。お世話になっております。
前の類の質問のご回答を、本当にありがとう
ございました。

すみません。
Linux版を使っていて、分からない点があり教えて頂き
たいことがありまして書き込みさせて頂きます。

「アー、アー、イー、イー、ウーッ」
という文が、あるNETの新聞記事の中にありました。

UNIX版だと、
「アー、アー、イー、イー、ウーッ」
は読まないのですが、
「アー、アー、イー、イー、ウー」
とすると読みました。

フリーWindows版のサンプルアプリ
AquesTalk\bin\AqTkApp.exeでは、
どちらも、読み上げ可能です。

促音の処理については、難しく長音の
後に来る場合も、あり得ます。

例えば「購入って難しい」の場合、
「こーにゅーって」になります。
このため、長音の後に促音が来ないという
ロジックでは対応できません。

例えば、読めない文字列は、エラーにしない
で、読み飛ばすような形になればうれしい
のですが。

すみません。よろしく、お願い致します。

Page: 1 |

Re: 促音、長音の扱い ( No.1 )
日時: 2007/08/08 03:45
名前: ラッキー

ラッキーです。お世話になっております。

促音「っ」の件で、追加情報です。
促音「っ」の直後が、「。」「、」「;」などだと、
エラーを返して読まないのではないかと思われます。

例えば、朝日新聞の社説2007年8月7日の社説に
「内野席を覆う鉄傘(てっさん)は軍に供出を求められた。」という文がありました。
この読みとして、「て'っ;さんわ。」のようにすると、処理されません。

また、
headlines.yahoo.co.jp/hl?a=20070807-00000017-mai-soci
に、「<朝ズバッ!>7日放送で改めて謝罪」
とあったのですが、
「あさずば'っ。」のようにすると、やはり読ま
ないようです。

Re: 促音、長音の扱い ( No.2 )
日時: 2007/08/08 03:50
名前: ラッキー

ラッキーです。お世話になっております。
ここで、ユーザの立場から見た勝手な意見です。
@(_ _)@

読めない文字が1つ入っているだけで、エラー
を返して読まない形になるより、もしも可能で
あれば、多少変であっても、読めない文字を
読み飛ばして読んでくれると本当に助かります。

「、」や「;」間のやたらと長い場合にも、可能
であれば、エラーになるのでなく、勝手に息継ぎ
してくれて処理してくれるような形だとありが
たいのではと思います。

たぶん、音声で読ませたいと思っているので、
エラーで返されるのは、あまりうれしくない
と思うユーザが多いと思います。実際音声の
場合には、流れていってしまうので、多少お
かしくなっても、声が出てくれた方がはるか
にうれしいと思います。

すなわち、エラーを内部的に返すのは良いとは
思うのですが、音声は何らかの形で、作成され
た方が、使う立場になると非常にありがたいと
思います。

テキスト音声合成での利用をしているので、
ある文だけ読まない文が発生してしまうように
なるので、利用者側からみると困っているとい
う感じです。

また、ユーザは、合成器の詳しい仕様を知って
いるのではないので、どのような場合にエラー
を返してしまうのか、予測が付かないので、
全てのエラーに対応するように言語処理側で、
コントロールするのは困難な気もします。

a-questは、大変素晴らしいシステムだと思う
のですが、ユーザ側から見て、エラー発生時
の処理をどうするかを選択可能にして頂けると
より、素晴らしくなるのではと思います。

よろしく、お願い致します。
Re: 促音、長音の扱い ( No.3 )
日時: 2007/08/09 11:33
名前: 管理人

促音、長音について詳しい情報および、ご指摘ありがとうございます。

促音「っ」の後に 。、;を続けるとエラー(記号列が正しくない)を返すことを、こちらでも確認いたしました。
これは、語末に「っ」が使われることを想定していなかったため、このような結果を返しています。
将来的にはエラーを返さないように修正するかもしれませんが、現状では仕様ということでご理解いただければと思います。
他にも長音記号で始めた場合など特殊なパタンではエラーを返す場合があるかと思います。

この辺りの制限事項については、いずれまとめたいと思っておりますが、どうしても想定の範囲をこえた入力列もありますので、読めない記号列の並びがありましたら、適時ご指摘いただければ幸いです。

また、処理できない入力に対して、エラーを返しながら音声波形も可能な限り生成するというアイデアにつきましては、一理あると思います。
しかしながら、エラーの生じた入力をどのように解釈して音声に変換するかを考えていくと、アルゴリズム上の複雑さが増し、結果に対して不確定さを生じる原因となりますので、これがさらなる混乱の原因となる可能性も否定できません。

話は戻りますが、

ラッキーさんのように、漢字かな混じり文からのTTSとしてのシステムを構築する場合は、今回の語末の促音のような制限事項に関して、まとまった情報があれば有用かと思います。
こちらで気がつかなかった読めない記号列のパタンもあると思いますので、もし、そのようなパタンを見つけたらこのBBSにアップいただければ幸いです。
Re: 促音、長音の扱い ( No.4 )
日時: 2007/08/09 23:53
名前: ラッキー

ラッキーです。お世話になっております。

どうも、ご回答をありがとうございます。
制限事項になりそうなパターンは、気が
付いたものは、できるだけ載せたいと思
います。

ということで・・・
促音「っ」についてですが、例えば
「えっっ、そんな。」
のように、促音が2つ以上連続する場合にも、
エラーを返すことが分かりました。

ブログのような柔らかい文章だと、とんでも
ない文が多く入っているので、色々と言語処
理からみても、困りものですね。
Re: 促音、長音の扱い ( No.5 )
日時: 2007/08/19 19:01
名前: 管理人
参照: http://www.a-quest.com/aquestalk/

本件に関して、現状のAquesTalkライブラリでの読み記号列の指定方法の制限についてまとめたものを、ドキュメント:音声記号列仕様の以下の項目に追加しました。
3.8. 読み記号並びの制限


AquesTalkのページ左側のリンクから参照ください。(AquesTalk パッケージ内のドキュメントは旧来のままとなってます)

Page: 1 |