-
Notifications
You must be signed in to change notification settings - Fork 198
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
追加:queryに無音時間調整関連のパラメータを作成 #1308
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@X-20A プルリクエストありがとうございます!
仕様に関してより良い形がありそうなので相談させてください!
isPauseLengthUseScale・・・倍率で指定するか, デフォルト値:true
pauseLength・・・絶対値で指定する場合の秒数, デフォルト値:0.3
isPauseLengthFixed・・・絶対値で指定する場合に話速を無視するか, デフォルト値:false
pauseLengthScale・・・倍率で指定する場合の乗数, デフォルト値:1
とされていますが、isPauseLengthUseScale
とisPauseLengthFixed
どちらも指定されていた場合どうなるのかなどが曖昧だと感じました!
あとこれを実現するためのパラメータはもっと減らせるように思いました。
このような形はどうでしょうか?
pauseLength・・・絶対値で指定する場合の秒数, デフォルト値:null(置き換えない)
pauseLengthScale・・・倍率で指定する場合の乗数, デフォルト値:1
以下、なくしたパラメーターの解説です!
isPauseLengthUseScale
これはpauseLengthScale=1
かそうじゃないかでfalse/trueを完全に表現できる。
同じことを表現する方法が2パターンあってしまうので、無い方がいい。(ややこしくなってしまう)
isPauseLengthFixed
迷いどころだがpauseLength=null
の時に「fixしない」とすればこのフラグが不要になる。
またisPauseLengthFixed=false
でpauseLength
に値が指定されてる場合の挙動がややこしいので、無い方がいい。
(pauseLength
を与えたのにポーズの長さが変わらない、となってしまうため)
実装イメージに食い違いがあるように感じるので確認したいのですが ・倍率で指定する この二種類に絞るということですか? |
@X-20A 指摘感謝です!! おっしゃる通りのことを考えていました! ということで実装したいのはこの2つかなと・・・! (ちなみにAPI の種類は、あらゆる可能性を想定するよりも、需要を想定してシンプルに実装する方が良いと思ってます!) |
パラメータをpauseLengthとpauseLengthScaleに絞りました |
@X-20A ありがとうございます!! ちなみにこんな感じにすればNoneを代入可能になると思います! voicevox_engine/voicevox_engine/model.py Lines 16 to 17 in d04f702
ちなみにおすすめはNoneです! |
@X-20A あ、すみません!! |
そうですね |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ほぼLGTMです!!!
ちょっと細かい点でコメントをいくつかさせていただきました!
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM!!!
いろいろ調整していただきありがとうございます!!!
ちょっとこちらで最終調整させていただこうと思います!!
voicevox_engine/preset/model.py
Outdated
pauseLength: float | None = Field(title="テキスト内の無音時間(絶対値)") | ||
pauseLengthScale: float = Field(title="テキスト内の無音時間(倍率)") |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ちょっとこのあたりの案内の変更も今のうちにさせていただこうと思います!!
(また変えさせていただくかもですが)
マージします!! エディタの方もぜひ完成できると嬉しいです!! @tarepan 音声合成クエリのパラメータが増えたので共有です 🙏 |
VOICEVOX/voicevox_engine#1308 と VOICEVOX/voicevox_engine#1425 の一部 を参考にコードを書いた。 COREへのENGINE機能移植の一環として、 @rokujyushi さんと @sabonerune さんの許諾のもと、MITライセンスとしてライセンスする。 Co-Authored-By: 黒猫大福 <[email protected]> Co-Authored-By: sabonerune <[email protected]> Refs: VOICEVOX#874 (comment) Refs: VOICEVOX#874 (comment)
内容
良く分からないことになってので整理しました
isPauseLengthUseScale・・・倍率で指定するか, デフォルト値:true
pauseLength・・・絶対値で指定する場合の秒数, デフォルト値:0.3
isPauseLengthFixed・・・絶対値で指定する場合に話速を無視するか, デフォルト値:false
pauseLengthScale・・・倍率で指定する場合の乗数, デフォルト値:1
(queryにテキスト内の無音時間を調整するための新しいパラメータ)
関連 Issue
ref #1289