Skip to content

Version 0.8.4

Compare
Choose a tag to compare
@kohya-ss kohya-ss released this 24 Feb 12:18
· 128 commits to main since this release
e69d341

Feb 24, 2024 / 2024/2/24: v0.8.4

  • The log output has been improved. PR #905 Thanks to shirayu!

    • The log is formatted by default. The rich library is required. Please see Upgrade and update the library.
    • If rich is not installed, the log output will be the same as before.
    • The following options are available in each training script:
    • --console_log_simple option can be used to switch to the previous log output.
    • --console_log_level option can be used to specify the log level. The default is INFO.
    • --console_log_file option can be used to output the log to a file. The default is None (output to the console).
  • The sample image generation during multi-GPU training is now done with multiple GPUs. PR #1061 Thanks to DKnight54!

  • The support for mps devices is improved. PR #1054 Thanks to akx! If mps device exists instead of CUDA, the mps device is used automatically.

  • The --new_conv_rank option to specify the new rank of Conv2d is added to networks/resize_lora.py. PR #1102 Thanks to mgz-dev!

  • An option --highvram to disable the optimization for environments with little VRAM is added to the training scripts. If you specify it when there is enough VRAM, the operation will be faster.

    • Currently, only the cache part of latents is optimized.
  • The IPEX support is improved. PR #1086 Thanks to Disty0!

  • Fixed a bug that svd_merge_lora.py crashes in some cases. PR #1087 Thanks to mgz-dev!

  • DyLoRA is fixed to work with SDXL. PR #1126 Thanks to tamlog06!

  • The common image generation script gen_img.py for SD 1/2 and SDXL is added. The basic functions are the same as the scripts for SD 1/2 and SDXL, but some new features are added.

    • External scripts to generate prompts can be supported. It can be called with --from_module option. (The documentation will be added later)
    • The normalization method after prompt weighting can be specified with --emb_normalize_mode option. original is the original method, abs is the normalization with the average of the absolute values, none is no normalization.
  • Gradual Latent Hires fix is added to each generation script. See here for details.

  • ログ出力が改善されました。 PR #905 shirayu 氏に感謝します。

    • デフォルトでログが成形されます。rich ライブラリが必要なため、Upgrade を参照し更新をお願いします。
    • rich がインストールされていない場合は、従来のログ出力になります。
    • 各学習スクリプトでは以下のオプションが有効です。
    • --console_log_simple オプションで従来のログ出力に切り替えられます。
    • --console_log_level でログレベルを指定できます。デフォルトは INFO です。
    • --console_log_file でログファイルを出力できます。デフォルトは None(コンソールに出力) です。
  • 複数 GPU 学習時に学習中のサンプル画像生成を複数 GPU で行うようになりました。 PR #1061 DKnight54 氏に感謝します。

  • mps デバイスのサポートが改善されました。 PR #1054 akx 氏に感謝します。CUDA ではなく mps が存在する場合には自動的に mps デバイスを使用します。

  • networks/resize_lora.py に Conv2d の新しいランクを指定するオプション --new_conv_rank が追加されました。 PR #1102 mgz-dev 氏に感謝します。

  • 学習スクリプトに VRAMが少ない環境向け最適化を無効にするオプション --highvram を追加しました。VRAM に余裕がある場合に指定すると動作が高速化されます。

    • 現在は latents のキャッシュ部分のみ高速化されます。
  • IPEX サポートが改善されました。 PR #1086 Disty0 氏に感謝します。

  • svd_merge_lora.py が場合によってエラーになる不具合が修正されました。 PR #1087 mgz-dev 氏に感謝します。

  • DyLoRA が SDXL で動くよう修正されました。PR #1126 tamlog06 氏に感謝します。

  • SD 1/2 および SDXL 共通の生成スクリプト gen_img.py を追加しました。基本的な機能は SD 1/2、SDXL 向けスクリプトと同じですが、いくつかの新機能が追加されています。

    • プロンプトを動的に生成する外部スクリプトをサポートしました。 --from_module で呼び出せます。(ドキュメントはのちほど追加します)
    • プロンプト重みづけ後の正規化方法を --emb_normalize_mode で指定できます。original は元の方法、abs は絶対値の平均値で正規化、none は正規化を行いません。
  • Gradual Latent Hires fix を各生成スクリプトに追加しました。詳細は こちら