Flux.1をForgeで効果的に利用するための詳細手順と設定について解説します。
最低限forgeのインストール、モデルの配置が完了すれば使用可能です。
Contents
Forgeのインストールとセットアップ
最新バージョンのForgeをGitHubからダウンロードします。ForgeはStable DiffusionのWebUIの一種で、特に高性能な画像生成に最適化されています。
インストールスクリプトを実行して必要な依存関係をインストールし、必要に応じて環境変数を設定します。
zipとかで落とすとエラーが出るので以下の画像部分をクリックしてインストールが簡単です。

Forgeの更新: 既にForgeがインストールされている場合は、最新のFluxモデルに対応させるため、更新が必要です。
インストールディレクトリ内のupdate.batスクリプトを実行します。これにより、新しい機能やモデルに対応したバージョンにアップデートされます。モデルを共有する前に実施が必要で、前後を間違えるとモデルの共有が再度必要になります。
・automatic1111の既存のモデルをforgeと共有する方法
ファイル名:G:\stable diffusion\webui_forge_cu121_torch231\webui
下記の”G:\stable diffusion\stable-diffusion-webui”部分を自身がすでに設定済みのautomatic1111のディレクトリに設定する。
set COMMANDLINE_ARGS=--forge-ref-a1111-home "G:\stable diffusion\stable-diffusion-webui"
Flux.1のダウンロードと配置 モデルについて
1.Flux Dev FP8 モデル ファイル名: flux1-dev-fp8.safetensors
このモデルは、VRAMが16GB以上の高性能なGPU向けです。高い精度とクオリティを提供しますが、メモリ使用量が多くなります。
2.Flux Dev NF4 モデル ファイル名: flux1-dev-bnb-nf4-v2.safetensors
このモデルは、VRAMが6GB〜12GBの低スペックGPU向けに最適化されています。4ビット量子化技術を使用しており、メモリ使用量を大幅に削減しながら高速なパフォーマンスを維持します。試しに使用する場合こちらをお勧めします。
3.Flux Schnell モデル ファイル名: flux1-schnell-bnb-nf4.safetensors
このモデルは、非常に軽量でありながら、品質を保ちながら画像生成を行うことができます。VRAMが4GB〜6GB程度のGPUでも動作可能です。商用利用も可能です。
4.モデルの配置
ダウンロードしたモデルファイル(flux1-dev-bnb-nf4-v2.safetensors等)を、Forgeのインストールディレクトリ内のmodels/Stable-diffusionフォルダに配置します。この手順を完了すると、ForgeのWebUIでモデルを選択できるようになります。
5.補足
「AssertionError: You do not have T5 state dict!」
上記のエラーようなが出た際はvaeに以下の画像の通り設定してください。
また各VAEは下記のリンクを参照下さい。

画像生成の設定 ForgeのWebUIでの設定
Forgeを起動し、WebUI上でダウンロードしたFluxモデルを選択します。WebUIのチェックポイントドロップダウンメニューから適切なモデルを選びます。
プロンプト入力: 生成したい画像の内容をプロンプトとして入力します。プロンプトの設定は画像生成の結果に大きく影響を与えるため、詳細かつ具体的なプロンプトを入力することが重要です。
例: 「ヴィクトリア朝風の建物で、天使のような白い翼を持つ美しい魔女」などといった詳細な説明を含むプロンプトが推奨されます。
画像サイズの設定: 推奨される画像サイズとして、1024×1024(正方形)、1216×832(3:2)、1344×768(16:9)などがあります。画像サイズが大きいほどメモリ消費が増加しますが、生成される画像の詳細度も向上します。小さいサイズ(例: 512×512)を選択すると、メモリ使用量が削減され、より軽量な環境での実行が可能になります。
Fluxモデルはネガティブプロンプトをサポートしていません。これは、画像生成において不要な要素を排除するためのプロンプトが使用できないことを意味します。そのため、必要な要素をより詳細に記述したポジティブプロンプトを使用することが重要です。
CFGスケール設定: CFGスケール(Classifier-Free Guidance Scale)は、生成される画像がプロンプトにどれだけ忠実であるかを制御します。通常、1〜7の範囲で設定されますが、Fluxでは1が推奨されています。これは、過度なプロンプトへの依存を避け、より自然な画像生成を行うためです。
High-Risk Fix機能: Forgeの「High-Risk Fix」機能を利用することで、より高精度な画像生成が可能ですが、その分生成時間が長くなる可能性があります。この機能は、特に複雑な画像や細かいディテールが要求されるプロジェクトで有効です。
Automatic: 自動で最適なビット精度を選択します。特に理由がなければ、これを選択することでハードウェアに最適なパフォーマンスが得られます。
bnb-nf4: 4ビット量子化を使用した設定。VRAMが6GB以下の低スペックGPUに最適です。メモリ使用量を大幅に削減できますが、画像品質がやや低下する可能性があります。
float8-e4m3fn: 8ビット浮動小数点形式で、VRAMが8GB〜12GBの中スペックGPUにおいて、メモリ効率と画像品質のバランスを最適化します。
bnb-fp4: 非常に低いビット精度での実行を可能にし、メモリ使用量を最小限に抑えます。VRAMが4GB以下の場合に有効ですが、性能や精度がさらに低下する可能性があります。
float8-e5m2: 高精度な8ビット設定。VRAMが12GB以上の高スペックGPUに最適で、最高品質の画像生成が可能です。
Swap Method:
Queue: メモリが不足した際に処理を順番に待機させる方式で、最も安定した設定です。特に、安定性を重視する場合に推奨されます。
Async: 非同期にスワップを行う設定です。パフォーマンス向上の可能性がありますが、システムが不安定になるリスクもあります。
Swap Location:
CPU: CPUメモリをスワップ先に指定します。パフォーマンスがやや低下する可能性がありますが、GPUメモリを節約できます。
Shared: GPUとCPUのメモリを共有して使用します。これにより、メモリ使用を効率的に最適化でき、特にGPUメモリが限られている環境で推奨されます。
設定の意味: GPU Weightsは、モデルの重みが使用するメモリ量を指します。これを調整することで、メモリ使用量とパフォーマンスのバランスを取ることが可能です。
推奨設定: 使用しているVRAMに応じて調整します。十分なVRAMがある場合は高く設定し、VRAMが不足している場合は低めに設定することで、メモリ不足によるクラッシュを防ぐことができます。
注意点: 設定値を高くすると、VRAMをフルに活用できるため性能が向上しますが、他のアプリケーションやシステムプロセスがVRAMを必要とする場合、不安定になる可能性があります。ですので、VRAM容量の80%~90%程度を目安に設定するのが一般的です。
最適な設定の組み合わせ
RTX4090などの環境では「Automatic」+「 Async」+「 Shared」:高性能なGPUでは、処理を並列で行うAsyncモードを利用することで、パフォーマンスを最大限に引き出せます。
RTX3060などの環境では「Automatic」+「Queue」+「Shared」: 安定性とパフォーマンスのバランスが取れた推奨設定です。これにより、様々な環境で安定した画像生成が可能です。
GTX1650などの環境では「Automatic」+「Queue」+「CPU」: メモリ使用量を最小限に抑え、システムの安定性を確保することを重視します。Queue設定とCPUへのスワップで、限られたリソースを最大限活用します。
低スペック環境: 「bnb-nf4」や「float8-e4m3fn」を選び、GPU Weightsを適切に調整することで、メモリ使用量を抑えながら運用することが可能です。
この詳細な手順と設定を基に、Flux.1をForgeで効果的に利用し、高品質な画像生成を行ってください。