FLUX.1 Kontextは、Black Forest Labsが開発したコンテキストを認識する画像編集モデルファミリーで、Novita AIではDev、Pro、Maxの3つのティアで利用できます。FLUX.1のテキストから画像を生成するモデルとは異なり、Kontextは既存の画像とテキストプロンプトを受け取り、コンテキストを保持したまま画像を編集します。被写体の衣装を変更したり、背景を入れ替えたり、タイポグラフィを調整したり、ゼロから作り直すことなく新しい要素を合成します。このガイドでは、3つのティアの違い、APIパラメータ、料金、そしてNovita AIでどのティアを選ぶべきかを解説します。
FLUX.1 Kontextとは?
FLUX.1 Kontextは、Black Forest Labsの画像編集モデルラインであり、FLUX.1およびFLUX1.1のテキストから画像を生成するモデルとは異なります。主要な機能はコンテキストを認識した編集です。テキスト指示とともに1つ以上の参照画像を提供すると、モデルは被写体のアイデンティティ、スタイル、空間的な関係性を編集結果に引き継ぎます。
対応する実用的なタスクは以下の通りです。
- キャラクターの顔を維持したまま、服、髪の色、アクセサリーを変更する
- 前景の被写体に影響を与えずに背景を交換または拡張する
- 画像内のテキストやタイポグラフィ(看板、ラベル、オーバーレイ)を編集する
- 複数のソース画像からの要素を合成する
- 構造的なコンテンツを保持したスタイル変換
Novita AIでは、3つのKontextバリアントはすべて、標準の非同期タスクAPI(https://api.novita.ai)を介して提供されます。適切なエンドポイントにPOSTしてtask_idを取得し、タスク結果APIをポーリングして出力の準備ができるのを待ちます。
FLUX.1 Kontext vs FLUX.1 テキストから画像へ
この違いは、適切なツールを選択する際に重要です。Novita AI上のFLUX.1 [dev]および[schnell]はテキストから画像を生成するモデルであり、画像入力なしでテキストプロンプトのみから画像を生成します。FLUX.1 Kontext Dev、Pro、Maxは画像編集モデルであり、少なくとも1つのソース画像を必要とし、その入力を基にした編集結果を生成します。
ゼロから生成したい場合は、FLUX.1 [dev]または[schnell]を使用してください。既存の画像を編集、修正、変換し、そのコンテキストを維持したい場合は、FLUX.1 Kontextを使用してください。
どのティアを使うべきか?
| Dev | Pro | Max | |
|---|---|---|---|
| Novita AI エンドポイント | /v3/async/flux-1-kontext-dev |
/v3/async/flux-1-kontext-pro |
/v3/async/flux-1-kontext-max |
| 画像あたりの料金 | $0.0225 ($0.018 fast) | $0.036 | $0.072 |
| 出力サイズ制御 | ピクセル寸法(一辺256~1536) | アスペクト比プリセット | アスペクト比プリセット |
| 推論ステップ数 | 設定可能(1~50、デフォルト28) | 固定 | 固定 |
| 高速モード | あり(低コスト、品質は若干低下) | なし | なし |
| セーフティトレランス | なし | あり(1~5、デフォルト2) | あり(1~5、デフォルト2) |
| 最大ソース画像数 | 4 | 4 | 4 |
| 最適な用途 | 大量パイプライン、コスト重視のワークフロー、カスタム解像度が必要な場合 | 品質とコストのバランス、本番運用 | 最高出力品質、プレミアムな一貫性 |
Devを使用する場合: コスト効率の良いスループットが必要な場合、推論ステップや出力ピクセル寸法を調整したい場合、高速モードが理にかなっている大量の自動パイプラインを実行している場合。
Proを使用する場合: 中程度の価格帯で信頼性の高いプロダクショングレードの編集を求めており、推論ステップを調整する必要がない場合。アスペクト比のインターフェースは、ウェブやソーシャルフォーマットで扱いやすいです。
Maxを使用する場合: 出力品質が最優先であり、コストは二の次である場合。Maxは、プロフェッショナルなアセット、ブランドイメージ、または視覚的な忠実度が最終製品に直接影響する作業において、プレミアムな一貫性を目指します。
Novita AI 上の FLUX.1 Kontext Dev
エンドポイント: POST https://api.novita.ai/v3/async/flux-1-kontext-dev
Devは、生成パラメータに対する最も多くの制御を提供します。アスペクト比プリセットではなく正確なピクセル寸法を設定したり、推論ステップ数を調整したり、高速モードを有効にして品質を犠牲にコストを削減したりできます。
リクエストパラメータ:
| パラメータ | 型 | デフォルト | 備考 |
|---|---|---|---|
prompt |
string | 必須 | 編集指示 |
images |
string[] | オプション | Base64またはURL;最大4枚の画像 |
fast_mode |
boolean | false | コストを$0.018/画像に削減 |
size |
string | — | width*height、各次元256~1536 |
num_inference_steps |
integer | 28 | 範囲1~50 |
guidance_scale |
number | 2.5 | 範囲1.0~20.0 |
num_images |
integer | 1 | 範囲1~4 |
seed |
integer | -1 | -1はランダム |
output_format |
string | jpeg | jpeg、png、webp |
ステップを調整するタイミング:単純な編集(色変更、テキスト置換)の場合は、20ステップで十分なことがよくあります。複雑な構成変更や複数画像のブレンドには、28~35ステップで通常、一貫性が向上します。40ステップを超えても、編集タスクの品質が有意に向上することはほとんどありません。
Novita AI 上の FLUX.1 Kontext Pro
エンドポイント: POST https://api.novita.ai/v3/async/flux-1-kontext-pro
Proは、細かいステップ制御を犠牲にして、よりシンプルなインターフェースと一段上の出力品質を提供します。ピクセル寸法ではなくアスペクト比を指定するため、標準的なフォーマット(ソーシャル向け1:1、動画サムネイル向け16:9、モバイル向け9:16)を簡単にターゲットにできます。
リクエストパラメータ:
| パラメータ | 型 | デフォルト | 備考 |
|---|---|---|---|
prompt |
string | 必須 | 編集指示 |
images |
string[] | オプション | Base64またはURL;最大4枚の画像 |
guidance_scale |
number | 3.5 | 範囲1.0~20.0 |
aspect_ratio |
string | — | 1:1, 16:9, 4:3, 3:2, 2:3, 3:4, 9:16, 9:21, 21:9 |
seed |
integer | -1 | -1はランダム |
safety_tolerance |
string | 2 | 1(厳格)から5(寛容);テキストから画像モードのみ |
注意:Novita AIのドキュメントによると、safety_toleranceはProのテキストから画像モードでのみ適用されます。Kontextを画像編集に使用する場合(つまり、ソース画像を渡す場合)、このパラメータは効果がありません。
Novita AI 上の FLUX.1 Kontext Max
エンドポイント: POST https://api.novita.ai/v3/async/flux-1-kontext-max
MaxはProとほとんど同じインターフェースを共有しています(同じアスペクト比プリセット、同じセーフティトレランス制御)が、より高い一貫性と忠実度を目指しています。Proを実行していてバッチ間で出力にばらつきがある場合、または特定の編集がソースの被写体から逸脱し続ける場合、Maxは試すべき次のステップです。
リクエストパラメータ:
| パラメータ | 型 | デフォルト | 備考 |
|---|---|---|---|
prompt |
string | 必須 | 編集指示 |
images |
string[] | オプション | Base64またはURL;最大4枚の画像 |
seed |
integer | — | 範囲-1~2147483647 |
guidance_scale |
number | 3.5 | 範囲1.0~20.0 |
safety_tolerance |
string | 2 | 1(厳格)から5(寛容) |
aspect_ratio |
string | — | Proと同じプリセット |
Proとの主な実用的な違いは、出力品質の上限と価格です。ほとんどのAPIワークフローでは、Proがユースケースをカバーします。Maxは、人間によるレビューの前にモデルの最高の出力が必要な最終アセットの制作に適しています。
Novita AI での FLUX.1 Kontext の料金はいくらですか?
2026年6月26日時点の料金(出典:Novita AIの料金ページ):
| バリアント | 画像あたりの料金 |
|---|---|
| FLUX.1 Kontext Dev | $0.0225 |
| FLUX.1 Kontext Dev (高速モード) | $0.018 |
| FLUX.1 Kontext Pro | $0.036 |
| FLUX.1 Kontext Max | $0.072 |
Novita AIの料金は、BFLの直接APIレート(2026年6月26日時点でBFLではPro: $0.04、Max: $0.08)よりも低くなっています。大量の編集パイプラインでは、その差はすぐに大きくなります。Novitaでの10,000件のPro編集は$360ですが、直接だと$400です。
API クイックスタート
Novita AIコンソールからAPIキーを取得してください。3つのKontextエンドポイントはすべて同じ非同期パターンを使用します。POSTで送信してtask_idを受け取り、出力が準備できるまでタスク結果エンドポイントからGETを繰り返します。
Python例 — FLUX.1 Kontext Pro:
import requests
import time
API_KEY = "YOUR_NOVITA_API_KEY"
BASE_URL = "https://api.novita.ai"
def edit_image_kontext_pro(image_url: str, prompt: str, aspect_ratio: str = "1:1") -> str:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-pro",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": prompt,
"images": [image_url],
"aspect_ratio": aspect_ratio,
"guidance_scale": 3.5,
},
)
response.raise_for_status()
task_id = response.json()["task_id"]
# 結果をポーリング
while True:
result = requests.get(
f"{BASE_URL}/v3/async/task-result",
headers={"Authorization": f"Bearer {API_KEY}"},
params={"task_id": task_id},
)
result.raise_for_status()
data = result.json()
if data.get("task", {}).get("status") == "TASK_STATUS_SUCCEED":
return data["images"][0]["image_url"]
elif data.get("task", {}).get("status") == "TASK_STATUS_FAILED":
raise RuntimeError(f"Task failed: {data}")
time.sleep(2)
高速モードとカスタム解像度を使用したDevバリアント:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-dev",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": "Change the jacket to red leather",
"images": [image_url],
"fast_mode": True,
"size": "1024*1024",
"num_inference_steps": 28,
"guidance_scale": 2.5,
"output_format": "webp",
},
)
最高品質を求めるMaxバリアント:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-max",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": "Replace the background with a sunset over mountains",
"images": [image_url],
"aspect_ratio": "16:9",
"guidance_scale": 3.5,
},
)
実用的な編集パターン
フレーム間での被写体の一貫性: バッチ全体でキャラクターや製品のアイデンティティを一貫して保つには、各フレームで同じソース画像を異なるプロンプトとともに渡します。固定されたseedは、セッション内の出力スタイルを固定します。
複数画像の合成: 3つのバリアントはすべて、最大4つのソース画像を受け入れます。キャラクターの参照と背景の参照を一緒に渡し、モデルにそれらを合成するように指示します。より単純な指示は、より予測可能な結果を生み出します。
タイポグラフィの編集: Kontextは、ほとんどの編集モデルよりも画像内のテキストをうまく処理します。プロンプトで変更を明示的に指定します。"Change the sign text from 'OPEN' to 'CLOSED'"。ProとMaxは、特に小さなテキストや装飾的なテキストにおいて、Devよりも読みやすいタイポグラフィ編集を生成します。
反復的な洗練: Kontextの出力は単なる画像です。それを次の編集のソースとして再度入力します。最初にDevの高速モードで大まかな編集を行い、最終的な品質パスでProまたはMaxを使用します。
Kontextを避けるべき場合: ソース参照なしで画像を生成するには、Novita AI上のFLUX.1 Dev テキストから画像へを使用してください。Kontextは編集するためのソース画像を必要とします。
結論
FLUX.1 Kontextは、コンテキストを認識する画像編集モデルファミリーであり、テキストから画像を生成するシステムではありません。その中核的な機能は、被写体のアイデンティティ、空間関係、スタイルを維持しながら、既存の画像にテキスト駆動の正確な編集を適用することです。この違いは、FLUX.1 Dev、Schnell、または他のT2IモデルよりもKontextを選択する際に重要です。Kontextは、ソース画像があり、それについて特定の何かを変更する必要がある場合に適したツールです。
Novita AIの3つのティアのうち、選択ロジックは簡単です。Devは、高スループットまたはコスト重視のワークフローに適しています。推論ステップの制御とピクセルレベルのサイズ調整を公開し、高速モードでは価格が$0.018/画像に下がります。Proは、ほとんどの本番ユースケースのデフォルトです。よりシンプルなアスペクト比インターフェース、Devよりも優れた出力の一貫性、そして継続的なパイプラインに適した中間価格($0.036/画像)を備えています。Maxは、品質の上限がコストよりも重要である最終アセットの制作を対象としています。Proと同じインターフェースを共有しますが、より高い一貫性を提供するため、ブランドイメージ、印刷対応の作業、またはそれ以上編集せずに直接視聴者の前に出る出力に適した選択肢です。
3つのバリアントはすべて最大4つのソース画像を受け入れ、同じ非同期タスクAPIを通じて結果を返すため、実際にはティアの選択は1行のエンドポイント変更です。適切なティアは出力の用途に依存します。自動パイプラインはDevに、本番APIはProに、最終納品はMaxに傾きます。
FAQ
Q: Dev、Pro、Maxの間の最大の実用的な違いは何ですか?
A: Devは、推論ステップと出力ピクセル寸法を直接制御でき、さらに品質を多少犠牲にしてコストを削減する高速モードオプションを提供します。ProとMaxは代わりにアスペクト比プリセットを使用し、推論パイプラインを固定します。Proはバランスの取れた本番オプションであり、Maxはより高い品質の上限です。価格はこれを反映しています。Novita AIでは、Devは$0.018から、Proは$0.036、Maxは$0.072/画像です(2026年6月26日確認)。
Q: どのティアから始めるべきですか?
A: Proから始めてください。シンプルなインターフェースと信頼性の高い出力で、ほとんどの本番画像編集ユースケースをカバーします。スループットのコスト制御やカスタムピクセル寸法が必要な場合はDevに切り替え、Proの出力に一貫性がない場合や、直接視聴者に届く最終アセットを制作している場合はMaxに移行してください。
Q: ProからMaxにアップグレードする価値があるのはいつですか?
A: 出力の一貫性がコストよりも重要な場合です。一般的な兆候:アイデンティティの保持が重要な場合(同じキャラクターや製品を多くの編集で)にProの結果がバッチ間でずれる、細かいタイポグラフィ編集が劣化する、または人間によるQAステップなしで出力が直接本番に送られる場合。Maxは異なるパラメータを公開していません。Proと同じインターフェースで、より高い品質の上限があるだけです。
Q: Devの高速モードは品質を著しく低下させますか?
A: 単純な編集(単色変更、背景交換、オブジェクト削除)の場合、高速モードの品質は通常許容範囲内です。複雑な合成、正確なタイポグラフィ変更、または強力な被写体の一貫性を必要とする編集の場合、標準のDevまたはProの方が信頼性の高い結果を生成します。高速モードは、スクリーニングまたはプロトタイピングのティアとして扱うのが最適であり、最終出力のティアとしては扱わないでください。
Q: FLUX.1 KontextとFLUX.1 テキストから画像モデルの違いは何ですか?
A: FLUX.1 Kontext(Dev/Pro/Max)は画像編集モデルです。1つ以上のソース画像とテキスト指示を受け取り、編集されたバージョンを返します。FLUX.1 [dev]および[schnell]はテキストから画像を生成するモデルであり、画像入力を必要とせずにテキストプロンプトから画像を生成します。2つのファミリーは異なる問題を解決するため、互換性はありません。編集するソース画像がある場合はKontextを、ゼロから生成する場合はT2Iモデルを使用してください。
