MiniMax Hailuo 2.3 在 Novita AI 上:文字轉影片 vs 圖片轉影片 vs 快速模式

MiniMax Hailuo 2.3 在 Novita AI 上:文字轉影片 vs 圖片轉影片 vs 快速模式

在 Novita AI 上使用 MiniMax Hailuo 2.3 時,最簡單的選擇方式就是從你的輸入開始:當場景僅存在於提示詞中時,使用文字轉影片(Text to Video);當需要用第一幀或參考圖片來錨定片段時,使用圖片轉影片(Image to Video);而當你已有圖片,且想在投入標準 I2V 之前,先用價格較低的 Fast I2V 端點進行測試時,則使用快速圖片轉影片(Fast Image to Video)。

MiniMax Hailuo 2.3 模式選擇表

決策情境 從這裡開始 原因
你只有一段文字描述的場景 Hailuo 2.3 文字轉影片 T2V 端點需要 prompt,且不需要圖片。
你已有產品圖、角色圖、分鏡圖或已核准的視覺素材 Hailuo 2.3 圖片轉影片 I2V 端點需要同時提供 promptimage,因此輸入的圖片會錨定第一個視覺狀態。
你已有圖片,且需要更便宜的 I2V 初版測試 Hailuo 2.3 快速圖片轉影片 在相同的可視時長與解析度組合下,Fast I2V 的價格低於標準 I2V。
你需要 1080P 輸出 三種模式皆可,但限制為 6 秒 Novita 文件指出,Hailuo 2.3 任務在 6 秒時支援 1080P;10 秒任務則僅列出 768P。
你需要 10 秒的片段 使用 768P 的 T2V、I2V 或 Fast I2V 文件列出 10 秒為可用時長,而 768P 是支援的 10 秒解析度。
你需要 API 參考文件中記載的提示詞鏡頭指令 T2V 或標準 I2V T2V 和 I2V 文件列出 15 種支援的鏡頭指令;Fast I2V 頁面則未列出該鏡頭指令章節。
你需要為廣泛測試批次編列預算 從 6 秒 768P 開始;僅在有圖片時使用 Fast I2V 6 秒 768P 是每種模式中最低的可視價格列,而 Fast I2V 是最低的可視 Hailuo 2.3 I2V 價格列。
你要製作接近最終版的純提示詞片段 使用目標解析度與時長的 T2V T2V 是此處 Hailuo 2.3 系列中唯一不需要圖片輸入的端點。
你要製作接近最終版的素材主導片段 使用目標解析度與時長的標準 I2V 標準 I2V 保持以圖片為主的工作流程,同時使用非 Fast 端點。

重要的區別不在於哪種模式「最好」,而是在於你的第一個實用測試應該是以提示詞為主、以圖片為主,還是使用價格較低的 Fast I2V 測試。如果沒有來源圖片,Fast 模式就不是選項,因為 Fast Hailuo 2.3 被定義為圖片轉影片的端點。

Novita AI 上的 MiniMax Hailuo 2.3 API 模式

Novita AI 提供了三個獨立非同步的 MiniMax Hailuo 2.3 影片 API:

模式 Novita API 路徑 必要輸入 共用控制項
MiniMax Hailuo 2.3 文字轉影片 POST /v3/async/minimax-hailuo-2.3-t2v prompt durationresolutionenable_prompt_expansionfast_pretreatment
MiniMax Hailuo 2.3 圖片轉影片 POST /v3/async/minimax-hailuo-2.3-i2v promptimage durationresolutionenable_prompt_expansionfast_pretreatment
MiniMax Hailuo 2.3 快速圖片轉影片 POST /v3/async/minimax-hailuo-2.3-fast-i2v promptimage durationresolutionenable_prompt_expansion

三個端點都是非同步的。建立請求會回傳一個 task_id,而非完成的影片網址。應用程式應儲存該任務 ID,並使用 Novita AI 任務結果 API 來在任務完成時取得生成的輸出。

2026 年 6 月 23 日查閱的 Hailuo 2.3 API 參考文件列出了 duration 選項,分別為 610resolution 預設值為 768P,其中 6 秒影片可使用 768P1080P,而 10 秒影片則僅提供 768P。在所有三種模式中,prompt 欄位都是必填的,支援 1 到 2000 個字元。

對於以圖片為主的模式,image 欄位支援公開網址或 Base64 資料網址,例如 data:image/jpeg;base64,...。這使得 I2V 和 Fast I2V 更適合視覺種子已存在於儲存空間、設計工具、產品目錄或先前生成步驟中的工作流程。

T2V、I2V 和 Fast I2V 有何差異?

當片段的第一個版本應僅從語言產生時,請選擇 Hailuo 2.3 文字轉影片。這對於概念探索、場景發想、鏡頭規劃以及尚未有固定產品圖或角色圖的提示詞測試而言,是更乾淨的起點。

T2V 也是最簡單的請求形式。它沒有圖片上傳或圖片網址的要求,因此產品可以收集提示詞、選擇時長與解析度、提交任務,然後輪詢結果。當驗收標準是關於場景創意,而非忠於特定的起始圖片時,請使用它。

當輸入圖片是驗收標準的一部分時,請選擇 Hailuo 2.3 圖片轉影片。如果你已經擁有產品靜態圖、已核准的角色圖、品牌視覺素材、分鏡面板或生成的關鍵影格,就不應該從文字重新建立它。請使用 I2V,讓生成過程從你提供的圖片開始。

標準 I2V 也適合審查工作流程,例如設計師、行銷人員或產品團隊在加入動態之前先核准靜態影格。輸入圖片成為片段的參考點,而提示詞則描述場景應如何移動。

當你已有圖片,並想測試 Fast I2V 端點列出的較低價格時,請選擇 Hailuo 2.3 Fast Image to Video。Fast I2V 不是純提示詞模式;它仍然需要 imageprompt。因此,它是以圖片為主的工作流程中的一種成本和端點選擇,而非 T2V 的替代品。

文件將 Fast Hailuo 2.3 描述為加速版,並定位為以更具成本效益的費率來平衡品質與效能。在實際規劃中,應將其視為一個理由,讓你儘早用自己的素材進行測試,而不是假設它總是能取代標準 I2V。如果 Fast I2V 通過你的視覺驗收標準,它可能會是更好的迭代路徑。如果沒有,則將相同的圖片和提示詞方向轉移到標準 I2V。

有一個需要注意的文件控制項差異。T2V 和標準 I2V 的請求主體包含 fast_pretreatment;而文件中顯示的 Fast I2V 請求主體則沒有。T2V 和標準 I2V 文件也列出了 15 種支援的鏡頭指令,包括平移、傾斜、變焦、橫移、前推、後拉、升降、震動、跟蹤鏡頭和靜態鏡頭。為本文查閱的 Fast I2V 頁面並未包含該鏡頭指令章節,因此除非你自己的測試確認了,否則不要承諾所有三種模式都有相同的鏡頭指令行為。

Hailuo 2.3 在 Novita AI 上的費用是多少?

2026 年 6 月 23 日查閱的目前 Novita 模型庫與定價數據列出了以下 MiniMax Hailuo 2.3 的價格列:

模式 時長 解析度 價格
Hailuo 2.3 文字轉影片 6 秒 768P 每個影片 $0.28
Hailuo 2.3 文字轉影片 10 秒 768P 每個影片 $0.56
Hailuo 2.3 文字轉影片 6 秒 1080P 每個影片 $0.49
Hailuo 2.3 圖片轉影片 6 秒 768P 每個影片 $0.28
Hailuo 2.3 圖片轉影片 10 秒 768P 每個影片 $0.56
Hailuo 2.3 圖片轉影片 6 秒 1080P 每個影片 $0.49
Hailuo 2.3 快速圖片轉影片 6 秒 768P 每個影片 $0.19
Hailuo 2.3 快速圖片轉影片 10 秒 768P 每個影片 $0.32
Hailuo 2.3 快速圖片轉影片 6 秒 1080P 每個影片 $0.33

兩個定價重點對規劃很重要。首先,標準 T2V 和標準 I2V 在相同時長與解析度下具有相同的可視價格列。根據輸入來選擇,而非成本。其次,在可視的 Hailuo 2.3 價格列中,Fast I2V 的價格低於標準 I2V,但它需要圖片,並且應根據你自己的輸出標準來評估。

對於早期探索,6 秒 768P 是每種模式中最低的可視選項。對於純提示詞測試,這意味著使用 T2V 時每個影片 $0.28。對於以圖片為主的測試,這意味著使用標準 I2V 時每個影片 $0.28,或使用 Fast I2V 時每個影片 $0.19。

對於 1080P,可視的 Hailuo 2.3 價格列是 6 秒任務:T2V 或標準 I2V 為每個影片 $0.49,Fast I2V 為每個影片 $0.33。對於 10 秒任務,可視的價格列是 768P:T2V 或標準 I2V 為每個影片 $0.56,Fast I2V 為每個影片 $0.32。

價格可能會有變動。在進行大量批次處理之前,請在 Novita AI 模型庫 或主控台定價檢視中確認確切的價格列。

你應該先測試哪種模式?

如果創意還只存在於簡要說明中,請從 T2V 開始。保持第一個提示詞簡短,選擇 6 秒 768P,只有在會影響審查時才加入鏡頭方向。這使得第一次測試保持輕量:無需準備圖片、無需上傳素材,只需快速檢查場景概念是否值得進一步發展。

如果圖片已經是簡要說明的一部分,請先使用標準 I2V。產品靜態圖、角色圖或分鏡面板會將任務從「發想場景」轉變為「為此確切的起點製作動畫」。T2V 可能會產生看似合理的內容,但除非將特定來源圖片傳入 I2V 端點,否則它無法保留該圖片。

Fast I2V 在你已有圖片並且想在挑選最終作品之前獲得更多實驗空間時非常有用。由於它是以圖片為主的任務中可視價格最低的 Hailuo 2.3 價格列,因此它是測試動作方向、提示詞措辭以及來源圖片是否適合作為種子的合理途徑。在那次測試之後,如果 Fast I2V 的輸出符合你的標準,就繼續使用它,否則將較有潛力的候選作品轉移到標準 I2V。

主要的陷阱是過早選擇 Fast I2V。它仍然是圖片轉影片,所以如果沒有附上圖片的文字簡要,它就不是捷徑。在這種情況下,T2V 是更好的初次測試。

對於廣泛探索,768P 通常足以判斷提示詞方向、圖片契合度以及動作創意。將 1080P 保留給那些已經足夠接近、需要詳細檢查的較小片段集合。

只有在額外時間會改變創意決策時,才使用 10 秒測試,而不是將其作為預設的第一次測試。Hailuo 2.3 文件記載的 10 秒任務價格列是 768P;如果你的團隊需要 1080P,請規劃使用 6 秒任務,或在投入批次處理前確認即時主控台是否已新增更新的選項。

MiniMax Hailuo 2.3 API 工作流程

一個生產級整合應將 Hailuo 2.3 視為非同步任務工作流程:

  1. 根據可用的輸入選擇 T2V、I2V 或 Fast I2V。
  2. 選擇 6 秒或 10 秒的時長。
  3. 選擇 768P1080P,請注意 1080P 是為 6 秒任務定義的。
  4. 將請求提交到特定模型的非同步端點。
  5. 儲存回傳的 task_id
  6. 輪詢任務結果 API,直到任務成功或失敗。
  7. 根據你產品的保留規則儲存回傳的媒體網址。

這是一個最簡單的文字轉影片請求:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A compact smart speaker on a kitchen counter lights up as the camera slowly pushes in. Soft morning light, clean product demo, no text overlays.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

這是一個最簡單的圖片轉影片請求:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

這是使用 Fast I2V 的相同圖片主導測試:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-fast-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true
  }'

在這三種情況下,請針對佇列、處理中、成功和失敗狀態進行建置。初始回應會給你一個任務 ID,並不表示影片已經可用。

最終建議

對於大多數團隊來說,第一個 MiniMax Hailuo 2.3 測試應該是 6 秒 768P。如果你只有提示詞,請使用 T2V。如果第一幀或參考圖片是不可妥協的,請使用標準 I2V。如果你有圖片,並且在決定哪些輸出值得使用標準 I2V 或 1080P 審查之前,想要一個價格較低的迭代路徑,請使用 Fast I2V。

這個順序將第一次測試與實際的輸入限制結合在一起。它也避免了一個常見錯誤:將 Fast 模式視為通用捷徑。Fast Hailuo 2.3 是一個圖片轉影片端點,因此只有在圖片存在後才有用。

常見問題

MiniMax Hailuo 2.3 在 Novita AI 上是否提供文字轉影片功能?

有的。Novita AI 將 POST /v3/async/minimax-hailuo-2.3-t2v 定義為 MiniMax Hailuo 2.3 文字轉影片。

MiniMax Hailuo 2.3 在 Novita AI 上是否提供圖片轉影片功能?

有的。Novita AI 將 POST /v3/async/minimax-hailuo-2.3-i2v 定義為標準圖片轉影片,並將 POST /v3/async/minimax-hailuo-2.3-fast-i2v 定義為快速圖片轉影片。

Hailuo 2.3 I2V 和 Fast I2V 有什麼差別?

兩者都需要 promptimage。Fast I2V 端點的可視價格列低於標準 I2V,並被單獨定義為 minimax-hailuo-2.3-fast-i2v。標準 I2V 的文件請求主體中包含 fast_pretreatment;Fast I2V 則未顯示該欄位。

Hailuo 2.3 支援 1080P 嗎?

有的,用於 6 秒任務。2026 年 6 月 23 日查閱的 Hailuo 2.3 文件列出 6 秒影片支援 768P1080P,而 10 秒影片僅支援 768P

MiniMax Hailuo 2.3 在 Novita AI 上的費用是多少?

2026 年 6 月 23 日查閱的可視價格列起價為:6 秒 768P T2V 或標準 I2V 每個影片 $0.28,6 秒 768P Fast I2V 每個影片 $0.19,6 秒 1080P T2V 或標準 I2V 每個影片 $0.49,以及 6 秒 1080P Fast I2V 每個影片 $0.33。

推薦文章