Vidu Q3 Pro 與 Turbo 在 Novita AI 上的比較:您應該使用哪種影片模式?

Vidu Q3 Pro 與 Turbo 在 Novita AI 上的比較:您應該使用哪種影片模式?

當您需要較低成本、快速迭代或大量影片測試時,請先選擇 Vidu Q3 Turbo;當您願意為 Pro 版本支付較高的每秒價格,並希望與 Turbo 進行最終創意階段的比較時,請選擇 Vidu Q3 Pro。在 Novita AI 上,兩種變體都提供文字轉影片、圖片轉影片和開始-結束轉影片端點,支援非同步生成,並在這些三種模式下使用相同的公開每秒定價模式。

Vidu Q3 Pro vs Turbo 選擇摘要

Vidu Q3 Pro 和 Vidu Q3 Turbo 在 Novita AI 上最明確、有來源支持的差異在於定價。Novita AI 公開的定價載體顯示,Turbo 在 540p、720p 和 1080p 解析度下的每秒費率均低於 Pro。API 文件也顯示,兩種變體都透過各自獨立的非同步端點提供文字轉影片、圖片轉影片和開始-結束轉影片功能。

決策點 從 Vidu Q3 Turbo 開始 從 Vidu Q3 Pro 開始
主要目標 探索提示詞、執行更多變體、降低每秒花費 比較 Pro 變體以取得最終候選片段
預算概況 所有列舉解析度下,尖峰與離峰價格均較低 所有列舉解析度下,每秒價格較高
Novita AI 上的 API 模式 文字轉影片、圖片轉影片、開始-結束轉影片 文字轉影片、圖片轉影片、開始-結束轉影片
文件中的輸出選項 最高 1080p;1-16 秒 最高 1080p;1-16 秒
文件中的音訊支援 提供 Q3 影音生成控制 提供 Q3 影音生成控制
最佳首次測試 大量迭代、提示詞搜尋、粗剪、社群變體 在 Turbo 縮小提示詞與模式後的最終比較

Turbo 和 Pro 更應被視為兩種定價與工作流程選項,而非簡單的好壞排名。公開文件與定價頁面支援成本與端點比較,但並未發布通用基準、延遲分數或場景品質排名來為每個提示詞定案。如果輸出結果真的很重要,更可靠的決定方式是對兩種變體使用相同的提示詞或圖片集,並排比較結果。

Vidu Q3 文字轉影片、圖片轉影片與開始-結束模式

Vidu Q3 並非單一設定。在 Novita AI 上,實用的選擇是二維的:選擇 Pro 或 Turbo,然後選擇符合您來源素材的生成模式。

模式 您提供的內容 使用時機 Pro 端點 Turbo 端點
文字轉影片 文字提示詞 您正在從頭探索新場景、角色、運鏡、廣告概念或分鏡腳本 /v3/async/vidu-q3-pro-t2v /v3/async/vidu-q3-turbo-t2v
圖片轉影片 一張參考圖片加上選擇性的動作提示詞 您已有產品圖片、角色幀、風格參考或靜態構圖需要動畫化 /v3/async/vidu-q3-pro-i2v /v3/async/vidu-q3-turbo-i2v
開始-結束轉影片 兩張圖片:一張起始幀和一張結束幀 您需要模型在已知的第一幀和最後一幀之間進行插補 /v3/async/vidu-q3-pro-f2v /v3/async/vidu-q3-turbo-f2v

對於文字轉影片,文件列出必需的 prompt、布林值 audiodurationresolutionaspect_ratiooff_peak 以及浮水印控制項。Pro 文字轉影片接受最多 2,000 個字元的提示詞;Turbo 文字轉影片接受最多 5,000 個字元的提示詞。

對於圖片轉影片,文件要求提供 images 陣列。Pro 圖片轉影片目前支援單張圖片輸入,接受 JPG、JPEG、PNG 和 WebP 格式,每張圖片最大 50 MB,長寬比介於 1:4 至 4:1 之間。Pro 圖片轉影片文件將 audio 列為背景音樂的自訂音訊 URL 欄位。Turbo 圖片轉影片同樣使用參考圖片陣列,支援相同的列舉圖片格式與 50 MB 限制,並列出一個布林值 audio 加上一個 audio_type 選項:allspeech_onlysound_effect_only

對於開始-結束轉影片,Pro 和 Turbo 文件都要求恰好兩張圖片:第一張圖片是起始幀,第二張圖片是結束幀。文件列出 1-16 秒的持續時間以及 540p、720p 和 1080p 解析度選項。當您更在意轉場的開始與結束位置,而非從空白提示詞探索場景時,請使用此模式。

Vidu Q3 Pro 與 Turbo 定價

Novita AI 針對 Vidu Q3 Pro 和 Vidu Q3 Turbo 以每秒列出定價。2026 年 6 月 23 日查閱的當前公開定價顯示,每種變體與解析度在文字轉影片、圖片轉影片和開始-結束轉影片上的費率相同。

解析度 Vidu Q3 Pro 尖峰 Vidu Q3 Pro 離峰 Vidu Q3 Turbo 尖峰 Vidu Q3 Turbo 離峰
540p $0.0625/s $0.0313/s $0.0357/s $0.0179/s
720p $0.1339/s $0.0670/s $0.0536/s $0.0268/s
1080p $0.1429/s $0.0714/s $0.0714/s $0.0357/s

以下是一般測試片段對應的費用:

測試片段 Pro 尖峰 Pro 離峰 Turbo 尖峰 Turbo 離峰
5 秒 540p $0.3125 $0.1565 $0.1785 $0.0895
10 秒 720p $1.3390 $0.6700 $0.5360 $0.2680
16 秒 1080p $2.2864 $1.1424 $1.1424 $0.5712

當週轉時間彈性時,離峰模式最為合理。Vidu Q3 API 文件將離峰任務描述為在 48 小時內處理的低成本任務,當您正在探索提示詞並希望以較低成本進行更廣泛的批次測試時,這會很有用。如果您正在建置面向使用者的流程,尖峰模式仍然是較安全的預設選項,除非延遲交付已是產品體驗的一部分。

您應該先測試哪種 Vidu Q3 模式?

選擇模式最簡單的方法是從您已有的輸入開始。許多令人失望的測試都來自於先選擇最令人興奮的選項,而不是最符合手上素材的選項。

情況 優先測試的模式 建議的變體 原因
您只有一個書面想法 文字轉影片 Turbo 讓您以較低的每秒成本探索更多提示方向。
您有產品渲染圖或角色靜態幀 圖片轉影片 先 Turbo,後 Pro 用於決選 參考圖片限制了視覺目標,而 Turbo 可降低迭代成本。
您有已知第一幀和最後一幀的分鏡腳本 開始-結束轉影片 先 Turbo,必要時再用 Pro 兩張圖片為模型提供了明確的端點,對於受控轉場很有用。
您需要一個無聲片段以便後期編輯 文字轉影片或圖片轉影片並停用音訊 Turbo 文件提供了 audio 控制項,因此您可以避免生成後續會取代的音訊。
您正在決定最終候選片段 兩種變體使用相同模式 Pro 和 Turbo 並排比較 使用相同的輸入並比較場景輸出,而非依賴通用假設。

如果您是 Novita AI 上 Vidu Q3 的新手,這通常是最順暢的入門方式:

  1. 以 540p 或 720p 執行 Turbo 文字轉影片,以找到提示方向。
  2. 如果您需要從靜態圖片中獲得身份、產品或視覺風格控制,則轉向圖片轉影片。
  3. 僅當您有實際的第一幀和最後一幀時,才使用開始-結束轉影片。
  4. 在決定該場景較高的價格是否合理之前,先在 Pro 中以目標解析度重新執行最強的候選項目。

這個順序將較昂貴的比較步驟保留在最終決策附近,此時您已有一個有前景的方向。它也有助於避免將 Pro 預算花費在可能最終會丟棄的早期提示詞探索上。

Vidu Q3 API 端點與請求流程

此比較中的所有六個 Vidu Q3 端點都使用 Novita AI 的 v3 非同步任務模式。您提交生成請求,收到一個 task_id,然後在任務成功時使用該 task_id 呼叫任務結果 API 以檢索生成的影片。

端點 方法 結果模式
/v3/async/vidu-q3-pro-t2v POST 返回 task_id
/v3/async/vidu-q3-pro-i2v POST 返回 task_id
/v3/async/vidu-q3-pro-f2v POST 返回 task_id
/v3/async/vidu-q3-turbo-t2v POST 返回 task_id
/v3/async/vidu-q3-turbo-i2v POST 返回 task_id
/v3/async/vidu-q3-turbo-f2v POST 返回 task_id
/v3/async/task-result GET 當可用時返回任務狀態與生成的媒體

一個基本的 Turbo 文字轉影片請求範例如下:

curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "prompt": "A close-up product launch video on a clean studio table, soft camera push-in, subtle lighting movement",
    "duration": 5,
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "audio": true,
    "off_peak": false
  }'

然後輪詢任務結果端點:

curl --request GET \
  --url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
  --header "Authorization: Bearer $NOVITA_API_KEY"

對於圖片轉影片,將端點替換為 I2V 端點並提供 images 陣列。對於開始-結束轉影片,使用 F2V 端點並依序提供兩張圖片:先提供起始幀,再提供結束幀。

實用的 Vidu Q3 測試計劃

使用小型測試矩陣而非一次性印象。目標不是證明通用贏家;而是為您的使用案例選擇正確的變體和模式。

測試輪次 變體 模式 解析度 評估項目
提示詞搜尋 Turbo 文字轉影片 540p 或 720p 哪種提示詞結構能提供正確的場景、動作和構圖?
參考控制 Turbo 圖片轉影片 720p 模型是否足以保留主體或產品以符合您的使用案例?
轉場控制 Turbo 開始-結束轉影片 720p 第一幀與最後一幀之間的運動感覺是否可用?
最終比較 Turbo 和 Pro 相同的勝出模式 目標解析度 Pro 的結果是否值得為此場景支付更高的每秒成本?
成本評估 勝出變體 相同的勝出模式 目標解析度 此任務應使用尖峰,還是可移至離峰?

當您比較 Pro 和 Turbo 時,請保持這些變數相同:

  • 相同的提示詞、圖片輸入、持續時間、解析度和長寬比。
  • 相同的音訊設定。
  • 在比較輸出結果時,相同的離峰設定。
  • 相同的評估標準:身份一致性、動作清晰度、運鏡、音訊實用性和可編輯性。

如果您同時更改提示詞和模型變體,比較就會變得模糊,因為您無法再判斷是哪個變更實際上改善了結果。

常見問題

Vidu Q3 Turbo 在 Novita AI 上比 Vidu Q3 Pro 便宜嗎?

是的。2026 年 6 月 23 日查閱的當前 Novita AI 定價顯示,Turbo 在 540p、720p 和 1080p 解析度下的文字轉影片、圖片轉影片和開始-結束轉影片費率均低於 Pro。

Vidu Q3 Pro 和 Turbo 是否支援相同的模式?

Novita AI 文件為文字轉影片、圖片轉影片和開始-結束轉影片列出了獨立的 Pro 和 Turbo 端點。每個端點都返回一個 task_id,並使用 v3 非同步任務結果流程。

我應該先使用文字轉影片還是圖片轉影片?

當您只有一個想法或書面場景時,請先使用文字轉影片。當參考圖片很重要時,例如產品照片、角色幀或固定視覺風格,請先使用圖片轉影片。

何時應該使用開始-結束轉影片?

當您有兩個幀且需要模型在它們之間建立運動時,請使用開始-結束轉影片。它是三種模式中結構化程度最高的,因為起始幀和結束幀都已指定。

Vidu Q3 是否支援音訊控制?

是的。Vidu Q3 文件包含音訊控制。文字轉影片和開始-結束轉影片提供一個布林值 audio。Pro 圖片轉影片將 audio 列為背景音樂的自訂音訊 URL 欄位,而 Turbo 圖片轉影片則列出一個布林值 audio 加上 audio_type 選項:allspeech_onlysound_effect_only

我應該對同一個提示詞同時執行 Vidu Q3 Turbo 和 Pro 嗎?

當您正在探索提示詞、參考、持續時間和長寬比時,請先執行 Turbo。如果某個結果接近您所需,則在 Pro 上重新執行相同的設定,以便比較僅限於模型變體,而不會混雜提示詞和輸入的變更。

推薦文章