當您需要較低成本、快速迭代或大量影片測試時,請先選擇 Vidu Q3 Turbo;當您願意為 Pro 版本支付較高的每秒價格,並希望與 Turbo 進行最終創意階段的比較時,請選擇 Vidu Q3 Pro。在 Novita AI 上,兩種變體都提供文字轉影片、圖片轉影片和開始-結束轉影片端點,支援非同步生成,並在這些三種模式下使用相同的公開每秒定價模式。
Vidu Q3 Pro vs Turbo 選擇摘要
Vidu Q3 Pro 和 Vidu Q3 Turbo 在 Novita AI 上最明確、有來源支持的差異在於定價。Novita AI 公開的定價載體顯示,Turbo 在 540p、720p 和 1080p 解析度下的每秒費率均低於 Pro。API 文件也顯示,兩種變體都透過各自獨立的非同步端點提供文字轉影片、圖片轉影片和開始-結束轉影片功能。
| 決策點 | 從 Vidu Q3 Turbo 開始 | 從 Vidu Q3 Pro 開始 |
|---|---|---|
| 主要目標 | 探索提示詞、執行更多變體、降低每秒花費 | 比較 Pro 變體以取得最終候選片段 |
| 預算概況 | 所有列舉解析度下,尖峰與離峰價格均較低 | 所有列舉解析度下,每秒價格較高 |
| Novita AI 上的 API 模式 | 文字轉影片、圖片轉影片、開始-結束轉影片 | 文字轉影片、圖片轉影片、開始-結束轉影片 |
| 文件中的輸出選項 | 最高 1080p;1-16 秒 | 最高 1080p;1-16 秒 |
| 文件中的音訊支援 | 提供 Q3 影音生成控制 | 提供 Q3 影音生成控制 |
| 最佳首次測試 | 大量迭代、提示詞搜尋、粗剪、社群變體 | 在 Turbo 縮小提示詞與模式後的最終比較 |
Turbo 和 Pro 更應被視為兩種定價與工作流程選項,而非簡單的好壞排名。公開文件與定價頁面支援成本與端點比較,但並未發布通用基準、延遲分數或場景品質排名來為每個提示詞定案。如果輸出結果真的很重要,更可靠的決定方式是對兩種變體使用相同的提示詞或圖片集,並排比較結果。
Vidu Q3 文字轉影片、圖片轉影片與開始-結束模式
Vidu Q3 並非單一設定。在 Novita AI 上,實用的選擇是二維的:選擇 Pro 或 Turbo,然後選擇符合您來源素材的生成模式。
| 模式 | 您提供的內容 | 使用時機 | Pro 端點 | Turbo 端點 |
|---|---|---|---|---|
| 文字轉影片 | 文字提示詞 | 您正在從頭探索新場景、角色、運鏡、廣告概念或分鏡腳本 | /v3/async/vidu-q3-pro-t2v |
/v3/async/vidu-q3-turbo-t2v |
| 圖片轉影片 | 一張參考圖片加上選擇性的動作提示詞 | 您已有產品圖片、角色幀、風格參考或靜態構圖需要動畫化 | /v3/async/vidu-q3-pro-i2v |
/v3/async/vidu-q3-turbo-i2v |
| 開始-結束轉影片 | 兩張圖片:一張起始幀和一張結束幀 | 您需要模型在已知的第一幀和最後一幀之間進行插補 | /v3/async/vidu-q3-pro-f2v |
/v3/async/vidu-q3-turbo-f2v |
對於文字轉影片,文件列出必需的 prompt、布林值 audio、duration、resolution、aspect_ratio、off_peak 以及浮水印控制項。Pro 文字轉影片接受最多 2,000 個字元的提示詞;Turbo 文字轉影片接受最多 5,000 個字元的提示詞。
對於圖片轉影片,文件要求提供 images 陣列。Pro 圖片轉影片目前支援單張圖片輸入,接受 JPG、JPEG、PNG 和 WebP 格式,每張圖片最大 50 MB,長寬比介於 1:4 至 4:1 之間。Pro 圖片轉影片文件將 audio 列為背景音樂的自訂音訊 URL 欄位。Turbo 圖片轉影片同樣使用參考圖片陣列,支援相同的列舉圖片格式與 50 MB 限制,並列出一個布林值 audio 加上一個 audio_type 選項:all、speech_only 或 sound_effect_only。
對於開始-結束轉影片,Pro 和 Turbo 文件都要求恰好兩張圖片:第一張圖片是起始幀,第二張圖片是結束幀。文件列出 1-16 秒的持續時間以及 540p、720p 和 1080p 解析度選項。當您更在意轉場的開始與結束位置,而非從空白提示詞探索場景時,請使用此模式。
Vidu Q3 Pro 與 Turbo 定價
Novita AI 針對 Vidu Q3 Pro 和 Vidu Q3 Turbo 以每秒列出定價。2026 年 6 月 23 日查閱的當前公開定價顯示,每種變體與解析度在文字轉影片、圖片轉影片和開始-結束轉影片上的費率相同。
| 解析度 | Vidu Q3 Pro 尖峰 | Vidu Q3 Pro 離峰 | Vidu Q3 Turbo 尖峰 | Vidu Q3 Turbo 離峰 |
|---|---|---|---|---|
| 540p | $0.0625/s | $0.0313/s | $0.0357/s | $0.0179/s |
| 720p | $0.1339/s | $0.0670/s | $0.0536/s | $0.0268/s |
| 1080p | $0.1429/s | $0.0714/s | $0.0714/s | $0.0357/s |
以下是一般測試片段對應的費用:
| 測試片段 | Pro 尖峰 | Pro 離峰 | Turbo 尖峰 | Turbo 離峰 |
|---|---|---|---|---|
| 5 秒 540p | $0.3125 | $0.1565 | $0.1785 | $0.0895 |
| 10 秒 720p | $1.3390 | $0.6700 | $0.5360 | $0.2680 |
| 16 秒 1080p | $2.2864 | $1.1424 | $1.1424 | $0.5712 |
當週轉時間彈性時,離峰模式最為合理。Vidu Q3 API 文件將離峰任務描述為在 48 小時內處理的低成本任務,當您正在探索提示詞並希望以較低成本進行更廣泛的批次測試時,這會很有用。如果您正在建置面向使用者的流程,尖峰模式仍然是較安全的預設選項,除非延遲交付已是產品體驗的一部分。
您應該先測試哪種 Vidu Q3 模式?
選擇模式最簡單的方法是從您已有的輸入開始。許多令人失望的測試都來自於先選擇最令人興奮的選項,而不是最符合手上素材的選項。
| 情況 | 優先測試的模式 | 建議的變體 | 原因 |
|---|---|---|---|
| 您只有一個書面想法 | 文字轉影片 | Turbo | 讓您以較低的每秒成本探索更多提示方向。 |
| 您有產品渲染圖或角色靜態幀 | 圖片轉影片 | 先 Turbo,後 Pro 用於決選 | 參考圖片限制了視覺目標,而 Turbo 可降低迭代成本。 |
| 您有已知第一幀和最後一幀的分鏡腳本 | 開始-結束轉影片 | 先 Turbo,必要時再用 Pro | 兩張圖片為模型提供了明確的端點,對於受控轉場很有用。 |
| 您需要一個無聲片段以便後期編輯 | 文字轉影片或圖片轉影片並停用音訊 | Turbo | 文件提供了 audio 控制項,因此您可以避免生成後續會取代的音訊。 |
| 您正在決定最終候選片段 | 兩種變體使用相同模式 | Pro 和 Turbo 並排比較 | 使用相同的輸入並比較場景輸出,而非依賴通用假設。 |
如果您是 Novita AI 上 Vidu Q3 的新手,這通常是最順暢的入門方式:
- 以 540p 或 720p 執行 Turbo 文字轉影片,以找到提示方向。
- 如果您需要從靜態圖片中獲得身份、產品或視覺風格控制,則轉向圖片轉影片。
- 僅當您有實際的第一幀和最後一幀時,才使用開始-結束轉影片。
- 在決定該場景較高的價格是否合理之前,先在 Pro 中以目標解析度重新執行最強的候選項目。
這個順序將較昂貴的比較步驟保留在最終決策附近,此時您已有一個有前景的方向。它也有助於避免將 Pro 預算花費在可能最終會丟棄的早期提示詞探索上。
Vidu Q3 API 端點與請求流程
此比較中的所有六個 Vidu Q3 端點都使用 Novita AI 的 v3 非同步任務模式。您提交生成請求,收到一個 task_id,然後在任務成功時使用該 task_id 呼叫任務結果 API 以檢索生成的影片。
| 端點 | 方法 | 結果模式 |
|---|---|---|
/v3/async/vidu-q3-pro-t2v |
POST |
返回 task_id |
/v3/async/vidu-q3-pro-i2v |
POST |
返回 task_id |
/v3/async/vidu-q3-pro-f2v |
POST |
返回 task_id |
/v3/async/vidu-q3-turbo-t2v |
POST |
返回 task_id |
/v3/async/vidu-q3-turbo-i2v |
POST |
返回 task_id |
/v3/async/vidu-q3-turbo-f2v |
POST |
返回 task_id |
/v3/async/task-result |
GET |
當可用時返回任務狀態與生成的媒體 |
一個基本的 Turbo 文字轉影片請求範例如下:
curl --request POST \
--url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
--header "Authorization: Bearer $NOVITA_API_KEY" \
--header "Content-Type: application/json" \
--data '{
"prompt": "A close-up product launch video on a clean studio table, soft camera push-in, subtle lighting movement",
"duration": 5,
"resolution": "720p",
"aspect_ratio": "16:9",
"audio": true,
"off_peak": false
}'
然後輪詢任務結果端點:
curl --request GET \
--url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
--header "Authorization: Bearer $NOVITA_API_KEY"
對於圖片轉影片,將端點替換為 I2V 端點並提供 images 陣列。對於開始-結束轉影片,使用 F2V 端點並依序提供兩張圖片:先提供起始幀,再提供結束幀。
實用的 Vidu Q3 測試計劃
使用小型測試矩陣而非一次性印象。目標不是證明通用贏家;而是為您的使用案例選擇正確的變體和模式。
| 測試輪次 | 變體 | 模式 | 解析度 | 評估項目 |
|---|---|---|---|---|
| 提示詞搜尋 | Turbo | 文字轉影片 | 540p 或 720p | 哪種提示詞結構能提供正確的場景、動作和構圖? |
| 參考控制 | Turbo | 圖片轉影片 | 720p | 模型是否足以保留主體或產品以符合您的使用案例? |
| 轉場控制 | Turbo | 開始-結束轉影片 | 720p | 第一幀與最後一幀之間的運動感覺是否可用? |
| 最終比較 | Turbo 和 Pro | 相同的勝出模式 | 目標解析度 | Pro 的結果是否值得為此場景支付更高的每秒成本? |
| 成本評估 | 勝出變體 | 相同的勝出模式 | 目標解析度 | 此任務應使用尖峰,還是可移至離峰? |
當您比較 Pro 和 Turbo 時,請保持這些變數相同:
- 相同的提示詞、圖片輸入、持續時間、解析度和長寬比。
- 相同的音訊設定。
- 在比較輸出結果時,相同的離峰設定。
- 相同的評估標準:身份一致性、動作清晰度、運鏡、音訊實用性和可編輯性。
如果您同時更改提示詞和模型變體,比較就會變得模糊,因為您無法再判斷是哪個變更實際上改善了結果。
常見問題
Vidu Q3 Turbo 在 Novita AI 上比 Vidu Q3 Pro 便宜嗎?
是的。2026 年 6 月 23 日查閱的當前 Novita AI 定價顯示,Turbo 在 540p、720p 和 1080p 解析度下的文字轉影片、圖片轉影片和開始-結束轉影片費率均低於 Pro。
Vidu Q3 Pro 和 Turbo 是否支援相同的模式?
Novita AI 文件為文字轉影片、圖片轉影片和開始-結束轉影片列出了獨立的 Pro 和 Turbo 端點。每個端點都返回一個 task_id,並使用 v3 非同步任務結果流程。
我應該先使用文字轉影片還是圖片轉影片?
當您只有一個想法或書面場景時,請先使用文字轉影片。當參考圖片很重要時,例如產品照片、角色幀或固定視覺風格,請先使用圖片轉影片。
何時應該使用開始-結束轉影片?
當您有兩個幀且需要模型在它們之間建立運動時,請使用開始-結束轉影片。它是三種模式中結構化程度最高的,因為起始幀和結束幀都已指定。
Vidu Q3 是否支援音訊控制?
是的。Vidu Q3 文件包含音訊控制。文字轉影片和開始-結束轉影片提供一個布林值 audio。Pro 圖片轉影片將 audio 列為背景音樂的自訂音訊 URL 欄位,而 Turbo 圖片轉影片則列出一個布林值 audio 加上 audio_type 選項:all、speech_only 和 sound_effect_only。
我應該對同一個提示詞同時執行 Vidu Q3 Turbo 和 Pro 嗎?
當您正在探索提示詞、參考、持續時間和長寬比時,請先執行 Turbo。如果某個結果接近您所需,則在 Pro 上重新執行相同的設定,以便比較僅限於模型變體,而不會混雜提示詞和輸入的變更。
