Vidu Q3 Pro 與 Turbo 在 Novita AI 上的比較：你應該使用哪種影片模式？

Vidu Q3 Pro 與 Turbo 選擇摘要
Vidu Q3 文字轉影片、圖片轉影片與開始-結束模式
Vidu Q3 Pro 與 Turbo 定價
你應該先測試哪個 Vidu Q3 模式？
Vidu Q3 API 端點與請求流程
實用的 Vidu Q3 測試計畫
常見問題
推薦文章

當你需要較低成本、快速迭代或大量影片測試時，請先選擇 Vidu Q3 Turbo；當你願意為 Pro 版本支付更高的每秒價格，並想將其與 Turbo 進行最終創意階段的比較時，則選擇 Vidu Q3 Pro。在 Novita AI 上，兩個變體都提供文字轉影片、圖片轉影片以及開始-結束轉影片的端點，支援非同步生成，並且在這三種模式下使用相同的每秒公開定價模式。

Vidu Q3 Pro 與 Turbo 選擇摘要

Vidu Q3 Pro 和 Vidu Q3 Turbo 在 Novita AI 上最明顯的官方差異是定價。Novita AI 的公開定價資訊顯示，在 540p、720p 和 1080p 解析度下，Turbo 的每秒費率低於 Pro。API 文件也顯示，兩個變體可透過不同的非同步端點用於文字轉影片、圖片轉影片和開始-結束轉影片。

決策點	從 Vidu Q3 Turbo 開始	從 Vidu Q3 Pro 開始
主要目標	探索提示詞、執行更多變體、降低每秒花費	為最終候選片段比較 Pro 變體
預算狀況	所有列出的解析度均有較低的尖峰與離峰價格	所有列出的解析度均有較高的每秒價格
Novita AI 上的 API 模式	文字轉影片、圖片轉影片、開始-結束轉影片	文字轉影片、圖片轉影片、開始-結束轉影片
文件中的輸出選項	最高 1080p；1-16 秒	最高 1080p；1-16 秒
文件中的音訊支援	可使用 Q3 音訊-影片生成控制	可使用 Q3 音訊-影片生成控制
最佳首次測試	大量迭代、提示詞搜尋、粗剪、社群變體	在 Turbo 縮小提示詞與模式範圍後進行最終比較

Turbo 和 Pro 更適合視為兩種定價與工作流程選項，而非簡單的好壞排名。公開文件和定價頁面支援成本與端點比較，但並未發布通用的基準測試、延遲評分或場景品質排名來說明哪個對每個提示詞都更好。如果輸出結果真的很重要，更可靠的方式是透過相同提示詞或圖片集在兩個變體上執行直接比對，並並排評估結果。

Vidu Q3 文字轉影片、圖片轉影片與開始-結束模式

Vidu Q3 並非單一設定。在 Novita AI 上，有用的選擇是二維的：選擇 Pro 或 Turbo，然後選擇符合你原始素材的生成模式。

模式	你提供什麼	何時使用	Pro 端點	Turbo 端點
文字轉影片	一則文字提示詞	你正在從零探索新的場景、角色、運鏡、廣告概念或分鏡腳本	`/v3/async/vidu-q3-pro-t2v`	`/v3/async/vidu-q3-turbo-t2v`
圖片轉影片	一張參考圖片加上可選的動態提示詞	你已經有產品圖片、角色畫面、風格參考或靜態構圖要動畫化	`/v3/async/vidu-q3-pro-i2v`	`/v3/async/vidu-q3-turbo-i2v`
開始-結束轉影片	兩張圖片，一張開始幀和一張結束幀	你需要模型在已知的第一幀與最後一幀之間進行插值	`/v3/async/vidu-q3-pro-f2v`	`/v3/async/vidu-q3-turbo-f2v`

對於文字轉影片，文件列出必填的 prompt、一個 audio 布林值、duration、resolution、aspect_ratio、off_peak 和浮水印控制項。Pro 文字轉影片接受最多 2,000 個字元的提示詞；Turbo 文字轉影片接受最多 5,000 個字元的提示詞。

對於圖片轉影片，文件要求一個 images 陣列。Pro 圖片轉影片目前支援一張圖片輸入，接受 JPG、JPEG、PNG 和 WebP 格式，每張圖片最大 50 MB，長寬比介於 1:4 到 4:1 之間。Pro 圖片轉影片文件將 audio 列為自訂音訊 URL 欄位，用於背景音樂。Turbo 圖片轉影片也使用參考圖片陣列，支援相同列出的圖片格式和 50 MB 限制，並列出一個 audio 布林值加上一個 audio_type 選項：all、speech_only 或 sound_effect_only。

對於開始-結束轉影片，Pro 和 Turbo 的文件都要求剛好兩張圖片：第一張是開始幀，第二張是結束幀。文件列出 1-16 秒的持續時間以及 540p、720p 和 1080p 的解析度選項。當你更在乎過場的起點和終點，而不是從空白提示詞發現場景時，可使用此模式。

Vidu Q3 Pro 與 Turbo 定價

Novita AI 的定價以每秒為單位列出 Vidu Q3 Pro 和 Vidu Q3 Turbo。截至 2026 年 6 月 23 日檢查的公開定價顯示，每個變體和解析度的文字轉影片、圖片轉影片和開始-結束轉影片費率相同。

解析度	Vidu Q3 Pro 尖峰	Vidu Q3 Pro 離峰	Vidu Q3 Turbo 尖峰	Vidu Q3 Turbo 離峰
540p	$0.0625/s	$0.0313/s	$0.0357/s	$0.0179/s
720p	$0.1339/s	$0.0670/s	$0.0536/s	$0.0268/s
1080p	$0.1429/s	$0.0714/s	$0.0714/s	$0.0357/s

以下是這對常見測試片段的影響：

測試片段	Pro 尖峰	Pro 離峰	Turbo 尖峰	Turbo 離峰
5 秒 540p	$0.3125	$0.1565	$0.1785	$0.0895
10 秒 720p	$1.3390	$0.6700	$0.5360	$0.2680
16 秒 1080p	$2.2864	$1.1424	$1.1424	$0.5712

當周轉時間具彈性時，離峰模式最有意義。如果 vidu q3 pro vs turbo 的速度對你的工作流程很重要，尖峰模式能提供更快的結果，而離峰模式則以較低的每秒費率換取較長的處理時間。Vidu Q3 API 文件將離峰任務描述為在 48 小時內處理的低成本任務，這在探索提示詞並希望以較低成本獲得更大批量測試時運作良好。如果你正在建構面向使用者的流程，尖峰模式仍是較安全的預設，除非延遲交付已包含在產品體驗中。

你應該先測試哪個 Vidu Q3 模式？

選擇模式最簡單的方式是從你已有的輸入開始。許多令人失望的測試來自於先選擇最令人興奮的選項，而不是最符合手中材料的選項。

情境	首先測試的模式	建議變體	原因
你只有一個書面想法	文字轉影片	Turbo	讓你能以更低的每秒成本探索更多提示詞方向。
你有一個產品渲染圖或角色靜態圖	圖片轉影片	先 Turbo，再對候選作品用 Pro	參考圖片限制了視覺目標，而 Turbo 保持迭代成本較低。
你有一個已知第一幀和最後一幀的分鏡腳本	開始-結束轉影片	先 Turbo，必要時再用 Pro	兩張圖片為模型提供了明確的端點，對受控的過場很有用。
你需要一個無聲片段供後續編輯	文字轉影片或圖片轉影片，並停用音訊	Turbo	文件提供了 `audio` 控制，因此你可以避免生成將要取代的音訊。
你正在決定最終候選片段	相同模式在兩個變體上	Pro 和 Turbo 並行比較	使用完全相同的輸入，並為你的場景比較輸出，而不是依賴通用的假設。

如果你是 Novita AI 上 Vidu Q3 的新手，這通常是開始最流暢的方式：

執行 Turbo 文字轉影片（540p 或 720p）來找出提示詞方向。
如果需要從靜態圖片控制身份、產品或視覺風格，則轉到圖片轉影片。
只有當你確實有首幀和末幀時，才使用開始-結束轉影片。
在目標解析度下用 Pro 重新執行最強候選作品，以評估 vidu q3 pro 的品質，然後再決定該場景是否值得更高的價格。

這個順序將較昂貴的比較步驟保留在接近最終決策的時候，此時你已經有了一個有希望的方向。這也能幫助你避免將 Pro 預算花在可能最終會捨棄的早期提示詞探索上。

Vidu Q3 API 端點與請求流程

此比較中所有六個 Vidu Q3 端點都使用 Novita AI 的 v3 非同步任務模式。你提交一個生成請求，收到一個 task_id，然後用該 task_id 呼叫任務結果 API，在任務成功時檢索生成的影片。

端點	方法	結果模式
`/v3/async/vidu-q3-pro-t2v`	`POST`	回傳 `task_id`
`/v3/async/vidu-q3-pro-i2v`	`POST`	回傳 `task_id`
`/v3/async/vidu-q3-pro-f2v`	`POST`	回傳 `task_id`
`/v3/async/vidu-q3-turbo-t2v`	`POST`	回傳 `task_id`
`/v3/async/vidu-q3-turbo-i2v`	`POST`	回傳 `task_id`
`/v3/async/vidu-q3-turbo-f2v`	`POST`	回傳 `task_id`
`/v3/async/task-result`	`GET`	在可用時回傳任務狀態與生成的媒體

一個最簡的 Turbo 文字轉影片請求範例如下：

curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "prompt": "A close-up product launch video on a clean studio table, soft camera push-in, subtle lighting movement",
    "duration": 5,
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "audio": true,
    "off_peak": false
  }'

然後輪詢任務結果端點：

curl --request GET \
  --url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
  --header "Authorization: Bearer $NOVITA_API_KEY"

對於圖片轉影片，將端點替換為 I2V 端點並提供 images 陣列。對於開始-結束轉影片，使用 F2V 端點並依序提供兩張圖片：先是開始幀，然後是結束幀。

實用的 Vidu Q3 測試計畫

使用小型測試矩陣，而非單次印象。目標不是證明一個通用的優勝者，而是為你的使用案例選擇正確的變體和模式。

測試回合	變體	模式	解析度	評估什麼
提示詞搜尋	Turbo	文字轉影片	540p 或 720p	哪個提示詞結構能給出正確的場景、動態和構圖？
參考控制	Turbo	圖片轉影片	720p	模型是否足夠保留主體或產品以滿足你的使用案例？
過場控制	Turbo	開始-結束轉影片	720p	第一幀與最後一幀之間的動態是否感覺可用？
最終比較	Turbo 和 Pro	相同的獲勝模式	目標解析度	Pro 的結果是否值得為這個場景支付更高的每秒成本？
成本分析	獲勝變體	相同的獲勝模式	目標解析度	此請求應該用尖峰模式，還是可以改用離峰模式？

當你比較 Pro 和 Turbo 時，保持這些變數一致：

相同的提示詞、圖片輸入、持續時間、解析度和長寬比。
相同的音訊設定。
比較輸出結果時使用相同的離峰設定。
相同的評估標準：身份一致性、動態清晰度、運鏡、音訊實用性和可編輯性。

如果你同時改變提示詞和模型變體，比較就會變得模糊，因為你無法再判斷是哪項改變改善了結果。

常見問題

Vidu Q3 Turbo 在 Novita AI 上比 Vidu Q3 Pro 便宜嗎？

是的。截至 2026 年 6 月 23 日檢查的 Novita AI 最新定價顯示，在文字轉影片、圖片轉影片和開始-結束轉影片的 540p、720p 和 1080p 解析度下，Turbo 的價格都低於 Pro。

Vidu Q3 Pro 和 Turbo 支援相同的模式嗎？

Novita AI 文件列出了文字轉影片、圖片轉影片和開始-結束轉影片的獨立 Pro 和 Turbo 端點。每個端點回傳一個 task_id 並使用 v3 非同步任務結果流程。

我應該先使用文字轉影片還是圖片轉影片？

當你只有一個想法或書面場景時，先使用文字轉影片。當參考圖片很重要時（例如產品照片、角色畫面或固定的視覺風格），先使用圖片轉影片。

何時應該使用開始-結束轉影片？

當你有兩個幀，並且需要模型在它們之間建立動態時使用開始-結束轉影片。它是三種模式中最結構化的，因為首幀和末幀都已指定。

Vidu Q3 支援音訊控制嗎？

是的。Vidu Q3 文件包含音訊控制。文字轉影片和開始-結束轉影片提供一個 audio 布林值。Pro 圖片轉影片將 audio 列為自訂音訊 URL 欄位（用於背景音樂），而 Turbo 圖片轉影片則列出一個 audio 布林值加上 audio_type 選項：all、speech_only 和 sound_effect_only。

我應該對同一個提示詞同時執行 Vidu Q3 Turbo 和 Pro 嗎？

當你探索提示詞、參考圖片、持續時間和長寬比時，先執行 Turbo。如果某個結果接近你需要的，用 Pro 重新執行相同的設定，這樣比較就能隔離模型變體的影響，而非混合提示詞和輸入的變化。