Vidu Q3 Pro,盛数科技(Shengshu Technology)最新推出的 AI 影片生成模型,現已上線 Novita AI。這標誌著可存取的 AI 影片創作邁向重要里程碑——結合原生音視訊生成、最長16 秒的片段、1080p 解析度,所有功能都可透過簡單的 API 取得。
如果你一直在等待一個無需將音訊後製拼接至無聲片段的生產級影片模型,那現在就是時候了。
Vidu Q3 的與眾不同之處?
目前多數 AI 影片生成器輸出的都是無聲影片。即使有支援音訊,也多為事後添加,往往與視覺內容不同步。Vidu Q3 採用了完全不同的技術路線。
原生音視訊生成
Vidu Q3 會同步生成影片與音訊,而非先後生成,這代表:
- 對白、背景音樂、音效都會與視覺內容同步生成
- 場景節奏匹配:音訊韻律與畫面動作一致
- 無需後製拼接:你取得的是可直接發佈的完整影片
兩種模式:文字生成影片(T2V)與圖片生成影片(I2V)
Novita AI 現已開放兩種 Vidu Q3 Pro 版本的 API 存取:
1. 文字生成影片(T2V)
從文字描述生成完整影片。
核心規格:
- 解析度:540p、720p、1080p
- 時長:1 至 16 秒
- 畫面比例:16:9、9:16、4:3、3:4、1:1
- 音訊:同步對白 + 音效(可選)
2. 圖片生成影片(I2V)
讓靜態圖片產生自然動作,且保持主體一致性。
核心規格:
- 輸入:單張參考圖片(JPG、PNG、WEBP;最大 50MB)
- 動作控制:描述期望的鏡頭移動與場景動態
- 風格選項:一般(寫實)或動漫
- 自訂音訊:上傳自己的背景音樂(MP3、WAV、M4A、FLAC)
效能對比
Vidu Q3 最突出的優勢是整合式敘事能力。雖然 Kling 3.0 這類模型在視覺精緻度、Sora 2 在物理模擬方面表現優異,但 Vidu Q3 專注於生成完整的、可直接用於敘事的片段:
| 功能 | Vidu Q3 | 一般競爭對手 |
| 原生音視訊生成 | ✅ 支援 | ❌ 音訊需後製添加 |
| 單一片段最長時長 | 16 秒 | 8-12 秒 |
| 同步音效 | ✅ 支援 | ⚠️ 有限或需手動調整 |
| 多鏡頭敘事(智慧剪輯) | ✅ 支援 | ❌ 不支援 |
立即體驗:無需寫程式碼的遊樂場
想在整合 API 前先測試 Vidu Q3?你可以使用 Novita AI 的多模態遊樂場立即體驗:
👉 啟動 Vidu Q3 遊樂場
- 無需撰寫程式碼
- 透過視覺化介面調整參數
- 數秒內生成影片
- 非常適合提示詞測試與品質評估

如何透過 API 使用 Vidu Q3 Pro
取得你的 API 金鑰
- 註冊一個Novita AI 帳號
- 從控制台取得你的API 金鑰

在 Novita AI 上整合 API
Vidu Q3 Pro 的兩個 API 都是非同步的:
- 提交生成請求 → 取得
task_id - 輪詢任務結果 API → 影片生成完成後即可取得
在 Novita AI 上整合 API
Vidu Q3 Pro 的兩個 API 都是非同步的:
- 提交生成請求 → 取得
task_id - 輪詢任務結果 API → 影片生成完成後即可取得
步驟 1:提交影片生成請求
發送請求開始生成影片,你將立即收到 task_id。
- Python 程式碼
import requests
url = "https://api.novita.ai/v3/async/vidu-q3-pro-t2v"
payload = {
"seed": 123,
"audio": True,
"prompt": "<string>",
"wm_url": "<string>",
"duration": 123,
"off_peak": True,
"watermark": True,
"resolution": "<string>",
"wm_position": 123,
"aspect_ratio": "<string>"
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
- cURL 程式碼
curl --request POST \
--url https://api.novita.ai/v3/async/vidu-q3-pro-t2v \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>' \
--data '
{
"seed": 123,
"audio": true,
"prompt": "<string>",
"wm_url": "<string>",
"duration": 123,
"off_peak": true,
"watermark": true,
"resolution": "<string>",
"wm_position": 123,
"aspect_ratio": "<string>"
}
'
步驟 2:取得你的影片
使用 task_id 查詢任務結果 API 即可下載生成的影片。
- Python 程式碼
import requests
url = "https://api.novita.ai/v3/async/task-result"
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.get(url, headers=headers)
print(response.text)
- cURL 程式碼
curl --request GET \
--url https://api.novita.ai/v3/async/task-result \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>'
定價與優化建議
| 模型 | 時段 | 解析度 | 價格 |
| Vidu Q3 Pro 文字生成影片 | 離峰 | 540P | $0.0313 /秒 |
| 尖峰 | 540P | $0.0625 /秒 | |
| 離峰 | 720P | $0.067 /秒 | |
| 尖峰 | 720P | $0.1339 /秒 | |
| 離峰 | 1080P | $0.0714 /秒 | |
| 尖峰 | 1080P | $0.1429 /秒 | |
| Vidu Q3 Pro 圖片生成影片 | 離峰 | 540P | $0.0313 /秒 |
| 尖峰 | 540P | $0.0625 /秒 | |
| 離峰 | 720P | $0.067 /秒 | |
| 尖峰 | 720P | $0.1339 /秒 | |
| 離峰 | 1080P | $0.0714 /秒 | |
| 尖峰 | 1080P | $0.1429 /秒 |
🙌 Novita AI 為注重成本的工作流程提供離峰優惠價:
- 在 API 請求中設定
"off_peak": true- 任務會排隊處理,48 小時內完成
- 每次生成成本更低
非常適合批次處理、預先排程的內容創作,或非緊急的專案。
Vidu Q3 適合誰使用?
內容創作者與行銷人員
- 需要快速產出可發佈的影片廣告或社群短影音
- 希望無需聘請音訊設計師就能取得內建音訊的影片
產品團隊
- 為影片功能或演示製作原型
- 為 UX 模型生成預留位置的內容
開發者
- 開發以影片為核心的應用程式(例如 AI 虛擬分身、教育工具)
- 需要以程式方式取得高品質影片生成能力
影片製片人
- 在昂貴的拍攝前預先視覺化場景
- 快速迭代分鏡概念
總結
Vidu Q3 Pro 不只是一款新的影片模型——它是首個將音訊與視訊視為單一整合輸出的廣泛存取的 API。對於注重速度、連貫性與生產就緒度的工作流程來說,這是真正的進步。
無論你是要搭建 AI 驅動的內容流程,還是已經厭倦了手動將音訊同步到無聲片段,Novita AI 上的 Vidu Q3 都值得你測試。
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供平價且可靠的 GPU 雲端服務,用於建構與擴展 AI 應用。
常見問題
誰開發了 Vidu Q3?
Vidu Q3 由專注於影片生成模型的 AI 公司**盛数科技(Shengshu Technology)**開發。該公司於 2026 年初的全球創意周期間推出 Vidu Q3,定位為適用於敘事影片創作的生產級工具。
Vidu Q3 與其他 AI 影片模型有何不同?
Vidu Q3 會一次性同步生成影片與音訊,而非分步處理。這能產生與視覺節奏自然匹配的對白、音效與背景音樂,無需後製階段的音訊對齊工作。
生成一段影片需要多久?
生成時間取決於影片時長與解析度,一般標準請求的處理時間約為 2 至 5 分鐘。非緊急專案可使用 off_peak 選項,影片將在 48 小時內以更低的成本處理完成。
