Wan 2.5 是 Wan 影片生成系列的最新專有進化版本,現已正式上線 Novita AI。本次更新推出了兩款專屬模型:
- Wan 2.5 Preview 文字轉影片(T2V) — 可直接從文字描述生成高品質影片,支援5 秒與 10 秒的影片長度。
- Wan 2.5 Preview 圖片轉影片(I2V) — 可根據初始圖片與文字指引生成流暢的動態影片,同樣提供5 秒與 10 秒的格式選項。
兩個版本首度搭載全新音訊功能,支援自動配音,也提供上傳自訂音訊檔案的選項,實現無縫同步。基於先進的深度學習技術,Wan 2.5 能提供更清晰的畫質、更流暢的動態效果、更快的生成速度——讓創作者、教育工作者與行銷人員能夠以極低的成本產出專業級別的影片內容。
以下是 Wan 2.5 目前在 Novita AI 上的定價:
Wan 2.5 重點特色
Wan 2.5 以 Wan 2.1 的扎實基礎為底,在生成品質與整體模型能力上都有顯著提升。這些進步源於多項核心技術創新,其中最關鍵的是整合了混合專家(Mixture-of-Experts, MoE)架構、擴充與優化了訓練資料,以及採用了高壓縮影片生成技術。
1. AI 驅動的自動化
自動處理場景轉場、光線與節奏,最大程度減少手動編輯工作量,同時確保電影級的畫面一致性。
2. 文字轉影片與圖片轉影片生成
能將提示詞或劇本轉換為動態、可直接分享的影片,大幅縮短製作時間。
3. 精準音訊同步
可完美對齊旁白、音樂與音效,產出專業級的影音成果。
4. 高畫質輸出
支援最高1080p 與 4K 匯出,畫質清晰、色彩鮮明,適合所有平台使用。
5. 彈性模板與自訂功能
提供擴充後的模板庫,支援可調整的效果與品牌選項,釋放最大創作自由度。
6. 硬體友善的高效能
即使在標準個人電腦與消費級 GPU 上也能流暢運行,非常適合個人創作者或小型團隊。
Wan 2.5 在其影片擴散框架中整合了混合專家(MoE)架構。該架構在大型語言模型中已被驗證效果顯著,MoE 能大幅提升模型總參數量,同時不會明顯增加推論成本。在 Wan 2.5 的 A14B 系列中,專門為擴散去噪流程引入了雙專家配置:高噪聲專家負責早期生成階段,確立整體構圖;低噪聲專家負責後期階段,強化細部細節。每個專家包含約 140 億個參數,總參數量達 270 億,但每一步僅有 140 億個參數處於活躍狀態,幾乎不會增加推論運算負載與 GPU 記憶體用量。
Wan 2.5 與 Wan 2.2 對比:有哪些新功能?
雖然兩者屬於同一模型家族,但Wan 2.5 帶來了多項重大升級,在效能、效率與使用者體驗上都有全面提升。它在 Wan 2.1 的基礎上實現了更快的渲染速度、更優的真實感,以及更豐富的創作控制選項。
| 對比項目 | Wan 2.5 | Wan 2.2 |
|---|---|---|
| 演算法 | 採用先進深度學習技術,準確度更高、畫質更逼真 | 使用標準深度學習技術,影片品質普通 |
| 效能 | 生成速度更快,能高效處理複雜的高解析度場景 | 影片生成速度慢,僅支援有限的高解析度輸出 |
| 功能 | 新增擴充模板、精準音訊同步與可自訂效果 | 僅提供基礎模板與效果 |
| 使用者體驗 | 直覺易用的介面設計,適合初學者與專業人士使用 | 傳統介面,需要一定的學習成本 |
Wan 2.5 AI 影片模型的應用場景
- 行銷影片: 輕鬆產出專業的產品推廣、活動宣傳或品牌故事內容。
- 社群媒體內容: 生成適合 Instagram、TikTok、YouTube 等平台的精彩影片,提升互動率。
- 教育資源: 將課程教案、教學影片或講座內容轉換為互動性強、視覺吸引力高的學習材料。
- 企業簡報: 快速高效地產出精緻的內部溝通與培訓影片。
- 創意專案: 非常適合動畫、敘事型內容與多媒體藝術創作,實現無限的創意表達。
Wan 2.5 影片生成展示
T2V 提示詞:一名年輕男子靜靜地坐在地鐵列車上,周圍是快速移動的模糊人影。【近景】他幾乎不眨眼的眼神,強化了孤獨感。
I2V 參考圖片:

I2V 提示詞:一名銀髮女王莊重地站在中世紀要塞的庭院中。她的斗篷隨風輕輕飄動,士兵們靜靜地站在她身後。鏡頭緩緩推近,捕捉她髮絲的細微動態與盔甲上閃爍的光影。帶有柔和晨光與戲劇性氛圍的電影感調性。
立即在 Novita AI 上開始使用 Wan 2.5!
Wan 2.5 現已上線 Novita AI,1080p 畫質的 5 秒影片每段僅需 $0.75(T2V 與 I2V 同價),讓你能以可預測的成本體驗強大的影片生成功能。
步驟 1:登入並進入模型庫
登入你的帳號,點擊**模型庫**按鈕。

步驟 2:選擇你需要的模型
瀏覽可用的選項,選擇符合你需求的模型。

步驟 3:取得你的 API 金鑰
若要透過 API 進行驗證,我們會提供給你新的 API 金鑰。進入設定頁面後,即可按照圖中指示複製 API 金鑰。

步驟 4:安裝 API
使用你所用程式語言對應的套件管理器安裝 API。

安裝完成後,將必要的函式庫匯入你的開發環境。使用你的 API 金鑰初始化 API,即可開始與 Novita AI 的大型語言模型互動。以下為 Python 使用者適用的聊天完成 API 範例,更多詳情請查閱文件。
Wan 2.5 圖片轉影片 API 範例
import requests
url = "https://api.novita.ai/v3/async/wan-2.5-i2v-preview"
payload = {
"input": {
"prompt": "<string>",
"negative_prompt": "<string>",
"img_url": "<string>",
"audio_url": "<string>"
},
"parameters": {
"resolution": "<string>",
"duration": 123,
"prompt_extend": True,
"audio": True,
"seed": 123
}
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.json())
透過結合智慧自動化與彈性的創作控制,Wan 2.5 重新定義了 AI 驅動影片生成的可能性。其雙重文字轉影片與圖片轉影片模型,搭配精準的音訊整合與加速渲染功能,讓專業影片創作比以往更快、更流暢、更易於上手。無論用於敘事、教育還是行銷,Wan 2.5 都能讓每一位創作者輕鬆將想法化為現實,所有功能都整合在單一平台上。
常見問題
什麼是 Wan 2.5? Wan 2.5 是 Wan 系列的最新封閉源碼 AI 影片生成模型,能將文字、圖片或音訊轉換為完整的高品質影片,只需極低的操作成本。基於先進的深度學習技術,它能簡化整個製作流程——即使沒有專業的編輯技能,任何人都能產出視覺連貫的專業影片。
Wan 2.5 與 Wan 2.2 的主要差異是什麼? Wan 2.5 引入了混合專家(MoE)架構、更快的渲染速度、更高的視覺真實感、精準的音訊同步,以及 1080p/4K 輸出支援,比 Wan 2.2 更高效、更靈活。
Wan 2.5 是開源的吗? 不是。Wan 2.5 是封閉源碼模型,但可透過 Novita AI 平台與 API 整合公開使用。
Novita AI 是實現你 AI 抱負的全方位雲端平台。整合 API、無伺服器運算、GPU 實例——你需要的所有高性價比工具都在這裡。免除基礎設施搭建成本,免費開始使用,讓你的 AI 願景化為現實。
