Hunyuan Video：一款開源AI文字轉影片模型

開源可用性
僅支援文字轉影片
硬體需求
模型架構與關鍵創新
比較
應用

重點摘要

Hunyuan Video 是一款 AI 文字轉影片生成器，擅長將文字提示轉換為電影級品質的影片。

該模型可生成最高 **1024x576 像素 **、長達 16 秒 的影片。

它支援不同等級的 GPU，即使較低 VRAM（最低 24GB）仍會影響影片品質與生成速度。

Hunyuan Video 是由騰訊開發的新穎開源影片基礎模型，專為從文字描述生成高品質影片而設計。其整合了數據策展、圖像-影片聯合模型訓練與高效基礎設施，有助於大規模模型訓練與推論。Hunyuan Video 旨在縮小封閉原始碼與開源影片基礎模型之間的差距，讓社群能夠實驗 AI 驅動的影片創作。

https://videopress.com/v/r7bUS0Ua?resizeToParent=true&cover=true&preloadContent=metadata&useAverageColor=true

立即在 Novita AI 上開始免費試用。若要整合 Hunyuan Video API，請造訪我們的開發者文件了解更多詳情。

開源可用性

Hunyuan Video 以 新穎的開源 ** 影片基礎模型脫穎而出，這是為了 ** 普及 ** 先進 AI 影片生成技術的有意之舉。騰訊釋出該模型的程式碼與權重，旨在 ** 縮小 專有封閉原始碼替代方案與開源社群之間的差距。

僅支援文字轉影片

Hunyuan Video 被定位為文字轉影片（T2V）模型。圖像轉影片模型的釋出已被延後，預計可能在未來推出。

硬體需求

考量以上幾點，硬體需求對個人使用者來說相對較高，但與一些競爭的 AI 影片生成模型相比 更為可行。

基本需求：
• VRAM：最低 24GB，建議 45GB，最佳 80GB
• GPU：支援 CUDA 的 NVIDIA GPU
• RAM：32GB
• 儲存空間：100GB 可用空間

解析度 vs VRAM：
• 720p（1280x720）：60GB VRAM
• 544p（960x544）：45GB VRAM

模型架構與關鍵創新

統一生成框架
• 採用先進的 Transformer 與 Full Attention
• 獨特的「雙流到單流」設計
• 無縫融合影片與文字處理

來自 Hunyuan

增強語言理解
• 由多模態大語言模型（MLLM）驅動
• 僅解碼器（Decoder-Only）結構擅長細節理解
• 相較傳統 CLIP/T5 模型，具有更優的圖像-文字對齊能力

來自 Hunyuan

高效影片處理
• 先進的 3D VAE 搭配 CausalConv3D
• 最佳化的潛在空間壓縮
• 在原始解析度/幀率下保持高品質

來自 Hunyuan

智慧提示系統
• 內建提示最佳化引擎
• 兩種模式：Normal（基本）與 Master（詳細）
• 自動重新格式化使用者輸入以獲得最佳結果

比較

VBench 是一個強大且全面的基準測試套件，旨在評估影片生成模型。它將「影片生成品質」分解為分層、解耦且特定的維度，每個維度都配備了量身打造的提示與評估方法。主要評估指標包括：

大動作生成
人體偽影
像素級穩定性
身份一致性
物理合理性
平滑度
綜合圖像品質
場景生成品質
風格化能力
單一物體準確度
多個物體準確度
空間位置準確度
攝影機控制
動作指令跟隨

目前尚無針對 Hunyuan 的權威 VBench 評估，僅有 Hunyuan 自己在 GitHub 上進行的實驗。以下是他們的測試方法：

為了評估 Hunyuan Video 的效能，他們從封閉原始碼的影片生成模型中選取了五個強基準。他們使用 1,533 個文字提示，以 HunyuanVideo 一次性生成相同數量的影片樣本。為確保公平性，他們只進行一次推論，避免挑選結果。在與基準方法比較時，他們對所有選定模型使用預設設定，以保持一致的影片解析度。影片根據三個標準進行評估：文字對齊、動作品質與視覺品質。超過 60 位專業評估者進行了評估。Hunyuan Video 在整體表現上最佳，尤其在動作品質方面。請注意，此評估使用的是 Hunyuan Video 的高品質版本，與目前發布的快速版本不同。

來自 Hunyuan

立即體驗 Hunyuan Video 示範

應用

為社交媒體、行銷或娛樂創作內容
視覺化想法或概念
製作教學或解說用的教育影片
為藝術專案進行創意實驗
產品示範、創意場景、角色動畫與宣傳內容

Hunyuan Video 站在 AI 驅動影片生成的前沿，提供一個強大的開源解決方案，能將文字描述轉換為逼真、高品質的影片內容。其突破性的架構，結合高效的訓練方法與對影片品質的堅定關注，已成為學術研究人員與創意專業人士的寶貴工具。作為一個由活躍社群參與支援的開源平台，Hunyuan Video 已準備好引領 AI 影片生成技術的下一次創新浪潮。

Novita AI 是全方位雲端平台，助力您的 AI 抱負。整合 API、無伺服器、GPU 實例——您所需的經濟高效工具。消除基礎設施，免費開始，讓您的 AI 願景成真。

Hunyuan Video：一款開源AI文字轉影片模型

重點摘要

開源可用性

僅支援文字轉影片

硬體需求

模型架構與關鍵創新

比較

應用

推薦閱讀

Product

RESOURCES

Partners

Company

重點摘要

開源可用性

僅支援文字轉影片

硬體需求

模型架構與關鍵創新

比較

應用

推薦閱讀

相關文章

Product

RESOURCES

Partners

Company