关键亮点
Wan2.1 在实际精度方面表现出色,包括:
手部细节: 渲染手指和纹理。
绘制动画: 将静态绘图转换为剪辑。
物理: 模拟树木弯曲等效果。
头发运动: 真实地呈现线束动画。
对象交互: 处理复杂的空间交互。
人群渲染: 在大场景中保持清晰度。
通过 Novita AI,以 5秒720P视频售价0.40美元并提供易于使用的 API。Wan2.1 在视频生成方面兼具经济实惠、便捷性和精准性。
探索 Wan 2.1 的全部功能
什么是 Wan 2.1?
阿里云迈出了重要一步,开源了其 Wan2.1 系列用于视频生成的 AI 模型。此举降低了学术界、研究人员和商业用户的使用门槛,使他们无需支付巨额前期成本即可利用最先进的 AI 功能。通过开放这些模型,阿里云致力于促进 AI 和视频生成领域的创新与合作。
Wan2.1 的多功能功能
Wan2.1 是一款用途广泛的工具,在与视频和图像生成相关的各种任务中表现出色:
- 文本转视频 (T2V): 将文本提示转换为视频。
- 图像到视频 (I2V): 从单个图像输入生成视频。
- 视频编辑: 启用 AI 编辑以提高视频质量和效果。
- 文本转图像(T2I): 将文本描述转换为静止图像。
Wan2.1 的一个突出特点是它能够生成 中文和英文使其成为多语言视频生成领域的先驱。其强大的文本生成功能增强了其在各种用例中的实用性。
Wan2.1 的实际准确度
Wan2.1系列以其在模拟真实世界物理和细节方面的卓越精度而脱颖而出。以下是一些彰显其卓越性能的关键功能:
a. 牌局详情
- 该模型擅长渲染手部,展示准确的细节,例如 个别手指, 皮肤纹理, 乃至 配饰 像戒指一样。
b.绘制动画
- Wan2.1可以改造 静态图纸 成 短视频剪辑,使其成为动画师和数字艺术家的强大工具。
c.物理模拟
- 该模型准确地描述了现实世界的物理现象。例如,它可以渲染 长颈鹿倒挂在树上,用树枝 在重压下真实地弯曲.
d. 头发运动
- 它准确地呈现 头发运动 在视频中,显示 单独的股 当人们转头时它们会自然地移动。
e. 对象交互
- Wan2.1可以模拟 复杂对象交互,确保多个物体在同一空间内真实地互动。
f. 人群渲染
- 该模型擅长渲染 大群人 每个个体都保持独特,从而形成连贯而细致的场景。
Wan 2.1 的 VBench
VBench 旨在提供关于各个模型优缺点的宝贵见解,从而促进详细客观的评估。这些见解不仅为视频生成的未来发展提供参考,也有助于提升模型性能。为了确保与人类感知的一致性,VBench 集成了人类偏好注释,从而增强了其作为基准的相关性和可靠性。下图重点展示了 Wan2.1 的性能:

Wan2.1的硬件要求
Wan2.1 提供多种针对不同用例的型号,每种型号都有特定的硬件要求。以下是四种 Wan2.1 型号的硬件要求详细摘要:
| 型号名称 | 功能 | 分辨率支持 | 型号尺寸 | 硬件需求 | 首推最高性价比 GPU |
|---|---|---|---|---|---|
| T2V-14B | 文本转视频 (T2V) | 480P/720P | 14B | ⭐⭐⭐⭐ | A100 / RTX 3090 / RTX 4090 |
| I2V-14B-720P | 图像转视频 (I2V) | 720P | 14B | ⭐⭐⭐⭐ | A100 / RTX 3090 / RTX 4090 |
| I2V-14B-480P | 图像转视频 (I2V) | 480P | 14B | ⭐⭐⭐ | RTX 3090 / RTX 4070 Ti |
| T2V-1.3B | 文本转视频 (T2V) | 低分辨率 | 1.3B | ⭐⭐ | RTX 3060 / RTX 4060 或更高版本 |
使用 API 运行 Wan2.1
Novita AI 是一个 AI 云平台,它为开发人员提供了一种使用我们简单的 API 轻松部署 AI 模型的方法,同时还提供经济实惠且可靠的 GPU 用于构建和扩展的云。
Novita 在市场上提供极具竞争力的价格。
例如,一个 2.1 720P 5 秒的视频每段仅需 0.4 美元
Replicate 上的类似视频每个售价 1 美元
步骤 1:登录并访问模型库
登录您的帐户并点击 模型库 按钮。

步骤 2:选择您的型号
浏览可用的选项并选择适合您需求的模型。

第 3 步:开始免费试用
开始免费试用,探索所选型号的功能。

步骤 4:获取您的 API 密钥
为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。输入“个人设置“页面,您可以按照图中所示复制API密钥。

步骤 5:安装 API
使用特定于您的编程语言的包管理器安装 API。

安装完成后,将必要的库导入到你的开发环境中。使用你的 API 密钥初始化 API,即可开始与 Novita AI LLM。这是 Python 用户使用聊天完成 API 的示例。
导入请求 url = "https://api.novita.ai/v3/async/wan-t2v”有效载荷={“额外”:{“webhook”:{“url”:“ ", "test_mode": { "enabled": True, "return_task_status": " " }}, "模型名称": " ", "宽度": 123, "高度": 123, "种子": 123, "提示": " ", "frames": 123 } 标题 = { "Content-Type": " “, “授权”: ” " } 响应 = 请求。请求(“POST”,url,json = payload,headers = headers)打印(response.text)
常見問題解答
高性能 GPU滋味 A100, RTX 3090 或 RTX 4090 建议用于 14B 型号。
入门级型号(例如 T2V-1.3B)可以运行 RTX 3060+ 用于低分辨率任务。
有竞争力的价格: 每 0.40 秒 5P 视频 720 美元 相比之下,同类平台的价格为 2.39 美元。
易于使用的 API,为开发人员提供详细的文档。
使用 Wan2.1 通过 Novita AI:
登录 并访问模型库。
选择所需的型号。
开始 免费试用 探索其能力。
获取您的 API 密钥 个人设置 部分。
安装并将 API 集成到您的开发环境中。
Novita AI 是助力您实现 AI 梦想的一体化云平台。集成 API、无服务器、 GPU 实例——您所需的经济高效的工具。无需任何基础设施,免费启动,即可将您的 AI 愿景变为现实。
推荐阅读
探索 Novita 的更多内容
订阅即可将最新帖子发送到您的电子邮箱。






