Kling 3.0 现已登陆 Novita AI,为开发者和创作者带来灵活可调的 3–15 秒视频生成、原生音频协同生成以及多镜头视频合成功能。定价透明且按用量计费:Standard 版不含音频起价为 $0.168/s,含音频为 $0.252/s;Pro 版不含音频定价为 $0.224/s,含音频为 $0.336/s。结合生产级 API 接入,Novita AI 上的 Kling 3.0 为从实验到部署提供了切实可行的路径。
Kling 3.0 是什么?
Kling 3.0 是快手(Kuaishou)最新的 AI 视频生成模型,于 2026 年 2 月 5 日全球发布。它在视频时长、原生多语言音频生成以及时序一致性方面进行了重大升级,使其更适合真实的创意和商业工作流。
与早期版本相比,Kling 3.0 带来了以下几项显著改进:
- 更长的视频生成:支持最长 15 秒,早期版本为 10 秒
- 原生多语言音频:支持中文、英语、日语、韩语和西班牙语,以及多种口音和方言
- 更强的元素一致性:角色、物体和场景在帧间保持更连贯
- 更好的文字保留:徽标、字幕和品牌元素在整段视频中保持更清晰、更易读
- 更逼真的输出效果:优化的面部表情和更自然的身体动作
Novita AI 上的 Kling 3.0:可用功能
Novita AI 当前支持四个 Kling 3.0 端点:
- Kling 3.0 Standard 文本生成视频
- Kling 3.0 Standard 图像生成视频
- Kling 3.0 Pro 文本生成视频
- Kling 3.0 Pro 图像生成视频
四个端点均支持:
- 灵活时长:3-15 秒(每次请求可选)
- 多种宽高比:16:9、9:16、1:1
- 可选音频协同生成:在创建视频时同步生成音频
- 多提示词合成:将视频分为多个镜头,每个镜头使用独立的提示词
Kling 3.0 Standard 与 Pro 的主要区别
总体来看,Novita 文档和定价中的区别很直接:Standard 专为成本效益迭代而设计,而 Pro 更适合需要更高级控制和更高输出质量的用户。
在 Novita AI 上,Kling 3.0 Standard 文本生成视频和图像生成视频的定价为 **$0.168/s(不含音频)**和 $0.252/s(含音频)。Pro 文本生成视频和图像生成视频的定价为 **$0.224/s(不含音频)**和 $0.336/s(含音频),Pro 比 Standard 大约贵 33%。
具体来说:
- 一段 5 秒静音视频在 Standard 上约需 $0.84,在 Pro 上约需 $1.12
- 一段 10 秒含音频视频在 Standard 上约需 $2.52,在 Pro 上约需 $3.36
对很多用户而言,最高效的工作流是先使用 Standard 快速迭代,当需要多镜头合成、更高一致性或更精致的输出时,再切换到 Pro,此时增加的投入便物有所值。
如何在 Novita AI 上使用 Kling 3.0
1. 获取 API 密钥
在 Novita AI 注册,并在控制台生成 API 密钥。Novita AI 为新用户提供免费额度。

2. 选择端点
Novita AI 提供四个专用端点:
- Standard 文本生成视频:
POST /v3/async/txt2video-kling-v3.0-std - Standard 图像生成视频:
POST /v3/async/img2video-kling-v3.0-std - Pro 文本生成视频:
POST /v3/async/txt2video-kling-v3.0-pro - Pro 图像生成视频:
POST /v3/async/img2video-kling-v3.0-pro
3. 发起第一个请求
以 Kling 3.0 Standard 文本生成视频为例:
curl --request POST \
--url https://api.novita.ai/v3/async/kling-v3.0-std-t2v \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>' \
--data '
{
"sound": true,
"prompt": "<string>",
"duration": 123,
"cfg_scale": 123,
"aspect_ratio": "<string>",
"negative_prompt": "<string>"
}
'
4. 轮询获取结果
Kling 3.0 是异步的——您会立即收到一个 task_id。轮询结果端点:
curl --request GET \
--url https://api.novita.ai/v3/async/task-result \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>'
定价明细:Novita AI 上的 Kling 3.0
Novita AI 对 Kling 3.0 采用按秒计费,让您能精确控制 3-15 秒间任意时长的成本。
完整定价表
| 模型 | 模式 | 音频 | 每秒价格 | 5 秒费用 | 10 秒费用 | 15 秒费用 |
| Standard | 文本生成视频 | 否 | $0.168/s | $0.84 | $1.68 | $2.52 |
| Standard | 文本生成视频 | 是 | $0.252/s | $1.26 | $2.52 | $3.78 |
| Standard | 图像生成视频 | 否 | $0.168/s | $0.84 | $1.68 | $2.52 |
| Standard | 图像生成视频 | 是 | $0.252/s | $1.26 | $2.52 | $3.78 |
| Pro | 文本生成视频 | 否 | $0.224/s | $1.12 | $2.24 | $3.36 |
| Pro | 文本生成视频 | 是 | $0.336/s | $1.68 | $3.36 | $5.04 |
| Pro | 图像生成视频 | 否 | $0.224/s | $1.12 | $2.24 | $3.36 |
| Pro | 图像生成视频 | 是 | $0.336/s | $1.68 | $3.36 | $5.04 |
关键定价说明
- 按秒计费适用于您指定的实际时长(3-15 秒)
- 音频会增加 50% 成本(Standard:+$0.084/s,Pro:+$0.112/s)
- 同一级别内文本生成视频与图像生成视频定价相同
- 相同配置下,Pro 比 Standard 贵 33%
结论
Novita AI 上的 Kling 3.0 让 AI 视频生成更贴近真实生产工作流。凭借 3–15 秒视频支持、原生音频以及改进的时序一致性,它适用于电商演示、社交内容、概念测试等场景。结合透明定价、可靠的 API 接入以及灵活的时长控制,Novita AI 在成本、质量与易用性之间取得了良好平衡。如果您正在为产品或内容管线评估 AI 视频,不妨从 Novita AI 上的 Kling 3.0 开始。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的简便途径,同时提供价格实惠、稳定可靠的 GPU 云服务用于构建和扩展。
常见问题
Kling 3.0 与 3.0 Omni 有什么区别?
Kling 3.0(Standard/Pro)从文本或图像生成单个视频,支持多提示词合成。Kling 3.0 Omni 额外支持参考视频编辑、多镜头分镜(最多 6 段)以及用于角色一致性的元素库。
Kling 3.0 是免费的吗?
不是。Novita AI 上的 Kling 3.0 采用按秒计费:Standard 版 $0.168/s(不含音频)或 $0.252/s(含音频);Pro 版 $0.224/s 或 $0.336/s。Novita AI 为新用户提供免费额度。示例:一段 10 秒含音频的 Pro 视频费用为 $3.36。
生成一个视频需要多长时间?
生成时间通常为 30-120 秒,取决于视频时长(3-15s)、模式(Standard/Pro)以及是否开启音频。Kling 3.0 使用异步 API:提交请求后获得任务 ID,当状态变为 “succeed” 时轮询获取结果。
