- Seedance V1.5 Pro 快速选择表
- Novita AI 上提供的 Seedance V1.5 Pro 模式
- Seedance V1.5 Pro 文生视频 vs 图生视频
- Seedance V1.5 Pro 音频 vs 静音输出
- Seedance V1.5 Pro 在线 vs Flex 批量处理
- Seedance V1.5 Pro 分辨率:480p vs 720p vs 1080p
- Seedance V1.5 Pro 按分辨率、音频和 Flex 批量定价
- 应首先测试哪种 Seedance V1.5 Pro 模式?
- Novita AI 上的 Seedance V1.5 Pro API 工作流
- Seedance V1.5 Pro 最终建议
- 常见问题
在 Novita AI 上选择 Seedance V1.5 Pro 时,最简便的方法是从已有的素材入手:当场景从提示词开始时使用文生视频;当需要第一帧或首尾帧设定来引导结果时使用图生视频;在早期视觉迭代阶段保持静音输出;只有当语音、音效或音乐是验收标准的一部分时才添加音频;对于延迟不敏感的批量任务,则使用 flex 服务层级。
Seedance V1.5 Pro 快速选择表
| 决策 | 从此处开始 | 原因 |
|---|---|---|
| 你只有文字描述的场景 | 文生视频 | T2V 端点需要 prompt,可根据提示自适应选择画面比例。 |
| 你有产品图、角色帧、分镜帧或已确认的视觉素材 | 图生视频 | I2V 端点需要 image 加 prompt,首帧为生成片段提供锚点。 |
| 你需要控制开头和结尾 | 图生视频(带 last_image) |
I2V API 支持可选的 last_image,实现首尾帧生成。 |
| 你需要生成的语音、音效或背景音乐 | 设置 generate_audio: true |
启用后,音频由提示词和视觉内容生成。 |
| 你将自行添加音频 | 设置 generate_audio: false |
静音输出可避免为要丢弃的生成音频付费。 |
| 你希望更快获得面向用户的结果 | 使用 service_tier: "default" |
文档将 default 描述为适用于时间敏感场景的在线推理。 |
| 你可以等待并希望降低单位成本 | 使用 service_tier: "flex" |
文档将 flex 描述为离线推理,价格为在线模式的 50%。 |
| 你在探索提示词 | 在延迟不重要时,从 480p 静音 flex 开始 | 在重新生成最终候选片段前,使早期探索更便宜。 |
| 你在审查接近最终的片段 | 切换到 720p,仅在音频是验收标准的一部分时启用 | 720p 比 480p 成本更高,音频会使列出的每秒费率翻倍。 |
Novita AI 上提供的 Seedance V1.5 Pro 模式
Novita AI 通过独立的异步视频 API 暴露 Seedance V1.5 Pro:
| 模式 | Novita API 路径 | 必需输入 | 可选输入与控制 |
|---|---|---|---|
| Seedance V1.5 Pro 文生视频 | POST /v3/async/seedance-v1.5-pro-t2v |
prompt |
fps, seed, ratio, duration, watermark, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after |
| Seedance V1.5 Pro 图生视频 | POST /v3/async/seedance-v1.5-pro-i2v |
image, prompt |
fps, seed, ratio, duration, watermark, last_image, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after |
两个 API 都先返回任务 ID,而非已完成视频。应用程序应调用 Novita AI 任务结果 API 来检查状态并在任务完成后获取生成的媒体。
共享的请求控制参数对产品设计至关重要。文档列出了 duration 的取值范围 4 到 12 秒,fps 为 24,ratio 的选项包括 16:9、4:3、1:1、3:4、9:16、21:9 和 adaptive,resolution 的选项为 480p、720p 和 1080p。execution_expires_after 字段默认为 172800 秒,文档给出的范围是 3600 到 259200 秒。
Seedance V1.5 Pro 文生视频 vs 图生视频
当创意仍停留在文字阶段时,选择文生视频。如果你的工作流始于一行脚本、镜头方向、主题描述或创意简报,T2V 可使第一版生成保持轻量。它更适合构思、提示词探索以及当精确的产品或角色身份并非主要验收标准的情况。
当首帧视觉素材至关重要时,选择图生视频。I2V 更适合产品静物、设计帧、角色参考、缩略图、分镜面板和品牌控视觉。它不保证每一帧都完美保留身份特征,但为生成提供了一个纯提示 T2V 所不具备的具体起点。
I2V 独有的额外字段是 last_image。当片段需要从已知的开场帧过渡到已知的结束帧时使用它。这对于过渡测试、简短产品展示、简单的开始到结束运动以及最终构图已确定的分镜场景非常有用。当首尾帧宽高比不同时,文档指出尾帧会自动裁剪以匹配首帧,因此在视觉构图重要时,团队应准备匹配的宽高比。
对于纯提示概念,通常先测试 T2V。对于由素材驱动的概念,通常先测试 I2V。如果你已经知道起始帧,则无需强迫模型从文字中重新发现它。
Seedance V1.5 Pro 音频 vs 静音输出
Seedance V1.5 Pro 通过 generate_audio 提供了直接的音频开关。当设置为 true 时,生成的视频包含同步音频,例如基于提示词和视觉内容自动生成的语音、音效和背景音乐。当为 false 时,输出为静音。
音频会改变提示词编写方式。如果生成的语音是测试的一部分,请明确写出要说的台词,并将其与视觉动作和环境音分开。模糊的场景提示可能足以进行视觉探索,但通常不足以进行可靠的音频审查。
音频也会改变成本。根据 2026 年 6 月 22 日检查的最新 Novita 定价页面数据,Seedance V1.5 Pro T2V 和 I2V 在 480P 和 720P 下的音频行价格是相应静音行的两倍。如果你的产品将在单独管线中添加画外音、音乐背景或声音设计,请为早期通次生成静音视频。如果同步语音或场景音频是实际产品需求的一部分,请尽早测试音频,因为它会影响审查标准和预算。
Seedance V1.5 Pro 在线 vs Flex 批量处理
service_tier 字段是主要的处理层级选择。Seedance V1.5 Pro 文档将 default 描述为具有较低 RPM 和并发配额的在线推理,适用于时间敏感场景。将 flex 描述为离线推理,具有更高的 TPD 配额,价格为在线模式的 50%,适用于延迟不敏感场景。
对于应用设计,将 default 视为交互通道,将 flex 视为批量通道。一个面向用户的创意工具,当有人在 UI 中等待时,应从 default 开始。夜间的提示词扫描、数据集风格的创意评估、大型内部审核队列或非紧急的活动批次可以使用 flex。
这种区分与异步 API 模式不同。两种模式仍然先返回任务 ID。区别在于处理层级和成本概况,而非 API 是否同步。
Seedance V1.5 Pro 分辨率:480p vs 720p vs 1080p
当前 Seedance V1.5 Pro 文档列出了 480p、720p 和 1080p 作为支持的 resolution 值。当前定价页面数据为 Seedance V1.5 Pro T2V 和 I2V 显示了详细的 480P 和 720P 价格行。同一页面数据中,本次修订检查的数据未显示匹配的 Seedance V1.5 Pro 1080P 价格行,因此在规模化使用 1080p 之前,生产预算计划应核对实时定价页面或控制台。
对大多数团队而言,480p 是合适的探索设置。它足以判断提示词方向、粗略运动、图像参考是否有效以及音频是否应保留在范围内。当视觉审查比探索成本更重要时,将最终候选片段以 720p 重新生成。
仅在确认了计划运行的具体作业形状的可用性和计费方式后才使用 1080p。API 字段支持它,但仅凭可见的 480P 和 720P 行进行预算将是不完整的。
Seedance V1.5 Pro 按分辨率、音频和 Flex 批量定价
根据 2026 年 6 月 22 日检查的当前 Novita 定价页面数据,Seedance V1.5 Pro 文生视频和图生视频的价格相同。首帧 I2V 与首尾帧 I2V 行的价格也相同。
| 模式 | 分辨率 | 输出 | 在线 default |
Flex 批量 flex |
|---|---|---|---|---|
| T2V 或 I2V | 480P | 静音 | $0.012/秒 | $0.006/秒 |
| T2V 或 I2V | 480P | 音频 | $0.024/秒 | $0.012/秒 |
| T2V 或 I2V | 720P | 静音 | $0.026/秒 | $0.013/秒 |
| T2V 或 I2V | 720P | 音频 | $0.052/秒 | $0.026/秒 |
成本倍数关系是实用信息:
- 音频成本是相应静音行的两倍。
- Flex 批量成本是相应在线行的一半。
- 720P 成本略高于相应 480P 行的两倍。
- T2V 和 I2V 在相同分辨率、音频设置和服务层级下费率相同。
对于一个 10 秒的 720P 音频片段,列出的在线成本为 10 x $0.052,即 $0.52。同一片段通过 flex 在延迟可接受的情况下成本为 10 x $0.026,即 $0.26。对于一个 10 秒的 480P 静音探索片段,列出的 flex 成本为 10 x $0.006,即 $0.06。
这使得早期测试路径变得简单:通过关闭音频、使用 480P 和 flex 来降低成本,当审查无需即时结果时。仅在片段接近最终评估质量时才提高成本。
应首先测试哪种 Seedance V1.5 Pro 模式?
当你仍在寻找场景时,从 T2V 开始。编写五到十个简洁的提示词,保持时长足以进行审查,使用 480p,除非语音是核心创意,否则关闭音频。目标是在引入素材约束之前发现概念是否可行。
当素材本身就是概念时,从 I2V 开始。如果产品帧、角色参考或已确认的构图是必须的,那么在第一次测试中就使用该图像。T2V 提示词可能会创建出合理的场景,但除非你提供图像,否则它无法知道确切的参考图像。
当转场比开放式运动更重要时,从带 last_image 的 I2V 开始。这是已知开始和结束构图的正确首次测试。让首帧和尾帧在宽高比上接近,避免用过多不相关的动作使提示词过载。
除非音频是验收标准的一部分,否则从静音开始。一旦视觉方向可接受,如果需要,启用 generate_audio,并明确写出台词或声音提示。
对于队列使用 flex,对于实时 UI 使用 default。如果生成结果将进入后台审查管线,使用 flex 并将节省的开销用于更多变体。如果用户在产品界面中等待,使用 default 并围绕任务进度设计 UI。
Novita AI 上的 Seedance V1.5 Pro API 工作流
生产工作流应将两种 Seedance V1.5 Pro 模式视为异步作业:
- 根据是否有输入图像选择 T2V 或 I2V。
- 通过
generate_audio选择静音或音频。 - 通过
service_tier选择default或flex。 - 选择分辨率和时长。
- 将任务提交到特定模型的端点。
- 存储返回的任务 ID。
- 轮询任务结果 API,直到任务成功或失败。
- 在 URL 过期前存储返回的视频 URL。
以下是一个最小的文生视频请求示例:
curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${NOVITA_API_KEY}" \
--data-raw '{
"prompt": "A product demo clip showing a compact smart lamp turning on in a clean studio. Slow push-in camera movement, soft shadows, neutral background.",
"duration": 5,
"resolution": "480p",
"ratio": "16:9",
"service_tier": "flex",
"generate_audio": false,
"watermark": false
}'
以下是一个最小的图生视频请求示例:
curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${NOVITA_API_KEY}" \
--data-raw '{
"image": "https://example.com/product-frame.png",
"prompt": "Animate the lamp with a gentle light pulse while the camera makes a subtle forward move. Keep the product centered and avoid text overlays.",
"duration": 5,
"resolution": "480p",
"ratio": "adaptive",
"service_tier": "flex",
"generate_audio": false,
"watermark": false
}'
提交后,使用返回的任务 ID 配合任务结果 API。应处理排队、处理中、成功和失败等状态,而不是假设视频 URL 会立即可用。
Seedance V1.5 Pro 最终建议
对于大多数团队,最佳的首次 Seedance V1.5 Pro 测试是 480P、静音、flex:如果只有文字概念则用 T2V,如果有源图像则用 I2V。在提示词或参考图像接近目标后切换到 720P。仅在生成的语音、音效或音乐是审查的一部分时才启用音频。当结果面向用户且时间敏感时使用 default;当任务可以等待时使用 flex。
这个顺序在不改变核心 API 流程的情况下使首次评估保持低成本。一旦片段通过视觉审查,提高分辨率,如果需要则开启音频,并对较小的最终候选集合进行运行。
常见问题
Seedance V1.5 Pro 在 Novita AI 上是否同时支持文生视频和图生视频?
是的。Novita AI 文档分别列出了 Seedance V1.5 Pro T2V 和 I2V 端点:POST /v3/async/seedance-v1.5-pro-t2v 和 POST /v3/async/seedance-v1.5-pro-i2v。
Seedance V1.5 Pro 能否生成音频?
能。generate_audio 字段控制输出是否包含同步音频。设置为 true 可生成语音、音效或背景音乐,设置为 false 则输出静音视频。
图生视频比文生视频更贵吗?
本文检查的当前定价页面数据显示,在相同分辨率、音频设置和服务层级下,Seedance V1.5 Pro 的 T2V 和 I2V 费率相同。
在线处理与 flex 处理有何区别?
文档将 default 描述为适用于时间敏感场景的在线推理,将 flex 描述为适用于延迟不敏感场景的离线推理,价格为在线模式的 50%。
我应该先测试 480P 还是 720P?
使用 480P 进行广泛的提示词和参考图像探索。当概念足够接近,需要进行更严肃的视觉审查时,使用 720P。在大规模运行前,请核实 1080P 的计费方式。
