Seedance V1.5 Pro 在 Novita AI 上:文生视频 vs 图生视频、音频与静音模式

Seedance V1.5 Pro 在 Novita AI 上:文生视频 vs 图生视频、音频与静音模式

在 Novita AI 上选择 Seedance V1.5 Pro 时,最简便的方法是从已有的素材入手:当场景从提示词开始时使用文生视频;当需要第一帧或首尾帧设定来引导结果时使用图生视频;在早期视觉迭代阶段保持静音输出;只有当语音、音效或音乐是验收标准的一部分时才添加音频;对于延迟不敏感的批量任务,则使用 flex 服务层级。

Seedance V1.5 Pro 快速选择表

决策 从此处开始 原因
你只有文字描述的场景 文生视频 T2V 端点需要 prompt,可根据提示自适应选择画面比例。
你有产品图、角色帧、分镜帧或已确认的视觉素材 图生视频 I2V 端点需要 imageprompt,首帧为生成片段提供锚点。
你需要控制开头和结尾 图生视频(带 last_image I2V API 支持可选的 last_image,实现首尾帧生成。
你需要生成的语音、音效或背景音乐 设置 generate_audio: true 启用后,音频由提示词和视觉内容生成。
你将自行添加音频 设置 generate_audio: false 静音输出可避免为要丢弃的生成音频付费。
你希望更快获得面向用户的结果 使用 service_tier: "default" 文档将 default 描述为适用于时间敏感场景的在线推理。
你可以等待并希望降低单位成本 使用 service_tier: "flex" 文档将 flex 描述为离线推理,价格为在线模式的 50%。
你在探索提示词 在延迟不重要时,从 480p 静音 flex 开始 在重新生成最终候选片段前,使早期探索更便宜。
你在审查接近最终的片段 切换到 720p,仅在音频是验收标准的一部分时启用 720p 比 480p 成本更高,音频会使列出的每秒费率翻倍。

Novita AI 上提供的 Seedance V1.5 Pro 模式

Novita AI 通过独立的异步视频 API 暴露 Seedance V1.5 Pro:

模式 Novita API 路径 必需输入 可选输入与控制
Seedance V1.5 Pro 文生视频 POST /v3/async/seedance-v1.5-pro-t2v prompt fps, seed, ratio, duration, watermark, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after
Seedance V1.5 Pro 图生视频 POST /v3/async/seedance-v1.5-pro-i2v image, prompt fps, seed, ratio, duration, watermark, last_image, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after

两个 API 都先返回任务 ID,而非已完成视频。应用程序应调用 Novita AI 任务结果 API 来检查状态并在任务完成后获取生成的媒体。

共享的请求控制参数对产品设计至关重要。文档列出了 duration 的取值范围 4 到 12 秒,fps 为 24,ratio 的选项包括 16:94:31:13:49:1621:9adaptiveresolution 的选项为 480p720p1080pexecution_expires_after 字段默认为 172800 秒,文档给出的范围是 3600 到 259200 秒。

Seedance V1.5 Pro 文生视频 vs 图生视频

当创意仍停留在文字阶段时,选择文生视频。如果你的工作流始于一行脚本、镜头方向、主题描述或创意简报,T2V 可使第一版生成保持轻量。它更适合构思、提示词探索以及当精确的产品或角色身份并非主要验收标准的情况。

当首帧视觉素材至关重要时,选择图生视频。I2V 更适合产品静物、设计帧、角色参考、缩略图、分镜面板和品牌控视觉。它不保证每一帧都完美保留身份特征,但为生成提供了一个纯提示 T2V 所不具备的具体起点。

I2V 独有的额外字段是 last_image。当片段需要从已知的开场帧过渡到已知的结束帧时使用它。这对于过渡测试、简短产品展示、简单的开始到结束运动以及最终构图已确定的分镜场景非常有用。当首尾帧宽高比不同时,文档指出尾帧会自动裁剪以匹配首帧,因此在视觉构图重要时,团队应准备匹配的宽高比。

对于纯提示概念,通常先测试 T2V。对于由素材驱动的概念,通常先测试 I2V。如果你已经知道起始帧,则无需强迫模型从文字中重新发现它。

Seedance V1.5 Pro 音频 vs 静音输出

Seedance V1.5 Pro 通过 generate_audio 提供了直接的音频开关。当设置为 true 时,生成的视频包含同步音频,例如基于提示词和视觉内容自动生成的语音、音效和背景音乐。当为 false 时,输出为静音。

音频会改变提示词编写方式。如果生成的语音是测试的一部分,请明确写出要说的台词,并将其与视觉动作和环境音分开。模糊的场景提示可能足以进行视觉探索,但通常不足以进行可靠的音频审查。

音频也会改变成本。根据 2026 年 6 月 22 日检查的最新 Novita 定价页面数据,Seedance V1.5 Pro T2V 和 I2V 在 480P 和 720P 下的音频行价格是相应静音行的两倍。如果你的产品将在单独管线中添加画外音、音乐背景或声音设计,请为早期通次生成静音视频。如果同步语音或场景音频是实际产品需求的一部分,请尽早测试音频,因为它会影响审查标准和预算。

Seedance V1.5 Pro 在线 vs Flex 批量处理

service_tier 字段是主要的处理层级选择。Seedance V1.5 Pro 文档将 default 描述为具有较低 RPM 和并发配额的在线推理,适用于时间敏感场景。将 flex 描述为离线推理,具有更高的 TPD 配额,价格为在线模式的 50%,适用于延迟不敏感场景。

对于应用设计,将 default 视为交互通道,将 flex 视为批量通道。一个面向用户的创意工具,当有人在 UI 中等待时,应从 default 开始。夜间的提示词扫描、数据集风格的创意评估、大型内部审核队列或非紧急的活动批次可以使用 flex

这种区分与异步 API 模式不同。两种模式仍然先返回任务 ID。区别在于处理层级和成本概况,而非 API 是否同步。

Seedance V1.5 Pro 分辨率:480p vs 720p vs 1080p

当前 Seedance V1.5 Pro 文档列出了 480p720p1080p 作为支持的 resolution 值。当前定价页面数据为 Seedance V1.5 Pro T2V 和 I2V 显示了详细的 480P 和 720P 价格行。同一页面数据中,本次修订检查的数据未显示匹配的 Seedance V1.5 Pro 1080P 价格行,因此在规模化使用 1080p 之前,生产预算计划应核对实时定价页面或控制台。

对大多数团队而言,480p 是合适的探索设置。它足以判断提示词方向、粗略运动、图像参考是否有效以及音频是否应保留在范围内。当视觉审查比探索成本更重要时,将最终候选片段以 720p 重新生成。

仅在确认了计划运行的具体作业形状的可用性和计费方式后才使用 1080p。API 字段支持它,但仅凭可见的 480P 和 720P 行进行预算将是不完整的。

Seedance V1.5 Pro 按分辨率、音频和 Flex 批量定价

根据 2026 年 6 月 22 日检查的当前 Novita 定价页面数据,Seedance V1.5 Pro 文生视频和图生视频的价格相同。首帧 I2V 与首尾帧 I2V 行的价格也相同。

模式 分辨率 输出 在线 default Flex 批量 flex
T2V 或 I2V 480P 静音 $0.012/秒 $0.006/秒
T2V 或 I2V 480P 音频 $0.024/秒 $0.012/秒
T2V 或 I2V 720P 静音 $0.026/秒 $0.013/秒
T2V 或 I2V 720P 音频 $0.052/秒 $0.026/秒

成本倍数关系是实用信息:

  • 音频成本是相应静音行的两倍。
  • Flex 批量成本是相应在线行的一半。
  • 720P 成本略高于相应 480P 行的两倍。
  • T2V 和 I2V 在相同分辨率、音频设置和服务层级下费率相同。

对于一个 10 秒的 720P 音频片段,列出的在线成本为 10 x $0.052,即 $0.52。同一片段通过 flex 在延迟可接受的情况下成本为 10 x $0.026,即 $0.26。对于一个 10 秒的 480P 静音探索片段,列出的 flex 成本为 10 x $0.006,即 $0.06。

这使得早期测试路径变得简单:通过关闭音频、使用 480P 和 flex 来降低成本,当审查无需即时结果时。仅在片段接近最终评估质量时才提高成本。

应首先测试哪种 Seedance V1.5 Pro 模式?

当你仍在寻找场景时,从 T2V 开始。编写五到十个简洁的提示词,保持时长足以进行审查,使用 480p,除非语音是核心创意,否则关闭音频。目标是在引入素材约束之前发现概念是否可行。

当素材本身就是概念时,从 I2V 开始。如果产品帧、角色参考或已确认的构图是必须的,那么在第一次测试中就使用该图像。T2V 提示词可能会创建出合理的场景,但除非你提供图像,否则它无法知道确切的参考图像。

当转场比开放式运动更重要时,从带 last_image 的 I2V 开始。这是已知开始和结束构图的正确首次测试。让首帧和尾帧在宽高比上接近,避免用过多不相关的动作使提示词过载。

除非音频是验收标准的一部分,否则从静音开始。一旦视觉方向可接受,如果需要,启用 generate_audio,并明确写出台词或声音提示。

对于队列使用 flex,对于实时 UI 使用 default。如果生成结果将进入后台审查管线,使用 flex 并将节省的开销用于更多变体。如果用户在产品界面中等待,使用 default 并围绕任务进度设计 UI。

Novita AI 上的 Seedance V1.5 Pro API 工作流

生产工作流应将两种 Seedance V1.5 Pro 模式视为异步作业:

  1. 根据是否有输入图像选择 T2V 或 I2V。
  2. 通过 generate_audio 选择静音或音频。
  3. 通过 service_tier 选择 defaultflex
  4. 选择分辨率和时长。
  5. 将任务提交到特定模型的端点。
  6. 存储返回的任务 ID。
  7. 轮询任务结果 API,直到任务成功或失败。
  8. 在 URL 过期前存储返回的视频 URL。

以下是一个最小的文生视频请求示例:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A product demo clip showing a compact smart lamp turning on in a clean studio. Slow push-in camera movement, soft shadows, neutral background.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

以下是一个最小的图生视频请求示例:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Animate the lamp with a gentle light pulse while the camera makes a subtle forward move. Keep the product centered and avoid text overlays.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

提交后,使用返回的任务 ID 配合任务结果 API。应处理排队、处理中、成功和失败等状态,而不是假设视频 URL 会立即可用。

Seedance V1.5 Pro 最终建议

对于大多数团队,最佳的首次 Seedance V1.5 Pro 测试是 480P、静音、flex:如果只有文字概念则用 T2V,如果有源图像则用 I2V。在提示词或参考图像接近目标后切换到 720P。仅在生成的语音、音效或音乐是审查的一部分时才启用音频。当结果面向用户且时间敏感时使用 default;当任务可以等待时使用 flex

这个顺序在不改变核心 API 流程的情况下使首次评估保持低成本。一旦片段通过视觉审查,提高分辨率,如果需要则开启音频,并对较小的最终候选集合进行运行。

常见问题

Seedance V1.5 Pro 在 Novita AI 上是否同时支持文生视频和图生视频?

是的。Novita AI 文档分别列出了 Seedance V1.5 Pro T2V 和 I2V 端点:POST /v3/async/seedance-v1.5-pro-t2vPOST /v3/async/seedance-v1.5-pro-i2v

Seedance V1.5 Pro 能否生成音频?

能。generate_audio 字段控制输出是否包含同步音频。设置为 true 可生成语音、音效或背景音乐,设置为 false 则输出静音视频。

图生视频比文生视频更贵吗?

本文检查的当前定价页面数据显示,在相同分辨率、音频设置和服务层级下,Seedance V1.5 Pro 的 T2V 和 I2V 费率相同。

在线处理与 flex 处理有何区别?

文档将 default 描述为适用于时间敏感场景的在线推理,将 flex 描述为适用于延迟不敏感场景的离线推理,价格为在线模式的 50%。

我应该先测试 480P 还是 720P?

使用 480P 进行广泛的提示词和参考图像探索。当概念足够接近,需要进行更严肃的视觉审查时,使用 720P。在大规模运行前,请核实 1080P 的计费方式。

推荐阅读