Seedance V1.5 Pro API：文生视频与图生视频、音频与静音模式详解

Seedance V1.5 Pro 快速选择表
Novita AI 上的 Seedance V1.5 Pro 文生视频和图生视频模式
Seedance V1.5 Pro 文生视频 vs 图生视频
Seedance V1.5 Pro 音频 vs 静音输出
Seedance V1.5 Pro Online 在线 vs Flex 批量处理
Seedance V1.5 Pro 分辨率：480p vs 720p vs 1080p
Seedance V1.5 Pro 定价：按分辨率、音频和 Flex 批量区分
应该先测试哪个 Seedance V1.5 Pro 模式？
Novita AI 上的 Seedance V1.5 Pro API：完整工作流程
Seedance V1.5 Pro 最终推荐
常见问题解答

在 Novita AI 上选择 Seedance V1.5 Pro 最简单的方式是从你已有的素材开始：当场景源于提示词时使用文生视频，当需要第一帧或首尾帧设置来引导结果时使用图生视频，在早期视觉迭代时保持输出静音，只有当语音、音效或音乐是验收标准的一部分时才添加音频，并对延迟不敏感的批量工作使用 flex 服务层级。

如果你正在将 Seedance 与其他视频生成方案进行比较，建议先从 Novita AI 更广泛的 Sora 替代方案：AI 视频生成总览开始，然后使用本指南来确定 Seedance 特有的模式、音频、分辨率和服务层级决策。如需直接的模型间对比，Kling V2.5 Turbo 以可预测的每视频定价（无 flex/online 层级区分）覆盖了 T2V 和 I2V，而 MiniMax Hailuo 2.3 则为以图像为主导的工作流程添加了价格更低的 Fast I2V 端点。

Seedance V1.5 Pro 快速选择表

决策点	从这里开始	原因
你只有一个文字描述的场景	文生视频	T2V 端点需要 `prompt`（提示词），并能根据提示词选择自适应宽高比。
你有一张产品图、角色图、分镜图或已批准的视觉稿	图生视频	I2V 端点需要 `image`（图像）和 `prompt`，因此第一帧会锚定生成的片段。
你需要控制开始和结束画面	带 `last_image` 的图生视频	I2V API 支持可选的 `last_image` 参数用于首尾帧生成。
你需要生成语音、音效或背景音乐	设置 `generate_audio: true`	启用时，音频会根据提示词和视觉内容生成。
你之后会自己添加音频	设置 `generate_audio: false`	静音输出可以避免为你将要丢弃的生成音频付费。
你需要更快地获得面向用户的结果	使用 `service_tier: "default"`	文档中将 `default` 描述为适用于时间敏感场景的在线推理。
你可以等待并希望降低单位成本	使用 `service_tier: "flex"`	文档中将 `flex` 描述为离线推理，价格为在线模式的 50%。
你正在探索提示词	从静音、flex 模式、480p 开始（延迟不重要时）	在重新生成最终候选版本之前，可以降低早期探索成本。
你正在审查接近最终的片段	升级到 720p，并且仅在音频是验收标准时才开启	720p 比 480p 成本更高，音频会使列出的每秒费率翻倍。

Novita AI 上的 Seedance V1.5 Pro 文生视频和图生视频模式

Novita AI 通过独立的异步视频 API 提供 Seedance V1.5 Pro：

模式	Novita API 路径	必需输入	可选输入与控制参数
Seedance V1.5 Pro 文生视频	`POST /v3/async/seedance-v1.5-pro-t2v`	`prompt`	`fps`, `seed`, `ratio`, `duration`, `watermark`, `resolution`, `camera_fixed`, `service_tier`, `generate_audio`, `execution_expires_after`
Seedance V1.5 Pro 图生视频	`POST /v3/async/seedance-v1.5-pro-i2v`	`image`, `prompt`	`fps`, `seed`, `ratio`, `duration`, `watermark`, `last_image`, `resolution`, `camera_fixed`, `service_tier`, `generate_audio`, `execution_expires_after`

两个 API 首先返回一个任务 ID，而非完成的视频。应用程序应调用 Novita AI 任务结果 API 来检查状态并在任务完成后获取生成的媒体文件。

共享的请求控制参数对产品设计很重要。文档列出 duration 为 4 到 12 秒的值，fps 为 24，ratio 选项包括 16:9、4:3、1:1、3:4、9:16、21:9 和 adaptive，以及 resolution 选项 480p、720p 和 1080p。execution_expires_after 字段默认为 172800 秒，文档范围从 3600 到 259200 秒。

Seedance V1.5 Pro 文生视频 vs 图生视频

当创意仍停留在文字描述阶段时，选择文生视频。如果你的工作流程始于一行脚本、镜头方向、主体描述或创意简报，T2V 能让第一轮处理保持轻量。它是用于构思、提示词探索以及那些精确产品或角色身份不是主要验收标准的场景的更简洁模式。

当第一帧画面很重要时，选择图生视频。I2V 更适合产品静物图、设计稿、角色参考图、缩略图、分镜板以及品牌控制的视觉元素。它不能保证每一帧都完美保留身份特征，但为生成过程提供了一个具体的起点，这是单纯依赖提示词的 T2V 所不具备的。

额外的 I2V 专属字段是 last_image。当片段需要从已知的开场帧过渡到已知的结束帧时使用它。这对于转场测试、简短的产品展示、简单的前后运动以及最终构图已确定的分镜场景非常有用。如果首尾帧的宽高比不同，文档说明最后一帧会自动裁剪以匹配第一帧的宽高比，因此当视觉构图很重要时，团队应准备匹配的宽高比。

对于仅基于提示词的概念，T2V 通常是第一个测试。对于以素材为主导的概念，I2V 通常是第一个测试。如果你已经知道起始帧，不要强迫模型从文本中重新发现它。

Seedance V1.5 Pro 音频 vs 静音输出

Seedance V1.5 Pro 通过 generate_audio 提供直接的音频开关。当设置为 true 时，生成的视频会包含同步音频，例如根据提示词和视觉内容自动生成的语音、音效和背景音乐。当设置为 false 时，输出为静音。

音频会改变提示词编写方式。如果生成语音是测试的一部分，请明确写出旁白台词，并将其与视觉动作和环境音分开。一个模糊的场景提示词可能足以进行视觉探索，但通常不足以进行可靠的音频审查。

音频也会改变成本。根据 2026 年 6 月 22 日检查的当前 Novita 定价页面数据，Seedance V1.5 Pro 的 T2V 和 I2V 在 480P 和 720P 分辨率下，音频行的价格是对应静音行的两倍。如果你的产品将在单独的管线中添加配音、音乐背景或声音设计，那么在早期阶段生成静音视频。如果同步语音或场景音频是实际产品需求的一部分，请尽早测试音频，因为它会影响审查标准和预算。

Seedance V1.5 Pro Online 在线 vs Flex 批量处理

service_tier 字段是主要的处理层级选择。Seedance V1.5 Pro 文档将 default 描述为用于时间敏感场景的在线推理，具有较低的 RPM 和并发配额。将 flex 描述为用于延迟不敏感场景的离线推理，具有更高的 TPD 配额，价格为在线模式的 50%。

对于应用程序设计，将 default 视为交互通道，将 flex 视为批量通道。一个面向用户的创意工具，如果有人在 UI 中等待，则应从 default 开始。夜间提示词扫描、数据集式创意评估、大型内部审查队列或非紧急的营销活动批次可以使用 flex。

这种区别与异步 API 模式是分开的。两种模式仍然首先返回一个任务 ID。区别在于处理层级和成本概况，而不是 API 是否同步。

Seedance V1.5 Pro 分辨率：480p vs 720p vs 1080p

当前的 Seedance V1.5 Pro 文档列出 480p、720p 和 1080p 作为受支持的 resolution 值。当前的定价页面数据展示了 Seedance V1.5 Pro T2V 和 I2V 在 480P 和 720P 下的详细价格行。在本次修订检查的页面数据中，没有暴露匹配的 Seedance V1.5 Pro 1080P 价格行，因此生产预算计划在规模化使用 1080p 之前，应核实实时定价页面或控制台。

对于大多数团队来说，480p 是正确的探索设置。它足以判断提示词方向、大致运动、图像参考是否有效以及音频是否应保留在范围内。当视觉审查比探索成本更重要时，在 720p 下重新生成最终候选版本。

只有在为你计划运行的确切作业形状确认了可用性和计费方式后，才使用 1080p。API 字段支持它，但仅根据可见的 480P 和 720P 行进行预算是不完整的。

Seedance V1.5 Pro 定价：按分辨率、音频和 Flex 批量区分

根据 2026 年 6 月 22 日检查的当前 Novita 定价页面数据，以下 Seedance V1.5 Pro 价格适用于文生视频和图生视频。相同的价格也出现在单帧 I2V 和首尾帧 I2V 行中。

模式	分辨率	输出	Online 在线，`default`	Flex 批量，`flex`
T2V 或 I2V	480P	静音	$0.012/秒	$0.006/秒
T2V 或 I2V	480P	音频	$0.024/秒	$0.012/秒
T2V 或 I2V	720P	静音	$0.026/秒	$0.013/秒
T2V 或 I2V	720P	音频	$0.052/秒	$0.026/秒

有用的成本倍数是：

音频成本是相应静音行的两倍。
Flex 批量成本是相应在线行的一半。
720P 成本略高于相应 480P 行的两倍。
在相同分辨率、音频设置和服务层级下，T2V 和 I2V 的列出费率相同。

对于一个 10 秒的 720P 音频片段，列出的在线成本为 10 x $0.052，即 $0.52。在延迟可接受的情况下，通过 flex 的相同片段成本为 10 x $0.026，即 $0.26。对于一个 10 秒的 480P 静音探索片段，列出的 flex 成本为 10 x $0.006，即 $0.06。

这使得早期测试路径很清晰：通过关闭音频、使用 480P 以及在审查不需要即时结果时使用 flex 来降低成本。仅在片段足够接近以评估最终质量时才提高成本。

应该先测试哪个 Seedance V1.5 Pro 模式？

当你仍在寻找场景时，从 T2V 开始。编写 5 到 10 个简洁的提示词，保持时长足够短以便审查，使用 480p，并且除非语音是核心创意，否则关闭音频。目标是在引入素材约束之前发现概念是否可行。

当素材本身就是概念时，从 I2V 开始。如果产品图、角色参考或已批准的构图是不可协商的，那么从第一次测试就使用该图像。T2V 提示词可能会创建出可信的场景，但除非你提供参考图像，否则它不会知道确切的参考。

当转场比开放式运动更重要时，从带 last_image 的 I2V 开始。这是已知开始和结束构图的正确首次测试。保持首尾图像的宽高比接近，并避免用太多无关的动作使提示词过载。

除非音频是验收标准的一部分，否则从静音开始。一旦视觉方向可接受，如果需要则启用 generate_audio，并明确写出旁白台词或声音提示。

对于队列使用 flex，对于实时 UI 使用 default。如果生成结果将进入后台审查管线，请使用 flex 并将节省的成本用于更多变体。如果用户在产品界面中等待，请使用 default 并围绕任务进度设计 UI。

Novita AI 上的 Seedance V1.5 Pro API：完整工作流程

生产工作流程应将两种 Seedance V1.5 Pro 模式视为异步任务：

根据是否有输入图像选择 T2V 或 I2V。
通过 generate_audio 选择静音或音频。
通过 service_tier 选择 default 或 flex。
选择分辨率和时长。
将任务提交到特定模型的端点。
存储返回的任务 ID。
轮询任务结果 API，直到任务成功或失败。
在返回的视频 URL 过期前存储它。

这是一个最小的文生视频请求示例：

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "一个产品演示片段，展示一个紧凑的智能灯在干净的工作室中打开。缓慢推进的摄像机运动，柔和的阴影，中性背景。",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

这是一个最小的图生视频请求示例：

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "让灯以柔和的灯光脉冲动画化，同时摄像机进行微妙的向前运动。保持产品居中，避免文字叠加。",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

提交后，使用返回的任务 ID 配合任务结果 API。针对排队中、处理中、成功和失败的状态进行构建，而不是假设视频 URL 会立即可用。

Seedance V1.5 Pro 最终推荐

对于大多数团队，最好的首次 Seedance V1.5 Pro 测试是 480P、静音、flex：如果你只有文字概念就用 T2V，如果你有源图像就用 I2V。在提示词或参考图像接近目标后，再升级到 720P。仅当生成的语音、音效或音乐是审查的一部分时，才启用音频。当结果面向用户且时间敏感时，使用 default；当任务可以等待时，使用 flex。

这个顺序在不改变核心 API 流程的情况下，保持了首次评估的低成本。一旦片段通过视觉审查，提高分辨率，如果需要则开启音频，并运行一个较小的最终候选集。

常见问题解答

Seedance V1.5 Pro 在 Novita AI 上是否同时支持文生视频和图生视频？

是的。Novita AI 为 Seedance V1.5 Pro 提供了独立的 T2V 和 I2V 端点：POST /v3/async/seedance-v1.5-pro-t2v 和 POST /v3/async/seedance-v1.5-pro-i2v。

Seedance V1.5 Pro 能否生成音频？

可以。generate_audio 字段控制输出是否包含同步音频。设置为 true 可生成语音、音效或背景音乐，设置为 false 则输出静音视频。

图生视频比文生视频更贵吗？

根据本文检查的当前定价页面数据，在相同分辨率、音频设置和服务层级下，Seedance V1.5 Pro 的 T2V 和 I2V 费率相同。

在线处理和 flex 处理有什么区别？

文档将 default 描述为用于时间敏感场景的在线推理，将 flex 描述为用于延迟不敏感场景的离线推理，价格为在线模式的 50%。

应该先测试 480P 还是 720P？

对广泛的提示词和参考图像探索使用 480P。当概念足够接近，需要进行更严肃的视觉审查时，使用 720P。在大量运行前，请确认 1080P 的计费方式。