Seedance V1.5 Pro API：文字轉影片 vs 圖片轉影片、音訊與靜音模式

Seedance V1.5 Pro 快速選擇表
在 Novita AI 上的 Seedance V1.5 Pro 文字轉影片與圖片轉影片模式
Seedance V1.5 Pro 文字轉影片 vs 圖片轉影片
Seedance V1.5 Pro 音訊 vs 靜音輸出
Seedance V1.5 Pro 線上 vs Flex 批次處理
Seedance V1.5 Pro 解析度：480p vs 720p vs 1080p
Seedance V1.5 Pro 定價：按解析度、音訊與 Flex 批次
你應該先測試哪個 Seedance V1.5 Pro 模式？
Seedance V1.5 Pro API：在 Novita AI 上的完整工作流程
關於 Seedance V1.5 Pro 的最終建議
常見問題

在 Novita AI 上使用 Seedance V1.5 Pro 時，最簡單的選擇方式是從你已有的素材開始：當場景從提示詞出發時使用文字轉影片；當需要以首幀或首尾幀設定引導結果時使用圖片轉影片；在早期視覺迭代時保持輸出靜音；僅當語音、音效或音樂屬於驗收標準的一部分時再加入音訊；以及針對延遲不敏感的批次工作使用 flex 服務層級。

如果你正在比較 Seedance 與其他影片生成方案，請先從 Novita AI 更廣泛的 Sora AI 影片生成替代方案概述開始，然後使用本指南來縮小 Seedance 特定模式、音訊、解析度和服務層級的決策範圍。如需直接的模型對模型比較，Kling V2.5 Turbo 涵蓋了 T2V 和 I2V，採用可預測的單一影片定價，無需區分 flex/online 層級；而 MiniMax Hailuo 2.3 則為以圖片為主的工作流程新增了一個價格更低的 Fast I2V 端點。

Seedance V1.5 Pro 快速選擇表

決策	從這裡開始	原因
你只有一段文字描述的場景	文字轉影片	T2V 端點需要 `prompt`，並可根據提示詞選擇自適應長寬比。
你有一張產品照、角色畫面、分鏡圖或已核准的視覺素材	圖片轉影片	I2V 端點需要 `image` 加上 `prompt`，讓首幀錨定生成的片段。
你需要控制開始和結束畫面	使用 `last_image` 的圖片轉影片	I2V API 支援可選的 `last_image`，用於首尾幀生成。
你需要生成的語音、音效或背景音樂	設定 `generate_audio: true`	啟用時，音訊會根據提示詞和視覺內容生成。
你之後會自行加入音訊	設定 `generate_audio: false`	靜音輸出可避免為你將要捨棄的生成音訊付費。
你需要更快獲得面向用戶的結果	使用 `service_tier: "default"`	官方文件說明 `default` 為線上推理，適用於時間敏感的情境。
你可以等待並希望降低單位成本	使用 `service_tier: "flex"`	官方文件說明 `flex` 為離線推理，價格為線上模式的 50%。
你正在探索提示詞	在延遲不重要時，從 480p 靜音 flex 開始	在重新生成最終候選影片之前，讓早期探索成本更低。
你正在審查接近最終版本的片段	升級到 720p，並僅在音訊屬於驗收標準時啟用	720p 成本高於 480p，且音訊會使列出的每秒價格翻倍。

在 Novita AI 上的 Seedance V1.5 Pro 文字轉影片與圖片轉影片模式

Novita AI 透過非同步影片 API 公開 Seedance V1.5 Pro：

模式	Novita API 路徑	必要輸入	可選輸入與控制項
Seedance V1.5 Pro 文字轉影片	`POST /v3/async/seedance-v1.5-pro-t2v`	`prompt`	`fps`、`seed`、`ratio`、`duration`、`watermark`、`resolution`、`camera_fixed`、`service_tier`、`generate_audio`、`execution_expires_after`
Seedance V1.5 Pro 圖片轉影片	`POST /v3/async/seedance-v1.5-pro-i2v`	`image`、`prompt`	`fps`、`seed`、`ratio`、`duration`、`watermark`、`last_image`、`resolution`、`camera_fixed`、`service_tier`、`generate_audio`、`execution_expires_after`

這兩個 API 會先回傳一個任務 ID，而不是完成的影片。應用程式應呼叫 Novita AI 任務結果 API 來檢查狀態，並在任務完成後擷取生成的媒體。

共同的請求控制項對產品設計很重要。官方文件列出 duration 的值範圍為 4 到 12 秒，fps 為 24，ratio 選項包括 16:9、4:3、1:1、3:4、9:16、21:9 和 adaptive，而 resolution 選項為 480p、720p 和 1080p。execution_expires_after 欄位預設為 172800 秒，文件說明的範圍為 3600 到 259200 秒。

Seedance V1.5 Pro 文字轉影片 vs 圖片轉影片

當想法仍處於文字階段時，請選擇文字轉影片。如果你的工作流程始於一句腳本台詞、鏡頭方向、主體描述或創意簡報，T2V 能讓第一輪處理保持輕量。對於構思、提示詞探索，以及當確切的產品或角色身份不是主要驗收標準時，T2V 是更簡潔的模式。

當首幀視覺素材至關重要時，請選擇圖片轉影片。I2V 更適合產品靜態照、設計框架、角色參考圖、縮圖、分鏡圖面板和品牌可控的視覺素材。它不能保證在每一幀都完美保留主體身份，但它為生成提供了一個具體的起點，這是純提示詞的 T2V 所沒有的。

I2V 獨有的額外欄位是 last_image。當片段需要從一個已知的起始畫面移動到一個已知的結束畫面時，請使用它。這對於轉場測試、簡短的產品展示、簡單的變化前後動態，以及最終構圖已確定的分鏡場景非常有用。當首幀和尾幀的長寬比不同時，官方文件指出尾幀會自動裁剪以匹配首幀，因此團隊在視覺構圖很重要時應準備匹配的長寬比。

對於純提示詞的概念，T2V 通常是第一個測試。對於以素材為主的概念，I2V 通常是第一個測試。如果你已經知道起始畫面，就不要強迫模型從文字中重新發現它。

Seedance V1.5 Pro 音訊 vs 靜音輸出

Seedance V1.5 Pro 透過 generate_audio 提供直接的音訊開關。當設定為 true 時，生成的影片會包含同步音訊，例如根據提示詞和視覺內容自動生成的語音、音效和背景音樂。當設定為 false 時，輸出為靜音。

音訊會改變提示詞的撰寫方式。如果生成的語音是測試的一部分，請明確寫出語音台詞，並將其與視覺動作和環境音效分開。一個模糊的場景提示詞可能足以進行視覺探索，但通常不足以進行可靠的聲音審查。

音訊也會改變成本。根據 2026 年 6 月 22 日檢查的當前 Novita 定價頁面數據，Seedance V1.5 Pro T2V 和 I2V 在 480P 和 720P 下的音訊價格行是對應靜音價格行的兩倍。如果你的產品將在單獨的流程中加入旁白、背景音樂或音效設計，請在早期階段生成靜音影片。如果同步語音或場景音訊是實際產品需求的一部分，請儘早測試音訊，因為它會同時影響審查標準和預算。

Seedance V1.5 Pro 線上 vs Flex 批次處理

service_tier 欄位是主要的處理層級選擇。Seedance V1.5 Pro 官方文件將 default 描述為適用於時間敏感情境、具有較低 RPM 和並發配額的線上推理。他們將 flex 描述為適用於延遲不敏感情境、具有較高 TPD 配額且價格為線上模式 50% 的離線推理。

對於應用程式設計，將 default 視為互動通道，將 flex 視為批次通道。一個面向用戶的創意工具，當有人在 UI 中等待時，應從 default 開始。一個夜間提示詞掃描、數據集風格的創意評估、大型內部審查佇列或非緊急的行銷活動批次，則可以使用 flex。

這個區別與非同步 API 模式是分開的。兩種模式仍然會先回傳一個任務 ID。不同之處在於處理層級和成本輪廓，而不是 API 是否為同步。

Seedance V1.5 Pro 解析度：480p vs 720p vs 1080p

目前 Seedance V1.5 Pro 官方文件列出 480p、720p 和 1080p 作為支援的 resolution 值。目前的定價頁面數據為 Seedance V1.5 Pro T2V 和 I2V 提供了詳細的 480P 和 720P 價格行。在本修訂版檢查的數據中，同一頁面並未顯示匹配的 Seedance V1.5 Pro 1080P 價格行，因此生產預算計劃應在大量使用 1080p 之前，先驗證即時定價頁面或控制台。

對大多數團隊來說，480p 是合適的探索設定。它足以判斷提示詞方向、大致的動態、圖像參考是否有幫助，以及音訊是否應保留在範圍內。當視覺審查比探索成本更重要時，再以 720p 重新生成最終候選片段。

只有在確認你要執行的確切任務形狀的可用性和計費方式後，才使用 1080p。API 欄位支援它，但僅根據可見的 480P 和 720P 價格行來編列預算將是不完整的。

Seedance V1.5 Pro 定價：按解析度、音訊與 Flex 批次

根據 2026 年 6 月 22 日檢查的當前 Novita 定價頁面數據，以下列出 Seedance V1.5 Pro 文字轉影片和圖片轉影片的價格。單幀 I2V 和首尾幀 I2V 的價格行也相同。

模式	解析度	輸出	線上，`default`	Flex 批次，`flex`
T2V 或 I2V	480P	靜音	$0.012/秒	$0.006/秒
T2V 或 I2V	480P	音訊	$0.024/秒	$0.012/秒
T2V 或 I2V	720P	靜音	$0.026/秒	$0.013/秒
T2V 或 I2V	720P	音訊	$0.052/秒	$0.026/秒

成本倍率是比較有用的部分：

音訊成本是對應靜音行的兩倍。
Flex 批次成本是對應線上行的二分之一。
720P 成本略高於對應 480P 行的兩倍。
T2V 和 I2V 在相同的解析度、音訊設定和服務層級下的列定價格相同。

對於一個 10 秒的 720P 音訊片段，列出的線上成本為 10 x $0.052，即 $0.52。當延遲可接受時，同一個片段透過 flex 的成本為 10 x $0.026，即 $0.26。對於一個 10 秒的 480P 靜音探索片段，列出的 flex 成本為 10 x $0.006，即 $0.06。

這使得早期測試路徑很直接：關閉音訊、使用 480P，並在審查不需要立即結果時使用 flex 來降低成本。僅當片段足夠接近最終品質以供評估時，才提高成本。

你應該先測試哪個 Seedance V1.5 Pro 模式？

當你仍在尋找場景時，從 T2V 開始。撰寫五到十個簡潔的提示詞，保持長度適合審查，使用 480p，除非語音是核心概念，否則關閉音訊。目標是在引入素材限制之前，先探索概念是否可行。

當素材本身就是概念時，從 I2V 開始。如果一個產品畫面、角色參考或已核准的構圖是不可妥協的，請在第一次測試中就使用該圖像。T2V 提示詞可能會創造出一個合理的場景，但除非你提供確切的參考圖像，否則它無法知道它。

當轉場比開放式動態更重要時，從 I2V 加上 last_image 開始。對於已知的開始和結束構圖，這是正確的第一個測試。保持首幀和尾幀的長寬比接近，並避免在提示詞中加入太多不相關的動作。

除非音訊是驗收標準的一部分，否則從靜音開始。一旦視覺方向可接受，如有需要，啟用 generate_audio 並明確寫出語音台詞或聲音提示。

為佇列使用 flex，為即時 UI 使用 default。如果生成結果將進入背景審查流程，請使用 flex 並將省下的成本花在更多變體上。如果用戶正在產品界面上等待，請使用 default 並圍繞任務進度設計 UI。

Seedance V1.5 Pro API：在 Novita AI 上的完整工作流程

一個生產級工作流程應將 Seedance V1.5 Pro 兩種模式視為非同步任務：

根據你是否有輸入圖像，選擇 T2V 或 I2V。
使用 generate_audio 選擇靜音或音訊。
使用 service_tier 選擇 default 或 flex。
選擇解析度和時長。
將任務提交到特定模型的端點。
儲存回傳的任務 ID。
輪詢任務結果 API，直到任務成功或失敗。
在回傳的影片 URL 過期前儲存它。

這是一個最小化的文字轉影片請求範例：

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A product demo clip showing a compact smart lamp turning on in a clean studio. Slow push-in camera movement, soft shadows, neutral background.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

這是一個最小化的圖片轉影片請求範例：

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Animate the lamp with a gentle light pulse while the camera makes a subtle forward move. Keep the product centered and avoid text overlays.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

提交後，使用回傳的任務 ID 搭配任務結果 API。請針對排隊中、處理中、成功和失敗狀態進行建置，而不是假設影片 URL 會立即可用。

關於 Seedance V1.5 Pro 的最終建議

對大多數團隊來說，最佳的首次 Seedance V1.5 Pro 測試是 480P、靜音且使用 flex：如果你只有文字概念，使用 T2V；如果你有來源圖像，使用 I2V。當提示詞或參考圖像接近理想時，再升級到 720P。僅當生成的語音、音效或音樂是審查的一部分時才啟用音訊。當結果是面向用戶且時間敏感時，使用 default；當任務可以等待時，使用 flex。

這個順序可以在不改變核心 API 流程的情況下，保持首次評估的成本低廉。一旦片段通過視覺審查，就提高解析度，如有需要則開啟音訊，並執行一組較小的最終候選片段。

常見問題

Seedance V1.5 Pro 在 Novita AI 上同時支援文字轉影片和圖片轉影片嗎？

是的。Novita AI 提供了獨立的 Seedance V1.5 Pro T2V 和 I2V 端點：POST /v3/async/seedance-v1.5-pro-t2v 和 POST /v3/async/seedance-v1.5-pro-i2v。

Seedance V1.5 Pro 會生成音訊嗎？

會的。generate_audio 欄位控制輸出是否包含同步音訊。將其設定為 true 以生成語音、音效或背景音樂，設定為 false 則生成靜音影片。

圖片轉影片比文字轉影片更貴嗎？

根據本文撰寫時檢查的當前定價頁面數據，Seedance V1.5 Pro T2V 和 I2V 在相同解析度、音訊設定和服務層級下的價格相同。

線上和 flex 處理有什麼不同？

官方文件將 default 描述為用於時間敏感情境的線上推理，將 flex 描述為用於延遲不敏感情境、價格為線上模式 50% 的離線推理。

我應該先測試 480P 還是 720P？

使用 480P 進行廣泛的提示詞和參考圖像探索。當概念足夠接近、需要更嚴肅的視覺審查時，再使用 720P。在大量運行前，請先驗證 1080P 的計費方式。