Seedance V1.5 Pro 在 Novita AI 上:文字轉影片 vs 圖片轉影片、音訊與無聲模式

Seedance V1.5 Pro 在 Novita AI 上:文字轉影片 vs 圖片轉影片、音訊與無聲模式

在 Novita AI 上使用 Seedance V1.5 Pro 時,最簡單的選擇方式是從你已擁有的素材開始:當場景從文字提示出發時使用文字轉影片;當希望由首幀或首末幀設定引導結果時使用圖片轉影片;進行早期視覺迭代時保持無聲輸出;僅在語音、音效或音樂是驗收標準的一部分時才加入音訊;對於延遲不敏感的批次作業則使用 flex 服務層級。

Seedance V1.5 Pro 快速選擇表

決策點 從這裡開始 原因
你只有文字描述的場景 文字轉影片 T2V 端點需要 prompt,且可根據提示選擇自適應長寬比。
你有產品照片、角色畫面、分鏡圖或已確認的視覺素材 圖片轉影片 I2V 端點需要 image 加上 prompt,因此首幀會錨定生成的片段。
你需要控制開頭與結尾 圖片轉影片加上 last_image I2V API 支援可選的 last_image,用於首末幀生成。
你需要生成的語音、音效或背景音樂 設定 generate_audio: true 啟用時會根據提示詞與視覺內容生成音訊。
你之後會自行加入音訊 設定 generate_audio: false 無聲輸出可避免為你將丟棄的音訊付費。
你需要更快取得面向使用者的結果 使用 service_tier: "default" 文件將 default 描述為適用於時間敏感情境的線上推理。
你可以等待並希望降低單位成本 使用 service_tier: "flex" 文件將 flex 描述為離線推理,價格為線上模式的 50%。
你正在探索提示詞 從 480p 無聲 flex 開始(當延遲不重要時) 在重新生成最終候選之前,先讓早期探索更便宜。
你正在審查接近最終的片段 升級到 720p,且僅在音訊為驗收標準時啟用音訊 720p 成本高於 480p,且音訊會使每秒價格加倍。

Novita AI 上可用的 Seedance V1.5 Pro 模式

Novita AI 透過獨立非同步影片 API 公開 Seedance V1.5 Pro:

模式 Novita API 路徑 必要輸入 可選輸入與控制
Seedance V1.5 Pro 文字轉影片 POST /v3/async/seedance-v1.5-pro-t2v prompt fpsseedratiodurationwatermarkresolutioncamera_fixedservice_tiergenerate_audioexecution_expires_after
Seedance V1.5 Pro 圖片轉影片 POST /v3/async/seedance-v1.5-pro-i2v imageprompt fpsseedratiodurationwatermarklast_imageresolutioncamera_fixedservice_tiergenerate_audioexecution_expires_after

兩個 API 都會先回傳任務 ID,而非完成的影片。應用程式應呼叫 Novita AI 任務結果 API 來檢查狀態並在任務完成後取得生成的媒體。

共同的請求控制項對產品設計很重要。文件列出 duration 為 4 到 12 秒的值、fps 為 24、ratio 選項包含 16:94:31:13:49:1621:9adaptive,以及 resolution 選項 480p720p1080pexecution_expires_after 欄位預設為 172800 秒,文件範圍為 3600 到 259200 秒。

Seedance V1.5 Pro 文字轉影片 vs 圖片轉影片

當創意仍處於文字階段時,選擇文字轉影片。如果你的工作流程從腳本台詞、鏡頭方向、主體描述或創意簡報開始,T2V 能讓第一次迭代保持輕量。對於構思、提示詞探索,以及當確切的產品或角色識別不是主要驗收標準時,它是更乾淨的模式。

當第一個視覺畫面很重要時,選擇圖片轉影片。I2V 更適合產品靜態圖、設計畫面、角色參考圖、縮圖、分鏡圖面板以及品牌控制的視覺素材。它不保證每一幀都能完美保留主體,但能為生成提供一個僅僅依靠提示詞的 T2V 所沒有的具體起點。

I2V 獨有的額外欄位是 last_image。當片段需要從已知的開場畫面移向已知的結束畫面時使用它。這對於轉場測試、短產品展示、簡單的前後對比動態以及最終構圖已確定的分鏡場景很有用。當首幀與末幀的長寬比不同時,文件指出末幀會自動裁切以匹配首幀,因此團隊在視覺構圖很重要時應準備好匹配的長寬比。

對於純提示詞概念,T2V 通常是首輪測試。對於以素材為主的概念,I2V 通常是首輪測試。如果你已經知道起始畫面,就不要強迫模型從文字中重新發現它。

Seedance V1.5 Pro 音訊 vs 無聲輸出

Seedance V1.5 Pro 透過 generate_audio 提供直接的音訊開關。當設為 true 時,生成的影片會包含基於提示詞與視覺內容自動生成的同步音訊,如語音、音效和背景音樂。當設為 false 時,輸出為無聲。

音訊會改變提示詞的寫法。如果生成的語音是測試的一部分,請明確寫出台詞,並將其與視覺動作和環境音分開。模糊的場景提示詞或許足夠進行視覺探索,但通常不足以進行可靠的音訊審查。

音訊也會改變成本。根據 2026 年 6 月 22 日檢查的最新 Novita 定價頁面資料,在 Seedance V1.5 Pro T2V 和 I2V 的 480P 與 720P 模式下,有音訊的價格是對應無聲價格的兩倍。如果你的產品將在後續流程中加入旁白、背景音樂或音效設計,則在早期迭代時生成無聲影片。如果同步語音或場景音訊是實際產品需求的一部分,請提早測試音訊,因為它既影響審查標準也影響預算。

Seedance V1.5 Pro 線上 vs Flex 批次處理

service_tier 欄位是主要的處理層級選擇。Seedance V1.5 Pro 文件將 default 描述為適用於時間敏感情境的線上推理,其 RPM 與並發配額較低。將 flex 描述為離線推理,具有更高的 TPD 配額,價格為線上模式的 50%,適用於延遲不敏感的情境。

對於應用程式設計,將 default 視為互動通道,將 flex 視為批次通道。一個面向使用者的創意工具,當有人在 UI 中等候時,應以 default 啟動。而夜間提示詞掃描、數據集風格的創意評估、大型內部審查佇列或非緊急活動批次則可使用 flex

這個區別與非同步 API 模式是分開的。兩種模式都還是先回傳任務 ID。差異在於處理層級與成本結構,而非 API 是否同步。

Seedance V1.5 Pro 解析度:480p vs 720p vs 1080p

目前的 Seedance V1.5 Pro 文件列出 480p720p1080p 作為支援的 resolution 值。最新的定價頁面資料針對 Seedance V1.5 Pro T2V 和 I2V 展示了詳細的 480P 與 720P 價格行。同一頁面資料在本次修訂檢查的數據中並未顯示匹配的 Seedance V1.5 Pro 1080P 價格行,因此生產預算計劃應在大量使用 1080p 前確認即時定價頁面或控制台。

對大多數團隊來說,480p 是合適的探索設定。它足以判斷提示詞方向、粗略動態、圖片參考是否有幫助,以及是否應保留音訊範圍。當視覺審查比探索成本更重要時,再將最終候選重新生成為 720p。

只有在確認了你計劃運行的確切作業形狀的可用性與計費方式後,才使用 1080p。API 欄位支援它,但僅根據可見的 480P 與 720P 行來編列預算會是不完整的。

Seedance V1.5 Pro 依解析度、音訊與 Flex 批次的定價

根據 2026 年 6 月 22 日檢查的最新 Novita 定價頁面資料,文字轉影片與圖片轉影片的 Seedance V1.5 Pro 價格如下。對於首幀 I2V 與首末幀 I2V,價格相同。

模式 解析度 輸出 線上 default Flex 批次 flex
T2V 或 I2V 480P 無聲 $0.012/秒 $0.006/秒
T2V 或 I2V 480P 音訊 $0.024/秒 $0.012/秒
T2V 或 I2V 720P 無聲 $0.026/秒 $0.013/秒
T2V 或 I2V 720P 音訊 $0.052/秒 $0.026/秒

實用的部分是成本倍數:

  • 音訊成本為對應無聲行的兩倍。
  • Flex 批次成本為對應線上模式的一半。
  • 720P 成本略高於對應 480P 行的兩倍。
  • T2V 與 I2V 在相同解析度、音訊設定與服務層級下價格相同。

對於一個 10 秒的 720P 音訊片段,列出的線上成本為 10 x $0.052,即 $0.52。相同片段透過 flex 為 10 x $0.026,即 $0.26(當延遲可接受時)。對於一個 10 秒的 480P 無聲探索片段,列出的 flex 成本為 10 x $0.006,即 $0.06。

這使得早期測試路徑簡單明瞭:關閉音訊、使用 480P、並在審查不需要立即結果時使用 flex 來降低成本。僅當片段已足夠接近最終品質以供評估時才提高成本。

你應該先測試哪個 Seedance V1.5 Pro 模式?

當你還在尋找場景時,從 T2V 開始。寫五到十個精簡提示詞,保持足夠短的時長以便審查,使用 480p,除非語音是核心想法否則關閉音訊。目標是在引入素材限制前先發現概念是否可行。

當素材本身就是概念時,從 I2V 開始。如果產品畫面、角色參考或已批准的構圖是無可妥協的,請從第一次測試就使用那張圖片。T2V 提示詞可能創造出合理的場景,但除非你提供它,否則它不會知道確切的參考圖像。

當轉場比開放式動態更重要時,從 I2V 加上 last_image 開始。這是已知開始與結束構圖時的正確首次測試。保持首幀與末幀的長寬比接近,並避免用太多不相關的動作超載提示詞。

保持無聲,除非音訊是驗收的一部分。一旦視覺方向可接受,如果需要,啟用 generate_audio 並明確寫出台詞或聲音提示。

對於佇列使用 flex,對於即時 UI 使用 default。如果生成內容將進入背景審查管線,使用 flex 並將節省的錢花在更多變體上。如果使用者在產品界面上等待,使用 default 並圍繞任務進度設計 UI。

Novita AI 上的 Seedance V1.5 Pro API 工作流程

生產工作流程應將兩種 Seedance V1.5 Pro 模式視為非同步作業:

  1. 根據你是否擁有輸入圖片來選擇 T2V 或 I2V。
  2. 使用 generate_audio 選擇無聲或音訊。
  3. 使用 service_tier 選擇 defaultflex
  4. 選擇解析度與時長。
  5. 將任務提交到特定模型的端點。
  6. 儲存回傳的任務 ID。
  7. 輪詢任務結果 API,直到任務成功或失敗。
  8. 在 URL 過期前儲存回傳的影片 URL。

這是最小的文字轉影片請求範例:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "一個產品展示片段,顯示一款精巧的智慧燈在乾淨的攝影棚中開啟。緩慢推近的鏡頭移動,柔和的陰影,中性背景。",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

這是最小的圖片轉影片請求範例:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "讓燈具以柔和的光脈衝動畫,同時鏡頭輕微向前移動。保持產品居中,避免文字疊加。",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

提交後,使用回傳的任務 ID 搭配任務結果 API。要考慮佇列中、處理中、成功與失敗狀態,而不是假設影片 URL 會立即可用。

Seedance V1.5 Pro 的最終建議

對於大多數團隊來說,最佳的首次 Seedance V1.5 Pro 測試是 480P、無聲、flex:如果你只有文字概念則用 T2V,如果你有來源圖像則用 I2V。在提示詞或參考圖像接近之後再升級到 720P。僅在生成的語音、音效或音樂是審查的一部分時才啟用音訊。當結果是面向使用者且時間敏感時使用 default;當任務可以等待時使用 flex

這個順序能在不改變核心 API 流程的情況下保持首次評估的低成本。一旦片段通過視覺審查,提高解析度,如有需要開啟音訊,並運行較小的最終候選集。

常見問題

Seedance V1.5 Pro 在 Novita AI 上是否同時支援文字轉影片與圖片轉影片?

是的。Novita AI 文件記錄了獨立的 Seedance V1.5 Pro T2V 與 I2V 端點:POST /v3/async/seedance-v1.5-pro-t2vPOST /v3/async/seedance-v1.5-pro-i2v

Seedance V1.5 Pro 會生成音訊嗎?

是的。generate_audio 欄位控制輸出是否包含同步音訊。設為 true 可獲得生成的語音、音效或背景音樂,設為 false 則獲得無聲影片。

圖片轉影片比文字轉影片更貴嗎?

根據本文檢查的最新定價頁面資料,T2V 與 I2V 在相同解析度、音訊設定與服務層級下費率相同。

線上處理與 flex 處理有什麼不同?

文件將 default 描述為時間敏感情境的線上推理,將 flex 描述為延遲不敏感情境的離線推理,價格為線上模式的 50%。

我應該先測試 480P 還是 720P?

使用 480P 進行廣泛的提示詞與參考圖像探索。當概念已足夠接近可進行更嚴肅的視覺審查時,使用 720P。在大量運行前請確認 1080P 的計費方式。

推薦文章