Novita AI 上の Seedance V1.5 Pro:テキストから動画 vs 画像から動画、オーディオ、サイレントモード

Novita AI 上の Seedance V1.5 Pro:テキストから動画 vs 画像から動画、オーディオ、サイレントモード

Novita AI 上の Seedance V1.5 Pro は、既存のアセットから始めるのが最も簡単です。シーンがプロンプトから始まる場合はテキストから動画(T2V)を、最初のフレームまたは最初と最後のフレームの設定で結果を導く場合は画像から動画(I2V)を、初期のビジュアル反復にはサイレント出力を、音声、効果音、音楽が受け入れ条件の一部である場合のみオーディオを追加し、レイテンシーに影響されないバッチ作業には flex サービス階層を使用します。

Seedance V1.5 Pro クイック選択表

判断基準 ここから始める 理由
書かれたシーンしかない テキストから動画 T2V エンドポイントは prompt が必要で、プロンプトからアダプティブなアスペクト比を選択できます。
商品写真、キャラクターフレーム、ストーリーボードのフレーム、承認済みのビジュアルがある 画像から動画 I2V エンドポイントは imageprompt が必要で、最初のフレームが生成クリップを固定します。
開始と終了を制御する必要がある last_image 付き画像から動画 I2V API は、最初と最後のフレーム生成のためにオプションの last_image をサポートしています。
生成された音声、効果音、BGM が必要 generate_audio: true を設定 有効にすると、プロンプトとビジュアルコンテンツからオーディオが生成されます。
後で自分でオーディオを追加する予定 generate_audio: false を設定 サイレント出力により、破棄する生成オーディオのコストを回避できます。
ユーザー向けの結果を早く必要とする service_tier: "default" を使用 ドキュメントでは、default を時間重視のシナリオ向けのオンライン推論と説明しています。
待てるし、単価を抑えたい service_tier: "flex" を使用 ドキュメントでは、flex をオンラインモード価格の 50% でレイテンシーに影響されないシナリオ向けのオフライン推論と説明しています。
プロンプトを探索中 レイテンシーが重要でない場合は、サイレント・フレックスで 480p から開始 最終候補を再生成する前に、初期探索を安く抑えられます。
最終候補に近いクリップをレビュー中 720p に移行し、オーディオは受け入れ条件の一部である場合のみ有効にする 720p は 480p よりコストがかかり、オーディオは表示されている秒単価を 2 倍にします。

Novita AI で利用可能な Seedance V1.5 Pro モード

Novita AI は Seedance V1.5 Pro を個別の非同期ビデオ API として提供しています。

モード Novita API パス 必須入力 オプション入力と制御
Seedance V1.5 Pro テキストから動画 POST /v3/async/seedance-v1.5-pro-t2v prompt fpsseedratiodurationwatermarkresolutioncamera_fixedservice_tiergenerate_audioexecution_expires_after
Seedance V1.5 Pro 画像から動画 POST /v3/async/seedance-v1.5-pro-i2v imageprompt fpsseedratiodurationwatermarklast_imageresolutioncamera_fixedservice_tiergenerate_audioexecution_expires_after

両 API は最初にタスク ID を返し、完成した動画は返しません。アプリケーションは Novita AI Task Result API を呼び出してステータスを確認し、タスク完了後に生成されたメディアを取得する必要があります。

共通のリクエスト制御は製品設計にとって重要です。ドキュメントでは、duration は 4 ~ 12 秒、fps は 24、ratio のオプションは 16:94:31:13:49:1621:9adaptiveresolution のオプションは 480p720p1080p と記載されています。execution_expires_after フィールドのデフォルトは 172800 秒で、3600 ~ 259200 秒の範囲が文書化されています。

Seedance V1.5 Pro テキストから動画 vs 画像から動画

アイデアがまだ言語段階の場合は、テキストから動画を選択します。ワークフローがスクリプトの一行、カメラの方向、被写体の説明、クリエイティブブリーフから始まる場合、T2V は最初のパスを軽量に保ちます。アイデア出し、プロンプト探索、正確な製品やキャラクターの同一性が主要な受け入れ条件ではない場合には、よりクリーンなモードです。

最初のビジュアルが重要な場合は、画像から動画を選択します。I2V は、商品静止画、デザインフレーム、キャラクターリファレンス、サムネイル、ストーリーボードパネル、ブランド管理されたビジュアルに適しています。すべてのフレームで完全な同一性を保証するわけではありませんが、プロンプトのみの T2V にはない、生成の具体的な出発点を提供します。

I2V のみの追加フィールドは last_image です。クリップを既知の開始フレームから既知の終了フレームに移動させる必要がある場合に使用します。これは、トランジションテスト、短い製品紹介、シンプルなビフォーアフターの動き、最終構図がすでに決まっているストーリーボードシーンに役立ちます。最初と最後のフレームのアスペクト比が異なる場合、ドキュメントでは最後のフレームが最初のフレームに合わせて自動的にクロップされると記載されているため、ビジュアルフレーミングが重要な場合は、一致するアスペクト比を用意する必要があります。

プロンプトのみのコンセプトの場合は、通常最初のテストは T2V です。アセット主導のコンセプトの場合は、通常最初のテストは I2V です。開始フレームがすでにわかっている場合は、モデルにテキストから再発見させる必要はありません。

Seedance V1.5 Pro オーディオ vs サイレント出力

Seedance V1.5 Pro には generate_audio による直接的なオーディオスイッチがあります。true の場合、生成された動画には、プロンプトとビジュアルコンテンツに基づいて自動生成された音声、効果音、BGM など、同期されたオーディオが含まれます。false の場合、出力は無音です。

オーディオはプロンプト作成を変更します。生成された音声がテストの一部である場合は、話す台詞を明示的に書き、視覚的なアクションや環境音と分離します。漠然としたシーンプロンプトはビジュアル探索には十分かもしれませんが、信頼性の高いオーディオレビューには通常不十分です。

オーディオはコストも変えます。2026 年 6 月 22 日に確認した現在の Novita 価格ページのデータでは、Seedance V1.5 Pro T2V および I2V の 480P および 720P で、オーディオ行が対応するサイレント行の 2 倍の価格になっています。製品が別のパイプラインでナレーション、BGM、サウンドデザインを追加する場合は、初期パスではサイレント動画を生成します。同期音声やシーンオーディオが実際の製品要件の一部である場合は、早期にオーディオをテストします。これはレビュー基準と予算の両方に影響するためです。

Seedance V1.5 Pro オンライン vs Flex バッチ処理

service_tier フィールドが主要な処理階層の選択です。Seedance V1.5 Pro のドキュメントでは、default を時間重視のシナリオ向けで RPM と同時実行クォータが低いオンライン推論、flex をレイテンシーに影響されないシナリオ向けでオンラインモード価格の 50% で TPD クォータが高いオフライン推論と説明しています。

アプリケーション設計では、default をインタラクティブレーン、flex をバッチレーンとして扱います。UI で誰かが待っているユーザー向けクリエイティブツールは、default から開始する必要があります。夜間のプロンプトスイープ、データセット形式のクリエイティブ評価、大規模な内部レビューキュー、緊急でないキャンペーンバッチには flex を使用できます。

この区別は非同期 API パターンとは別です。どちらのモードも最初にタスク ID を返します。違いは処理階層とコストプロファイルであり、API が同期かどうかではありません。

Seedance V1.5 Pro 解像度:480p vs 720p vs 1080p

現在の Seedance V1.5 Pro ドキュメントでは、480p720p1080p がサポートされる resolution 値としてリストされています。現在の価格ページのデータでは、Seedance V1.5 Pro T2V および I2V の詳細な 480P および 720P 価格行が公開されています。この改訂で確認したデータでは、一致する Seedance V1.5 Pro 1080P 価格行は公開されていなかったため、1080p を大規模に使用する前に、本番予算計画はライブ価格ページまたはコンソールを確認する必要があります。

ほとんどのチームにとって、480p は適切な探索設定です。プロンプトの方向性、おおまかな動き、画像参照が役立っているかどうか、オーディオをスコープ内に残すべきかどうかを判断するには十分です。ビジュアルレビューが探索コストよりも重要な場合、最終候補を 720p で再生成します。

1080p は、実行予定のジョブ形状の可用性と課金の両方を確認した後にのみ使用します。API フィールドはサポートしていますが、表示されている 480P および 720P 行のみから予算を立てるのは不完全です。

Seedance V1.5 Pro 価格:解像度、オーディオ、Flex バッチ別

2026 年 6 月 22 日に確認した現在の Novita 価格ページのデータでは、テキストから動画と画像から動画の両方について、以下の Seedance V1.5 Pro 価格がリストされています。同じ価格が、最初のフレーム I2V と最初と最後のフレーム I2V の行にも表示されます。

モード 解像度 出力 オンライン default Flex バッチ flex
T2V または I2V 480P サイレント $0.012/s $0.006/s
T2V または I2V 480P オーディオ $0.024/s $0.012/s
T2V または I2V 720P サイレント $0.026/s $0.013/s
T2V または I2V 720P オーディオ $0.052/s $0.026/s

コスト倍率が有用な部分です。

  • オーディオは対応するサイレント行の 2 倍のコストです。
  • Flex バッチは対応するオンライン行の半分のコストです。
  • 720P は対応する 480P 行の約 2 倍強のコストです。
  • T2V と I2V は、同じ解像度、オーディオ設定、サービス階層で同じ表示レートです。

10 秒の 720P オーディオクリップの場合、表示されているオンラインコストは 10 x $0.052 = $0.52 です。レイテンシーが許容できる場合、同じクリップを flex で使用すると 10 x $0.026 = $0.26 です。10 秒の 480P サイレント探索クリップの場合、表示されている flex コストは 10 x $0.006 = $0.06 です。

これにより、初期テストのパスが簡単になります。オーディオをオフにし、480P を使用し、レビューで即時の結果が必要ない場合は flex を使用してコストを削減します。最終品質で評価できるほどクリップが近づいた場合にのみコストを上げます。

最初にテストすべき Seedance V1.5 Pro モードは?

シーンをまだ探している場合は、T2V から始めます。5 ~ 10 の簡潔なプロンプトを書き、レビューに十分な短い時間にし、480p を使用し、音声が核となるアイデアでない限りオーディオはオフにします。目標は、アセット制約を導入する前にコンセプトが機能するかどうかを発見することです。

アセットがすでにコンセプトである場合は、I2V から始めます。商品フレーム、キャラクターリファレンス、承認済みの構図が譲れない場合、最初のテストからその画像を使用します。T2V プロンプトはもっともらしいシーンを作成するかもしれませんが、明示的に提供しない限り、正確な参照画像を知ることはできません。

トランジションが自由な動きよりも重要な場合は、last_image 付きの I2V から始めます。これは、既知の開始構図と終了構図がある場合の適切な最初のテストです。最初と最後の画像のアスペクト比を近づけ、プロンプトに関連のないアクションを詰め込みすぎないようにします。

オーディオが受け入れ条件の一部でない限り、サイレントから始めます。ビジュアルの方向性が許容可能になったら、必要に応じて generate_audio を有効にし、話す台詞や音の合図を明示的に記述します。

キューには flex を、ライブ UI には default をそれぞれ使用します。生成がバックグラウンドレビューパイプラインに入る場合は、flex を使用して節約した費用をより多くのバリエーションに充てます。ユーザーが製品画面で待っている場合は、default を使用し、タスクの進行状況を中心に UI を設計します。

Novita AI 上の Seedance V1.5 Pro API ワークフロー

本番ワークフローでは、両方の Seedance V1.5 Pro モードを非同期ジョブとして扱う必要があります。

  1. 入力画像があるかどうかに基づいて T2V または I2V を選択します。
  2. generate_audio でサイレントまたはオーディオを選択します。
  3. service_tierdefault または flex を選択します。
  4. 解像度と duration を選択します。
  5. モデル固有のエンドポイントにタスクを送信します。
  6. 返されたタスク ID を保存します。
  7. タスクが成功または失敗するまで Task Result API をポーリングします。
  8. URL の有効期限が切れる前に、返された動画 URL を保存します。

以下は最小限のテキストから動画リクエストの例です。

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A product demo clip showing a compact smart lamp turning on in a clean studio. Slow push-in camera movement, soft shadows, neutral background.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

以下は最小限の画像から動画リクエストの例です。

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Animate the lamp with a gentle light pulse while the camera makes a subtle forward move. Keep the product centered and avoid text overlays.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

送信後、返されたタスク ID を Task Result API で使用します。動画 URL がすぐに利用可能になると想定するのではなく、キュー状態、処理中、成功、失敗の各状態に対応するよう構築します。

Seedance V1.5 Pro の最終推奨事項

ほとんどのチームにとって、最適な最初の Seedance V1.5 Pro テストは、480P、サイレント、flex です。書かれたコンセプトしかない場合は T2V、ソース画像がある場合は I2V です。プロンプトまたは参照画像がほぼ確定したら 720P に移行します。生成された音声、効果音、音楽がレビューの一部である場合のみオーディオを有効にします。結果がユーザー向けで時間に敏感な場合は default を、タスクが待機できる場合は flex を使用します。

この順序により、コア API フローを変更せずに、最初の評価を安価に保ちます。クリップがビジュアルレビューを通過したら、解像度を上げ、必要に応じてオーディオをオンにし、少数の最終候補を実行します。

FAQ

Seedance V1.5 Pro は Novita AI 上でテキストから動画と画像から動画の両方で利用できますか?

はい。Novita AI は、POST /v3/async/seedance-v1.5-pro-t2vPOST /v3/async/seedance-v1.5-pro-i2v という別々の Seedance V1.5 Pro T2V および I2V エンドポイントを文書化しています。

Seedance V1.5 Pro はオーディオを生成しますか?

はい。generate_audio フィールドで、出力に同期オーディオを含めるかどうかを制御します。生成された音声、効果音、BGM が必要な場合は true に、サイレント動画の場合は false に設定します。

画像から動画はテキストから動画より高価ですか?

この記事で確認した現在の価格ページのデータでは、同じ解像度、オーディオ設定、サービス階層において、T2V と I2V で同じ Seedance V1.5 Pro レートが表示されています。

オンライン処理とフレックス処理の違いは何ですか?

ドキュメントでは、default を時間重視のシナリオ向けのオンライン推論、flex をレイテンシーに影響されないシナリオ向けでオンラインモード価格の 50% のオフライン推論と説明しています。

最初に 480P と 720P のどちらをテストすべきですか?

広範なプロンプトと参照画像の探索には 480P を使用します。コンセプトがより本格的なビジュアルレビューに十分近づいたら 720P を使用します。大規模な実行で使用する前に、1080P の課金を確認してください。

おすすめ記事