Vidu Q3 Pro vs Turbo on Novita AI:どのビデオモードを選ぶべきか?

Vidu Q3 Pro vs Turbo on Novita AI:どのビデオモードを選ぶべきか?

低コスト、高速な反復、または大量のビデオテストが必要な場合は、最初にVidu Q3 Turboを選択してください。Proバリアントの1秒あたりの高い価格を受け入れ、最終的なクリエイティブパスでTurboと比較したい場合は、Vidu Q3 Proを選択してください。Novita AIでは、両方のバリアントがテキストからビデオ、画像からビデオ、開始-終了からビデオへのエンドポイントを公開し、非同期生成をサポートし、これら3つのモードで同じ公開の1秒あたりの価格パターンを使用します。

Vidu Q3 Pro vs Turbo:選択の概要

Novita AI上のVidu Q3 ProとVidu Q3 Turboの最も明確な情報源に基づく違いは価格です。公開されているNovita AIの価格ペイロードでは、Turboが540p、720p、1080pでProよりも低い1秒あたりのレートであることが示されています。APIドキュメントでは、両方のバリアントがテキストからビデオ、画像からビデオ、開始-終了からビデオへの個別の非同期エンドポイントを通じて利用可能であることも示されています。

判断ポイント Vidu Q3 Turboから始める Vidu Q3 Proから始める
主な目的 プロンプトの探索、より多くのバリアントの実行、1秒あたりのコスト削減 最終候補クリップのProバリアントの比較
予算プロファイル すべての表示解像度でピーク時とオフピーク時の価格が低い すべての表示解像度で1秒あたりの価格が高い
Novita AIのAPIモード テキストからビデオ、画像からビデオ、開始-終了からビデオ テキストからビデオ、画像からビデオ、開始-終了からビデオ
ドキュメント上の出力オプション 最大1080p、1~16秒 最大1080p、1~16秒
ドキュメント上のオーディオサポート Q3オーディオビデオ生成コントロールが利用可能 Q3オーディオビデオ生成コントロールが利用可能
最適な最初のテスト 大量反復、プロンプト検索、ラフカット、ソーシャルバリアント Turboがプロンプトとモードを絞り込んだ後の最終比較パス

TurboとProは、単純な善悪のランキングではなく、2つの価格とワークフローのオプションとして見るのが良いでしょう。公開ドキュメントと価格ページはコストとエンドポイントの比較をサポートしていますが、すべてのプロンプトの問題を解決する普遍的なベンチマーク、レイテンシスコア、またはシーン品質ランキングを公開していません。出力が本当に重要な場合、より信頼性の高い決定方法は、同じプロンプトまたは画像セットを両方のバリアントで実行し、結果を並べて比較することです。

Vidu Q3 テキストからビデオ、画像からビデオ、開始-終了モード

Vidu Q3は単一の設定ではありません。Novita AIでは、有用な選択は二次元的です:ProまたはTurboを選択し、次にソース素材に合った生成モードを選択します。

モード 提供するもの 使用する場面 Pro エンドポイント Turbo エンドポイント
テキストからビデオ テキストプロンプト 新しいシーン、キャラクター、カメラワーク、広告コンセプト、ストーリーボードのアイデアをゼロから探索する場合 /v3/async/vidu-q3-pro-t2v /v3/async/vidu-q3-turbo-t2v
画像からビデオ 1枚の参照画像とオプションのモーションプロンプト アニメーション化する製品画像、キャラクターフレーム、スタイルリファレンス、または静止画構成がすでにある場合 /v3/async/vidu-q3-pro-i2v /v3/async/vidu-q3-turbo-i2v
開始-終了からビデオ 2枚の画像(開始フレームと終了フレーム) 既知の最初と最後のフレーム間をモデルに補間させる必要がある場合 /v3/async/vidu-q3-pro-f2v /v3/async/vidu-q3-turbo-f2v

テキストからビデオの場合、ドキュメントには必須の promptaudio ブール値、durationresolutionaspect_ratiooff_peak、および透かしコントロールがリストされています。Pro テキストからビデオは最大2,000文字のプロンプトを受け入れます。Turbo テキストからビデオは最大5,000文字のプロンプトを受け入れます。

画像からビデオの場合、ドキュメントでは images 配列が必要です。Pro 画像からビデオは現在1つの画像入力に対応しており、JPG、JPEG、PNG、WebP形式、画像あたり最大50 MB、アスペクト比1:4から4:1まで受け入れます。Pro 画像からビデオのドキュメントでは、audio をバックグラウンドミュージック用のカスタムオーディオURLフィールドとしてリストしています。Turbo 画像からビデオも参照画像配列を使用し、同じ画像形式と50 MB制限をサポートし、audio ブール値と audio_type オプション(allspeech_onlysound_effect_only)をリストしています。

開始-終了からビデオの場合、Pro と Turbo 両方のドキュメントで正確に2枚の画像が必須です。最初の画像が開始フレーム、2番目の画像が終了フレームです。ドキュメントには1~16秒の長さと540p、720p、1080pの解像度オプションがリストされています。このモードは、空のプロンプトからシーンを発見することよりも、トランジションの開始と終了を気にする場合に使用します。

Vidu Q3 Pro と Turbo の価格

Novita AIの価格は、Vidu Q3 Pro と Vidu Q3 Turbo で1秒あたりに表示されます。2026年6月23日に確認された現在の公開価格では、各バリアントと解像度において、テキストからビデオ、画像からビデオ、開始-終了からビデオで同じレートが表示されています。

解像度 Vidu Q3 Pro ピーク時 Vidu Q3 Pro オフピーク時 Vidu Q3 Turbo ピーク時 Vidu Q3 Turbo オフピーク時
540p $0.0625/秒 $0.0313/秒 $0.0357/秒 $0.0179/秒
720p $0.1339/秒 $0.0670/秒 $0.0536/秒 $0.0268/秒
1080p $0.1429/秒 $0.0714/秒 $0.0714/秒 $0.0357/秒

以下は、一般的なテストクリップの意味です。

テストクリップ Pro ピーク時 Pro オフピーク時 Turbo ピーク時 Turbo オフピーク時
5秒(540p) $0.3125 $0.1565 $0.1785 $0.0895
10秒(720p) $1.3390 $0.6700 $0.5360 $0.2680
16秒(1080p) $2.2864 $1.1424 $1.1424 $0.5712

オフピークモードは、ターンアラウンドに柔軟性がある場合に最も意味があります。Vidu Q3 APIドキュメントでは、オフピークタスクは48時間以内に処理される低コストのタスクとして説明されており、プロンプトを探索し、より低コストでより広範なテストバッチを実行したい場合に適しています。ユーザー向けフローを構築している場合、配信の遅延が製品体験の一部でない限り、ピークモードが依然としてより安全なデフォルトです。

最初にテストすべきVidu Q3モードは?

モードを選択する最も簡単な方法は、すでに持っている入力から始めることです。多くの失望するテストは、手元の素材に最も適したオプションではなく、最もエキサイティングなオプションを最初に選んだことから来ます。

状況 最初にテストするモード 推奨バリアント 理由
書き留めたアイデアしかない テキストからビデオ Turbo 1秒あたりのコストを抑えながら、より多くのプロンプト方向を探索できます。
製品レンダリングやキャラクター静止画がある 画像からビデオ まずTurbo、最終候補にPro 参照画像がビジュアルターゲットを制約し、Turboで反復コストを抑えられます。
既知の最初と最後のフレームがあるストーリーボードがある 開始-終了からビデオ まずTurbo、必要に応じてPro 2枚の画像がモデルに明示的な端点を与え、制御されたトランジションに役立ちます。
後で編集するために無音のクリップが必要 テキストからビデオまたは画像からビデオ(オーディオ無効) Turbo ドキュメントで audio 制御が公開されているため、後で置き換えるオーディオの生成を回避できます。
最終候補クリップのどちらにするか決めている 両バリアントで同じモード Pro と Turbo を並べて 同一の入力を使用し、汎用的な仮定に頼るのではなく、シーンごとに出力を比較します。

Novita AIでVidu Q3を初めて使用する場合、通常これが最もスムーズな開始方法です。

  1. Turbo テキストからビデオを540pまたは720pで実行し、プロンプト方向を見つけます。
  2. 静止画像からアイデンティティ、製品、またはビジュアルスタイルの制御が必要な場合は、画像からビデオに移行します。
  3. 実際の最初と最後のフレームがある場合にのみ、開始-終了からビデオを使用します。
  4. 対象解像度で最も強い候補をProで再実行し、そのシーンに対して高い価格が正当化されるかどうかを判断します。

この順序により、より高価な比較ステップを最終決定に近づけ、有望な方向性がすでにある状態で行えます。また、後で破棄する可能性のある初期のプロンプト探索にProの予算を費やすのを避けるのにも役立ちます。

Vidu Q3 API エンドポイントとリクエストフロー

この比較における6つのVidu Q3エンドポイントはすべて、Novita AIのv3非同期タスクパターンを使用します。生成リクエストを送信し、task_id を受け取り、タスクが成功したときにその task_id でTask Result APIを呼び出して生成されたビデオを取得します。

エンドポイント メソッド 結果パターン
/v3/async/vidu-q3-pro-t2v POST task_id を返す
/v3/async/vidu-q3-pro-i2v POST task_id を返す
/v3/async/vidu-q3-pro-f2v POST task_id を返す
/v3/async/vidu-q3-turbo-t2v POST task_id を返す
/v3/async/vidu-q3-turbo-i2v POST task_id を返す
/v3/async/vidu-q3-turbo-f2v POST task_id を返す
/v3/async/task-result GET 利用可能な場合、タスクステータスと生成されたメディアを返す

最小限のTurboテキストからビデオリクエストは次のようになります。

curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "prompt": "A close-up product launch video on a clean studio table, soft camera push-in, subtle lighting movement",
    "duration": 5,
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "audio": true,
    "off_peak": false
  }'

次に、タスク結果エンドポイントをポーリングします。

curl --request GET \
  --url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
  --header "Authorization: Bearer $NOVITA_API_KEY"

画像からビデオの場合は、エンドポイントをI2Vエンドポイントに置き換え、images 配列を指定します。開始-終了からビデオの場合は、F2Vエンドポイントを使用し、2枚の画像を順番に(最初に開始フレーム、次に終了フレーム)指定します。

実用的なVidu Q3テスト計画

一度きりの印象ではなく、小さなテストマトリックスを使用してください。目的は普遍的な勝者を証明することではなく、ユースケースに適したバリアントとモードを選択することです。

テストパス バリアント モード 解像度 評価する項目
プロンプト検索 Turbo テキストからビデオ 540p または 720p どのプロンプト構造が適切なシーン、動き、フレーミングを与えるか?
参照制御 Turbo 画像からビデオ 720p モデルは被写体や製品をユースケースに十分に保持しているか?
トランジション制御 Turbo 開始-終了からビデオ 720p 最初と最後のフレーム間の動きは使用可能か?
最終比較 Turbo と Pro 同じ勝ちモード ターゲット解像度 Proの結果は、このシーンに対して1秒あたりの高いコストに見合うか?
コストパス 勝ちバリアント 同じ勝ちモード ターゲット解像度 これをピーク時で実行すべきか、オフピークに移行できるか?

Pro と Turbo を比較するときは、以下の変数を同じに保ちます。

  • 同じプロンプト、画像入力、長さ、解像度、アスペクト比。
  • 同じオーディオ設定。
  • 出力結果を比較する場合は同じオフピーク設定。
  • 同じ評価基準:アイデンティティの一貫性、動きの明瞭さ、カメラワーク、オーディオの有用性、編集可能性。

プロンプトとモデルバリアントを同時に変更すると、比較があいまいになります。どちらの変更が実際に結果を改善したのかを区別できなくなるためです。

よくある質問

Novita AIでは、Vidu Q3 TurboはVidu Q3 Proよりも安いですか?

はい。2026年6月23日に確認されたNovita AIの現在の価格では、Turboが540p、720p、1080pのすべてで、テキストからビデオ、画像からビデオ、開始-終了からビデオにおいてProよりも低い価格になっています。

Vidu Q3 ProとTurboは同じモードをサポートしていますか?

Novita AIのドキュメントでは、テキストからビデオ、画像からビデオ、開始-終了からビデオに対して、ProとTurboの個別のエンドポイントがリストされています。各エンドポイントは task_id を返し、v3非同期タスク結果フローを使用します。

最初にテキストからビデオと画像からビデオのどちらを使うべきですか?

アイデアや書き留めたシーンしかない場合は、最初にテキストからビデオを使用します。製品ショット、キャラクターフレーム、固定されたビジュアルスタイルなど、参照画像が重要な場合は、最初に画像からビデオを使用します。

開始-終了からビデオはいつ使用すべきですか?

2つのフレームがあり、モデルにそれらの間の動きを作成させる必要がある場合に、開始-終了からビデオを使用します。最初と最後のフレームの両方が指定されているため、3つのモードの中で最も構造化されています。

Vidu Q3はオーディオ制御をサポートしていますか?

はい。Vidu Q3のドキュメントにはオーディオ制御が含まれています。テキストからビデオと開始-終了からビデオでは audio ブール値が公開されています。Pro画像からビデオでは、audio をバックグラウンドミュージック用のカスタムオーディオURLフィールドとしてリストしています。一方、Turbo画像からビデオでは、audio ブール値と audio_type オプション(allspeech_onlysound_effect_only)がリストされています。

同じプロンプトでVidu Q3 TurboとProの両方を実行すべきですか?

プロンプト、参照、長さ、アスペクト比を探索するときは、まずTurboを実行します。結果が希望に近い場合は、同じ設定でProを再実行し、比較がプロンプトや入力の変更ではなく、モデルバリアントを分離するようにします。

おすすめ記事