Novita AIにおけるVidu Q3 Pro vs Turbo: どの動画モードを選ぶべきか？

Vidu Q3 Pro vs Turbo 選択の概要
Vidu Q3 テキスト読み取り動画、画像読み取り動画、開始-終了モード
Vidu Q3 Pro と Turbo の料金
最初にテストすべき Vidu Q3 モードはどれか？
Vidu Q3 API エンドポイントとリクエストフロー
実用的な Vidu Q3 テスト計画
FAQ
おすすめ記事

低コスト、高速な反復、または大量の動画テストが必要な場合は、まず Vidu Q3 Turbo を選択してください。Pro バリアントの1秒あたりの高い料金を支払う意思があり、最終的なクリエイティブパスのために Turbo と比較したい場合は、Vidu Q3 Pro を選択してください。Novita AI では、両方のバリアントがテキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画のエンドポイントを公開しており、非同期生成をサポートし、これら3つのモードで同じ公開1秒あたりの料金パターンを使用しています。

Vidu Q3 Pro vs Turbo 選択の概要

Novita AI における Vidu Q3 Pro と Vidu Q3 Turbo の最も明確な情報源に基づく違いは料金です。公開されている Novita AI の料金ペイロードでは、540p、720p、1080p のすべてにおいて、Turbo が Pro よりも低い1秒あたりのレートで記載されています。API ドキュメントでは、両方のバリアントがテキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画用の個別の非同期エンドポイントを通じて利用可能であることも示されています。

判断ポイント	Vidu Q3 Turbo から開始	Vidu Q3 Pro から開始
主な目的	プロンプトを探索、より多くのバリアントを実行、1秒あたりのコストを削減	最終候補クリップのために Pro バリアントを比較
予算プロファイル	記載されているすべての解像度で低いピーク時およびオフピーク時の価格	記載されているすべての解像度で高い1秒あたりの価格
Novita AI の API モード	テキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画	テキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画
ドキュメント内の出力オプション	最大1080p、1～16秒	最大1080p、1～16秒
ドキュメント内の音声サポート	Q3 音声・動画生成コントロールが利用可能	Q3 音声・動画生成コントロールが利用可能
最適な最初のテスト	大量反復、プロンプト検索、ラフカット、ソーシャルバリアント	Turbo がプロンプトとモードを絞り込んだ後の最終比較パス

Turbo と Pro は、単純な優劣のランキングではなく、2つの料金とワークフローのオプションとして捉えるのが最適です。公開ドキュメントと料金ページはコストとエンドポイントの比較をサポートしていますが、すべてのプロンプトに対して決定的な万能ベンチマーク、レイテンシスコア、またはシーン品質ランキングを公開しているわけではありません。出力が本当に重要な場合、より信頼性の高い判断方法は、同じプロンプトまたは画像セットを両方のバリアントで実行して直接 vidu q3 pro vs turbo 比較を行い、結果を並べて評価することです。

Vidu Q3 テキスト読み取り動画、画像読み取り動画、開始-終了モード

Vidu Q3 は単一の設定ではありません。Novita AI では、有用な選択は2次元です。Pro または Turbo を選び、次にソース素材に一致する生成モードを選びます。

モード	提供するもの	使用するタイミング	Pro エンドポイント	Turbo エンドポイント
テキスト読み取り動画	テキストプロンプト	新しいシーン、キャラクター、カメラワーク、広告コンセプト、ストーリーボードのアイデアをゼロから探索する場合	`/v3/async/vidu-q3-pro-t2v`	`/v3/async/vidu-q3-turbo-t2v`
画像読み取り動画	1枚の参照画像とオプションのモーションプロンプト	既に商品画像、キャラクターフレーム、スタイル参照、またはアニメーション化する静止画がある場合	`/v3/async/vidu-q3-pro-i2v`	`/v3/async/vidu-q3-turbo-i2v`
開始-終了読み取り動画	2枚の画像（開始フレームと終了フレーム）	既知の最初と最後のフレーム間をモデルに補間させる必要がある場合	`/v3/async/vidu-q3-pro-f2v`	`/v3/async/vidu-q3-turbo-f2v`

テキスト読み取り動画の場合、ドキュメントには必須の prompt、audio ブール値、duration、resolution、aspect_ratio、off_peak、および透かしコントロールが記載されています。Pro テキスト読み取り動画は最大2,000文字のプロンプトを受け付けます。Turbo テキスト読み取り動画は最大5,000文字のプロンプトを受け付けます。

画像読み取り動画の場合、ドキュメントには images 配列が必要です。Pro 画像読み取り動画は現在1つの画像入力に対応しており、JPG、JPEG、PNG、WebP が許容され、画像あたり最大50 MB、アスペクト比は1:4から4:1まで対応しています。Pro 画像読み取り動画のドキュメントでは、audio は背景音楽用のカスタム音声URLフィールドとして記載されています。Turbo 画像読み取り動画も参照画像配列を使用し、同じ画像形式と50 MB制限に対応し、audio ブール値に加えて audio_type オプション（all、speech_only、sound_effect_only）が記載されています。

開始-終了読み取り動画の場合、Pro と Turbo の両方のドキュメントで、正確に2枚の画像が必要です。最初の画像が開始フレーム、2番目の画像が終了フレームです。ドキュメントには1～16秒の長さと、540p、720p、1080p の解像度オプションが記載されています。このモードは、空白のプロンプトからシーンを発見することよりも、トランジションの開始と終了の位置を重視する場合に使用します。

Vidu Q3 Pro と Turbo の料金

Novita AI の料金は、Vidu Q3 Pro および Vidu Q3 Turbo に対して1秒あたりで記載されています。2026年6月23日に確認された現在の公開料金では、各バリアントと解像度において、テキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画間で同じレートが示されています。

解像度	Vidu Q3 Pro ピーク時	Vidu Q3 Pro オフピーク時	Vidu Q3 Turbo ピーク時	Vidu Q3 Turbo オフピーク時
540p	$0.0625/s	$0.0313/s	$0.0357/s	$0.0179/s
720p	$0.1339/s	$0.0670/s	$0.0536/s	$0.0268/s
1080p	$0.1429/s	$0.0714/s	$0.0714/s	$0.0357/s

以下は、一般的なテストクリップにおける意味合いです。

テストクリップ	Pro ピーク時	Pro オフピーク時	Turbo ピーク時	Turbo オフピーク時
540p で5秒	$0.3125	$0.1565	$0.1785	$0.0895
720p で10秒	$1.3390	$0.6700	$0.5360	$0.2680
1080p で16秒	$2.2864	$1.1424	$1.1424	$0.5712

オフピークモードは、納期に柔軟性がある場合に最も効果的です。ワークフローにおいて vidu q3 pro vs turbo の速度が重要な場合、ピークモードはより高速な結果を提供しますが、オフピークモードは納期を低い1秒あたりのレートと交換します。Vidu Q3 API ドキュメントでは、オフピークタスクは48時間以内に処理される低コストタスクとして説明されており、プロンプトを探索し、より低コストでより広範なテストバッチを実行したい場合に適しています。ユーザー向けフローを構築している場合、遅延配信が製品体験の一部でない限り、ピークモードがより安全なデフォルトです。

最初にテストすべき Vidu Q3 モードはどれか？

モードを選択する最も簡単な方法は、既に持っている入力から始めることです。多くの失望するテストは、手元の素材に最も適したオプションではなく、最もエキサイティングなオプションを最初に選ぶことから生じます。

状況	最初にテストするモード	推奨バリアント	理由
書き留めたアイデアのみがある	テキスト読み取り動画	Turbo	より低い1秒あたりのコストで、より多くのプロンプト方向を探索できます。
商品レンダリングやキャラクターの静止画がある	画像読み取り動画	まず Turbo、最終候補は Pro	参照画像が視覚的ターゲットを制約し、Turbo で反復コストを抑えられます。
既知の最初と最後のフレームを持つストーリーボードがある	開始-終了読み取り動画	まず Turbo、必要に応じて Pro	2枚の画像がモデルに明確な端点を与え、制御されたトランジションに役立ちます。
後で編集するために無音クリップが必要	音声を無効にしたテキスト読み取り動画または画像読み取り動画	Turbo	ドキュメントで `audio` コントロールが公開されているため、後で置き換える音声を生成するのを回避できます。
最終的な候補クリップの間で決定している	両方のバリアントで同じモード	Pro と Turbo を並べて	同一の入力を使用して出力を比較し、汎用的な前提に頼らずにシーンを評価します。

Novita AI で Vidu Q3 を初めて使用する場合、これが通常最もスムーズな開始方法です。

Turbo テキスト読み取り動画を540pまたは720pで実行して、プロンプトの方向性を見つけます。
静止画像からのアイデンティティ、商品、またはビジュアルスタイルの制御が必要な場合は、画像読み取り動画に移行します。
実際の最初のフレームと最後のフレームがある場合にのみ、開始-終了読み取り動画を使用します。
最も強力な候補をターゲット解像度で Pro で再実行し、そのシーンに対して高い料金が正当化されるかどうかを判断する前に vidu q3 pro の品質 を評価します。

この順序により、より高価な比較ステップを最終決定の近くに保ち、既に有望な方向性がある状態で実行できます。また、後で破棄する可能性のある初期のプロンプト探索に Pro の予算を費やすのを避けるのにも役立ちます。

Vidu Q3 API エンドポイントとリクエストフロー

この比較における6つの Vidu Q3 エンドポイントはすべて、Novita AI の v3 非同期タスクパターンを使用します。生成リクエストを送信し、task_id を受け取り、その task_id を使用してタスク結果 API を呼び出し、タスクが成功したときに生成された動画を取得します。

エンドポイント	メソッド	結果パターン
`/v3/async/vidu-q3-pro-t2v`	`POST`	`task_id` を返す
`/v3/async/vidu-q3-pro-i2v`	`POST`	`task_id` を返す
`/v3/async/vidu-q3-pro-f2v`	`POST`	`task_id` を返す
`/v3/async/vidu-q3-turbo-t2v`	`POST`	`task_id` を返す
`/v3/async/vidu-q3-turbo-i2v`	`POST`	`task_id` を返す
`/v3/async/vidu-q3-turbo-f2v`	`POST`	`task_id` を返す
`/v3/async/task-result`	`GET`	利用可能な場合、タスクステータスと生成メディアを返す

最小限の Turbo テキスト読み取り動画リクエストは次のようになります。

curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "prompt": "清潔なスタジオテーブル上のクローズアップ商品発表動画、ソフトなカメラのプッシュイン、微妙な照明の動き",
    "duration": 5,
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "audio": true,
    "off_peak": false
  }'

次に、タスク結果エンドポイントをポーリングします。

curl --request GET \
  --url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
  --header "Authorization: Bearer $NOVITA_API_KEY"

画像読み取り動画の場合は、エンドポイントを I2V エンドポイントに置き換え、images 配列を提供します。開始-終了読み取り動画の場合は、F2V エンドポイントを使用し、2枚の画像を順序通り（最初に開始フレーム、次に終了フレーム）提供します。

実用的な Vidu Q3 テスト計画

単発の印象ではなく、小さなテストマトリックスを使用します。目的は普遍的な勝者を証明することではなく、ユースケースに適したバリアントとモードを選択することです。

テストパス	バリアント	モード	解像度	評価する内容
プロンプト検索	Turbo	テキスト読み取り動画	540p または 720p	どのプロンプト構造が適切なシーン、動き、フレーミングを与えるか？
参照制御	Turbo	画像読み取り動画	720p	モデルはユースケースに十分な被写体または商品を保持しているか？
トランジション制御	Turbo	開始-終了読み取り動画	720p	最初と最後のフレーム間の動きは使いやすいか？
最終比較	Turbo と Pro	同じ勝利モード	ターゲット解像度	このシーンに対して、Pro の結果は高い1秒あたりのコストに見合うか？
コストパス	勝利バリアント	同じ勝利モード	ターゲット解像度	これはピーク時で実行すべきか、オフピーク時に移行できるか？

Pro と Turbo を比較する際は、以下の変数を同じに保ちます。

同じプロンプト、画像入力、長さ、解像度、アスペクト比。
同じ音声設定。
出力結果を比較する際は同じオフピーク設定。
同じ評価基準: アイデンティティの一貫性、動きの明瞭さ、カメラワーク、音声の有用性、編集可能性。

プロンプトとモデルバリアントを同時に変更すると、比較が曖昧になります。どちらの変更が実際に結果を改善したのかが分からなくなるためです。

FAQ

Novita AI では Vidu Q3 Turbo は Vidu Q3 Pro よりも安いですか？

はい。2026年6月23日に確認された現在の Novita AI の料金では、テキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画の540p、720p、1080p において、Turbo が Pro よりも低く設定されています。

Vidu Q3 Pro と Turbo は同じモードをサポートしていますか？

Novita AI のドキュメントでは、テキスト読み取り動画、画像読み取り動画、開始-終了読み取り動画用に個別の Pro と Turbo のエンドポイントが記載されています。各エンドポイントは task_id を返し、v3 非同期タスク結果フローを使用します。

最初にテキスト読み取り動画と画像読み取り動画のどちらを使用すべきですか？

アイデアや書き留めたシーンしかない場合は、最初にテキスト読み取り動画を使用します。商品写真、キャラクターフレーム、固定されたビジュアルスタイルなど、参照画像が重要な場合は、最初に画像読み取り動画を使用します。

開始-終了読み取り動画はいつ使用すべきですか？

2つのフレームがあり、それらの間の動きをモデルに作成させる必要がある場合に、開始-終了読み取り動画を使用します。最初と最後のフレームの両方が指定されるため、これは3つのモードの中で最も構造化されたものです。

Vidu Q3 は音声コントロールをサポートしていますか？

はい。Vidu Q3 のドキュメントには音声コントロールが含まれています。テキスト読み取り動画と開始-終了読み取り動画は audio ブール値を公開しています。Pro 画像読み取り動画は audio を背景音楽用のカスタム音声URLフィールドとして記載し、Turbo 画像読み取り動画は audio ブール値に加えて audio_type オプション（all、speech_only、sound_effect_only）を記載しています。

同じプロンプトで Vidu Q3 Turbo と Pro の両方を実行すべきですか？

プロンプト、参照、長さ、アスペクト比を探索する際は、最初に Turbo を実行します。ある結果が必要なものに近い場合は、同じ設定を Pro で再実行し、プロンプトや入力の変更を混在させずにモデルバリアントを分離して比較します。