Kling 3.0 が Novita AI で利用可能になりました。開発者やクリエイター向けに、柔軟な 3~15 秒の動画生成、ネイティブ音声生成、マルチショット動画合成を提供します。料金は透明で使用量ベースです。Standard は 音声なし $0.168/秒、音声あり $0.252/秒、Pro は 音声なし $0.224/秒、音声あり $0.336/秒 です。プロダクション対応の API アクセスと組み合わせることで、Kling 3.0 on Novita AI は実験から本番導入までの実用的なパスを提供します。
Kling 3.0 とは?
Kling 3.0 は、Kuaishou が開発した最新の AI 動画生成モデルで、2026 年 2 月 5 日にグローバル公開されました。動画の長さ、ネイティブ多言語音声生成、時間的一貫性において大幅なアップグレードが導入され、実際のクリエイティブおよび商用ワークフローにより適しています。
以前のバージョンと比較して、Kling 3.0 はいくつかの顕著な改善を提供します。
- より長い動画生成:以前の 10 秒から最大 15 秒に対応
- ネイティブ多言語音声:中国語、英語、日本語、韓国語、スペイン語、および複数のアクセントや方言に対応
- より強力な要素の一貫性:キャラクター、オブジェクト、シーンがフレーム間でより一貫性を保つ
- より優れたテキスト保存:ロゴ、字幕、ブランド要素がクリップ全体でよりシャープで読みやすく
- よりフォトリアルな出力:改善された表情とより自然な身体の動き
Novita AI 上の Kling 3.0:利用可能な機能
Novita AI は現在、4 つの Kling 3.0 エンドポイントをサポートしています。
- Kling 3.0 Standard テキストから動画
- Kling 3.0 Standard 画像から動画
- Kling 3.0 Pro テキストから動画
- Kling 3.0 Pro 画像から動画
4 つのエンドポイントすべてが以下をサポートしています。
- 柔軟な長さ:3~15 秒(リクエストごとに選択可能)
- 複数のアスペクト比:16:9、9:16、1:1
- オプションの音声同時生成:動画作成と同時に音声を生成
- マルチプロンプト構成:動画を複数のショットに分割し、セグメントごとに個別のプロンプト
Kling 3.0 Standard vs Pro:主な違い
大まかに言えば、Novita のドキュメントと料金体系における違いは明確です。Standard はコスト効率の良い反復処理向けに設計されており、Pro はより高度な制御と高品質な出力を必要とするユーザーに適しています。
Novita AI では、Kling 3.0 Standard テキストから動画および画像から動画は、音声なし $0.168/秒、音声あり $0.252/秒 です。Pro テキストから動画および画像から動画は、音声なし $0.224/秒、音声あり $0.336/秒 で、Standard と比較して約 33% 高い 料金設定です。
具体的には、次のようになります。
- 5 秒の無音クリップ:Standard で約 $0.84、Pro で約 $1.12
- 音声付き 10 秒クリップ:Standard で約 $2.52、Pro で約 $3.36
多くのユーザーにとって、最も効率的なワークフローは、最初に Standard で素早く反復処理を行い、マルチショット構成、より高い一貫性、またはより洗練された出力がプレミアムに見合う価値がある場合に Pro に切り替えることです。
Novita AI で Kling 3.0 を使用する方法
1. API キーを取得する
Novita AI にサインアップし、ダッシュボードから API キーを生成します。Novita は新規ユーザーに無料クレジットを提供しています。

2. エンドポイントを選択する
Novita AI は 4 つの専用エンドポイントを提供します。
- Standard テキストから動画:
POST /v3/async/txt2video-kling-v3.0-std - Standard 画像から動画:
POST /v3/async/img2video-kling-v3.0-std - Pro テキストから動画:
POST /v3/async/txt2video-kling-v3.0-pro - Pro 画像から動画:
POST /v3/async/img2video-kling-v3.0-pro
3. 最初のリクエストを行う
Kling 3.0 Standard テキストから動画の例:
curl --request POST \
--url https://api.novita.ai/v3/async/kling-v3.0-std-t2v \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>' \
--data '
{
"sound": true,
"prompt": "<string>",
"duration": 123,
"cfg_scale": 123,
"aspect_ratio": "<string>",
"negative_prompt": "<string>"
}
'
4. 結果をポーリングする
Kling 3.0 は非同期で動作し、すぐに task_id が返されます。結果エンドポイントをポーリングします。
curl --request GET \
--url https://api.novita.ai/v3/async/task-result \
--header 'Authorization: <authorization>' \
--header 'Content-Type: <content-type>'
料金内訳:Novita AI 上の Kling 3.0
Novita AI は Kling 3.0 に秒単位の課金を採用しており、3~15 秒の任意の長さに対して正確なコスト管理が可能です。
完全な料金表
| モデル | モード | オーディオ | 1秒あたりの料金 | 5秒のコスト | 10秒のコスト | 15秒のコスト |
| Standard | テキスト→動画 | なし | $0.168/秒 | $0.84 | $1.68 | $2.52 |
| Standard | テキスト→動画 | あり | $0.252/秒 | $1.26 | $2.52 | $3.78 |
| Standard | 画像→動画 | なし | $0.168/秒 | $0.84 | $1.68 | $2.52 |
| Standard | 画像→動画 | あり | $0.252/秒 | $1.26 | $2.52 | $3.78 |
| Pro | テキスト→動画 | なし | $0.224/秒 | $1.12 | $2.24 | $3.36 |
| Pro | テキスト→動画 | あり | $0.336/秒 | $1.68 | $3.36 | $5.04 |
| Pro | 画像→動画 | なし | $0.224/秒 | $1.12 | $2.24 | $3.36 |
| Pro | 画像→動画 | あり | $0.336/秒 | $1.68 | $3.36 | $5.04 |
料金に関する重要な注意事項
- 秒単位の課金は、指定した正確な長さ(3~15秒)に適用されます
- 音声を追加するとコストが 50% 増加します(Standard:+$0.084/秒、Pro:+$0.112/秒)
- 同じ階層内では T2V と I2V の料金に差はありません
- 同じ構成の場合、Pro は Standard より 33% 高くなります
まとめ
Novita AI 上の Kling 3.0 は、AI 動画生成を実際の制作ワークフローにさらに実用的なものにします。3~15 秒の動画サポート、ネイティブ音声、改善された時間的一貫性により、EC デモ、ソーシャルコンテンツ、コンセプトテストなどのユースケースに適しています。透明な料金、信頼性の高い API アクセス、柔軟な長さの制御と組み合わせることで、Novita AI はコスト、品質、使いやすさのバランスに優れています。製品やコンテンツパイプライン向けに AI 動画を評価している場合は、Novita AI 上の Kling 3.0 が最適な出発点となるでしょう。
Novita AI は、シンプルな API を使用して AI モデルを簡単にデプロイできる方法を開発者に提供するとともに、手頃な価格で信頼性の高い GPU クラウドを構築およびスケーリングするための AI クラウドプラットフォームです。
よくある質問
Kling 3.0 と 3.0 Omni の違いは何ですか?
Kling 3.0(Standard/Pro)は、マルチプロンプト構成によりテキストまたは画像から単一の動画を生成します。Kling 3.0 Omni は、参照動画の編集、マルチショットストーリーボード(最大 6 カット)、キャラクターの一貫性を保つための要素ライブラリを追加します。
Kling 3.0 は無料ですか?
いいえ。Novita AI 上の Kling 3.0 は秒単位の課金を使用します。Standard は $0.168/秒(音声なし)または $0.252/秒(音声あり)、Pro は $0.224/秒または $0.336/秒です。Novita AI は新規ユーザーに無料クレジットを提供しています。例:音声付き 10 秒の Pro 動画は $3.36 です。
動画の生成にはどのくらい時間がかかりますか?
生成には通常、動画の長さ(3~15 秒)、モード(Standard/Pro)、音声の有無にもよりますが、30~120 秒かかります。Kling 3.0 は非同期 API を使用します。リクエストを送信し、タスク ID を受け取り、ステータスが「succeed」になったら結果をポーリングします。
