Moonshot AIが開発したKimi-K2-Instructは、次世代のスパースMoEモデルであり、現在、 Novita AI合計 1 兆個のパラメータ、32 億個のアクティブ化パラメータ、および 128,000 トークンのコンテキスト ウィンドウを備え、エージェントの動作、ツールの使用、および長期コンテキストの推論に合わせて調整されています。
現在の価格はこちら キミ-K2-インストラクト on Novita AI: 0.57ドル/M入力トークン、2.3ドル/M出力トークン
Kimi K2とは何ですか?
Moonshot AI(北京拠点、2023年設立)は、K1.5、K2、マルチモーダルKimi-VLモデルを含むKimiブランドを展開しています。同社のオープンサイエンスミッションは、強力なエージェント型知能の民主化を目指しています。
Moonshot AIが開発したKimi K2は、32億個の活性化パラメータと合計1兆個のパラメータを備えた最先端の専門家混合(MoE)言語モデルです。Muonオプティマイザーを用いて学習されたKimi K2は、最先端の知識、推論、コーディングタスクにおいて卓越したパフォーマンスを発揮するとともに、高度なエージェント機能向けに微調整されています。
他社とのちがい
- 大規模トレーニング: トレーニングの不安定性がゼロの 1T トークンで 15.5T パラメータの MoE モデルを事前トレーニングしました。
- MuonClip Optimizer: Muon Optimizer を前例のない規模に適用し、スケールアップしながら不安定性を解決するための新しい最適化手法を開発します。
- エージェントインテリジェンス: ツールの使用、推論、自律的な問題解決のために特別に設計されています。
モデルバリアント
- キミK2ベース: 基礎モデルは、微調整とカスタム ソリューションを完全に制御したい研究者やビルダーにとって強力なスタートとなります。
- キミ-K2-インストラクト: ドロップイン型の汎用チャットやエージェント体験に最適な、事後学習済みモデルです。長時間の思考を必要としない反射レベルのモデルです。

指導モデル評価結果
| ベンチマーク | メトリック | キミK2インストラクト | ディープシーク-V3-0324 | クウェン3-235B-A22B (無思考) | クロード・ソネット 4 (じっくり考えずに) | クロード・オーパス4 (じっくり考えずに) | GPT-4.1 | ジェミニ 2.5 フラッシュ プレビュー(05-20) |
|---|---|---|---|---|---|---|---|---|
| コーディングタスク | ||||||||
| ライブコードベンチ v6 (24月25日~XNUMX月XNUMX日) | パス@1 | 53.7 | 46.9 | 37.0 | 48.5 | 47.4 | 44.7 | 44.7 |
| OJBench | パス@1 | 27.1 | 24.0 | 11.3 | 15.3 | 19.6 | 19.5 | 19.5 |
| 複数 | パス@1 | 85.7 | 83.1 | 78.2 | 88.6 | 89.6 | 86.7 | 85.6 |
| SWEベンチ検証済み (エージェントレスコーディング) | 単一パッチ(テストなし)(Acc) | 51.8 | 36.6 | 39.4 | 50.2 | 53.0 | 40.8 | 32.6 |
| SWEベンチ検証済み (エージェントコーディング) | 単一試行(Acc) | 65.8 | 38.8 | 34.4 | 72.7* | 72.5* | 54.6 | - |
| 複数回の試行(Acc) | 71.6 | - | - | 80.2 | 79.4* | - | - | |
| SWEベンチ多言語 (エージェントコーディング) | 単一試行(Acc) | 47.3 | 25.8 | 20.9 | 51.0 | - | 31.5 | - |
| ターミナルベンチ | 社内フレームワーク(Acc) | 30.0 | - | - | 35.5 | 43.2 | 8.3 | - |
| ターミナス(Acc) | 25.0 | 16.3 | 6.6 | - | - | 30.3 | 16.8 | |
| エイダー・ポリグロット | ACC | 60.0 | 55.1 | 61.8 | 56.4 | 70.7 | 52.4 | 44.0 |
| ツール使用タスク | ||||||||
| Tau2小売 | 平均@4 | 70.6 | 69.1 | 57.0 | 75.0 | 81.8 | 74.8 | 64.3 |
| タウ2航空 | 平均@4 | 56.5 | 39.0 | 26.5 | 55.5 | 60.0 | 54.5 | 42.5 |
| Tau2テレコム | 平均@4 | 65.8 | 32.5 | 22.1 | 45.2 | 57.0 | 38.6 | 16.9 |
| エースベンチ | ACC | 76.5 | 72.7 | 70.5 | 76.2 | 75.6 | 80.1 | 74.5 |
| 数学とSTEMの課題 | ||||||||
| エム2024 | 平均@64 | 69.6 | 59.4* | 40.1* | 43.4 | 48.2 | 46.5 | 61.3 |
| エム2025 | 平均@64 | 49.5 | 46.7 | 24.7* | 33.1* | 33.9* | 37.0 | 46.6 |
| 数学500 | ACC | 97.4 | 94.0* | 91.2* | 94.0 | 94.4 | 92.4 | 95.4 |
| HMMT 2025 | 平均@32 | 38.8 | 27.5 | 11.9 | 15.9 | 15.9 | 19.4 | 34.7 |
| CNMO 2024 | 平均@16 | 74.3 | 74.7 | 48.6 | 60.4 | 57.6 | 56.6 | 75.0 |
| PolyMath-en | 平均@4 | 65.1 | 59.5 | 51.9 | 52.8 | 49.8 | 54.0 | 49.9 |
| ゼブラロジック | ACC | 89.0 | 84.0 | 37.7* | 73.7 | 59.3 | 58.5 | 57.9 |
| オートロジ | ACC | 89.5 | 88.9 | 83.3 | 89.8 | 86.1 | 88.2 | 84.1 |
| GPQA ダイヤモンド | 平均@8 | 75.1 | 68.4* | 62.9* | 70.0* | 74.9* | 66.3 | 68.2 |
| スーパーGPQA | ACC | 57.2 | 53.7 | 50.2 | 55.7 | 56.5 | 50.8 | 49.6 |
| 人類最後の試験 (テキストのみ) | – | 4.7 | 5.2 | 5.7 | 5.8 | 7.1 | 3.7 | 5.6 |
| 一般的なタスク | ||||||||
| MMLU | EM | 89.5 | 89.4 | 87.0 | 91.5 | 92.9 | 90.4 | 90.1 |
| MMLU-Redux | EM | 92.7 | 90.5 | 89.2 | 93.6 | 94.2 | 92.4 | 90.6 |
| MMLUプロ | EM | 81.1 | 81.2* | 77.3 | 83.7 | 86.6 | 81.8 | 79.4 |
| IFEval | プロンプト厳格 | 89.8 | 81.1 | 83.2* | 87.6 | 87.4 | 88.0 | 84.3 |
| マルチチャレンジ | ACC | 54.1 | 31.4 | 34.0 | 46.8 | 49.0 | 36.4 | 39.5 |
| シンプルQA | 正解 | 31.0 | 27.7 | 13.2 | 15.9 | 22.8 | 42.3 | 23.3 |
| ライブベンチ | パス@1 | 76.4 | 72.4 | 67.6 | 74.8 | 74.6 | 69.8 | 67.8 |
Kimi-K2 対応エンジンと最小ハードウェア
サポートされているエンジン
- vLLM
- SGLang
- TensorRT-LLM
- Kトランスフォーマー
最小ハードウェア
| Hardware | 最小要件 |
|---|---|
| GPU タイプ | H200 |
| クラスターサイズ | 16 GPUs(最小) |
| 並列処理モード | テンソル並列処理(TP-16)またはデータ並列処理+エキスパート並列処理 |
| 重みの形式 | 8kシーケンスのFP128重み |
Kimi-K2-Instructへのアクセス方法 Novita AI
Kimi-K2-Instructは、早く、簡単に、そして手頃な価格で始められます。 Novita AI.
プレイグラウンドを使用する(コーディングは不要)
インスタントアクセス: サインアップして、Kimi‑K2‑Instruct やその他のトップ モデルをすぐに試してみましょう。
インタラクティブUI: 直感的なインターフェースを通じてモデルを体験してください。
モデルの比較: Kimi-K2-Instruct とその他のトップモデルを簡単に切り替えて、ニーズに最適なモデルを見つけてください。
API経由で統合する(開発者向け)
Kimi-K2-Instructをアプリケーション、ワークフロー、チャットボットにシームレスに接続します。 Novita AIの統合 REST API により、モデルの重みやインフラストラクチャを管理する必要がなくなります。
オプション 1: 直接 API 統合 (Python の例)
開始するには、以下のコード スニペットを使用するだけです。
openai からインポート OpenAI クライアント = OpenAI( base_url="https://api.novita.ai/v3/openai", api_key="", ) model = "moonshotai/kimi-k2-instruct" stream = True # または False max_tokens = 65536 system_content = ""役に立つアシスタントになりましょう"" temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create( model=model, messages=[ { "role": "system", "content": system_content, }, { "role": "user", "content": "こんにちは!", } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=周波数ペナルティ、response_format=レスポンスフォーマット、extra_body={ "top_k": top_k、 "repetition_penalty": repetition_penalty、 "min_p": min_p } ) ストリームの場合: for chunk in chat_completion_res: print(chunk.choices[0].delta.content or "", end="") else: print(chat_completion_res.choices[0].message.content)
主な特長:
- 統合エンドポイント:
/v3/openaiOpenAI の Chat Completions API 形式をサポートします。 - 柔軟なコントロール: 温度、トップポイント、ペナルティなどを調整して、カスタマイズされた結果を得ることができます。
- ストリーミングとバッチ処理: 希望する応答モードを選択してください。
オプション2: OpenAI Agents SDKを使用したマルチエージェントワークフロー
統合することで高度なマルチモーダルエージェントシステムを構築します Novita AI OpenAI エージェント SDK:
プラグ&プレイ: あらゆる OpenAI Agents ワークフローで Kimi‑K2‑Instruct を使用します。
ハンドオフ、ルーティング、ツールの使用をサポート: 視覚的なコンテンツを分析したり、タスクを委任したり、機能を実行したりできるエージェントを設計します。
Python統合: SDKをNovitaのエンドポイントにポイントするだけです(https://api.novita.ai/v3/openai) にアクセスし、API キーを使用してエージェントのワークフローをシームレスに実行します。
オプション3: サードパーティプラットフォームでKimi-K2-Instruct APIを接続する
ハグ顔: Kimi-K2-InstructをSpaces、パイプライン、またはTransformersライブラリで使用するには、 Novita AI エンドポイント
エージェントとオーケストレーション フレームワーク: 簡単に接続 Novita AI パートナープラットフォーム 続ける, 何もLLM, ラングチェーン, ディファイ の三脚と ラングフロー 公式コネクタとステップバイステップの統合ガイドを通じて。
OpenAI互換API: 次のようなツールで手間のかからない移行と統合をお楽しみください。 クライン 、トレイ、 カーソルOpenAI API 標準向けに設計されています。
結論
Kimi-K2-Instruct は、コーディング、推論、エージェント AI の限界を押し広げる、強力でオープン アクセスの 1T パラメータ MoE モデルです。
今すぐ利用可能 Novita AIKimi-K2-Instructは、大規模なスケール、ツール利用インテリジェンス、そしてロングコンテキスト処理を融合し、効率的な推論インフラストラクチャと組み合わせることで、すべて展開可能です。次世代のAIアシスタント、エージェント、推論エンジンを構築する開発者や研究者にとって、Kimi-KXNUMX-Instructは、強力で柔軟性が高く、実稼働環境にも対応できる最先端の基盤を提供します。
試します Kimi-K2-Instruct デモ on Novita AI !
Novita AI は、開発者がシンプルなAPIを使用してAIモデルを簡単に導入できるAIクラウドプラットフォームであり、手頃な価格で信頼性の高い GPU 構築と拡張のためのクラウド。
Novitaの詳細を見る
最新の投稿をメールで受け取るには購読してください。





