Kimi‑K2‑InstructがNovita AIで利用可能になりました

Kimi K2 とは？
インストラクションモデルの評価結果
Kimi‑K2 対応エンジンと最小ハードウェア要件
Novita AI で Kimi‑K2‑Instruct にアクセスする方法
結論

Moonshot AI が開発した Kimi‑K2‑Instruct は、次世代スパース MoE モデルで、Novita AI から利用可能になりました。総パラメータ数 1 兆、活性化パラメータ数 320 億、128,000 トークンのコンテキストウィンドウを備え、エージェント的な動作、ツール使用、長文コンテキストでの推論に最適化されています。

以下は、Novita AI 上の Kimi‑K2‑Instruct の現在の料金です：入力トークン 100 万あたり $0.57、出力トークン 100 万あたり $2.3

Kimi K2 とは？

Moonshot AI（北京拠点、2023 年設立）は、K1.5、K2、マルチモーダル Kimi‑VL モデルを含む Kimi ブランドの背後にいます。そのオープンサイエンスのミッションは、強力でエージェント的な知能を民主化することを目的としています。

Moonshot AI によって開発された Kimi K2 は、最先端の mixture-of-experts（MoE）言語モデルであり、320 億の活性化パラメータと総計 1 兆のパラメータを備えています。Muon オプティマイザを使用してトレーニングされた Kimi K2 は、最先端の知識、推論、コーディングタスクにおいて優れたパフォーマンスを発揮し、高度なエージェント機能に微調整されています。

主な特徴

大規模トレーニング：トレーニングの不安定性ゼロで 15.5T トークン上で 1T パラメータ MoE モデルを事前学習。
MuonClip オプティマイザ：Muon オプティマイザを前例のないスケールに適用し、スケールアップ中の不安定性を解決する新しい最適化技術を開発。
エージェント的知能：ツール使用、推論、自律的な問題解決に特化して設計。

モデルバリアント

Kimi-K2-Base：ベースモデル。微調整やカスタムソリューションを完全に制御したい研究者やビルダーに最適な強力な出発点。
Kimi-K2-Instruct：ポストトレーニングされたモデルで、汎用チャットやエージェント体験にそのまま最適。長時間思考を伴わない reflex-grade モデルです。

インストラクションモデルの評価結果

|Benchmark|Metric|^{Kimi K2 Instruct}|^{DeepSeek-V3-0324}|^{Qwen3-235B-A22B

(non-thinking)}|^{Claude Sonnet 4

(w/o extended thinking)}|^{Claude Opus 4

(w/o extended thinking)}|^GPT-4.1|^{Gemini 2.5 Flash

Preview (05-20)}| |—|—|—|—|—|—|—|—|—| |Coding Tasks| |LiveCodeBench v6
^{(Aug 24 - May 25)}|Pass@1|53.7|46.9|37.0|48.5|47.4|44.7|44.7| |OJBench|Pass@1|27.1|24.0|11.3|15.3|19.6|19.5|19.5| |MultiPL-E|Pass@1|85.7|83.1|78.2|88.6|89.6|86.7|85.6| |SWE-bench Verified
^{(Agentless Coding)}|Single Patch w/o Test (Acc)|51.8|36.6|39.4|50.2|53.0|40.8|32.6| |SWE-bench Verified
^{(Agentic Coding)}|Single Attempt (Acc)|65.8|38.8|34.4|72.7^*|72.5^*|54.6|—| |Multiple Attempts (Acc)|71.6|—|—|80.2|79.4^*|—|—| |SWE-bench Multilingual
^{(Agentic Coding)}|Single Attempt (Acc)|47.3|25.8|20.9|51.0|—|31.5|—| |TerminalBench|Inhouse Framework (Acc)|30.0|—|—|35.5|43.2|8.3|—| |Terminus (Acc)|25.0|16.3|6.6|—|—|30.3|16.8| |Aider-Polyglot|Acc|60.0|55.1|61.8|56.4|70.7|52.4|44.0| |Tool Use Tasks| |Tau2 retail|Avg@4|70.6|69.1|57.0|75.0|81.8|74.8|64.3| |Tau2 airline|Avg@4|56.5|39.0|26.5|55.5|60.0|54.5|42.5| |Tau2 telecom|Avg@4|65.8|32.5|22.1|45.2|57.0|38.6|16.9| |AceBench|Acc|76.5|72.7|70.5|76.2|75.6|80.1|74.5| |Math & STEM Tasks| |AIME 2024|Avg@64|69.6|59.4^*|40.1^*|43.4|48.2|46.5|61.3| |AIME 2025|Avg@64|49.5|46.7|24.7^*|33.1^*|33.9^*|37.0|46.6| |MATH-500|Acc|97.4|94.0^*|91.2^*|94.0|94.4|92.4|95.4| |HMMT 2025|Avg@32|38.8|27.5|11.9|15.9|15.9|19.4|34.7| |CNMO 2024|Avg@16|74.3|74.7|48.6|60.4|57.6|56.6|75.0| |PolyMath-en|Avg@4|65.1|59.5|51.9|52.8|49.8|54.0|49.9| |ZebraLogic|Acc|89.0|84.0|37.7^*|73.7|59.3|58.5|57.9| |AutoLogi|Acc|89.5|88.9|83.3|89.8|86.1|88.2|84.1| |GPQA-Diamond|Avg@8|75.1|68.4^*|62.9^*|70.0^*|74.9^*|66.3|68.2| |SuperGPQA|Acc|57.2|53.7|50.2|55.7|56.5|50.8|49.6| |Humanity’s Last Exam
^{(Text Only)}|-|4.7|5.2|5.7|5.8|7.1|3.7|5.6| |General Tasks| |MMLU|EM|89.5|89.4|87.0|91.5|92.9|90.4|90.1| |MMLU-Redux|EM|92.7|90.5|89.2|93.6|94.2|92.4|90.6| |MMLU-Pro|EM|81.1|81.2^*|77.3|83.7|86.6|81.8|79.4| |IFEval|Prompt Strict|89.8|81.1|83.2^*|87.6|87.4|88.0|84.3| |Multi-Challenge|Acc|54.1|31.4|34.0|46.8|49.0|36.4|39.5| |SimpleQA|Correct|31.0|27.7|13.2|15.9|22.8|42.3|23.3| |Livebench|Pass@1|76.4|72.4|67.6|74.8|74.6|69.8|67.8|

Kimi‑K2 対応エンジンと最小ハードウェア要件

対応エンジン

vLLM
SGLang
TensorRT-LLM
KTransformers

最小ハードウェア

ハードウェア	最小要件
GPU タイプ	H200
クラスタサイズ	16 GPU（最小）
並列モード	テンソル並列 (TP-16) またはデータ並列 + エキスパート並列
重み形式	FP8 重み、128k seqlen

vLLM および SGLang のデプロイ例は、モデルデプロイガイドに記載されています。

Novita AI で Kimi‑K2‑Instruct にアクセスする方法

Novita AI での Kimi‑K2‑Instruct の利用は、迅速、シンプル、そして手頃な価格です。

プレイグラウンドを使用（コーディング不要）

インスタントアクセス：サインアップすれば、すぐに Kimi‑K2‑Instruct や他のトップモデルを試せます。

インタラクティブ UI：直感的なインターフェースでモデルを体験。

モデル比較：Kimi‑K2‑Instruct と他のトップモデルを簡単に切り替え、ニーズに最適なモデルを見つけられます。

今すぐ Kimi‑K2‑Instruct デモを試す

API 経由で統合（開発者向け）

Novita AI の統合 REST API を使用して、Kimi‑K2‑Instruct をアプリケーション、ワークフロー、チャットボットにシームレスに接続 — モデルの重みやインフラを管理する必要はありません。

オプション 1: 直接 API 統合（Python 例）

開始するには、以下のコードスニペットを使用してください：

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "moonshotai/kimi-k2-instruct"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

主な特徴:

統合エンドポイント：/v3/openai は OpenAI の Chat Completions API 形式をサポート。
柔軟な制御：temperature、top-p、ペナルティなどを調整して、カスタマイズされた結果を得られます。
ストリーミングとバッチ処理：好みの応答モードを選択可能。

オプション 2: OpenAI Agents SDK によるマルチエージェントワークフロー

Novita AI を OpenAI Agents SDK と統合して、高度なマルチモーダルエージェントシステムを構築：

プラグアンドプレイ：任意の OpenAI Agents ワークフローで Kimi‑K2‑Instruct を使用。

ハンドオフ、ルーティング、ツール使用をサポート：視覚コンテンツを分析したり、タスクを委任したり、関数を実行できるエージェントを設計。

Python 統合：SDK を Novita のエンドポイント（https://api.novita.ai/v3/openai）に向け、API キーを使用するだけでシームレスなエージェントワークフローを実現。

オプション 3: サードパーティプラットフォームでの Kimi‑K2‑Instruct API 接続

Hugging Face：Novita AI エンドポイントを介して、Spaces、パイプライン、または Transformers ライブラリで Kimi‑K2‑Instruct を使用。

エージェント＆オーケストレーションフレームワーク：公式コネクタとステップバイステップの統合ガイドを通じて、Continue、AnythingLLM、LangChain、Dify、Langflow などのパートナープラットフォームと Novita AI を簡単に接続。

OpenAI 互換 API：Cline、Trae、Cursor など OpenAI API 標準向けに設計されたツールとの、手間のかからない移行と統合を実現。

結論

Kimi‑K2‑Instruct は、強力でオープンアクセスな 1T パラメータ MoE モデルであり、コーディング、推論、エージェント AI の最前線を押し広げています。

Novita AI で利用可能になり、大規模、ツール使用のインテリジェンス、長文コンテキスト処理を融合 — すべて効率的な推論インフラでデプロイ可能です。次世代の AI アシスタント、エージェント、推論エンジンを構築する開発者や研究者にとって、Kimi‑K2‑Instruct は強力で柔軟、かつ本番環境に対応した最先端の基盤を提供します。

Novita AI で Kimi‑K2‑Instruct デモをお試しください！

Novita AI は、開発者がシンプルな API を使用して AI モデルを簡単にデプロイし、手頃で信頼性の高い GPU クラウドを構築およびスケールするための AI クラウドプラットフォームです。

Kimi‑K2‑InstructがNovita AIで利用可能になりました

Kimi K2 とは？