Kimi-K2-Instructが利用可能になりました Novita AI

キミK2

Moonshot AIが開発したKimi-K2-Instructは、次世代のスパースMoEモデルであり、現在、 Novita AI合計 1 兆個のパラメータ、32 億個のアクティブ化パラメータ、および 128,000 トークンのコンテキスト ウィンドウを備え、エージェントの動作、ツールの使用、および長期コンテキストの推論に合わせて調整されています。

現在の価格はこちら キミ-K2-インストラクト on Novita AI: 0.57ドル/M入力トークン、2.3ドル/M出力トークン

Kimi K2とは何ですか?

Moonshot AI(北京拠点、2023年設立)は、K1.5、K2、マルチモーダルKimi-VLモデルを含むKimiブランドを展開しています。同社のオープンサイエンスミッションは、強力なエージェント型知能の民主化を目指しています。

Moonshot AIが開発したKimi K2は、32億個の活性化パラメータと合計1兆個のパラメータを備えた最先端の専門家混合(MoE)言語モデルです。Muonオプティマイザーを用いて学習されたKimi K2は、最先端の知識、推論、コーディングタスクにおいて卓越したパフォーマンスを発揮するとともに、高度なエージェント機能向けに微調整されています。

他社とのちがい

  • 大規模トレーニング: トレーニングの不安定性がゼロの 1T トークンで 15.5T パラメータの MoE モデルを事前トレーニングしました。
  • MuonClip Optimizer: Muon Optimizer を前例のない規模に適用し、スケールアップしながら不安定性を解決するための新しい最適化手法を開発します。
  • エージェントインテリジェンス: ツールの使用、推論、自律的な問題解決のために特別に設計されています。

モデルバリアント

  • キミK2ベース: 基礎モデルは、微調整とカスタム ソリューションを完全に制御したい研究者やビルダーにとって強力なスタートとなります。
  • キミ-K2-インストラクト: ドロップイン型の汎用チャットやエージェント体験に最適な、事後学習済みモデルです。長時間の思考を必要としない反射レベルのモデルです。
キミK2ベンチマーク

指導モデル評価結果

ベンチマークメトリックキミK2インストラクトディープシーク-V3-0324クウェン3-235B-A22B
(無思考)
クロード・ソネット 4
(じっくり考えずに)
クロード・オーパス4
(じっくり考えずに)
GPT-4.1ジェミニ 2.5 フラッシュ
プレビュー(05-20)
コーディングタスク
ライブコードベンチ v6
(24月25日~XNUMX月XNUMX日)
パス@153.746.937.048.547.444.744.7
OJBenchパス@127.124.011.315.319.619.519.5
複数パス@185.783.178.288.689.686.785.6
SWEベンチ検証済み
(エージェントレスコーディング)
単一パッチ(テストなし)(Acc)51.836.639.450.253.040.832.6
SWEベンチ検証済み
(エージェントコーディング)
単一試行(Acc)65.838.834.472.7*72.5*54.6 -
複数回の試行(Acc)71.6 - - 80.279.4* - -
SWEベンチ多言語
(エージェントコーディング)
単一試行(Acc)47.325.820.951.0 - 31.5 -
ターミナルベンチ社内フレームワーク(Acc)30.0 - - 35.543.28.3 -
ターミナス(Acc)25.016.36.6 - - 30.316.8
エイダー・ポリグロットACC60.055.161.856.470.752.444.0
ツール使用タスク
Tau2小売平均@470.669.157.075.081.874.864.3
タウ2航空平均@456.539.026.555.560.054.542.5
Tau2テレコム平均@465.832.522.145.257.038.616.9
エースベンチACC76.572.770.576.275.680.174.5
数学とSTEMの課題
エム2024平均@6469.659.4*40.1*43.448.246.561.3
エム2025平均@6449.546.724.7*33.1*33.9*37.046.6
数学500ACC97.494.0*91.2*94.094.492.495.4
HMMT 2025平均@3238.827.511.915.915.919.434.7
CNMO 2024平均@1674.374.748.660.457.656.675.0
PolyMath-en平均@465.159.551.952.849.854.049.9
ゼブラロジックACC89.084.037.7*73.759.358.557.9
オートロジACC89.588.983.389.886.188.284.1
GPQA ダイヤモンド平均@875.168.4*62.9*70.0*74.9*66.368.2
スーパーGPQAACC57.253.750.255.756.550.849.6
人類最後の試験
(テキストのみ)
4.75.25.75.87.13.75.6
一般的なタスク
MMLUEM89.589.487.091.592.990.490.1
MMLU-ReduxEM92.790.589.293.694.292.490.6
MMLUプロEM81.181.2*77.383.786.681.879.4
IFEvalプロンプト厳格89.881.183.2*87.687.488.084.3
マルチチャレンジACC54.131.434.046.849.036.439.5
シンプルQA正解31.027.713.215.922.842.323.3
ライブベンチパス@176.472.467.674.874.669.867.8

Kimi-K2 対応エンジンと最小ハードウェア

サポートされているエンジン

  • vLLM
  • SGLang
  • TensorRT-LLM
  • Kトランスフォーマー

最小ハードウェア

Hardware最小要件
GPU タイプH200
クラスターサイズ16 GPUs(最小)
並列処理モードテンソル並列処理(TP-16)またはデータ並列処理+エキスパート並列処理
重みの形式8kシーケンスのFP128重み
vの展開例LLM SGLangは モデル展開ガイド.

Kimi-K2-Instructへのアクセス方法 Novita AI

Kimi-K2-Instructは、早く、簡単に、そして手頃な価格で始められます。 Novita AI.

プレイグラウンドを使用する(コーディングは不要)

インスタントアクセス: サインアップして、Kimi‑K2‑Instruct やその他のトップ モデルをすぐに試してみましょう。

インタラクティブUI: 直感的なインターフェースを通じてモデルを体験してください。

モデルの比較: Kimi-K2-Instruct とその他のトップモデルを簡単に切り替えて、ニーズに最適なモデルを見つけてください。

API経由で統合する(開発者向け)

Kimi-K2-Instructをアプリケーション、ワークフロー、チャットボットにシームレスに接続します。 Novita AIの統合 REST API により、モデルの重みやインフラストラクチャを管理する必要がなくなります。

オプション 1: 直接 API 統合 (Python の例)

開始するには、以下のコード スニペットを使用するだけです。

openai からインポート OpenAI クライアント = OpenAI( base_url="https://api.novita.ai/v3/openai", api_key="", ) model = "moonshotai/kimi-k2-instruct" stream = True # または False max_tokens = 65536 system_content = ""役に立つアシスタントになりましょう"" temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create( model=model, messages=[ { "role": "system", "content": system_content, }, { "role": "user", "content": "こんにちは!", } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=周波数ペナルティ、response_format=レスポンスフォーマット、extra_body={ "top_k": top_k、 "repetition_penalty": repetition_penalty、 "min_p": min_p } ) ストリームの場合: for chunk in chat_completion_res: print(chunk.choices[0].delta.content or "", end="") else: print(chat_completion_res.choices[0].message.content)
  
  
  
  

主な特長:

  • 統合エンドポイント:/v3/openai OpenAI の Chat Completions API 形式をサポートします。
  • 柔軟なコントロール: 温度、トップポイント、ペナルティなどを調整して、カスタマイズされた結果を得ることができます。
  • ストリーミングとバッチ処理: 希望する応答モードを選択してください。

オプション2: OpenAI Agents SDKを使用したマルチエージェントワークフロー

統合することで高度なマルチモーダルエージェントシステムを構築します Novita AI OpenAI エージェント SDK:

プラグ&プレイ: あらゆる OpenAI Agents ワークフローで Kimi‑K2‑Instruct を使用します。

ハンドオフ、ルーティング、ツールの使用をサポート: 視覚的なコンテンツを分析したり、タスクを委任したり、機能を実行したりできるエージェントを設計します。

Python統合: SDKをNovitaのエンドポイントにポイントするだけです(https://api.novita.ai/v3/openai) にアクセスし、API キーを使用してエージェントのワークフローをシームレスに実行します。

オプション3: サードパーティプラットフォームでKimi-K2-Instruct APIを接続する

ハグ顔: Kimi-K2-InstructをSpaces、パイプライン、またはTransformersライブラリで使用するには、 Novita AI エンドポイント

エージェントとオーケストレーション フレームワーク: 簡単に接続 Novita AI パートナープラットフォーム 続ける, 何もLLM, ラングチェーン, ディファイ の三脚と ラングフロー 公式コネクタとステップバイステップの統合ガイドを通じて。

OpenAI互換API: 次のようなツールで手間のかからない移行と統合をお楽しみください。 クライン 、トレイ、 カーソルOpenAI API 標準向けに設計されています。

結論

Kimi-K2-Instruct は、コーディング、推論、エージェント AI の限界を押し広げる、強力でオープン アクセスの 1T パラメータ MoE モデルです。

今すぐ利用可能 Novita AIKimi-K2-Instructは、大規模なスケール、ツール利用インテリジェンス、そしてロングコンテキスト処理を融合し、効率的な推論インフラストラクチャと組み合わせることで、すべて展開可能です。次世代のAIアシスタント、エージェント、推論エンジンを構築する開発者や研究者にとって、Kimi-KXNUMX-Instructは、強力で柔軟性が高く、実稼働環境にも対応できる最先端の基盤を提供します。

試します Kimi-K2-Instruct デモ on Novita AI !

Novita AI は、開発者がシンプルなAPIを使用してAIモデルを簡単に導入できるAIクラウドプラットフォームであり、手頃な価格で信頼性の高い GPU 構築と拡張のためのクラウド。


Novitaの詳細を見る

最新の投稿をメールで受け取るには購読してください。

コメント

上へスクロール

Novitaの詳細を見る

今すぐ購読して読み続け、完全なアーカイブにアクセスしてください。

続きを読む