Ling-2.6-1T on Novita AI:無料API、SWE-Bench SOTA、1Tパラメータモデル

Ling-2.6-1T on Novita AI:無料API、SWE-Bench SOTA、1Tパラメータモデル

最も高性能なオープンソースモデルでは、生の知能かトークン効率かの選択を迫られます。思考モデルはリクエストごとに3~5倍のトークンを消費します。小規模な非推論モデルはコストを抑えられますが、能力に限界があります。Ling-2.6-1Tは、このトレードオフを打破するために作られました。

Ling-2.6-1Tは、Ant Group(inclusionAI)による兆パラメータ規模の包括的フラッグシップモデルであり、即時のタスク実行を目的に設計されています。MLA + Hybrid Linear Attention アーキテクチャを採用し、優れた知能対トークン比を実現。強力なベンチマーク性能と最小限の出力トークンオーバーヘッドを両立しています。AIME26では、他の非思考モデルを大幅に上回る性能を示します。エージェント実行ベンチマーク(SWE-bench Verified、BFCLv4、TAU2-Bench、Claw-Eval)では、オープンソースSOTAを達成。現在、Novita AIが唯一の推論プロバイダーとしてバックアップしています。

要するに、Ling-2.6-1Tはエージェントワークロード(複雑な推論、ツール使用、マルチステップ実行、長文脈指示追従)に対して包括的な最先端能力を、思考モデルのトークンコストの数分の一で提供します。

Novita AIがバックアップするLing-2.6-1Tを試す

Ling-2.6-1Tとは?

Ling-2.6-1Tは、Ant Group(AntLingAGI)のAI研究部門であるinclusionAIが開発した最新のフラッグシップモデルです。1兆パラメータのMixture-of-Expertsモデルであり、これまでにリリースされた中で最大のFP8トレーニング済み基盤モデルです。20兆以上の高品質トークンでトレーニングされ、後期段階では40%以上が推論密度の高いデータで構成されています。

思考モデル(DeepSeek-R1、QwQ)が回答前に長い推論連鎖を出力するのに対し、Ling-2.6-1Tは「高速思考」メカニズムを採用。推論を内部化し、冗長な思考連鎖を外部化しません。これによりトークン出力を抑えつつ、強力な分析深度を維持します。トークンごとに約500億パラメータが活性化し、1兆規模でも実用的な推論を実現します。

  • アーキテクチャ: MLA + Hybrid Linear Attention、総パラメータ1兆、トークンあたり約500億のアクティブパラメータ
  • コンテキストウィンドウ: 262,144トークン(YaRNロープスケーリング)、最大出力32,768トークン
  • トレーニング: FP8混合精度、20兆以上のトークン、40%以上の推論密度データ
  • パラダイム: 高速思考:推論内部化、冗長な思考連鎖の出力なし
  • ライセンス: MIT — 完全オープンウェイト
  • 提供: Novita AIが独占バックアップ(OpenRouterプロバイダー)

主な特長:Ling-2.6-1Tが際立つ理由

優れた知能対トークン比

思考モデルは印象的な結果を出しますが、トークン料金が膨れ上がります — 実際の回答の前に何百もの推論トークンを消費します。Ling-2.6-1Tは、中間トレーニングでEvo-CoT(進化的思考連鎖)を採用し、推論を外部化するのではなく内部化しています。その結果、AIME26(他の非思考モデルを上回る)、LiveCodeBench、Omni-MATHで優れたベンチマークスコアを獲得 — 思考プロセスにコストを払う必要はありません。公式モデルカードによれば、知能出力効率はGPT-5.4(非推論)と同等であり、前世代のLing-1Tからの大きな飛躍を表しています。高スループットのプロダクションワークロードでは、コスト削減に直接つながります。

エージェント実行におけるオープンソースSOTA

エージェントワークロードには、単独の数学やコーディングだけでなく、ツール使用、マルチステップ実行、実環境での信頼性の高い指示追従が必要です。Ling-2.6-1Tは、主要なエージェントベンチマーク(inclusionAIモデルカードより)でオープンソースSOTAを達成しています。

  • SWE-bench Verified — 実世界のソフトウェアエンジニアリングタスク解決
  • BFCLv4 — バークレー関数呼び出しリーダーボードv4、複雑なツール使用
  • TAU2-Bench — 長期的なエージェントタスク完了
  • Claw-Eval — マルチターンコマンド実行
  • PinchBench — 複合エージェント能力評価

LiveCodeBench(2024年8月~2025年5月)では61.68をスコアリング — DeepSeek-V3.1(48.02)、Kimi-K2-0905(48.95)、GPT-5-main(48.57)を13ポイント以上上回っています。フロントエンド生成では、ArtifactsBenchスコアは59.31 — この比較グループ(inclusionAIモデルカードより)ではGemini-2.5-Pro(lowthink)の60.28に次いで2位です。

長文脈+指示追従

262,144トークンのコンテキスト(YaRNロープスケーリング)により、Ling-2.6-1Tはコードベース全体、長文書、長時間のマルチターンエージェント会話を1回の呼び出しで処理できます。MRCRベンチマーク(16K~256Kコンテキスト範囲)では、一貫して検索精度を維持 — 長いツール出力や文書コーパスを処理するエージェントパイプラインにとって重要な要件です。IFBenchスコアは56.9%で、拡張コンテキスト下での複雑な指示追従能力の高さを示しています。

ベンチマークパフォーマンス

Artificial Analysis による独立測定では、Ling-2.6-1Tのインテリジェンスインデックスは33.6 — 測定された495モデルの73%を上回り、オープンウェイト大規模非推論クラスで第2位です。以下は、inclusionAIモデルカードから報告されたスコア(DeepSeek-V3.1-terminus、Kimi-K2-0905、GPT-5-main、Gemini-2.5-Pro(lowthink)との比較)と、AAによる独立検証スコアです。

数学・推論(inclusionAIモデルカードより)

ベンチマーク Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
AIME26 70.42 55.21 50.16 59.43 70.10
Omni-MATH 74.46 64.77 62.42 61.09 72.02
OptMATH 57.68 35.99 35.84 39.16 42.77
FinanceReasoning 87.45 86.44 84.83 86.28 86.65
BBEH 47.34 42.86 34.83 39.75 29.08
KOR-Bench 76.00 73.76 73.20 70.56 59.68
ARC-AGI-1 43.81 14.69 22.19 14.06 18.94

*Gemini-2.5-Pro(lowthink)。出典:inclusionAIモデルカード。最終確認:2026-04-24。

コード性能(inclusionAIモデルカードより)

ベンチマーク Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
LiveCodeBench 61.68 48.02 48.95 48.57 45.43
MultiPL-E 77.91 77.68 73.54 76.66 71.48
CodeForces Rating 1901 1582 1574 1120 1675
FullStack Bench 56.55 55.48 54.00 50.92 48.19
ArtifactsBench 59.31 43.29 44.87 41.04 60.28
Aider Code Editing 83.65 88.16 85.34 84.40 89.85

*Gemini-2.5-Pro(lowthink)。出典:inclusionAIモデルカード。最終確認:2026-04-24。注:モデルバージョン名(例:「gpt-5-main」「DeepSeek-V3.1-terminus」)はinclusionAIの報告に基づき、公開リリース版と対応しない場合があります。

エージェント実行ベンチマーク(inclusionAIモデルカードより)

Ling-2.6-1Tは、エージェント固有の評価全体でオープンソースSOTAを達成しています。競合の正確なスコアはすべてのベンチマークで公開されているわけではありません。結果は公式モデルカードの報告に基づいています。

ベンチマーク 測定内容 Ling-2.6-1T
SWE-bench Verified 実世界のGitHub Issue解決 オープンソースSOTA
BFCLv4 複雑なマルチステップ関数/ツール呼び出し オープンソースSOTA
TAU2-Bench 長期的エージェントタスク完了 オープンソースSOTA
Claw-Eval マルチターンコマンド実行 オープンソースSOTA
PinchBench 複合エージェント能力 オープンソースSOTA
IFBench 複雑な指示追従 56.9%

出典:inclusionAIモデルカード。「オープンソースSOTA」はinclusionAIによる主張。各スコアの独立データは未入手。最終確認:2026-04-24。

独立ベンチマーク(Artificial Analysis)

指標 Ling-2.6-1T 備考
AAインテリジェンスインデックス 33.6 495モデルの73%を上回る
AAコーディングインデックス 33.0 モデルの78%を上回る
AAエージェンティックインデックス 48.2 モデルの80%を上回る
GPQA Diamond 75.2% 大学院レベルの科学的推論
τ²-Bench Telecom 89.8% 会話型エージェントタスク
IFBench 56.9% 指示追従
出力速度 67.7 tok/s Novita AI経由(OpenRouter上)

出典:Artificial Analysis。最終確認:2026-04-24。

Novita AIがバックアップするLing-2.6-1Tの使い方

オプション1:プレイグラウンド(コード不要)

novita.ai/models/model-detail/inclusionai-ling-2.6-1t で即座にモデルを試せます。セットアップ不要。アプリに統合する前にプロンプトを素早くテストするのに便利です。

オプション2:API(Python)

Ling-2.6-1Tは完全にOpenAI互換です。Novita APIキーとモデルIDを差し替えるだけです。

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="YOUR_NOVITA_API_KEY",
)

response = client.chat.completions.create(
    model="inclusionai/ling-2.6-1t",
    messages=[{"role": "user", "content": "Your prompt here"}],
    temperature=0.7,
    top_p=0.95,
)

print(response.choices[0].message.content)

APIキーは novita.ai/settings で取得できます。このモデルはストリーミング、tool_useによる関数呼び出し、構造化出力もサポートしています。

オプション3:サードパーティツール

Novita AIはOpenAI互換であるため、カスタムベースURLを受け入れる任意のツール — CursorClaude CodeOpenWebUILangChainLlamaIndex など — でLing-2.6-1Tを使用できます。ベースURLを https://api.novita.ai/v3/openai に設定し、モデルを inclusionai/ling-2.6-1t に設定してください。

ユースケース

Ling-2.6-1Tは、1兆パラメータのキャパシティ、高速思考パラダイム、262Kコンテキストを組み合わせ、以下に最適です。

  • コーディングエージェント: CodeForcesレーティング1901、LiveCodeBenchの高いスコアにより、競技レベルのプログラミングタスクを処理。NovitaのAgent Sandboxと組み合わせれば、インフラ管理なしで完全に分離されたコード実行が可能です。
  • 金融分析: FinanceReasoningで87.45(inclusionAIモデルカードの比較グループで第1位)。自動レポート分析、決算サマリー、定量調査ワークフローに適しています。
  • フロントエンド生成: トレーニングにおけるハイブリッド構文・機能・美観報酬は、UIコード品質を特にターゲットにしています。ArtifactsBenchスコア59.31は比較グループで2番目に高く、Gemini-2.5-Pro(lowthink)との差はわずか0.97ポイントです。
  • 長文書処理: 262,144トークンのコンテキストは、数百ページの文書、リポジトリ全体の分析、長期の法務・研究コーパスを1回の呼び出しで処理します。
  • 高ボリュームプロダクションAPI: 非推論パラダイムにより、トークン数が予測可能でレイテンシ変動が少ない — 1日あたり数千リクエストを実行する場合に重要です。

DeepSeek V3 や Kimi K2 からの移行?

現在、DeepSeek V3 や Kimi K2 を別のプロバイダー経由で使用している場合、Novita AIがバックアップする Ling-2.6-1T への切り替えは1行の変更で完了します — 同じOpenAI互換API、同じリクエスト形式。モデルIDは inclusionai/ling-2.6-1t になります。

コーディングタスクでは、Ling-2.6-1TはDeepSeek-V3.1とKimi-K2-0905の両方をLiveCodeBench(61.68 vs 48.02および48.95)で上回り、数学推論ではAIME26とOptMATHの両方でリードしています。ワークロードが推論重視だが思考連鎖の冗長性を避けたい場合、思考モデルに切り替えるよりも、こちらの方がクリーンなアップグレードパスです。

料金

モデル 入力($ / 100万トークン) 出力($ / 100万トークン) コンテキスト
Ling-2.6-1T(Novita AI) $0.30 $2.50 262,144
DeepSeek V3.2 $0.28 $0.42 128K
Qwen3-235B-A22B $0.455 $1.82 131K
Kimi K2(OpenRouter) $0.57 $2.30 131K

Novita AIの料金は novita.ai より。競合の料金は OpenRouter より。最終確認:2026-04-24。

Ling-2.6-1Tの出力価格($2.50 / 100万トークン)はDeepSeek V3.2より高い — トレードオフとして、推論とコーディングタスクで実質的に強力なベンチマーク性能を提供します。1コールあたりのトークンコストが主な制約であれば、Ling-2.6-flash(パラメータ104B、アクティブ7.4B)はより安価な兄弟モデルであり、こちらもNovita AIからのみ提供されています。

無料枠: Ling-2.6-1Tは、OpenRouter上の inclusionai/ling-2.6-1t:free エンドポイントを介して無料で利用可能。これはNovita AIが独占提供しています。この無料期間は期間限定です。現在の提供状況は openrouter.ai/inclusionai/ling-2.6-1t:free で確認してください。

結論

結論: Ling-2.6-1Tは現在、競争力のある数学・コーディングベンチマークにおいて最も強力なオープンウェイト非推論モデルであり、思考連鎖の冗長性にコストを払わずに262Kコンテキストが必要な場合の最強のオープンソース選択肢です。トークンあたりの料金は最も安いわけではありませんが、複雑な推論タスクで思考モデルが料金を膨らませる場合、今日利用できる最も実用的な最先端オープンソース代替手段です。

Novita AIが独占バックアップ — OpenRouter上でLing-2.6-1TとLing-2.6-flashの両方を提供する唯一のプロバイダーです。安定した推論エンドポイント、99.9%のアップタイム、OpenAI互換APIを、最低32 GPUのデプロイを自分で管理することなく利用できます。

Ling-2.6-1Tを始める

FAQ

Ling-2.6-1Tとは何ですか?

Ling-2.6-1Tは、Ant Group(inclusionAI)が開発した1兆パラメータのMixture-of-Experts言語モデルです。トークンあたり約500億パラメータを活性化し、262,144トークンのコンテキストウィンドウをサポートします。高速思考型の非推論モデルとして設計されており、思考連鎖のオーバーヘッドなしで強力なベンチマーク性能を発揮します。MITライセンス、完全オープンウェイト。

APIを介してLing-2.6-1Tにアクセスするには?

OpenAI互換クライアントで base_url="https://api.novita.ai/v3/openai" および model="inclusionai/ling-2.6-1t" を設定してください。APIキーは novita.ai/settings で取得できます。OpenRouterからも同じモデルIDでアクセス可能です。

Ling-2.6-1TはDeepSeek V3と比較してどうですか?

自己報告ベンチマーク(inclusionAIモデルカード)では、Ling-2.6-1TはDeepSeek-V3.1をAIME26(70.42 vs 55.21)、LiveCodeBench(61.68 vs 48.02)、ARC-AGI-1(43.81 vs 14.69)で上回っています。DeepSeek V3.2はArtificial Analysis Intelligence Indexでより高いスコア(42 vs 34)を記録していますが、Ling-2.6-1Tはより大きなコンテキストウィンドウ(262K vs 128K)を同程度の価格(入力$0.30/M)で提供します。

Ling-2.6-1Tのコンテキストウィンドウは?

262,144トークン(ネイティブ128KからYaRNロープスケーリングで拡張)。最大出力長は32,768トークンです。

Ling-2.6-1Tは無料で使用できますか?

はい、一時的に。OpenRouter上の inclusionai/ling-2.6-1t:free エンドポイントはNovita AIが独占提供しています。無料期間は期間限定です。Novita AI経由の有料層は、入力$0.30/M、出力$2.50/Mトークンです。

おすすめ記事