Novita AI의 Ling-2.6-1T: 무료 API, SWE-Bench SOTA, 1T 파라미터 모델

Novita AI의 Ling-2.6-1T: 무료 API, SWE-Bench SOTA, 1T 파라미터 모델

가장 뛰어난 오픈소스 모델들은 원시 지능과 토큰 효율성 중 하나를 선택하게 합니다. 추론(thinking) 모델은 요청당 3~5배 더 많은 토큰을 사용합니다. 더 작은 비추론(non-reasoning) 모델은 비용을 줄이지만 성능이 제한됩니다. Ling-2.6-1T는 이러한 트레이드오프를 깨기 위해 설계되었습니다.

Ling-2.6-1T는 Ant Group (inclusionAI)의 트리리언 스케일 종합 플래그십 모델로, 즉각적인 작업 실행을 위해 만들어졌습니다. MLA + 하이브리드 선형 어텐션 아키텍처를 기반으로 하여, 우수한 지능 대 토큰 비율을 달성합니다. 즉, 최소한의 출력 토큰 오버헤드로 강력한 벤치마크 성능을 제공합니다. AIME26에서 다른 비추론 모델들을 크게 능가합니다. 에이전트 실행 벤치마크인 SWE-bench Verified, BFCLv4, TAU2-Bench, Claw-Eval에서는 오픈소스 SOTA에 도달했습니다. 현재 Novita AI가 유일한 추론 제공자(inference provider)로 지원합니다.

요약하면: Ling-2.6-1T는 복잡한 추론, 도구 사용, 다단계 실행, 긴 컨텍스트 명령 수행 등 에이전트 작업에 필요한 최첨단 종합 능력을 추론 모델의 토큰 비용 일부만으로 제공합니다.

Novita AI가 지원하는 Ling-2.6-1T 사용해보기

Ling-2.6-1T란 무엇인가?

Ling-2.6-1T는 Ant Group (AntLingAGI)의 AI 연구 부서인 inclusionAI의 최신 플래그십 모델입니다. 지금까지 공개된 가장 큰 FP8 훈련 기반 모델인 1조 개 파라미터 Mixture-of-Experts 모델로, 20T+ 고품질 토큰으로 훈련되었으며 후반부에는 40% 이상의 추론 밀집 데이터가 포함되었습니다.

추론 모델(DeepSeek-R1, QwQ)이 답변 전에 긴 사고 과정(chain-of-thought)을 출력하는 것과 달리, Ling-2.6-1T는 “빠른 사고(fast thinking)” 메커니즘을 사용합니다. 즉, 추론을 내재화하여 장황한 사고 과정을 외부화하지 않습니다. 이를 통해 토큰 출력을 간결하게 유지하면서도 강력한 분석 깊이를 유지합니다. 토큰당 약 50B 파라미터가 활성화되어 1T 규모의 추론을 실용적으로 만듭니다.

  • 아키텍처: MLA + 하이브리드 선형 어텐션, 총 파라미터 1T, 토큰당 활성 파라미터 약 50B
  • 컨텍스트 윈도우: 262,144 토큰 (YaRN 로프 스케일링 적용), 최대 출력 32,768 토큰
  • 훈련: FP8 혼합 정밀도, 20T+ 토큰, 40% 이상 추론 밀집 데이터
  • 패러다임: 빠른 사고 — 내재화된 추론, 장황한 사고 과정 출력 없음
  • 라이선스: MIT — 완전 오픈 가중치
  • 사용 가능: Novita AI (OpenRouter 제공자)가 유일하게 지원

주요 특징: Ling-2.6-1T가 돋보이는 이유

우수한 지능 대 토큰 비율

추론 모델은 인상적인 결과를 내지만 토큰 비용을 증가시킵니다. 실제 답변 전에 수백 개의 추론 토큰을 생성합니다. Ling-2.6-1T는 중간 훈련 단계에서 Evolutionary Chain-of-Thought (Evo-CoT)를 사용하여 추론을 외부화하지 않고 내재화하도록 훈련되었습니다. 그 결과, AIME26 (다른 비추론 모델보다 우수), LiveCodeBench, Omni-MATH에서 사고 과정 비용 없이 강력한 벤치마크 점수를 얻었습니다. 공식 모델 카드에 따르면, GPT-5.4 (비추론)에 버금가는 지능-출력 효율을 달성하여 이전 모델인 Ling-1T 대비 큰 도약을 이루었습니다. 높은 처리량의 프로덕션 워크로드의 경우 비용을 직접 절감할 수 있습니다.

에이전트 실행에서 오픈소스 SOTA

에이전트 워크로드는 수학과 코딩만으로는 충분하지 않습니다. 도구 사용, 다단계 실행, 실제 조건에서의 안정적인 명령 수행이 필요합니다. Ling-2.6-1T는 주요 에이전트 벤치마크에서 오픈소스 SOTA에 도달했습니다(inclusionAI 모델 카드 기준):

  • SWE-bench Verified — 실제 소프트웨어 엔지니어링 작업 해결
  • BFCLv4 — 버클리 함수 호출 리더보드 v4, 복잡한 도구 사용
  • TAU2-Bench — 장기 에이전트 작업 완료
  • Claw-Eval — 다중 턴 명령 실행
  • PinchBench — 복합 에이전트 능력 평가

LiveCodeBench (2024년 8월–2025년 5월)에서 61.68점을 기록하여 DeepSeek-V3.1 (48.02), Kimi-K2-0905 (48.95), GPT-5-main (48.57)을 13점 이상 차이로 앞질렀습니다. 프론트엔드 생성의 경우 ArtifactsBench 점수는 59.31로, 이 비교 그룹에서 Gemini-2.5-Pro(lowthink)의 60.28에 이어 두 번째를 기록했습니다(inclusionAI 모델 카드 기준).

긴 컨텍스트 및 명령 수행

262,144 토큰 컨텍스트(YaRN 로프 스케일링)를 통해 Ling-2.6-1T는 단일 호출로 전체 코드베이스, 긴 문서, 또는 확장된 다중 턴 에이전트 대화를 처리할 수 있습니다. MRCR 벤치마크(16K–256K 컨텍스트 범위)에서 검색 정확도를 일관되게 유지하며, 이는 긴 도구 출력이나 문서 말뭉치를 처리하는 에이전트 파이프라인에 중요한 요구 사항입니다. IFBench 점수는 56.9%로, 긴 컨텍스트에서도 복잡한 명령 수행 능력이 뛰어남을 보여줍니다.

벤치마크 성능

Artificial Analysis의 독립 측정 결과, Ling-2.6-1T는 지능 지수(Intelligence Index) 33.6을 기록하여 측정된 495개 모델 중 73%보다 우수하고, 오픈 가중치 대형 비추론 클래스에서 2위를 차지했습니다. 아래는 inclusionAI 모델 카드의 자체 보고 점수(DeepSeek-V3.1-terminus, Kimi-K2-0905, GPT-5-main, Gemini-2.5-Pro(lowthink) 비교)와 이어지는 AA 독립 검증 점수입니다.

수학 및 추론 (inclusionAI 모델 카드 기준)

벤치마크 Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
AIME26 70.42 55.21 50.16 59.43 70.10
Omni-MATH 74.46 64.77 62.42 61.09 72.02
OptMATH 57.68 35.99 35.84 39.16 42.77
FinanceReasoning 87.45 86.44 84.83 86.28 86.65
BBEH 47.34 42.86 34.83 39.75 29.08
KOR-Bench 76.00 73.76 73.20 70.56 59.68
ARC-AGI-1 43.81 14.69 22.19 14.06 18.94

*Gemini-2.5-Pro(lowthink). 출처: inclusionAI 모델 카드. 최종 확인: 2026-04-24.

코드 성능 (inclusionAI 모델 카드 기준)

벤치마크 Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
LiveCodeBench 61.68 48.02 48.95 48.57 45.43
MultiPL-E 77.91 77.68 73.54 76.66 71.48
CodeForces Rating 1901 1582 1574 1120 1675
FullStack Bench 56.55 55.48 54.00 50.92 48.19
ArtifactsBench 59.31 43.29 44.87 41.04 60.28
Aider Code Editing 83.65 88.16 85.34 84.40 89.85

*Gemini-2.5-Pro(lowthink). 출처: inclusionAI 모델 카드. 최종 확인: 2026-04-24. 참고: 모델 버전 이름(예: “gpt-5-main”, “DeepSeek-V3.1-terminus”)은 inclusionAI가 보고한 대로이며 공개 릴리스 버전과 일치하지 않을 수 있습니다.

에이전트 실행 벤치마크 (inclusionAI 모델 카드 기준)

Ling-2.6-1T는 에이전트 특화 평가에서 오픈소스 SOTA에 도달합니다. 모든 벤치마크에 대해 경쟁사 점수가 공개된 것은 아닙니다. 결과는 공식 모델 카드에 보고된 대로 나열됩니다.

벤치마크 측정 내용 Ling-2.6-1T
SWE-bench Verified 실제 GitHub 이슈 해결 오픈소스 SOTA
BFCLv4 복잡한 다단계 함수/도구 호출 오픈소스 SOTA
TAU2-Bench 장기 에이전트 작업 완료 오픈소스 SOTA
Claw-Eval 다중 턴 명령 실행 오픈소스 SOTA
PinchBench 복합 에이전트 능력 오픈소스 SOTA
IFBench 복잡한 명령 수행 56.9%

출처: inclusionAI 모델 카드. "오픈소스 SOTA"는 inclusionAI의 주장이며, 개별 점수에 대한 독립적인 데이터는 아직 제공되지 않았습니다. 최종 확인: 2026-04-24.

독립 벤치마크 (Artificial Analysis)

메트릭 Ling-2.6-1T 비고
AA 지능 지수 33.6 495개 모델 중 73%보다 우수
AA 코딩 지수 33.0 모델의 78%보다 우수
AA 에이전트 지수 48.2 모델의 80%보다 우수
GPQA Diamond 75.2% 대학원 수준 과학 추론
τ²-Bench Telecom 89.8% 대화형 에이전트 작업
IFBench 56.9% 명령 수행
출력 속도 67.7 tok/s OpenRouter에서 Novita AI를 통해

출처: Artificial Analysis. 최종 확인: 2026-04-24.

Novita AI가 지원하는 Ling-2.6-1T 사용 방법

옵션 1: 플레이그라운드 (코드 불필요)

novita.ai/models/model-detail/inclusionai-ling-2.6-1t에서 즉시 모델을 체험할 수 있습니다. 설정이 필요 없습니다. 앱에 통합하기 전에 프롬프트를 빠르게 테스트하는 데 유용합니다.

옵션 2: API (Python)

Ling-2.6-1T는 완전 OpenAI 호환입니다. Novita API 키와 모델 ID를 입력하세요:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="YOUR_NOVITA_API_KEY",
)

response = client.chat.completions.create(
    model="inclusionai/ling-2.6-1t",
    messages=[{"role": "user", "content": "Your prompt here"}],
    temperature=0.7,
    top_p=0.95,
)

print(response.choices[0].message.content)

API 키는 novita.ai/settings에서 발급받으세요. 이 모델은 스트리밍, tool_use를 통한 함수 호출, 구조화된 출력도 지원합니다.

옵션 3: 타사 도구

Novita AI가 OpenAI 호환이므로 Ling-2.6-1T는 사용자 정의 base URL을 허용하는 모든 도구에서 작동합니다. Cursor, Claude Code, OpenWebUI, LangChain, LlamaIndex 등이 포함됩니다. base URL을 https://api.novita.ai/v3/openai로 설정하고 모델을 inclusionai/ling-2.6-1t로 설정하세요.

사용 사례

Ling-2.6-1T의 1T 파라미터 용량, 빠른 사고 패러다임, 262K 컨텍스트의 조합은 다음과 같은 경우에 적합합니다:

  • 코딩 에이전트: CodeForces 등급 1901과 강력한 LiveCodeBench 점수로 경쟁 수준의 프로그래밍 작업을 처리합니다. 인프라 관리 없이 완전히 격리된 코드 실행을 위해 Novita의 Agent Sandbox와 함께 사용하세요.
  • 금융 분석: FinanceReasoning에서 87.45점(비교 그룹 1위, inclusionAI 모델 카드 기준)으로 자동화된 보고서 분석, 실적 요약, 정량적 연구 워크플로에 적합합니다.
  • 프론트엔드 생성: 훈련의 하이브리드 구문-기능-미학 보상은 UI 코드 품질을 목표로 합니다. ArtifactsBench 점수 59.31은 비교 그룹에서 두 번째로 높으며, Gemini-2.5-Pro(lowthink)에 0.97점 차이로 뒤집니다.
  • 긴 문서 처리: 262,144 토큰 컨텍스트로 수백 페이지 문서, 전체 저장소 분석, 또는 긴 법률/연구 자료를 단일 호출로 처리합니다.
  • 대량 프로덕션 API: 비추론 패러다임은 예측 가능한 토큰 수와 낮은 지연 시간 변동성을 의미합니다. 이는 하루에 수천 건의 요청을 실행할 때 중요합니다.

DeepSeek V3 또는 Kimi K2에서 마이그레이션?

현재 다른 제공자를 통해 DeepSeek V3 또는 Kimi K2를 사용 중이라면, Novita AI가 지원하는 Ling-2.6-1T로의 전환은 한 줄 변경만으로 가능합니다. 동일한 OpenAI 호환 API, 동일한 요청 형식입니다. 모델 ID는 inclusionai/ling-2.6-1t가 됩니다.

코딩 작업에서 Ling-2.6-1T는 LiveCodeBench에서 DeepSeek-V3.1과 Kimi-K2-0905를 모두 능가하며(61.68 vs 48.02 및 48.95), 수학 추론에서도 AIME26과 OptMATH에서 둘 모두를 앞섭니다. 워크로드가 추론 위주이지만 사고 과정의 장황함을 원하지 않는다면, 추론 모델로 전환하는 것보다 이 경로가 더 깨끗한 업그레이드 경로입니다.

가격

모델 입력 ($/1M 토큰) 출력 ($/1M 토큰) 컨텍스트
Ling-2.6-1T (Novita AI) $0.30 $2.50 262,144
DeepSeek V3.2 $0.28 $0.42 128K
Qwen3-235B-A22B $0.455 $1.82 131K
Kimi K2 (OpenRouter) $0.57 $2.30 131K

Novita AI 가격은 novita.ai 기준입니다. 경쟁사 가격은 OpenRouter 기준입니다. 최종 확인: 2026-04-24.

Ling-2.6-1T의 출력 가격($2.50/M)은 DeepSeek V3.2보다 높지만, 추론 및 코딩 작업에서 의미 있게 더 강력한 벤치마크 성능을 제공합니다. 호출당 토큰 비용이 주요 제약 조건이라면 Ling-2.6-flash (104B 파라미터, 7.4B 활성)가 더 저렴한 형제 모델이며 역시 Novita AI를 통해서만 독점 제공됩니다.

무료 티어: Ling-2.6-1T는 OpenRouter의 inclusionai/ling-2.6-1t:free 엔드포인트를 통해 무료로 사용할 수 있으며, Novita AI가 독점 제공합니다. 이 무료 기간은 시간 제한이 있습니다. 현재 가용성은 openrouter.ai/inclusionai/ling-2.6-1t:free에서 확인하세요.

결론

요약: Ling-2.6-1T는 현재 경쟁력 있는 수학 및 코딩 벤치마크에서 가장 강력한 오픈 가중치 비추론 모델이며, 사고 과정의 장황함에 대한 비용을 지불하지 않고 262K 컨텍스트가 필요할 때 가장 강력한 오픈소스 옵션입니다. 토큰당 가장 저렴한 옵션은 아니지만, 추론 모델이 비용을 증가시킬 복잡한 추론 작업의 경우 현재 사용 가능한 가장 실용적인 최첨단 오픈소스 대안입니다.

Novita AI가 독점 지원합니다. OpenRouter에서 Ling-2.6-1T와 Ling-2.6-flash를 모두 제공하는 유일한 제공자입니다. 안정적인 추론 엔드포인트, 99.9% 가동 시간, OpenAI 호환 API를 제공하며 최소 32 GPU 배포를 직접 관리할 필요가 없습니다.

Ling-2.6-1T 시작하기

자주 묻는 질문

Ling-2.6-1T란 무엇입니까?

Ling-2.6-1T는 Ant Group (inclusionAI)이 개발한 1조 개 파라미터 Mixture-of-Experts 언어 모델입니다. 토큰당 약 50B 파라미터를 활성화하고 262,144 토큰 컨텍스트 윈도우를 지원하며, 빠른 사고, 비추론 모델로 설계되었습니다. 즉, 사고 과정 오버헤드 없이 강력한 벤치마크 성능을 제공합니다. MIT 라이선스로 완전 오픈 가중치입니다.

API를 통해 Ling-2.6-1T에 어떻게 접근하나요?

OpenAI 호환 클라이언트에서 base_url="https://api.novita.ai/v3/openai"model="inclusionai/ling-2.6-1t"를 설정하세요. API 키는 novita.ai/settings에서 발급받을 수 있습니다. 동일한 모델 ID로 OpenRouter를 통해서도 접근 가능합니다.

Ling-2.6-1T는 DeepSeek V3와 어떻게 비교되나요?

자체 보고 벤치마크(inclusionAI 모델 카드 기준)에서 Ling-2.6-1T는 AIME26(70.42 vs 55.21), LiveCodeBench(61.68 vs 48.02), ARC-AGI-1(43.81 vs 14.69)에서 DeepSeek-V3.1을 능가합니다. DeepSeek V3.2는 Artificial Analysis 지능 지수에서 더 높은 점수(42 vs 34)를 받았지만, Ling-2.6-1T는 유사한 가격($0.30/M 입력)에 더 큰 컨텍스트 윈도우(262K vs 128K)를 제공합니다.

Ling-2.6-1T의 컨텍스트 윈도우는 얼마인가요?

262,144 토큰입니다(128K 네이티브에서 YaRN 로프 스케일링을 통해 확장). 최대 출력 길이는 32,768 토큰입니다.

Ling-2.6-1T는 무료로 사용할 수 있나요?

네, 일시적으로 가능합니다. OpenRouter의 inclusionai/ling-2.6-1t:free 엔드포인트는 Novita AI가 독점 제공합니다. 무료 기간은 시간 제한이 있습니다. Novita AI를 통한 유료 티어는 입력 $0.30/M, 출력 $2.50/M 토큰입니다.

추천 문서