DeepSeek-V3.1-Terminus는 기존 기능을 유지하면서 사용자가 보고한 주요 문제를 해결한 DeepSeek-V3.1의 업데이트 버전입니다. 이 모델은 언어 일관성이 개선되었으며 Code Agent 및 Search Agent 성능이 강화되었습니다.
MIT 라이선스로 배포되어 DeepSeek-V3와 동일한 모델 구조로 상업적 사용에 제한이 없습니다. Novita AI는 확장 가능한 플랫폼을 통해 이 강화된 모델에 접근할 수 있는 원활한 클라우드 배포를 제공합니다.
인프라 복잡성 없이 개선된 기능을 활용하려면 Novita AI에서 DeepSeek-V3.1-Terminus를 이용하세요.
현재 Novita AI 요금: 131072 컨텍스트, 입력 토큰 1M당 $0.27, 출력 토큰 1M당 $1
DeepSeek V3.1 Terminus 데모 체험하기
DeepSeek-V3.1-Terminus란 무엇인가요?
DeepSeek-V3.1-Terminus는 DeepSeek-V3.1의 기존 기능을 유지하면서 사용자가 보고한 특정 문제를 해결한 업데이트 모델입니다. DeepSeek-V3.1-Base 모델을 기반으로 구축되었으며, 실질적인 개선에 초점을 맞춘 정제된 버전입니다.
이 모델은 DeepSeek-V3와 동일한 구조를 사용하며 MIT 라이선스로 배포됩니다. 이를 통해 연구 및 상업적 애플리케이션 모두에 대한 개방적 접근이 보장됩니다.
주요 개선 사항
언어 일관성
이번 업데이트는 중국어-영어 혼용 텍스트 발생 빈도를 줄이고, 이전 버전에서 간혹 나타났던 비정상적인 문자를 제거했습니다.
에이전트 기능
DeepSeek-V3.1-Terminus는 다음을 위한 최적화된 성능을 제공합니다:
- Code Agent: 강화된 코딩 기능 및 성능
- Search Agent: 개선된 기능을 갖춘 업데이트된 템플릿 및 도구 세트
Search Agent 개선 사항은 제공된 assets/search_tool_trajectory.html 파일에서 확인할 수 있습니다.
성능 벤치마크
| 벤치마크 | DeepSeek-V3.1 | DeepSeek-V3.1-Terminus |
|---|---|---|
| 도구 사용 없이 추론 모드 | ||
| MMLU-Pro | 84.8 | 85.0 |
| GPQA-Diamond | 80.1 | 80.7 |
| 인류의 마지막 시험 | 15.9 | 21.7 |
| LiveCodeBench | 74.8 | 74.9 |
| Codeforces | 2091 | 2046 |
| Aider-Polyglot | 76.3 | 76.1 |
| 에이전트 도구 사용 | ||
| BrowseComp | 30.0 | 38.5 |
| BrowseComp-zh | 49.2 | 45.0 |
| SimpleQA | 93.4 | 96.8 |
| SWE Verified | 66.0 | 68.4 |
| SWE-bench Multilingual | 54.5 | 57.8 |
| Terminal-bench | 31.3 | 36.7 |
벤치마크 결과는 주요 분야에서 상당한 개선이 있었음을 보여줍니다. 특히 인류의 마지막 시험(36% 개선), BrowseComp(28% 개선), SimpleQA(3.6% 개선), Terminal-bench(17% 개선)가 주목할 만합니다.
Novita AI에서 DeepSeek-V3.1-Terminus 시작하기
Novita AI를 통해 DeepSeek-V3.1-Terminus에 접근하면 다양한 기술 수준과 사용 사례에 맞춘 여러 경로를 제공합니다. AI 기능을 탐색하는 비즈니스 사용자이든 프로덕션 애플리케이션을 구축하는 개발자이든, Novita AI는 필요한 도구를 제공합니다.
플레이그라운드 사용 (현재 이용 가능 – 코딩 불필요)
- 즉시 접근: 가입하기 후 몇 초 만에 DeepSeek-V3.1-Terminus 실험을 시작하세요.
- 대화형 인터페이스: 프롬프트를 테스트하고 출력을 실시간으로 시각화하세요.
- 모델 비교: 특정 사용 사례에 맞춰 DeepSeek-V3.1-Terminus를 다른 주요 모델과 비교하세요.
플레이그라운드를 사용하면 기술 설정 없이 다양한 프롬프트를 테스트하고 즉시 결과를 확인할 수 있습니다. 프로토타이핑, 아이디어 테스트, 전체 구현 전 모델 기능을 이해하는 데 이상적입니다.
API를 통한 통합 (라이브 이용 가능 – 개발자용)
Novita AI의 통합 REST API를 사용하여 애플리케이션에 DeepSeek-V3.1-Terminus를 연결하세요.
옵션 1: 직접 API 통합 (Python 예시)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="your_api_key_here",
)
model = "deepseek/deepseek-v3.1-terminus"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = {"type": "text"}
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
옵션 2: OpenAI Agents SDK를 활용한 멀티 에이전트 워크플로우
DeepSeek-V3.1-Terminus의 기능을 활용하여 정교한 멀티 에이전트 시스템을 구축하세요:
- 플러그 앤 플레이 통합: 모든 OpenAI Agents 워크플로우에서 DeepSeek-V3.1-Terminus를 사용하세요.
- 고급 에이전트 기능: 핸드오프, 라우팅, 도구 통합 지원
- 확장 가능한 아키텍처: DeepSeek-V3.1-Terminus의 기능을 활용하는 에이전트를 설계하세요.
타사 플랫폼과 연동
개발 도구: OpenAI 호환 API 및 Anthropic 호환 API를 통해 Cursor, Codex, Claude Code, Trae, Qwen Code, Cline 등 인기 IDE 및 개발 환경과 원활하게 통합할 수 있습니다.
오케스트레이션 프레임워크: 공식 커넥터를 사용하여 LangChain, Dify, CrewAI, Langflow 등 다른 AI 오케스트레이션 플랫폼과 연결할 수 있습니다.
Hugging Face 통합: Novita AI는 Hugging Face의 공식 추론 제공자로서 광범위한 생태계 호환성을 보장합니다.
결론
DeepSeek-V3.1-Terminus는 전작의 강력한 기반을 유지하면서 언어 일관성과 에이전트 기능에 대한 맞춤형 개선을 제공합니다. 강화된 Code Agent 및 Search Agent 성능, 향상된 언어 처리 기능을 결합하여 프로덕션 애플리케이션에 실용적인 선택지입니다.
Novita AI의 클라우드 플랫폼은 인프라 부담 없이 이러한 개선 사항에 쉽게 접근할 수 있도록 합니다. 오늘 Novita AI에서 DeepSeek-V3.1-Terminus에 접근하여 AI 애플리케이션에서 이러한 개선 사항을 활용하세요.
Novita AI는 간단한 API를 통해 AI 모델을 쉽게 배포할 수 있는 방법을 개발자에게 제공하는 동시에, 구축 및 확장을 위한 합리적인 가격의 신뢰할 수 있는 GPU 클라우드를 제공하는 AI 클라우드 플랫폼입니다.
