Novita AI를 통해 Claude Code에서 DeepSeek V4 Flash 사용하는 방법
Novita AI를 통해 Claude Code에서 DeepSeek V4 Flash를 설정하세요. 환경 변수 설정, Anthropic 호환 엔드포인트 사용, Claude Sonnet 대비 비용 절감.
Novita AI를 통해 Claude Code에서 DeepSeek V4 Flash를 설정하세요. 환경 변수 설정, Anthropic 호환 엔드포인트 사용, Claude Sonnet 대비 비용 절감.
GLM 5.2는 이제 Novita AI에서 1M 컨텍스트, 128K 최대 출력, 함수 호출, 구조화된 출력, 서버리스 API 액세스를 지원합니다.
Kimi K2.7 Code가 Novita AI에서 공식 출시되었습니다. OpenAI 호환 채팅 API 액세스, 256K 컨텍스트, 도구 호출, 멀티모달 입력을 지원합니다.
Nemotron 3 Nano 30B A3B는 Novita AI에서 Serverless LLM으로 제공되며, OpenAI 호환 채팅 완료, 256K 컨텍스트, 사용량 기반 토큰 가격 책정을 지원합니다.
CoBuddy가 코드 생성, 코딩 어시스턴트 및 AI 에이전트 워크플로우를 위한 코딩 중심 LLM API로 Novita AI에서 제공됩니다.
코딩, 에이전틱 워크플로우, 1M-토큰 컨텍스트, 멀티모달 입력을 위한 Novita AI의 MiniMax M3를 OpenAI 호환 API로 활용하세요.
Qwen3.7-Max가 Novita AI에서 에이전틱 코딩 및 장기 컨텍스트 워크플로우를 위해 제공됩니다. API 액세스, 가격, 제한 사항 및 사용 사례를 확인하세요.
PegaFlow 외부 KV 캐시는 vLLM 서빙 팀이 재시작, 인스턴스, RDMA 노드 간에 KV 캐시를 보존하고 공유할 수 있도록 돕습니다.
DeepSeek-V4-Pro는 1.6T 매개변수의 오픈소스 MoE 모델로, LiveCodeBench 점수(93.5)와 1M 토큰 컨텍스트를 제공합니다. 지금 Novita AI에서 이용 가능합니다.
Ling-2.6-1T는 Ant Group의 트리리언 스케일 모델로, MLA + 하이브리드 선형 어텐션(표준 MoE가 아님)을 기반으로 구축되었습니다. 에이전트 벤치마크(SWE-bench, BFCLv4, TAU2
Gemma 4가 Novita AI에서 제공됩니다 — 4가지 모델 크기, 3가지 아키텍처, 전체 라인업에 비전 지원, E2B 및 E4B에 오디오 지원.
Novita AI에서 Kimi K2.5에 액세스하세요 - Moonshot AI의 대표 멀티모달 에이전트 모델, 256K 컨텍스트, 비전+텍스트, 사고 모드 및 에이전트 스웜 지원.
TTS 및 음성 에이전트에 대한 Speech 2.6의 장점을 알아보세요. 애플리케이션에서 생산성과 효율성을 어떻게 향상시키는지 확인하세요.
Novita AI에서 GLM-4.6V API를 이용하세요: 106B 파라미터 비전-언어 모델, 128K 컨텍스트, 네이티브 함수 호출, 최첨단 멀티모달 문서 이해.