Kimi K2.7 Code는 Novita AI에서 모델 ID moonshotai/kimi-k2.7-code, OpenAI 호환 chat/completions 엔드포인트, 262,144 토큰 컨텍스트 윈도우, 그리고 텍스트, 이미지, 비디오 입력을 지원하며 사용할 수 있습니다. 이 빠른 시작 가이드는 개발자 설정을 다룹니다: 인증, 첫 번째 요청 전송, 비전 입력 사용, 함수 호출 추가, 그리고 빌드 전 가격 이해. 포지셔닝과 사용 사례에 대한 더 넓은 개요는 Kimi K2.7 Code on Novita AI 개요를 참조하세요.
Kimi K2.7 Code API 설정
세 가지 설정 항목으로 시작합니다:
| 항목 | 값 |
|---|---|
| API 키 | Novita AI API 키를 생성하여 NOVITA_API_KEY와 같은 환경 변수에 저장합니다. |
| OpenAI 호환 기본 URL | https://api.novita.ai/openai |
| 채팅 완성 엔드포인트 | POST https://api.novita.ai/openai/v1/chat/completions |
| 모델 ID | moonshotai/kimi-k2.7-code |
Novita AI 문서 인덱스에는 OpenAI 호환 기본 URL이 나열되어 있으며, 채팅 완성 API 참조에는 전체 요청 및 응답 필드가 문서화되어 있습니다.
API 키를 소스 코드 저장소에 포함하지 마세요. 로컬 개발을 위해 셸에서 내보내기 하세요:
export NOVITA_API_KEY="your_api_key"
애플리케이션이 이미 OpenAI SDK를 사용하고 있다면 변경 사항은 최소화됩니다: 기본 URL을 Novita AI로 지정하고 모델을 moonshotai/kimi-k2.7-code로 설정하면 됩니다.
Kimi K2.7 Code 가격 및 제한
코드에서는 정확한 모델 ID를 사용하세요. 사용자에게 보여지는 UI 표시 이름은 "Kimi K2.7 Code"를 사용합니다.
| 필드 | 현재 Novita 값 |
|---|---|
| 표시 이름 | Kimi K2.7 Code |
| API 모델 ID | moonshotai/kimi-k2.7-code |
| 모델 시리즈 | MoonshotAI |
| 아키텍처 | MoE, 총 1T 파라미터, 32B 활성화 |
| 엔드포인트 패밀리 | chat/completions, anthropic |
| 입력 모달리티 | 텍스트, 이미지, 비디오 |
| 출력 모달리티 | 텍스트 |
| 컨텍스트 윈도우 | 262,144 토큰 |
| 최대 출력 토큰 | 262,144 토큰 |
| 기능 | 함수 호출, 구조화된 출력, 추론 |
2026년 6월 16일 기준, Novita는 moonshotai/kimi-k2.7-code에 대해 다음과 같은 토큰 가격을 제시합니다:
| 토큰 유형 | 명시된 가격 |
|---|---|
| 입력 토큰 | 100만 토큰당 $0.95 |
| 출력 토큰 | 100만 토큰당 $4.00 |
| 캐시 읽기 입력 토큰 | 100만 토큰당 $0.19 |
가격, 가용성 및 속도 제한은 변경될 수 있습니다. 프로덕션 출시 또는 비용 관련 결정 전에 Kimi K2.7 Code 모델 페이지 및 Novita AI 가격 페이지를 확인하세요.
Kimi K2.7 Code cURL 예제
비전 또는 도구 호출을 추가하기 전에 텍스트 전용 요청으로 인증, 모델 라우팅 및 응답 파싱을 확인합니다.
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "moonshotai/kimi-k2.7-code",
"messages": [
{
"role": "system",
"content": "You are a concise code review assistant."
},
{
"role": "user",
"content": "List three common mistakes when implementing retry logic in Python."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
성공적인 응답은 표준 채팅 완성 형식을 반환합니다: choices 배열, content가 포함된 메시지, 모델/생성 메타데이터, 그리고 프롬프트, 완성, 총 토큰 수를 포함한 usage 객체.
이 간단한 테스트를 통해 다음을 확인하세요:
- API 키가 유효하고 인증 헤더가 올바르게 포맷되었는지 확인.
- 모델 ID가 404 또는 모델-찾을-수-없음 오류 없이 수락되는지 확인.
- 클라이언트가
choices[0].message.content를 파싱할 수 있는지 확인. - 토큰 사용량이 기록되어 첫 번째 요청부터 비용을 모니터링할 수 있는지 확인.
Kimi K2.7 Code Python 예제
OpenAI Python SDK는 Novita 기본 URL을 설정하면 Novita AI와 함께 작동합니다. SDK 버전은 자체 종속성 정책에 따라 고정하세요.
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a concise code review assistant."},
{
"role": "user",
"content": "Review this Python function for off-by-one errors and missing edge cases:\n\ndef get_items(lst, start, end):\n return lst[start:end]",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)
긴 코딩 에이전트 세션의 경우 max_tokens를 명시적으로 설정하세요. Kimi K2.7 Code는 최대 262,144 출력 토큰을 지원하지만, 프로덕션 에이전트는 턴별 토큰 사용량을 예산으로 관리하고 다단계 실행에 걸친 누적 비용을 모니터링해야 합니다.
이미지 및 비디오 입력
Novita는 Kimi K2.7 Code의 입력 모달리티로 텍스트, 이미지 및 비디오를 명시합니다. 비전 입력의 경우, 사용자 메시지에 text 부분과 image_url 부분이 포함된 content 배열을 전달하세요:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a UI code review assistant."},
{
"role": "user",
"content": [
{
"type": "text",
"text": "Describe any accessibility issues visible in this UI screenshot and suggest CSS fixes.",
},
{
"type": "image_url",
"image_url": {"url": "https://example.com/screenshot.png"},
},
],
},
],
max_tokens=512,
)
print(response.choices[0].message.content)
멀티모달 통합을 위한 실용적인 순서:
- 먼저 텍스트 전용 간단 테스트가 작동하는지 확인합니다.
- UI 스크린샷에서 라벨 추출과 같이 명확하게 검증 가능한 작업으로 이미지 입력 하나를 추가합니다.
- 실제 워크로드에 대한 응답 품질과 응답 형식을 모두 검증합니다.
- 비디오 입력을 별도로 테스트합니다 — 짧은 클립부터 시작하고, 요청 형식을 확인하고, 프로덕션 경로에 비디오를 추가하기 전에 지연 시간과 토큰 비용을 측정합니다.
모든 OpenAI 호환 멀티모달 페이로드가 모든 Novita 호스팅 모델에서 동일하게 수락된다고 가정하지 마십시오. 배포 전에 현재 Novita AI 문서 또는 moonshotai/kimi-k2.7-code에 대한 콘솔 예제에서 정확한 이미지 및 비디오 페이로드 형식을 확인하세요.
함수 호출 및 구조화된 출력
Kimi K2.7 Code는 tools 매개변수를 통한 함수 호출과 response_format을 통한 구조화된 출력을 지원합니다. 두 기능 모두 Novita AI 모델 페이지에 기능으로 나열되어 있습니다.
모델이 도구를 선택하고 산문으로 답변하는 대신 구조화된 인수를 반환해야 할 때 함수 호출을 사용하세요:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
tools = [
{
"type": "function",
"function": {
"name": "file_search",
"description": "Search the repository for files matching a pattern.",
"parameters": {
"type": "object",
"properties": {
"pattern": {
"type": "string",
"description": "Glob pattern to match, e.g. '**/*.py'",
},
"directory": {
"type": "string",
"description": "Root directory to search within.",
},
},
"required": ["pattern"],
},
},
}
]
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a repository analysis assistant."},
{
"role": "user",
"content": "Find all Python files in the src directory that might contain database migration logic.",
},
],
tools=tools,
tool_choice="auto",
temperature=0.1,
)
message = response.choices[0].message
if message.tool_calls:
for call in message.tool_calls:
print(f"Tool: {call.function.name}")
print(f"Arguments: {call.function.arguments}")
else:
print(message.content)
구조화된 출력의 경우, 도구 호출 없이 검증된 JSON 응답이 필요할 때 json_schema와 함께 response_format을 사용하세요. 초기 스키마는 작게 유지하고, 프로덕션에서 엄격 모드에 의존하기 전에 moonshotai/kimi-k2.7-code가 반환하는 정확한 응답 형식에 대해 파서를 테스트하세요.
Kimi K2.7 Code의 인터리브드 사고(interleaved thinking) 아키텍처는 결과를 반환하기 전에 다단계 작업을 통해 추론합니다. 턴당 여러 도구 호출이 있는 에이전트 코딩 워크플로의 경우, 프로덕션 트래픽을 라우팅하기 전에 실제 작업 세트에서 도구 선택, 인수 품질 및 응답 지연 시간이 어떻게 작동하는지 테스트하세요.
프로덕션 테스트 체크리스트
Kimi K2.7 Code는 입력, 출력 및 캐시 읽기 토큰에 대해 별도로 가격이 책정됩니다. 비용 프로필은 워크로드에 따라 크게 다릅니다:
- 긴 컨텍스트 코드 리뷰: 큰 입력 토큰 수가 비용을 좌우합니다.
- 코드 생성 에이전트: 출력 토큰 사용량은 응답 길이와 턴 수에 따라 확장됩니다.
- 반복 컨텍스트 워크플로: 안정적인 시스템 프롬프트, 도구 스키마 또는 저장소 요약이 여러 호출에 걸쳐 반복될 때 캐시 읽기 가격이 적용됩니다.
프로덕션 전에 다음을 포함한 평가 세트를 실행하세요:
- 짧은 텍스트 전용 프롬프트 (지연 시간 기준 및 인증 확인).
- 최대 윈도우가 아닌 예상 작업 크기에 가까운 긴 컨텍스트 프롬프트.
- 올바른 동작이 유효한 인수로 함수를 호출하는 것인 도구 호출 프롬프트.
- 실제 업로드 소스 및 파일 처리와 일치하는 이미지 입력.
- 실패 케이스: 너무 큰 입력, 누락된 미디어 URL, 잘못된 API 키 및 시간 초과 동작.
기능 목록은 사용 가능한 것을 설명합니다. 실제 워크로드에 대한 평가는 지연 시간, 토큰 사용량, 도구 인수 품질 및 출력 정확성이 프로덕션 기준을 충족하는지 알려줍니다.
FAQ
Kimi K2.7 Code를 Novita AI에서 사용할 수 있나요?
네. Novita AI는 Kimi K2.7 Code를 API 모델 ID moonshotai/kimi-k2.7-code를 가진 서버리스 LLM으로 제공합니다.
올바른 모델 ID는 무엇인가요?
모든 API 호출에서 moonshotai/kimi-k2.7-code를 사용하세요.
어떤 엔드포인트를 사용해야 하나요?
OpenAI 호환 채팅 완성 엔드포인트인 POST https://api.novita.ai/openai/v1/chat/completions를 사용하세요. OpenAI SDK 클라이언트를 사용할 때 기본 URL을 https://api.novita.ai/openai로 설정하세요.
Kimi K2.7 Code의 비용은 얼마인가요?
2026년 6월 16일 기준, Novita AI는 입력 토큰 100만 개당 $0.95, 출력 토큰 100만 개당 $4.00, 캐시 읽기 입력 토큰 100만 개당 $0.19를 명시합니다. 조달 결정 전에 Kimi K2.7 Code 모델 페이지에서 현재 가격을 확인하세요.
이미지 및 비디오 입력을 지원하나요?
Novita는 텍스트, 이미지 및 비디오를 입력 모달리티로 제공합니다. 정확한 페이로드 형식은 멀티모달 기능을 배포하기 전에 현재 Novita 문서 또는 테스트 호출을 통해 확인하세요.
Kimi K2.7 Code는 함수 호출을 지원하나요?
네. 채팅 완성 요청에서 tools 매개변수를 사용하세요. Novita는 함수 호출 및 구조화된 출력을 지원되는 기능으로 나열합니다.
컨텍스트 윈도우는 얼마인가요?
Novita AI 모델 페이지에 명시된 대로 262,144 토큰 컨텍스트 윈도우 및 262,144 토큰 최대 출력입니다.
