Novita AI에서 Kimi K2.7 Code API 빠른 시작

Kimi K2.7 Code API 설정
Kimi K2.7 Code 가격 및 제한 사항
Kimi K2.7 Code cURL 예제
Kimi K2.7 Code Python 예제
이미지 및 비디오 입력
함수 호출 및 구조화된 출력
프로덕션 테스트 체크리스트
FAQ
추천 문서

Kimi K2.7 Code는 모델 ID moonshotai/kimi-k2.7-code, OpenAI 호환 chat/completions 엔드포인트, 262,144 토큰 컨텍스트 윈도우, 텍스트, 이미지 및 비디오 입력 지원과 함께 Novita AI에서 사용할 수 있습니다. 이 빠른 시작은 개발자 설정, 인증, 첫 번째 요청 전송, 비전 입력 사용, 함수 호출 추가 및 구축 전 가격 이해를 다룹니다. 포지셔닝 및 사용 사례에 대한 더 넓은 개요는 Kimi K2.7 Code on Novita AI 개요를 참조하세요. Anthropic 호환 엔드포인트를 통해 Kimi K2.7 Code를 Claude Code에 연결하려면 Claude Code에서 Kimi K2.7 Code 사용 방법을 참조하세요.

Kimi K2.7 Code API 설정

세 가지 구성 요소로 시작합니다:

항목	값
API 키	`NOVITA_API_KEY`와 같은 환경 변수에 Novita AI API 키를 생성하여 저장합니다.
OpenAI 호환 기본 URL	`https://api.novita.ai/openai`
채팅 완성 엔드포인트	`POST https://api.novita.ai/openai/v1/chat/completions`
모델 ID	`moonshotai/kimi-k2.7-code`

Novita AI 문서 인덱스는 OpenAI 호환 기본 URL을 나열하고, 채팅 완성 API 참조는 전체 요청 및 응답 필드를 문서화합니다.

API 키를 소스 코드 관리에서 제외하세요. 로컬 개발을 위해 셸에서 내보냅니다:

export NOVITA_API_KEY="your_api_key"

애플리케이션이 이미 OpenAI SDK를 사용하고 있다면 변경 사항은 최소화됩니다: 기본 URL을 Novita AI로 지정하고 모델을 moonshotai/kimi-k2.7-code로 설정하면 됩니다.

Kimi K2.7 Code 가격 및 제한 사항

코드에서는 정확한 모델 ID를 사용하세요. 사용자 대상 UI에서는 표시 이름 "Kimi K2.7 Code"를 사용합니다.

필드	현재 Novita 값
표시 이름	Kimi K2.7 Code
API 모델 ID	`moonshotai/kimi-k2.7-code`
모델 시리즈	MoonshotAI
아키텍처	MoE, 총 1T 파라미터, 활성화 32B
엔드포인트 패밀리	`chat/completions`, `anthropic`
입력 모달리티	텍스트, 이미지, 비디오
출력 모달리티	텍스트
컨텍스트 윈도우	262,144 토큰
최대 출력 토큰	262,144 토큰
기능	함수 호출, 구조화된 출력, 추론

2026년 6월 16일 기준, Novita는 moonshotai/kimi-k2.7-code에 대해 다음과 같은 토큰 가격을 제공합니다:

토큰 유형	명시된 가격
입력 토큰	1M 토큰당 $0.95
출력 토큰	1M 토큰당 $4.00
캐시 읽기 입력 토큰	1M 토큰당 $0.19

가격, 가용성 및 요율 제한은 변경될 수 있습니다. 프로덕션 출시 또는 비용 확정 전에 Kimi K2.7 Code 모델 페이지와 Novita AI 가격 페이지를 확인하세요.

Kimi K2.7 Code cURL 예제

비전 또는 도구 호출을 추가하기 전에 텍스트 전용 요청으로 인증, 모델 라우팅 및 응답 구문 분석을 확인하세요.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "moonshotai/kimi-k2.7-code",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise code review assistant."
      },
      {
        "role": "user",
        "content": "List three common mistakes when implementing retry logic in Python."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

성공적인 응답은 표준 채팅 완성 형태를 반환합니다: choices 배열, content가 있는 메시지, 모델/생성 메타데이터, 프롬프트, 완성 및 총 토큰 수가 포함된 usage 객체입니다.

이 스모크 테스트를 사용하여 다음을 확인하세요:

API 키가 유효하고 인증 헤더가 올바르게 포맷되었습니다.
모델 ID가 404 또는 모델을 찾을 수 없음 오류 없이 허용됩니다.
클라이언트가 choices[0].message.content를 구문 분석할 수 있습니다.
첫 번째 요청부터 비용을 모니터링할 수 있도록 토큰 사용량이 기록됩니다.

Kimi K2.7 Code Python 예제

OpenAI Python SDK는 Novita 기본 URL을 설정하면 Novita AI와 함께 작동합니다. 자체 종속성 정책에 따라 SDK 버전을 고정하세요.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a concise code review assistant."},
        {
            "role": "user",
            "content": "Review this Python function for off-by-one errors and missing edge cases:\n\ndef get_items(lst, start, end):\n    return lst[start:end]",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)

긴 코딩 에이전트 세션의 경우 max_tokens를 명시적으로 설정하세요. Kimi K2.7 Code는 최대 262,144 출력 토큰을 지원하지만, 프로덕션 에이전트는 턴당 토큰 사용량을 예산하고 다단계 실행에서 누적 비용을 모니터링해야 합니다.

이미지 및 비디오 입력

Novita는 Kimi K2.7 Code의 입력 모달리티로 텍스트, 이미지 및 비디오를 제공합니다. 비전 입력의 경우 사용자 메시지에 text 부분과 image_url 부분이 포함된 content 배열을 전달합니다:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a UI code review assistant."},
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Describe any accessibility issues visible in this UI screenshot and suggest CSS fixes.",
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/screenshot.png"},
                },
            ],
        },
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

멀티모달 통합을 위한 실용적인 순서:

먼저 텍스트 전용 스모크 테스트가 작동하는지 확인합니다.
UI 스크린샷에서 레이블 추출과 같이 명확하게 확인 가능한 작업으로 이미지 입력 하나를 추가합니다.
실제 워크로드에 대한 응답 품질과 응답 형태를 모두 검증합니다.
비디오 입력은 별도로 테스트합니다 — 짧은 클립으로 시작하고, 요청 형식을 확인하며, 프로덕션 경로에 비디오를 추가하기 전에 지연 시간과 토큰 비용을 측정합니다.

모든 OpenAI 호환 멀티모달 페이로드가 모든 Novita 호스팅 모델에서 동일하게 허용된다고 가정하지 마십시오. 출시 전에 moonshotai/kimi-k2.7-code에 대한 현재 Novita AI 문서 또는 콘솔 예제에서 정확한 이미지 및 비디오 페이로드 형태를 확인하세요.

함수 호출 및 구조화된 출력

Kimi K2.7 Code는 tools 매개변수를 통한 함수 호출과 response_format을 통한 구조화된 출력을 지원합니다. 둘 다 Novita AI 모델 페이지에 기능으로 나열되어 있습니다.

모델이 산문으로 답변하는 대신 도구를 선택하고 구조화된 인수를 반환해야 할 때 함수 호출을 사용하세요:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "file_search",
            "description": "Search the repository for files matching a pattern.",
            "parameters": {
                "type": "object",
                "properties": {
                    "pattern": {
                        "type": "string",
                        "description": "Glob pattern to match, e.g. '**/*.py'",
                    },
                    "directory": {
                        "type": "string",
                        "description": "Root directory to search within.",
                    },
                },
                "required": ["pattern"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a repository analysis assistant."},
        {
            "role": "user",
            "content": "Find all Python files in the src directory that might contain database migration logic.",
        },
    ],
    tools=tools,
    tool_choice="auto",
    temperature=0.1,
)

message = response.choices[0].message
if message.tool_calls:
    for call in message.tool_calls:
        print(f"Tool: {call.function.name}")
        print(f"Arguments: {call.function.arguments}")
else:
    print(message.content)

구조화된 출력의 경우, 도구 호출 없이 검증된 JSON 응답이 필요할 때 json_schema와 함께 response_format을 사용하세요. 초기 스키마는 작게 유지하고 프로덕션에서 엄격 모드를 사용하기 전에 moonshotai/kimi-k2.7-code가 반환하는 정확한 응답 형태에 대해 파서를 테스트하세요.

Kimi K2.7 Code의 인터리브드 씽킹 아키텍처는 결과를 반환하기 전에 다단계 작업을 통해 추론합니다. 턴당 여러 도구 호출이 있는 에이전트 코딩 워크플로의 경우, 프로덕션 트래픽을 라우팅하기 전에 실제 작업 세트에서 도구 선택, 인수 품질 및 응답 지연 시간이 어떻게 작동하는지 테스트하세요.

프로덕션 테스트 체크리스트

Kimi K2.7 Code는 입력, 출력 및 캐시 읽기 토큰에 대해 별도로 가격이 책정됩니다. 비용 프로필은 워크로드에 따라 크게 다릅니다:

긴 컨텍스트 코드 리뷰: 큰 입력 토큰 수가 비용을 지배합니다.
코드 생성 에이전트: 출력 토큰 사용량은 응답 길이와 턴 수에 따라 확장됩니다.
반복 컨텍스트 워크플로: 안정적인 시스템 프롬프트, 도구 스키마 또는 리포지토리 요약이 많은 호출에서 반복될 때 캐시 읽기 가격이 적용됩니다.

프로덕션 전에 다음을 포함하는 평가 세트를 실행하세요:

짧은 텍스트 전용 프롬프트(지연 시간 기준 및 인증 확인).
최대 윈도우가 아닌 예상 작업 크기에 가까운 긴 컨텍스트 프롬프트.
올바른 동작이 유효한 인수로 함수를 호출하는 것인 도구 호출 프롬프트.
실제 업로드 소스 및 파일 처리와 일치하는 이미지 입력.
실패 사례: 크기가 초과된 입력, 누락된 미디어 URL, 유효하지 않은 API 키 및 시간 초과 동작.

기능 목록은 사용 가능한 것을 설명합니다. 실제 워크로드에 대한 평가는 지연 시간, 토큰 사용량, 도구 인수 품질 및 출력 정확도가 프로덕션 기준을 충족하는지 알려줍니다.

FAQ

Kimi K2.7 Code를 Novita AI를 통해 사용할 수 있나요?

예. Novita AI는 Kimi K2.7 Code를 API 모델 ID moonshotai/kimi-k2.7-code를 가진 Serverless LLM으로 제공합니다.

올바른 모델 ID는 무엇인가요?

모든 API 호출에서 moonshotai/kimi-k2.7-code를 사용하세요.

어떤 엔드포인트를 사용해야 하나요?

OpenAI 호환 채팅 완성 엔드포인트를 사용하세요: POST https://api.novita.ai/openai/v1/chat/completions. OpenAI SDK 클라이언트를 사용할 때 기본 URL을 https://api.novita.ai/openai로 설정하세요.

Kimi K2.7 Code 비용은 얼마인가요?

2026년 6월 16일 기준, Novita AI는 1M 입력 토큰당 $0.95, 1M 출력 토큰당 $4.00, 1M 캐시 읽기 입력 토큰당 $0.19를 제공합니다. 조달 결정 전에 Kimi K2.7 Code 모델 페이지에서 현재 가격을 확인하세요.

이미지 및 비디오 입력을 지원하나요?

Novita는 입력 모달리티로 텍스트, 이미지 및 비디오를 제공합니다. 정확한 페이로드 형태는 멀티모달 기능을 출시하기 전에 현재 Novita 문서 또는 테스트 호출을 통해 확인하세요.

Kimi K2.7 Code는 함수 호출을 지원하나요?

예. 채팅 완성 요청에서 tools 매개변수를 사용하세요. Novita는 함수 호출 및 구조화된 출력을 지원되는 기능으로 제공합니다.

컨텍스트 윈도우는 무엇인가요?

Novita AI 모델 페이지에 명시된 대로 262,144 토큰 컨텍스트 윈도우 및 262,144 토큰 최대 출력입니다.

Novita AI에서 Kimi K2.7 Code API 빠른 시작

Kimi K2.7 Code API 설정

Kimi K2.7 Code 가격 및 제한 사항

Kimi K2.7 Code cURL 예제

Kimi K2.7 Code Python 예제

이미지 및 비디오 입력

함수 호출 및 구조화된 출력

프로덕션 테스트 체크리스트

FAQ

Kimi K2.7 Code를 Novita AI를 통해 사용할 수 있나요?

올바른 모델 ID는 무엇인가요?

어떤 엔드포인트를 사용해야 하나요?

Kimi K2.7 Code 비용은 얼마인가요?

이미지 및 비디오 입력을 지원하나요?

Kimi K2.7 Code는 함수 호출을 지원하나요?

컨텍스트 윈도우는 무엇인가요?

추천 문서

Product

RESOURCES

Partners

Company

Kimi K2.7 Code API 설정

Kimi K2.7 Code 가격 및 제한 사항

Kimi K2.7 Code cURL 예제

Kimi K2.7 Code Python 예제

이미지 및 비디오 입력

함수 호출 및 구조화된 출력

프로덕션 테스트 체크리스트

FAQ

Kimi K2.7 Code를 Novita AI를 통해 사용할 수 있나요?

올바른 모델 ID는 무엇인가요?

어떤 엔드포인트를 사용해야 하나요?

Kimi K2.7 Code 비용은 얼마인가요?

이미지 및 비디오 입력을 지원하나요?

Kimi K2.7 Code는 함수 호출을 지원하나요?

컨텍스트 윈도우는 무엇인가요?

추천 문서

관련 게시글

Product

RESOURCES

Partners

Company