Kimi K2.7 Code доступен на Novita AI с ID модели moonshotai/kimi-k2.7-code, OpenAI-совместимым endpoint chat/completions, окном контекста в 262 144 токена и поддержкой ввода текста, изображений и видео. В этом быстром старте описана настройка для разработчика: аутентификация, отправка первого запроса, использование ввода изображений, добавление вызова функций и понимание цен перед началом работы. Для более общего обзора позиционирования и вариантов использования см. Kimi K2.7 Code на Novita AI обзор.
Настройка Kimi K2.7 Code API
Начните с трёх элементов конфигурации:
| Пункт | Значение |
|---|---|
| API key | Создайте и сохраните API-ключ Novita AI в переменной окружения, например NOVITA_API_KEY. |
| OpenAI-совместимый базовый URL | https://api.novita.ai/openai |
| Endpoint chat completions | POST https://api.novita.ai/openai/v1/chat/completions |
| ID модели | moonshotai/kimi-k2.7-code |
В индексе документации Novita AI указан OpenAI-совместимый базовый URL, а в справочнике API chat completions документированы все поля запроса и ответа.
Не храните API-ключ в системе контроля версий. Экспортируйте его в вашей оболочке для локальной разработки:
export NOVITA_API_KEY="your_api_key"
Если ваше приложение уже использует OpenAI SDK, изменения минимальны: укажите базовый URL на Novita AI и установите модель moonshotai/kimi-k2.7-code.
Цены и ограничения Kimi K2.7 Code
Используйте точный ID модели в коде. В пользовательском интерфейсе используйте отображаемое имя «Kimi K2.7 Code».
| Поле | Текущее значение на Novita |
|---|---|
| Отображаемое имя | Kimi K2.7 Code |
| ID модели API | moonshotai/kimi-k2.7-code |
| Серия модели | MoonshotAI |
| Архитектура | MoE, 1 трлн параметров всего, 32 млрд активировано |
| Семейства endpoint’ов | chat/completions, anthropic |
| Входные модальности | Текст, изображение, видео |
| Выходная модальность | Текст |
| Окно контекста | 262 144 токена |
| Максимум выходных токенов | 262 144 токена |
| Возможности | Вызов функций, структурированные выходные данные, рассуждение |
По состоянию на 16 июня 2026 года Novita указывает следующие цены на токены для moonshotai/kimi-k2.7-code:
| Тип токена | Указанная цена |
|---|---|
| Входные токены | $0.95 за 1M токенов |
| Выходные токены | $4.00 за 1M токенов |
| Токены кэшированного чтения на входе | $0.19 за 1M токенов |
Цены, доступность и лимиты могут меняться. Проверьте страницу модели Kimi K2.7 Code и страницу цен Novita AI перед запуском в производство или любыми финансовыми обязательствами.
Пример cURL для Kimi K2.7 Code
Начните с запроса только с текстом, чтобы подтвердить аутентификацию, маршрутизацию модели и разбор ответа, прежде чем добавлять изображения или вызовы инструментов.
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "moonshotai/kimi-k2.7-code",
"messages": [
{
"role": "system",
"content": "You are a concise code review assistant."
},
{
"role": "user",
"content": "List three common mistakes when implementing retry logic in Python."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
В случае успеха возвращается стандартная структура chat completions: массив choices, сообщение с content, метаданные модели/создания и объект usage с количеством токенов запроса, ответа и общим количеством.
Используйте этот дымовой тест для проверки:
- API-ключ действителен и заголовок авторизации отформатирован корректно.
- ID модели принимается без ошибки 404 или ошибки «модель не найдена».
- Ваш клиент может разобрать
choices[0].message.content. - Использование токенов записывается, чтобы вы могли отслеживать расходы с первого запроса.
Пример Python для Kimi K2.7 Code
OpenAI Python SDK работает с Novita AI при указании базового URL Novita. Закрепите версию SDK согласно вашей политике зависимостей.
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a concise code review assistant."},
{
"role": "user",
"content": "Review this Python function for off-by-one errors and missing edge cases:\n\ndef get_items(lst, start, end):\n return lst[start:end]",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)
Для длительных сессий агента кодирования явно задавайте max_tokens. Kimi K2.7 Code поддерживает до 262 144 выходных токенов, но в производственных агентах следует рассчитывать использование токенов на каждый шаг и отслеживать совокупные расходы в многопоточных запусках.
Ввод изображений и видео
Novita указывает текст, изображение и видео как входные модальности для Kimi K2.7 Code. Для ввода изображений передайте массив content в сообщении пользователя с частью text и частью image_url:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a UI code review assistant."},
{
"role": "user",
"content": [
{
"type": "text",
"text": "Describe any accessibility issues visible in this UI screenshot and suggest CSS fixes.",
},
{
"type": "image_url",
"image_url": {"url": "https://example.com/screenshot.png"},
},
],
},
],
max_tokens=512,
)
print(response.choices[0].message.content)
Практический порядок для мультимодальной интеграции:
- Сначала убедитесь, что тестовый запрос только с текстом работает.
- Добавьте один ввод изображения с четко проверяемой задачей, например извлечение меток из скриншота интерфейса.
- Проверьте как качество ответа, так и его структуру для вашей реальной нагрузки.
- Тестируйте ввод видео отдельно — начните с коротких клипов, проверьте формат запроса и измерьте задержку и затраты токенов перед добавлением видео в рабочий процесс.
Не предполагайте, что любая мультимодальная нагрузка, совместимая с OpenAI, принимается одинаково любой моделью, размещенной на Novita. Проверьте точную структуру изображений и видео в текущей документации Novita AI или примерах консоли для moonshotai/kimi-k2.7-code перед развертыванием.
Вызов функций и структурированные выходные данные
Kimi K2.7 Code поддерживает вызов функций через параметр tools и структурированные выходные данные через response_format. Обе возможности указаны на странице модели Novita AI.
Используйте вызов функций, когда модель должна выбрать инструмент и вернуть структурированные аргументы вместо ответа в виде текста:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
tools = [
{
"type": "function",
"function": {
"name": "file_search",
"description": "Search the repository for files matching a pattern.",
"parameters": {
"type": "object",
"properties": {
"pattern": {
"type": "string",
"description": "Glob pattern to match, e.g. '**/*.py'",
},
"directory": {
"type": "string",
"description": "Root directory to search within.",
},
},
"required": ["pattern"],
},
},
}
]
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a repository analysis assistant."},
{
"role": "user",
"content": "Find all Python files in the src directory that might contain database migration logic.",
},
],
tools=tools,
tool_choice="auto",
temperature=0.1,
)
message = response.choices[0].message
if message.tool_calls:
for call in message.tool_calls:
print(f"Tool: {call.function.name}")
print(f"Arguments: {call.function.arguments}")
else:
print(message.content)
Для структурированных выходных данных используйте response_format с json_schema, когда вам нужен проверенный JSON-ответ без вызова функции. Делайте первые схемы небольшими и тестируйте свой парсер на точной структуре ответа, возвращаемой moonshotai/kimi-k2.7-code, прежде чем полагаться на строгий режим в производстве.
Встроенная архитектура рассуждений Kimi K2.7 Code означает, что модель продумывает многошаговые задачи перед возвратом результата. Для агентных рабочих процессов кодирования с множеством вызовов инструментов за один шаг проверьте, как выбор инструмента, качество аргументов и задержка ответа ведут себя на вашем реальном наборе задач, прежде чем направлять производственный трафик.
Контрольный список тестирования в производстве
Цена на Kimi K2.7 Code устанавливается отдельно для входных, выходных токенов и токенов кэшированного чтения. Профили затрат сильно различаются в зависимости от нагрузки:
- Ревью кода с длинным контекстом: большие количества входных токенов доминируют в затратах.
- Агенты генерации кода: использование выходных токенов масштабируется с длиной ответа и количеством шагов.
- Рабочие процессы с повторяющимся контекстом: цена кэшированного чтения применяется, когда стабильный системный запрос, схема инструментов или сводка репозитория повторяются во многих вызовах.
Перед запуском в производство выполните набор оценки, который включает:
- Короткие запросы только с текстом (базовая задержка и проверка аутентификации).
- Запросы с длинным контекстом, близкие к ожидаемому рабочему размеру, а не к максимальному окну.
- Запросы с вызовом инструментов, где правильным поведением является вызов функции с допустимыми аргументами.
- Ввод изображений, соответствующий вашему реальному источнику загрузки и обработке файлов.
- Случаи сбоев: слишком большой ввод, отсутствие URL медиа, недействительный API-ключ и поведение при тайм-ауте.
Списки возможностей описывают, что доступно. Оценка на вашей реальной нагрузке покажет, соответствуют ли задержка, использование токенов, качество аргументов инструментов и правильность вывода вашему производственному стандарту.
Часто задаваемые вопросы
Доступен ли Kimi K2.7 Code через Novita AI?
Да. Novita AI указывает Kimi K2.7 Code как Serverless LLM с ID модели API moonshotai/kimi-k2.7-code.
Какой правильный ID модели?
Используйте moonshotai/kimi-k2.7-code во всех вызовах API.
Какой endpoint мне следует использовать?
Используйте OpenAI-совместимый endpoint chat completions: POST https://api.novita.ai/openai/v1/chat/completions. Установите базовый URL https://api.novita.ai/openai при использовании клиента OpenAI SDK.
Сколько стоит Kimi K2.7 Code?
По состоянию на 16 июня 2026 года Novita AI указывает $0.95 за 1M входных токенов, $4.00 за 1M выходных токенов и $0.19 за 1M токенов кэшированного чтения на входе. Проверьте текущие цены на странице модели Kimi K2.7 Code перед любым решением о закупке.
Поддерживает ли он ввод изображений и видео?
Novita указывает текст, изображение и видео как входные модальности. Для точной структуры нагрузки проверьте текущую документацию Novita или выполните тестовый вызов перед развертыванием мультимодальных функций.
Поддерживает ли Kimi K2.7 Code вызов функций?
Да. Используйте параметр tools в запросе chat completions. Novita указывает вызов функций и структурированные выходные данные как поддерживаемые возможности.
Каков размер окна контекста?
Окно контекста 262 144 токена и максимум 262 144 токена на выходе, как указано на странице модели Novita AI.
