Nemotron 3 Nano 30B A3B доступен на Novita AI в качестве серверной LLM для совместимых с OpenAI чат-завершений, с моделью ID nvidia/nemotron-3-nano-30b-a3b, окном контекста 256K, максимальным количеством выходных токенов 32 768, текстовым вводом/выводом, function calling, structured outputs и reasoning, указанными на странице модели Novita. По состоянию на 11 июня 2026 года Novita указывает цены в размере $0.05 за миллион входных токенов и $0.20 за миллион выходных токенов, что делает его практичным вариантом, когда вам нужны долгоконтекстные агенты, программирование, математика или рабочие процессы с использованием инструментов без управления инфраструктурой модели.
Что такое Nemotron 3 Nano 30B A3B?
Nemotron 3 Nano 30B A3B — это модель NVIDIA, указанная на странице модели Novita AI Nemotron 3 Nano 30B A3B как вычислительно эффективная модель с открытыми весами для агентного ИИ. На странице она описывается как модель Mixture-of-Experts с общим количеством параметров 30B и активными параметрами 3.5B, использующая гибридную архитектуру Mamba-2 и Transformer.
Для разработчиков ключевой момент не только в архитектуре. Дело в том, что модель доступна через Serverless LLM API от Novita AI, поэтому вы можете вызывать её через тот же совместимый с OpenAI шаблон чат-завершений, который используется другими языковыми моделями Novita.
| Поле | Текущее значение |
|---|---|
| Отображаемое имя | Nemotron 3 Nano 30B A3B |
| ID модели API | nvidia/nemotron-3-nano-30b-a3b |
| Провайдер/серия от Novita | Nvidia |
| Категория | LLM, Serverless |
| Эндпоинт | chat/completions |
| Входные модальности | Text |
| Выходные модальности | Text |
| Окно контекста | 256K токенов |
| Максимум выходных токенов | 32 768 |
| Отмеченные флаги функций | Serverless, function calling, structured outputs, reasoning |
| Квантование от Novita | fp4 |
Это делает модель подходящей для задач, где требуется большой бюджет подсказок, шаблоны использования инструментов и ответы в формате JSON, но при этом вы хотите использовать размещенный API, а не собственное развертывание.
Доступность на Novita AI и цены
В настоящее время модель указана как NEW Serverless LLM на Novita AI. Используйте точный ID модели nvidia/nemotron-3-nano-30b-a3b в вызовах API.
По состоянию на 11 июня 2026 года Novita указывает следующие цены на токены:
| Тип токена | Цена |
|---|---|
| Входные токены | $0.05 за 1M токенов |
| Выходные токены | $0.20 за 1M токенов |
Цены и доступность могут меняться, поэтому производственные команды должны проверять страницу модели Nemotron 3 Nano 30B A3B и страницу цен Novita AI перед запуском или проверкой закупок.
Novita также предоставляет модель через совместимый с OpenAI базовый URL API:
https://api.novita.ai/openai
Для чат-завершений путь эндпоинта:
POST https://api.novita.ai/openai/v1/chat/completions
Аутентификация использует Bearer-токен в заголовке Authorization. Храните ключи API в переменных окружения или в менеджере секретов; не встраивайте их в код приложения.
Когда разработчикам следует её использовать?
Используйте Nemotron 3 Nano 30B A3B, когда вашему приложению требуется длинный контекст, структурированные выходные данные модели или ориентированное на использование инструментов рассуждение от серверной текстовой модели.
Хорошие примеры использования:
- Агенты с длинным контекстом, которым нужно читать большие файлы проектов, логи, стенограммы или фрагменты баз знаний.
- Помощники по программированию, которым требуется достаточно контекста для просмотра нескольких файлов перед созданием плана или патча.
- Рабочие процессы по математике, планированию и многошаговому анализу, где важен флаг функции reasoning модели.
- Агентские рабочие процессы, которые вызывают инструменты через function calling.
- Задачи извлечения данных, которые требуют структурированных JSON-ответов вместо свободного текста.
Не предполагайте, что эта модель лучшая для каждой задачи. Для чувствительных к задержке коротких подсказок, изображений или аудиовходов, строгих тестовых целей или рабочих нагрузок с известным предпочтением модели, тестируйте её на своем наборе кандидатов. Страница модели подтверждает доступность и флаги функций; она не заменяет вашу собственную оценку на реальных подсказках.
Быстрый старт: вызов API Nemotron 3 Nano 30B A3B
Самый простой способ начать — вызвать совместимый с OpenAI эндпоинт чат-завершений с проверенным ID модели.
cURL
export NOVITA_API_KEY="your_api_key"
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "nvidia/nemotron-3-nano-30b-a3b",
"messages": [
{
"role": "system",
"content": "You are a concise technical assistant."
},
{
"role": "user",
"content": "Summarize the risks in this API migration plan and return three action items."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
Python
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="nvidia/nemotron-3-nano-30b-a3b",
messages=[
{"role": "system", "content": "You are a concise technical assistant."},
{
"role": "user",
"content": "Summarize the risks in this API migration plan and return three action items.",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
Подробности реализации см. в руководстве по LLM API Novita AI и справочнике API чат-завершений.
Используйте function calling, structured outputs и reasoning с осторожностью
Novita указывает function calling, structured outputs и reasoning среди флагов функций модели. Эти функции наиболее полезны, когда вашему приложению нужны предсказуемые интерфейсы между моделью и остальной системой.
Для function calling передавайте массив tools с определениями функций. API чат-завершений поддерживает функциональные инструменты с именами, описаниями, параметрами JSON Schema и опцией strict.
Для structured outputs используйте response_format с json_schema, когда модель и схема поддерживаются. Справочник API отмечает, что строгие структурированные выводы поддерживают подмножество JSON Schema, поэтому тестируйте свою точную схему перед использованием в продакшене.
Что касается поведения reasoning, четко различайте доступность на уровне модели и поведение на уровне запроса. Страница модели Nemotron указывает reasoning как флаг функции, в то время как справочник API чат-завершений документирует параметры запроса, такие как separate_reasoning и enable_thinking, с примечаниями о поддержке для конкретных моделей. Перед использованием полей reasoning в продакшене выполните небольшой тест API с точным ID модели и запишите структуру ответа, которую будет обрабатывать ваше приложение.
Часто задаваемые вопросы
Доступен ли Nemotron 3 Nano 30B A3B на Novita AI?
Да. Модель указана на Novita AI как Serverless LLM с ID модели nvidia/nemotron-3-nano-30b-a3b.
Какое окно контекста у Nemotron 3 Nano 30B A3B?
Novita указывает окно контекста 256K и максимум 32 768 выходных токенов для nvidia/nemotron-3-nano-30b-a3b.
Сколько стоит API Nemotron 3 Nano 30B A3B на Novita AI?
По состоянию на 11 июня 2026 года Novita указывает цены $0.05 за миллион входных токенов и $0.20 за миллион выходных токенов.
Поддерживает ли модель function calling и structured outputs?
Страница модели Novita указывает function calling и structured outputs как флаги функций для Nemotron 3 Nano 30B A3B. Проверьте свою точную схему инструмента или JSON-схему через API перед использованием в продакшене.
Какой эндпоинт мне использовать?
Используйте совместимый с OpenAI эндпоинт чат-завершений: https://api.novita.ai/openai/v1/chat/completions.
