Nemotron 3 Nano 30B A3B на Novita AI: запуск, цены и быстрый старт

Nemotron 3 Nano 30B A3B на Novita AI: запуск, цены и быстрый старт

Nemotron 3 Nano 30B A3B доступен на Novita AI в качестве серверной LLM для совместимых с OpenAI чат-завершений, с моделью ID nvidia/nemotron-3-nano-30b-a3b, окном контекста 256K, максимальным количеством выходных токенов 32 768, текстовым вводом/выводом, function calling, structured outputs и reasoning, указанными на странице модели Novita. По состоянию на 11 июня 2026 года Novita указывает цены в размере $0.05 за миллион входных токенов и $0.20 за миллион выходных токенов, что делает его практичным вариантом, когда вам нужны долгоконтекстные агенты, программирование, математика или рабочие процессы с использованием инструментов без управления инфраструктурой модели.

Что такое Nemotron 3 Nano 30B A3B?

Nemotron 3 Nano 30B A3B — это модель NVIDIA, указанная на странице модели Novita AI Nemotron 3 Nano 30B A3B как вычислительно эффективная модель с открытыми весами для агентного ИИ. На странице она описывается как модель Mixture-of-Experts с общим количеством параметров 30B и активными параметрами 3.5B, использующая гибридную архитектуру Mamba-2 и Transformer.

Для разработчиков ключевой момент не только в архитектуре. Дело в том, что модель доступна через Serverless LLM API от Novita AI, поэтому вы можете вызывать её через тот же совместимый с OpenAI шаблон чат-завершений, который используется другими языковыми моделями Novita.

Поле Текущее значение
Отображаемое имя Nemotron 3 Nano 30B A3B
ID модели API nvidia/nemotron-3-nano-30b-a3b
Провайдер/серия от Novita Nvidia
Категория LLM, Serverless
Эндпоинт chat/completions
Входные модальности Text
Выходные модальности Text
Окно контекста 256K токенов
Максимум выходных токенов 32 768
Отмеченные флаги функций Serverless, function calling, structured outputs, reasoning
Квантование от Novita fp4

Это делает модель подходящей для задач, где требуется большой бюджет подсказок, шаблоны использования инструментов и ответы в формате JSON, но при этом вы хотите использовать размещенный API, а не собственное развертывание.

Доступность на Novita AI и цены

В настоящее время модель указана как NEW Serverless LLM на Novita AI. Используйте точный ID модели nvidia/nemotron-3-nano-30b-a3b в вызовах API.

По состоянию на 11 июня 2026 года Novita указывает следующие цены на токены:

Тип токена Цена
Входные токены $0.05 за 1M токенов
Выходные токены $0.20 за 1M токенов

Цены и доступность могут меняться, поэтому производственные команды должны проверять страницу модели Nemotron 3 Nano 30B A3B и страницу цен Novita AI перед запуском или проверкой закупок.

Novita также предоставляет модель через совместимый с OpenAI базовый URL API:

https://api.novita.ai/openai

Для чат-завершений путь эндпоинта:

POST https://api.novita.ai/openai/v1/chat/completions

Аутентификация использует Bearer-токен в заголовке Authorization. Храните ключи API в переменных окружения или в менеджере секретов; не встраивайте их в код приложения.

Когда разработчикам следует её использовать?

Используйте Nemotron 3 Nano 30B A3B, когда вашему приложению требуется длинный контекст, структурированные выходные данные модели или ориентированное на использование инструментов рассуждение от серверной текстовой модели.

Хорошие примеры использования:

  • Агенты с длинным контекстом, которым нужно читать большие файлы проектов, логи, стенограммы или фрагменты баз знаний.
  • Помощники по программированию, которым требуется достаточно контекста для просмотра нескольких файлов перед созданием плана или патча.
  • Рабочие процессы по математике, планированию и многошаговому анализу, где важен флаг функции reasoning модели.
  • Агентские рабочие процессы, которые вызывают инструменты через function calling.
  • Задачи извлечения данных, которые требуют структурированных JSON-ответов вместо свободного текста.

Не предполагайте, что эта модель лучшая для каждой задачи. Для чувствительных к задержке коротких подсказок, изображений или аудиовходов, строгих тестовых целей или рабочих нагрузок с известным предпочтением модели, тестируйте её на своем наборе кандидатов. Страница модели подтверждает доступность и флаги функций; она не заменяет вашу собственную оценку на реальных подсказках.

Быстрый старт: вызов API Nemotron 3 Nano 30B A3B

Самый простой способ начать — вызвать совместимый с OpenAI эндпоинт чат-завершений с проверенным ID модели.

cURL

export NOVITA_API_KEY="your_api_key"

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "nvidia/nemotron-3-nano-30b-a3b",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise technical assistant."
      },
      {
        "role": "user",
        "content": "Summarize the risks in this API migration plan and return three action items."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Python

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="nvidia/nemotron-3-nano-30b-a3b",
    messages=[
        {"role": "system", "content": "You are a concise technical assistant."},
        {
            "role": "user",
            "content": "Summarize the risks in this API migration plan and return three action items.",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)

Подробности реализации см. в руководстве по LLM API Novita AI и справочнике API чат-завершений.

Используйте function calling, structured outputs и reasoning с осторожностью

Novita указывает function calling, structured outputs и reasoning среди флагов функций модели. Эти функции наиболее полезны, когда вашему приложению нужны предсказуемые интерфейсы между моделью и остальной системой.

Для function calling передавайте массив tools с определениями функций. API чат-завершений поддерживает функциональные инструменты с именами, описаниями, параметрами JSON Schema и опцией strict.

Для structured outputs используйте response_format с json_schema, когда модель и схема поддерживаются. Справочник API отмечает, что строгие структурированные выводы поддерживают подмножество JSON Schema, поэтому тестируйте свою точную схему перед использованием в продакшене.

Что касается поведения reasoning, четко различайте доступность на уровне модели и поведение на уровне запроса. Страница модели Nemotron указывает reasoning как флаг функции, в то время как справочник API чат-завершений документирует параметры запроса, такие как separate_reasoning и enable_thinking, с примечаниями о поддержке для конкретных моделей. Перед использованием полей reasoning в продакшене выполните небольшой тест API с точным ID модели и запишите структуру ответа, которую будет обрабатывать ваше приложение.

Часто задаваемые вопросы

Доступен ли Nemotron 3 Nano 30B A3B на Novita AI?

Да. Модель указана на Novita AI как Serverless LLM с ID модели nvidia/nemotron-3-nano-30b-a3b.

Какое окно контекста у Nemotron 3 Nano 30B A3B?

Novita указывает окно контекста 256K и максимум 32 768 выходных токенов для nvidia/nemotron-3-nano-30b-a3b.

Сколько стоит API Nemotron 3 Nano 30B A3B на Novita AI?

По состоянию на 11 июня 2026 года Novita указывает цены $0.05 за миллион входных токенов и $0.20 за миллион выходных токенов.

Поддерживает ли модель function calling и structured outputs?

Страница модели Novita указывает function calling и structured outputs как флаги функций для Nemotron 3 Nano 30B A3B. Проверьте свою точную схему инструмента или JSON-схему через API перед использованием в продакшене.

Какой эндпоинт мне использовать?

Используйте совместимый с OpenAI эндпоинт чат-завершений: https://api.novita.ai/openai/v1/chat/completions.