Шаг 3.7 Flash в Novita AI: Быстрый старт с мультимодальным API

Содержание

Что нужно иметь перед вызовом API?
Какие факты о Step 3.7 Flash важны для реализации?
Как вызвать Step 3.7 Flash с помощью cURL?
Как вызвать Step 3.7 Flash из Python?
Как следует обрабатывать мультимодальный ввод?
Как работают вызов функций и структурированные выходы?
Как командам следует планировать бюджет и тестировать перед продакшеном?
Часто задаваемые вопросы
Рекомендуемые статьи

Step 3.7 Flash доступен в Novita AI как Serverless LLM с идентификатором модели stepfun/step-3.7-flash, совместимым с OpenAI chat/completions, поддержкой текстового, графического и видео-ввода, текстовым выводом, вызовом функций, структурированными выходами и режимом рассуждений, указанными на странице модели. Это краткое руководство фокусируется на рабочем процессе разработчика: как вызвать API, какие паттерны запросов безопасно использовать сегодня, какие параметры ценообразования учитывать в бюджете, и на что обратить внимание перед добавлением мультимодальности или режима рассуждений в продакшн. Для более широкого обзора возможностей и позиционирования модели обратитесь к обзору API Step 3.7 Flash.

Что нужно иметь перед вызовом API?

Начните с трёх элементов конфигурации:

Элемент	Значение
API-ключ	Создайте и сохраните API-ключ Novita AI в переменной окружения, например `NOVITA_API_KEY`.
Базовый URL, совместимый с OpenAI	`https://api.novita.ai/openai`
Эндпоинт чат-дополнений	`POST https://api.novita.ai/openai/v1/chat/completions`
Идентификатор модели	`stepfun/step-3.7-flash`

Индекс документации Novita AI содержит базовый URL, совместимый с OpenAI, а справочник API чат-дополнений описывает поля запроса и ответа для POST https://api.novita.ai/openai/v1/chat/completions.

Не храните API-ключ в системе контроля версий. При локальной разработке экспортируйте его в оболочке. В продакшене загружайте его из менеджера секретов:

export NOVITA_API_KEY="your_api_key"

Если ваше приложение уже использует совместимый с OpenAI API чат-дополнений, путь миграции обычно невелик: укажите клиенту базовый URL Novita AI, установите токен авторизации Bearer и используйте идентификатор модели Step 3.7 Flash.

Какие факты о Step 3.7 Flash важны для реализации?

Используйте точный идентификатор модели в коде и отображаемое имя в пользовательском интерфейсе. Текущая страница модели Novita указывает Step 3.7 Flash как чат-модель в серии StepFun.

Поле	Текущее значение в Novita
Отображаемое имя	Step 3.7 Flash
API-идентификатор модели	`stepfun/step-3.7-flash`
Семейство моделей, указанное Novita	StepFun
Тип хостинга	Serverless LLM
Эндпоинт	`chat/completions`
Модальности ввода	Текст, изображение, видео
Модальности вывода	Текст
Контекстное окно	262 144 токена
Максимальное количество выходных токенов	256 000
Перечисленные возможности	Serverless, вызов функций, структурированные выходы, режим рассуждений
Перечисленные метки	MoE, >100B, NEW, Featured
Лимит T1 по умолчанию	30 RPM и 50 000 000 TPM

По состоянию на 18 июня 2026 года Novita указывает следующие цены на токены для stepfun/step-3.7-flash:

Тип токена	Указанная цена
Входные токены	$0.20 за 1M токенов
Выходные токены	$1.15 за 1M токенов
Кэшированные входные токены	$0.04 за 1M токенов

Цены, доступность моделей, лимиты запросов и поддерживаемые параметры запросов могут меняться. Проверьте страницу модели Step 3.7 Flash и страницу цен Novita AI перед проверкой закупок, запуском в продакшн или любыми клиентскими обязательствами по ценообразованию.

Как вызвать Step 3.7 Flash с помощью cURL?

Для первого теста оставьте запрос текстовым. Это подтвердит аутентификацию, маршрутизацию модели, обработку ответа и базовую генерацию до того, как вы добавите инструменты, схемы, изображения или видео.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "stepfun/step-3.7-flash",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise technical assistant."
      },
      {
        "role": "user",
        "content": "Create a four-step checklist for testing a multimodal support bot before release."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Успешный ответ соответствует структуре чат-дополнений, описанной Novita AI: массив choices, сообщение со сгенерированным content, метаданные created/model и объект usage, когда использование возвращается. Для потоковых ответов в справочнике API указано, что использование появляется в последнем фрагменте ответа.

Используйте этот тест для проверки:

API-ключ действителен.
Идентификатор модели принят.
Ваш клиент может парсить choices[0].message.content.
Ваше логирование фиксирует количество использованных токенов (prompt, completion, total) без хранения секретов.
Ваш таймаут и политика повторных попыток соответствуют размеру запроса.

Как вызвать Step 3.7 Flash из Python?

Паттерн OpenAI Python SDK работает с Novita AI, если вы установите базовый URL Novita. Установите и зафиксируйте версию SDK в своём проекте в соответствии с политикой зависимостей.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {"role": "system", "content": "You are a concise technical assistant."},
        {
            "role": "user",
            "content": "Summarize the release risks for a customer support workflow that accepts screenshots and long text tickets.",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)

Для прикладного кода оберните этот вызов в небольшой модельный шлюз вместо того, чтобы разбрасывать прямые API-вызовы по всей кодовой базе. Шлюз позволяет установить лимиты токенов по умолчанию, настроить таймауты для каждого маршрута, нормализовать ошибки и переключать модели для оценки без изменения бизнес-логики.

Практичная продакшн-обёртка должна фиксировать:

model, prompt_tokens, completion_tokens и total_tokens.
Задержку запроса и количество повторных попыток.
HTTP-статус и категорию ошибки API.
Использовались ли инструменты, JSON-схема, графический или видео-ввод.
Сокращённую сводку запроса без API-ключей и конфиденциального пользовательского контента.

Эта телеметрия важна, поскольку Step 3.7 Flash имеет большое контекстное окно и высокий лимит выходных токенов. Эти лимиты полезны, но продакшн-системы всё равно должны устанавливать явный max_tokens, отклонять слишком большие пользовательские загрузки до вызова модели и контролировать длину вывода.

Как следует обрабатывать мультимодальный ввод?

Novita указывает текст, изображение и видео как модальности ввода для Step 3.7 Flash и текст как модальность вывода. Относитесь к этому как к границе поддерживаемых возможностей, а затем проверьте точную структуру полезной нагрузки в текущей документации или консоли Novita перед запуском мультимодальной интеграции.

Для быстрого старта используйте следующий порядок:

Выполните текстовый тест.
Добавьте один графический ввод, используя текущий задокументированный формат сообщений Novita.
Проверьте качество и структуру ответа на вашей реальной задаче.
Добавляйте большие пакеты изображений или видео только после того, как подтвердите формат запроса, ограничения по размеру, задержку и стоимость.

Не предполагайте, что каждая совместимая с OpenAI мультимодальная структура полезной нагрузки принимается каждой моделью, размещённой в Novita. Страница модели Step 3.7 Flash подтверждает поддержку графического и видео-ввода, но примеры видео-запросов более чувствительны к обработке файлов, доступу по URL, длительности, размеру и форматированию, специфичному для модели. Если текущая документация или пример в консоли не показывают точную структуру видео-запроса, которая вам нужна, не копируйте её из документации другого провайдера.

Хорошие первые варианты использования изображений включают:

Суммирование скриншота поддержки вместе с текстом обращения пользователя.
Извлечение состояния пользовательского интерфейса из скриншота продукта для внутреннего ассистента сортировки.
Просмотр визуального QA-изображения и создание текстового чек-листа.

Видео следует тестировать более консервативно. Начните с коротких клипов, запишите точную форму запроса, которая работает, зафиксируйте задержку и использование токенов, и определите поведение при сбое, когда видео-ввод отклонён, слишком велик или слишком медлителен для вашего маршрута.

Как работают вызов функций и структурированные выходы?

Step 3.7 Flash указан с поддержкой вызова функций и структурированных выходов. В API чат-дополнений вызов функций реализуется через tools, а структурированные выходы — через response_format.

Используйте вызов функций, когда модель должна выбрать инструмент и вернуть JSON-аргументы вместо прямого ответа пользователю. В справочнике API описаны инструменты-функции с type function, function.name, description, JSON Schema parameters и необязательной настройкой strict.

tools = [
    {
        "type": "function",
        "function": {
            "name": "create_support_ticket",
            "description": "Create an internal support ticket from a user-reported issue.",
            "parameters": {
                "type": "object",
                "properties": {
                    "summary": {"type": "string"},
                    "priority": {
                        "type": "string",
                        "enum": ["low", "medium", "high"],
                    },
                    "needs_human_review": {"type": "boolean"},
                },
                "required": ["summary", "priority", "needs_human_review"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {
            "role": "user",
            "content": "The payment settings page returns a 500 error after I upload a screenshot.",
        }
    ],
    tools=tools,
    temperature=0.1,
)

Используйте структурированные выходы, когда вашему приложению нужен валидированный JSON-ответ и не требуется внешний вызов инструмента. Справочник API чат-дополнений Novita описывает response_format с json_schema и отмечает, что строгий режим поддерживает подмножество JSON Schema. На ранних этапах используйте небольшие схемы, избегайте экзотических возможностей схем и отключайтесь при ошибке, если ответ модели не проходит валидацию.

Что касается режима рассуждений, различайте возможности модели и поведение запроса. Страница модели Step 3.7 Flash указывает режим рассуждений как функцию, в то время как справочник API чат-дополнений описывает параметры, связанные с рассуждениями, с пометками о поддержке, специфичной для модели. Прежде чем полагаться на поле рассуждений в продакшн-парсере, выполните API-тест с stepfun/step-3.7-flash и обработайте точную структуру ответа, которую получает ваша учётная запись.

Как командам следует планировать бюджет и тестировать перед продакшеном?

Используйте указанные цены на токены для оценки первоначального бюджета, затем проверьте на реальных логах использования. Step 3.7 Flash имеет разную цену для ввода, вывода и кэшированных чтений, поэтому длинные запросы, подробные выводы и повторяющийся контекст имеют разные профили стоимости. Если вы сравниваете Novita AI с другими провайдерами LLM API, руководство лучшие провайдеры LLM API 2026 охватывает уровни цен, лимиты запросов и компромиссы провайдеров. Для команд, которые всё ещё оценивают, какой инференс-провайдер подходит для рабочей нагрузки агента, статья выбор инференс-провайдера для AI-агентов подробно описывает ключевые критерии оценки.

Например, приложение, отправляющее большие стенограммы поддержки, может тратить большую часть бюджета на входные токены. Агент, запрашивающий длинные планы, может тратить больше на выходные токены. Рабочий процесс поиска или памяти, который повторно использует контекст, может выиграть от ценообразования на кэшированные чтения, если поведение кэширования применимо к развёрнутому паттерну запросов.

Перед продакшеном запустите оценочный набор, который включает:

Короткие текстовые запросы для проверки задержки и базового качества ответов.
Длинные контекстные запросы, близкие к вашей ожидаемой верхней границе, но не к максимальному контекстному окну.
Графические запросы, соответствующие вашему реальному источнику загрузки и обработке файлов.
Запросы с вызовом инструментов, где правильное поведение — вызвать функцию.
Запросы с JSON-схемой, намеренно тестирующие невалидные, отсутствующие и граничные поля.
Случаи сбоя для слишком большого ввода, отсутствующих медиафайлов, недействительных API-ключей и таймаутов.

Не направляйте весь трафик на новую модель, основываясь только на списке функций. Фиче-флаги говорят вам, что доступно; оценка говорит вам, следует ли модель вашим инструкциям, схемам, правилам безопасности и бюджету задержки на вашей рабочей нагрузке.

Часто задаваемые вопросы

Доступен ли Step 3.7 Flash через Novita AI?

Да. Novita указывает Step 3.7 Flash как Serverless LLM с API-идентификатором модели stepfun/step-3.7-flash.

Какой эндпоинт следует использовать для Step 3.7 Flash?

Используйте эндпоинт чат-дополнений, совместимый с OpenAI: POST https://api.novita.ai/openai/v1/chat/completions.

Поддерживает ли Step 3.7 Flash графический и видео-ввод?

Novita указывает текст, изображение и видео как модальности ввода для Step 3.7 Flash, а текст — как модальность вывода. Используйте текущую документацию Novita или примеры в консоли для проверки точной структуры графического или видео-запроса перед продакшеном.

Сколько стоит Step 3.7 Flash?

По состоянию на 18 июня 2026 года Novita указывает цену stepfun/step-3.7-flash как $0.20 за 1M входных токенов, $1.15 за 1M выходных токенов и $0.04 за 1M кэшированных входных токенов.

Поддерживает ли Step 3.7 Flash вызов функций и структурированные выходы?

Да. Novita указывает вызов функций и структурированные выходы как возможности Step 3.7 Flash. Используйте tools для вызова функций и response_format для структурированных выходов, затем протестируйте вашу точную схему и парсер перед продакшеном.

Стоит ли копировать видео-запрос от другого провайдера?

Нет. Даже если API совместимы с OpenAI, обработка мультимодальных файлов и URL может различаться. Используйте структуру запроса, проверенную в текущей документации Novita, примерах в консоли или вашем собственном успешном API-тесте для stepfun/step-3.7-flash.

Шаг 3.7 Flash в Novita AI: Быстрый старт с мультимодальным API

Что нужно иметь перед вызовом API?

Какие факты о Step 3.7 Flash важны для реализации?

Как вызвать Step 3.7 Flash с помощью cURL?

Как вызвать Step 3.7 Flash из Python?

Как следует обрабатывать мультимодальный ввод?

Как работают вызов функций и структурированные выходы?

Как командам следует планировать бюджет и тестировать перед продакшеном?

Часто задаваемые вопросы

Доступен ли Step 3.7 Flash через Novita AI?

Какой эндпоинт следует использовать для Step 3.7 Flash?

Поддерживает ли Step 3.7 Flash графический и видео-ввод?

Сколько стоит Step 3.7 Flash?

Поддерживает ли Step 3.7 Flash вызов функций и структурированные выходы?

Стоит ли копировать видео-запрос от другого провайдера?

Рекомендуемые статьи

Product

RESOURCES

Partners

Company

Что нужно иметь перед вызовом API?

Какие факты о Step 3.7 Flash важны для реализации?

Как вызвать Step 3.7 Flash с помощью cURL?

Как вызвать Step 3.7 Flash из Python?

Как следует обрабатывать мультимодальный ввод?

Как работают вызов функций и структурированные выходы?

Как командам следует планировать бюджет и тестировать перед продакшеном?

Часто задаваемые вопросы

Доступен ли Step 3.7 Flash через Novita AI?

Какой эндпоинт следует использовать для Step 3.7 Flash?

Поддерживает ли Step 3.7 Flash графический и видео-ввод?

Сколько стоит Step 3.7 Flash?

Поддерживает ли Step 3.7 Flash вызов функций и структурированные выходы?

Стоит ли копировать видео-запрос от другого провайдера?

Рекомендуемые статьи

Похожие статьи

Product

RESOURCES

Partners

Company