Быстрый старт с MiniMax M3 API на Novita AI

Быстрый старт с MiniMax M3 API на Novita AI

MiniMax M3 доступен через Novita AI с идентификатором модели minimax/minimax-m3, совместимой с OpenAI базовой URL-адресом, окном контекста в 1 000 000 токенов и многоуровневым ценообразованием для длинных запросов. Этот краткий старт сохраняет практичность настройки: скопируйте идентификатор модели, установите свой API-ключ, выполните один небольшой запрос, а затем масштабируйтесь до более длинных, когда основа заработает.

Когда использовать этот краткий старт

Используйте этот краткий старт, когда хотите протестировать MiniMax M3 через серверный API-путь, а не строить вокруг сырого хостинга модели. Он предназначен для разработчиков, у которых уже есть запрос или рабочая нагрузка на уме, и которым нужна конечная точка, идентификатор модели, лимиты токенов и детали ценообразования перед написанием небольшого proof of concept.

MiniMax M3 отлично подходит, когда ваш запрос требует большого бюджета контекста, структурированного вывода, задач, ориентированных на инструменты, или помощи в кодировании при длинных входах. На Novita AI текущая страница модели указывает text, image и video как принимаемые модальности ввода, text как модальность вывода, а также поддержку серверного доступа, вызова функций, структурированного вывода, рассуждений и совместимости с Anthropic API.

Это не глубокое погружение в бенчмарки или анонс запуска. Цель проще: сделать один чистый запрос, затем решить, подходит ли MiniMax M3 для вашего приложения.

Шаг 1: Получите свой API-ключ Novita

Создайте или выберите учетную запись Novita AI, откройте настройки API-ключа и сгенерируйте ключ для использования на серверной стороне. Храните ключ вне клиентского кода, фронтенд-сборок, публичных репозиториев и записных книжек, которые могут быть распространены за пределами вашей команды.

Установите ключ как переменную окружения перед запуском примеров:

export NOVITA_API_KEY="your_api_key_here"

Если вы тестируете в командной среде, используйте ограниченный ключ проекта или временный ключ, если это поддерживается настройками вашей учетной записи. Ротируйте ключ после публичных демонстраций, совместных экспериментов или любого случайного раскрытия.

Шаг 2: Подтвердите идентификатор модели и конечную точку

Прежде чем писать код, держите детали подключения MiniMax M3 в одном месте:

Поле Значение
Идентификатор модели minimax/minimax-m3
Базовый URL https://api.novita.ai/openai
URL чат-завершений https://api.novita.ai/openai/v1/chat/completions
Окно контекста 1 000 000 токенов
Максимальный вывод 131 072 токенов
Входные данные Текст, изображение, видео
Выходные данные Текст
Серверная поддержка Поддерживается
Вызов функций Поддерживается
Структурированный вывод Поддерживается
Рассуждения Поддерживается
Совместимость с Anthropic API Поддерживается

Проверьте документацию модели MiniMax M3 перед запуском, так как доступность, цены и лимиты могут измениться.

Шаг 3: Отправьте свой первый запрос

Начните с короткого текстового чат-запроса. Гораздо проще отлаживать аутентификацию, маршрутизацию и разбор ответа до добавления большого запроса.

Для первого запроса попросите детерминированный, легко проверяемый вывод. Например: Summarize the main implementation risks in a long-context code review process.

Держите max_tokens скромным для первого вызова. MiniMax M3 поддерживает гораздо более длинный вывод, но первая задача — подтвердить, что интеграция работает.

Шаг 4: Прочитайте ответ

Ответ чат-завершения, совместимый с OpenAI, обычно возвращает ответ ассистента в choices[0].message.content.

Также логируйте идентификатор запроса или метаданные ответа, которые предоставляет ваша среда выполнения. Эти детали полезны, когда запрос не удается или работает медленно. Для отслеживания затрат записывайте размер запроса, размер вывода, использование чтения из кэша, если ваша рабочая нагрузка использует кэшированный контекст, и попал ли запрос в диапазон цен длинного контекста.

Не рассматривайте первый вывод как доказательство того, что ваш запрос готов для пользователей. Когда интеграция заработает, тестируйте запросы, похожие на вашу реальную рабочую нагрузку: длинные кодовые базы, многофайловые инструкции, схемы инструментов, структурированный JSON-вывод или мультимодальные входные данные, если они нужны вашему приложению.

Шаг 5: Проверьте цены, лимиты и распространенные ошибки

MiniMax M3 использует многоуровневое ценообразование на Novita AI. Цена меняется, когда запрос попадает в диапазон длинного контекста:

Диапазон размера запроса Ввод Вывод Чтение из кэша
Менее 524 288 токенов $0.30 за 1M токенов $1.20 за 1M токенов $0.06 за 1M токенов
От 524 288 до 1 000 000 токенов $1.20 за 1M токенов $4.80 за 1M токенов $0.24 за 1M токенов

Это разделение имеет значение. Тест с 50 000 токенов и запрос почти на 1M токенов оцениваются не одинаково. При оценке затрат учитывайте длину запроса, ожидаемую длину вывода, поведение кэша, повторные попытки и то, как часто пользователи могут отправлять очень большие запросы.

MiniMax M3 в настоящее время имеет окно контекста в 1 000 000 токенов и максимальный вывод в 131 072 токена. Перед запуском повторно проверьте документацию модели MiniMax M3 для последней таблицы цен и любых рекомендаций по ограничению скорости, привязанных к вашей учетной записи.

Распространенные ошибки настройки включают:

  • Отсутствующий или неправильный заголовок Authorization.
  • Использование неправильного идентификатора модели, например, отображаемого имени вместо minimax/minimax-m3.
  • Отправка запросов на неправильный базовый URL.
  • Установка max_tokens выше, чем может безопасно потреблять ваше приложение.
  • Тестирование запросов с длинным контекстом без учета более высокого ценового диапазона.
  • Передача мультимодального контента в формате, который не поддерживается вашей клиентской библиотекой.

Пример на Python

Этот пример использует OpenAI Python SDK с совместимым с OpenAI базовым URL от Novita AI.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai/v1",
)

response = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[
        {
            "role": "system",
            "content": "You are a concise API assistant for software teams.",
        },
        {
            "role": "user",
            "content": "Summarize the main implementation risks in a long-context code review process.",
        },
    ],
    temperature=0.2,
    max_tokens=600,
)

answer = response.choices[0].message.content
print(answer)

Отправьте запрос с помощью cURL

Если вы предпочитаете cURL, храните JSON-тело в переменной payload. Это делает запрос более читаемым и позволяет избежать записи полного JSON-тела в одну команду.

payload='{
  "model": "minimax/minimax-m3",
  "messages": [
    {
      "role": "system",
      "content": "You are a concise API assistant for software teams."
    },
    {
      "role": "user",
      "content": "Summarize the main implementation risks in a long-context code review process."
    }
  ],
  "temperature": 0.2,
  "max_tokens": 600
}'

curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data "$payload"

Ключевые параметры

Параметр Что контролирует Начните с
model Какая размещенная модель отвечает на запрос minimax/minimax-m3
messages Инструкции системы и пользователя Короткий текстовый запрос
temperature Изменчивость вывода 0.2 для повторяемых тестов
max_tokens Максимальный сгенерированный вывод Небольшой лимит, затем увеличьте
stream Потоковая передача токенов Включите после того, как базовый вызов заработает
tools Определения функций/инструментов Добавляйте по одному инструменту за раз
response_format Форма структурированного ответа Проверьте вывод перед использованием

Для мультимодальных входных данных подтвердите точную форму запроса в вашей SDK или документации API, прежде чем полагаться на запросы с изображениями или видео. Страница модели перечисляет поддержку модальностей, но форматирование запроса зависит от используемого вами клиентского пути.

Устранение неполадок

Ошибка аутентификации

Убедитесь, что NOVITA_API_KEY установлена в той же оболочке или среде выполнения, где вы запускаете запрос. Заголовок авторизации должен использовать формат bearer-токена.

API не может найти модель

Подтвердите, что в запросе используется minimax/minimax-m3, а не MiniMax M3, minimax-m3 или название блога. Отображаемые имена моделей и идентификаторы моделей не взаимозаменяемы.

Запрос работает для коротких запросов, но не удается для длинных

Измеряйте сериализованный ввод, а не только видимое количество слов. Схемы инструментов, извлеченные документы, ссылки на изображения и история диалога — все учитывается. Если вы приближаетесь к 1 000 000 токенов, попробуйте меньший запрос и добавьте логику усечения или извлечения перед повторной попыткой.

Счет выше ожидаемого

Проверьте, попал ли запрос в ценовой диапазон от 524 288 до 1 000 000 токенов. MiniMax M3 имеет более высокие цены на ввод, вывод и чтение из кэша в этом уровне длинного контекста.

Структурированный вывод непостоянен

Начните с меньшей схемы, более низкой температуры и явной проверки. Если ваше приложение требует строгий JSON, обрабатывайте некорректные ответы с помощью проверки и логики повторных попыток, а не предполагайте, что каждый ответ будет разобран.

Вызовы инструментов не соответствуют схеме вашей функции

Тестируйте по одному инструменту за раз. Держите имена функций, описания и схемы параметров понятными и добавляйте проверку на стороне сервера перед выполнением любого вызова инструмента.

Часто задаваемые вопросы

Доступен ли MiniMax M3 через API Novita AI?

Да. Текущая страница модели Novita AI указывает MiniMax M3 как доступный через серверный API с идентификатором модели minimax/minimax-m3.

Какой идентификатор модели для MiniMax M3?

Используйте minimax/minimax-m3.

Какой базовый URL следует использовать?

Используйте https://api.novita.ai/openai в качестве совместимой с OpenAI базовой URL. В SDK OpenAI установите базовый URL SDK на https://api.novita.ai/openai/v1.

Сколько стоит MiniMax M3 на Novita AI?

Цены MiniMax M3 многоуровневые. Для запросов ниже 524 288 токенов ввод стоит $0.30 за 1M токенов, вывод $1.20 за 1M токенов, чтение из кэша $0.06 за 1M токенов. Для запросов от 524 288 до 1 000 000 токенов ввод стоит $1.20 за 1M токенов, вывод $4.80 за 1M токенов, чтение из кэша $0.24 за 1M токенов.

Поддерживает ли MiniMax M3 потоковую передачу или мультимодальный ввод?

Текущая страница модели указывает ввод текста, изображений и видео с выводом текста. Поведение потоковой передачи следует протестировать через совместимый с OpenAI путь чат-завершений перед использованием в производстве.

Какое максимальное окно контекста?

MiniMax M3 в настоящее время имеет окно контекста в 1 000 000 токенов и максимальный вывод в 131 072 токена.