Novita AI での MiniMax M3 API クイックスタート

Novita AI での MiniMax M3 API クイックスタート

MiniMax M3 は、モデル ID minimax/minimax-m3、OpenAI 互換のベース URL、1,000,000 トークンのコンテキストウィンドウ、および長いプロンプト向けの段階的価格設定により、Novita AI 経由で利用可能です。このクイックスタートでは、セットアップを実用的に保ちます。モデル ID をコピーし、API キーを設定し、1 つの小さなリクエストを実行してから、基本が動作した後に長いプロンプトにスケールアップします。

このクイックスタートを使用するタイミング

このクイックスタートは、生のモデルホスティングを中心に構築する代わりに、サーバーレス API パスを通じて MiniMax M3 をテストしたい場合に使用します。これは、すでにプロンプトやワークロードを念頭に置いており、小さな概念実証を書く前にエンドポイント、モデル ID、トークン制限、価格詳細が必要な開発者向けです。

MiniMax M3 は、リクエストに大規模なコンテキスト予算、構造化出力、ツール指向のタスク、または長い入力に対するコーディング支援が必要な場合に適しています。Novita AI では、現在のモデルページに、受け入れ可能な入力モダリティとして textimagevideo、出力モダリティとして text、およびサーバーレスアクセス、関数呼び出し、構造化出力、推論、Anthropic API 互換性のサポートがリストされています。

これはベンチマークの詳細やローンチアナウンスではありません。目標はよりシンプルです。1 つのクリーンなリクエストを行い、その後 MiniMax M3 がアプリケーションに適しているかどうかを判断します。

ステップ 1: Novita API キーを取得する

Novita AI アカウントを作成または選択し、API キー設定を開き、サーバーサイドで使用するためのキーを生成します。キーをクライアントサイドコード、フロントエンドバンドル、公開リポジトリ、およびチーム外で共有される可能性のあるノートブックに含めないでください。

例を実行する前に、キーを環境変数として設定します。

export NOVITA_API_KEY="your_api_key_here"

チーム環境でテストする場合は、スコープ付きプロジェクトキー、またはアカウント設定でサポートされている場合は一時キーを使用します。公開デモ、共有実験、または偶発的な露出の後にキーをローテーションします。

ステップ 2: モデル ID とエンドポイントを確認する

コードを書く前に、MiniMax M3 の接続詳細を 1 か所にまとめておきます。

フィールド
モデル ID minimax/minimax-m3
ベース URL https://api.novita.ai/openai
チャット補完 URL https://api.novita.ai/openai/v1/chat/completions
コンテキストウィンドウ 1,000,000 トークン
最大出力 131,072 トークン
入力 テキスト、画像、動画
出力 テキスト
サーバーレスサポート サポート
関数呼び出し サポート
構造化出力 サポート
推論 サポート
Anthropic API 互換性 サポート

出荷前に MiniMax M3 モデルドキュメント を確認してください。可用性、価格、制限が変更される可能性があります。

ステップ 3: 最初のリクエストを送信する

短いテキストのみのチャットリクエストから始めます。大きなプロンプトを追加する前に、認証、ルーティング、応答解析をデバッグする方がはるかに簡単です。

最初のプロンプトでは、決定論的でチェックしやすい出力を求めます。例: 長いコンテキストのコードレビュープロセスにおける主な実装リスクを要約してください。

最初の呼び出しでは max_tokens を控えめに保ちます。MiniMax M3 はより長い出力をサポートしていますが、最初の仕事は統合が機能することを確認することです。

ステップ 4: 応答を読む

OpenAI 互換のチャット補完応答は、通常、choices[0].message.content にアシスタントの回答を返します。

また、ランタイムが公開するリクエスト ID や応答メタデータをログに記録します。これらの詳細は、リクエストが失敗したり遅くなったりした場合に役立ちます。コスト追跡のために、プロンプトサイズ、出力サイズ、ワークロードがキャッシュされたコンテキストを使用する場合はキャッシュ読み取り使用量、およびリクエストが長いコンテキストの価格帯に入ったかどうかを記録します。

最初の出力を、プロンプトがユーザーに使用できる状態であることの証明として扱わないでください。統合が機能したら、実際のワークロードに似たプロンプト(長いコードベース、複数ファイルの指示、ツールスキーマ、構造化 JSON 出力、またはアプリケーションが必要とする場合はマルチモーダル入力)をテストします。

ステップ 5: 価格、制限、一般的なエラーを確認する

MiniMax M3 は Novita AI で段階的価格設定を使用します。プロンプトが長いコンテキスト帯域に入ると価格が変わります。

プロンプトサイズ帯域 入力 出力 キャッシュ読み取り
524,288 トークン未満 100 万トークンあたり $0.30 100 万トークンあたり $1.20 100 万トークンあたり $0.06
524,288 ~ 1,000,000 トークン 100 万トークンあたり $1.20 100 万トークンあたり $4.80 100 万トークンあたり $0.24

この分割は重要です。50,000 トークンのテストと 100 万トークン近いリクエストでは、価格は同じではありません。コストを見積もる際には、プロンプトの長さ、予想出力長、キャッシュ動作、再試行、およびユーザーが非常に大きなリクエストを送信する頻度を含めてください。

MiniMax M3 は現在、1,000,000 トークンのコンテキストウィンドウと 131,072 トークンの最大出力を持っています。出荷前に、最新の価格表とアカウントに適用されるレート制限のガイダンスについて、MiniMax M3 モデルドキュメント を再確認してください。

一般的なセットアップエラーは次のとおりです。

  • Authorization ヘッダーがない、または形式が正しくない。
  • 表示名ではなく minimax/minimax-m3 などの間違ったモデル ID を使用している。
  • 間違ったベース URL にリクエストを送信している。
  • max_tokens をアプリケーションが安全に消費できるよりも高く設定している。
  • 高い価格帯を考慮せずに長いコンテキストのプロンプトをテストしている。
  • クライアントライブラリがサポートしない形式でマルチモーダルコンテンツを渡している。

Python の例

この例では、Novita AI の OpenAI 互換ベース URL とともに OpenAI Python SDK を使用しています。

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai/v1",
)

response = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[
        {
            "role": "system",
            "content": "あなたはソフトウェアチーム向けの簡潔なAPIアシスタントです。",
        },
        {
            "role": "user",
            "content": "長いコンテキストのコードレビュープロセスにおける主な実装リスクを要約してください。",
        },
    ],
    temperature=0.2,
    max_tokens=600,
)

answer = response.choices[0].message.content
print(answer)

cURL でリクエストを送信する

cURL を使用する場合は、JSON ボディを payload 変数に保持します。これにより、リクエストが読みやすくなり、完全な JSON ボディを 1 つのコマンドに詰め込むのを避けられます。

payload='{
  "model": "minimax/minimax-m3",
  "messages": [
    {
      "role": "system",
      "content": "あなたはソフトウェアチーム向けの簡潔なAPIアシスタントです。"
    },
    {
      "role": "user",
      "content": "長いコンテキストのコードレビュープロセスにおける主な実装リスクを要約してください。"
    }
  ],
  "temperature": 0.2,
  "max_tokens": 600
}'

curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data "$payload"

主要パラメータ

パラメータ 制御内容 最初の値
model リクエストに応答するホストモデル minimax/minimax-m3
messages システムとユーザーの指示 短いテキストのみのプロンプト
temperature 出力のばらつき 再現可能なテスト用に 0.2
max_tokens 生成される最大出力 小さい上限、後で引き上げる
stream トークンを段階的にストリーミングするかどうか 基本呼び出しが機能した後に有効化
tools 関数/ツールの定義 一度に 1 つのツールを追加
response_format 構造化応答の形状 使用前に出力を検証

マルチモーダル入力の場合、画像や動画のプロンプトに依存する前に、SDK または API ドキュメントで正確なリクエスト形式を確認してください。モデルページにはモダリティサポートがリストされていますが、リクエストのフォーマットは使用するクライアントパスによって異なります。

トラブルシューティング

認証が失敗する

NOVITA_API_KEY がリクエストを実行する同じシェルまたはランタイムに設定されていることを確認してください。認証ヘッダーは Bearer トークン形式を使用する必要があります。

API がモデルを見つけられない

リクエストで minimax/minimax-m3 を使用していることを確認してください。MiniMax M3minimax-m3、またはブログのタイトルではありません。モデル表示名とモデル ID は交換可能ではありません。

短いプロンプトでは機能するが、長いプロンプトでは失敗する

可視の単語数だけでなく、シリアライズされた入力を測定します。ツールスキーマ、取得ドキュメント、画像参照、会話履歴はすべてカウントされます。1,000,000 トークンに近づいている場合は、より小さなプロンプトを試し、再試行する前にトランケーションまたは取得ロジックを追加します。

請求額が予想より高い

プロンプトが 524,288 ~ 1,000,000 トークンの価格帯に入ったかどうかを確認してください。MiniMax M3 はその長いコンテキスト層で、入力、出力、キャッシュ読み取りの価格が高くなっています。

構造化出力に一貫性がない

より小さなスキーマ、低い温度、明示的な検証から始めてください。アプリケーションが厳密な JSON を必要とする場合は、すべての応答が解析されることを想定するのではなく、検証と再試行ロジックで不正な形式の応答を処理してください。

ツール呼び出しが関数スキーマと一致しない

一度に 1 つのツールをテストしてください。関数名、説明、パラメータスキーマを明確にし、ツール呼び出しを実行する前にサーバーサイド検証を追加してください。

FAQ

MiniMax M3 は Novita AI API 経由で利用できますか?

はい。現在の Novita AI モデルページには、MiniMax M3 がモデル ID minimax/minimax-m3 でサーバーレス API アクセスを通じて利用可能とリストされています。

MiniMax M3 のモデル ID は何ですか?

minimax/minimax-m3 を使用してください。

どのベース URL を使用すればよいですか?

OpenAI 互換のベース URL として https://api.novita.ai/openai を使用してください。OpenAI SDK では、SDK のベース URL を https://api.novita.ai/openai/v1 に設定します。

Novita AI での MiniMax M3 の料金はいくらですか?

MiniMax M3 の価格は段階的です。524,288 トークン未満のプロンプトの場合、入力は 100 万トークンあたり $0.30、出力は 100 万トークンあたり $1.20、キャッシュ読み取りは 100 万トークンあたり $0.06 です。524,288 ~ 1,000,000 トークンのプロンプトの場合、入力は 100 万トークンあたり $1.20、出力は 100 万トークンあたり $4.80、キャッシュ読み取りは 100 万トークンあたり $0.24 です。

MiniMax M3 はストリーミングまたはマルチモーダル入力をサポートしていますか?

現在のモデルページには、テキスト、画像、動画の入力とテキスト出力がリストされています。ストリーミング動作は、本番環境で使用する前に OpenAI 互換のチャット補完パスを通じてテストする必要があります。

最大コンテキストウィンドウは何ですか?

MiniMax M3 は現在、1,000,000 トークンのコンテキストウィンドウと 131,072 トークンの最大出力を持っています。