ステップ 3.7 Flash (Novita AI)：マルチモーダルクイックスタート

API を呼び出す前に必要なものは？
実装に関わる Step 3.7 Flash の事実は？
cURL で Step 3.7 Flash を呼び出すには？
Python から Step 3.7 Flash を呼び出すには？
マルチモーダル入力はどのように扱うべきか？
関数呼び出しと構造化出力はどのように機能するか？
本番前の予算策定とテストはどのように行うべきか？
FAQ
おすすめ記事

Step 3.7 Flash は、モデル ID stepfun/step-3.7-flash を持つ Serverless LLM として Novita AI で利用できます。OpenAI 互換の chat/completions、テキスト、画像、動画入力のサポート、テキスト出力、関数呼び出し、構造化出力、推論がモデルページに記載されています。このクイックスタートでは、開発者ワークフローに焦点を当てます：API の呼び出し方、現在安全に使えるリクエストパターン、予算を組むべき価格設定フィールド、そして本番環境にマルチモーダルや推論の動作を組み込む前に注意すべき点について。モデルの機能と位置付けをより広く知りたい場合は、Step 3.7 Flash API 概要を参照してください。

API を呼び出す前に必要なものは？

以下の3つの設定項目から始めます。

項目	値
API キー	Novita AI の API キーを作成し、`NOVITA_API_KEY` などの環境変数に保存します。
OpenAI 互換のベース URL	`https://api.novita.ai/openai`
Chat completions エンドポイント	`POST https://api.novita.ai/openai/v1/chat/completions`
モデル ID	`stepfun/step-3.7-flash`

Novita AI ドキュメントインデックスには OpenAI 互換のベース URL が記載されており、chat completions API リファレンスには POST https://api.novita.ai/openai/v1/chat/completions のリクエストとレスポンスのフィールドが文書化されています。

API キーをソースコード管理外に保管してください。ローカル開発ではシェルにエクスポートします。本番環境ではシークレットマネージャーから読み込みます：

export NOVITA_API_KEY="your_api_key"

アプリケーションがすでに OpenAI 互換の chat completions を使用している場合、移行パスは通常小さいものです：クライアントを Novita AI のベース URL に向け、Authorization ベアラートークンを設定し、Step 3.7 Flash のモデル ID を使用します。

実装に関わる Step 3.7 Flash の事実は？

コード内では正確なモデル ID を、ユーザー向け UI では表示名を使用します。現在の Novita モデルページでは、Step 3.7 Flash は StepFun シリーズの Chat モデルとしてリストされています。

フィールド	現在の Novita の値
表示名	Step 3.7 Flash
API モデル ID	`stepfun/step-3.7-flash`
Novita が示すモデルファミリー	StepFun
ホスティングタイプ	Serverless LLM
エンドポイント	`chat/completions`
入力モダリティ	テキスト、画像、動画
出力モダリティ	テキスト
コンテキストウィンドウ	262,144 トークン
最大出力トークン数	256,000
リストされている機能	Serverless、関数呼び出し、構造化出力、推論
リストされているラベル	MoE、>100B、NEW、Featured
デフォルトの T1 レート制限	30 RPM、50,000,000 TPM

2026年6月18日現在、Novita は stepfun/step-3.7-flash に対して以下のトークン価格を掲載しています：

トークンタイプ	掲載価格
入力トークン	1M トークンあたり $0.20
出力トークン	1M トークンあたり $1.15
キャッシュ読み取り入力トークン	1M トークンあたり $0.04

価格、モデルの可用性、レート制限、サポートされるリクエストパラメータは変更される可能性があります。調達レビュー、本番リリース、顧客向けの価格コミットメントの前に、Step 3.7 Flash モデルページおよび Novita AI 価格ページを確認してください。

cURL で Step 3.7 Flash を呼び出すには？

最初のスモークテストでは、リクエストはテキストのみにしておきます。これにより、認証、モデルルーティング、レスポンス解析、基本的な生成が確認できます。その後、ツール、スキーマ、画像、動画を追加します。

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "stepfun/step-3.7-flash",
    "messages": [
      {
        "role": "system",
        "content": "あなたは簡潔なテクニカルアシスタントです。"
      },
      {
        "role": "user",
        "content": "リリース前にマルチモーダルサポートボットをテストするための4ステップのチェックリストを作成してください。"
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

成功したレスポンスは、Novita AI によって文書化された chat completions の形状に従います： choices 配列、生成された content を持つメッセージ、created/model メタデータ、使用量が返される場合には usage オブジェクト。ストリーミングレスポンスの場合、API リファレンスによると使用量は最後のレスポンスチャンクに表示されます。

このスモークテストで以下を確認してください：

API キーが有効である。
モデル ID が受け入れられる。
クライアントが choices[0].message.content を解析できる。
ログがプロンプト、補完、合計トークン使用量を秘密情報を保存せずにキャプチャしている。
タイムアウトとリトライポリシーがプロンプトのサイズに適切である。

Python から Step 3.7 Flash を呼び出すには？

OpenAI Python SDK のパターンは、Novita のベース URL を設定すれば Novita AI でも動作します。SDK をインストールし、依存関係ポリシーに従ってバージョンを固定してください。

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {"role": "system", "content": "あなたは簡潔なテクニカルアシスタントです。"},
        {
            "role": "user",
            "content": "スクリーンショットと長いテキストチケットを受け付けるカスタマーサポートワークフローのリリースリスクを要約してください。",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)

アプリケーションコードでは、生の API 呼び出しをコードベース全体に散らばらせる代わりに、小さなモデルゲートウェイでラップしてください。ゲートウェイを使用すると、デフォルトのトークン制限を適用し、ルートごとのタイムアウトを設定し、エラーを正規化し、ビジネスロジックを変更せずに評価のためにモデルを切り替えることができます。

実用的な本番ラッパーがキャプチャすべき事項：

model、prompt_tokens、completion_tokens、total_tokens。
リクエストレイテンシとリトライ回数。
HTTP ステータスと API エラーカテゴリ。
ツール、JSON スキーマ、画像入力、動画入力が使用されたかどうか。
API キーや機密性の高いユーザーコンテンツを除外した、編集済みのリクエストサマリー。

このテレメトリは、Step 3.7 Flash が大きなコンテキストウィンドウと高い最大出力制限を持つため重要です。これらの制限は便利ですが、本番システムでは明示的な max_tokens を設定し、モデル呼び出しの前に過大なユーザーアップロードを拒否し、出力長を監視する必要があります。

マルチモーダル入力はどのように扱うべきか？

Novita は Step 3.7 Flash の入力モダリティとしてテキスト、画像、動画を、出力モダリティとしてテキストをリストしています。これをサポートされる機能の境界として扱い、マルチモーダル統合をリリースする前に現在の Novita ドキュメントまたはコンソールで正確なペイロード形状を確認してください。

クイックスタートとしては、以下の順序で進めてください：

テキストのみのスモークテストを実行する。
現在文書化されている Novita チャットメッセージ形式を使用して1つの画像入力を追加する。
実際のタスクでレスポンス品質とレスポンス形状を検証する。
リクエスト形式、サイズ制限、レイテンシ、コストの振る舞いを確認した後にのみ、より大きな画像バッチや動画を追加する。

すべての OpenAI 互換のマルチモーダルペイロード形状が、すべての Novita ホストモデルで受け入れられるとは想定しないでください。Step 3.7 Flash モデルページでは画像と動画入力のサポートが確認されていますが、動画リクエストの例はファイル処理、URL アクセス、時間、サイズ、モデル固有のフォーマットに対してより敏感です。現在のドキュメントやコンソールの例が必要な正確な動画ペイロード形状を示していない場合は、他のプロバイダーのドキュメントからハードコードするのを避けてください。

画像の初回ユースケースとして適しているもの：

ユーザーのチケットテキストと一緒にサポートスクリーンショットを要約する。
製品スクリーンショットから UI 状態を抽出し、内部トリアージアシスタントに提供する。
ビジュアル QA 画像をレビューし、テキストのチェックリストを作成する。

動画はより保守的にテストする必要があります。短いクリップから開始し、動作する正確なリクエスト形式を記録し、レイテンシとトークン使用量をキャプチャし、動画入力が拒否されたり、大きすぎたり、ルートに対して遅すぎたりする場合のフォールバック動作を定義してください。

関数呼び出しと構造化出力はどのように機能するか？

Step 3.7 Flash は関数呼び出しと構造化出力がリストされています。chat completions API では、関数呼び出しは tools で公開され、構造化出力は response_format で公開されます。

モデルがユーザーに直接回答する代わりにツールを選択し JSON 引数を返すべき場合には、関数呼び出しを使用します。API リファレンスでは、type が function、function.name、description、JSON Schema parameters、およびオプションの strict 設定を持つ関数ツールが文書化されています。

tools = [
    {
        "type": "function",
        "function": {
            "name": "create_support_ticket",
            "description": "ユーザーから報告された問題から社内サポートチケットを作成します。",
            "parameters": {
                "type": "object",
                "properties": {
                    "summary": {"type": "string"},
                    "priority": {
                        "type": "string",
                        "enum": ["low", "medium", "high"],
                    },
                    "needs_human_review": {"type": "boolean"},
                },
                "required": ["summary", "priority", "needs_human_review"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {
            "role": "user",
            "content": "支払い設定ページでスクリーンショットをアップロードした後に500エラーが返されます。",
        }
    ],
    tools=tools,
    temperature=0.1,
)

外部ツール呼び出しが不要で、アプリケーションが検証済みの JSON レスポンスを必要とする場合には、構造化出力を使用します。Novita の chat completions API リファレンスでは、json_schema を用いた response_format が文書化されており、strict モードが JSON Schema のサブセットをサポートすることが記載されています。初期のスキーマは小さく保ち、珍しいスキーマ機能を避け、モデルのレスポンスが検証に失敗した場合には安全側に倒してクローズ（fail closed）してください。

推論については、モデルの能力とリクエストの動作を区別してください。Step 3.7 Flash モデルページは推論を機能としてリストしており、chat completions API リファレンスは推論関連パラメータをモデル固有のサポートノートとともに文書化しています。本番パーサーで推論フィールドに依存する前に、stepfun/step-3.7-flash を使用して API テストを実行し、アカウントが受け取る正確なレスポンス形状を処理してください。

本番前の予算策定とテストはどのように行うべきか？

リストされたトークン価格を使用して最初の予算を見積もり、実際の使用量ログで検証します。Step 3.7 Flash は入力、出力、キャッシュ読み取りで価格が異なるため、長いプロンプト、冗長な出力、繰り返されるコンテキストは異なるコストプロファイルを持ちます。Novita AI を他の LLM API プロバイダーと比較している場合、2026年最高のLLM API プロバイダーガイドでは価格層、レート制限、プロバイダーのトレードオフについて説明しています。まだエージェントワークロードに適した推論プロバイダーを評価しているチームは、AI エージェント向け推論プロバイダーの選び方で主要な評価基準を確認できます。

例えば、大きなサポートトランスクリプトを送信するアプリケーションは、予算のほとんどを入力トークンに費やす可能性があります。長い計画を求めるエージェントは、出力トークンにより多く費やす可能性があります。コンテキストを再利用する検索やメモリのワークフローは、キャッシュ動作がデプロイされたリクエストパターンに適用される場合、キャッシュ読み取り価格の恩恵を受ける可能性があります。

本番環境の前に、以下の内容を含む評価セットを実行してください：

レイテンシとベースラインの回答品質のための短いテキストのみのプロンプト。
最大コンテキストウィンドウではなく、予想される上限に近い長文コンテキストのプロンプト。
実際のアップロードソースとファイル処理に一致する画像プロンプト。
正しい動作が関数を呼び出すことであるツールコールプロンプト。
無効、欠落、エッジケースのフィールドを意図的にテストする JSON スキーマプロンプト。
過大な入力、メディアの欠落、無効な API キー、タイムアウトの失敗ケース。

機能リストのみに基づいてすべてのトラフィックを新しいモデルにルーティングしないでください。機能フラグは何が利用可能かを示しますが、モデルが指示、スキーマ、安全ルール、レイテンシ予算に従うかどうかを評価するのは評価です。

FAQ

Step 3.7 Flash は Novita AI から利用できますか？

はい。Novita は Step 3.7 Flash を API モデル ID stepfun/step-3.7-flash の Serverless LLM としてリストしています。

Step 3.7 Flash にはどのエンドポイントを使用すればよいですか？

OpenAI 互換の chat completions エンドポイントを使用します：POST https://api.novita.ai/openai/v1/chat/completions

Step 3.7 Flash は画像と動画の入力をサポートしていますか？

Novita は Step 3.7 Flash の入力モダリティとしてテキスト、画像、動画を、出力モダリティとしてテキストをリストしています。本番環境では、現在の Novita ドキュメントまたはコンソールの例を使用して、正確な画像または動画のペイロード形状を確認してください。

Step 3.7 Flash のコストはいくらですか？

2026年6月18日現在、Novita は stepfun/step-3.7-flash を入力トークン 1M あたり $0.20、出力トークン 1M あたり $1.15、キャッシュ読み取り入力トークン 1M あたり $0.04 とリストしています。

Step 3.7 Flash は関数呼び出しと構造化出力をサポートしていますか？

はい。Novita は関数呼び出しと構造化出力を Step 3.7 Flash の機能としてリストしています。関数呼び出しには tools を、構造化出力には response_format を使用し、本番環境の前に正確なスキーマとパーサーをテストしてください。

他のプロバイダーの動画ペイロードをコピーしてもよいですか？

いいえ。API が OpenAI 互換であっても、マルチモーダルファイルと URL の処理は異なる場合があります。現在の Novita ドキュメント、コンソールの例、または stepfun/step-3.7-flash に対する自身の成功した API テストで検証されたペイロード形状を使用してください。

ステップ 3.7 Flash (Novita AI)：マルチモーダルクイックスタート

API を呼び出す前に必要なものは？

実装に関わる Step 3.7 Flash の事実は？

cURL で Step 3.7 Flash を呼び出すには？

Python から Step 3.7 Flash を呼び出すには？

マルチモーダル入力はどのように扱うべきか？

関数呼び出しと構造化出力はどのように機能するか？

本番前の予算策定とテストはどのように行うべきか？

FAQ

Step 3.7 Flash は Novita AI から利用できますか？

Step 3.7 Flash にはどのエンドポイントを使用すればよいですか？

Step 3.7 Flash は画像と動画の入力をサポートしていますか？

Step 3.7 Flash のコストはいくらですか？

Step 3.7 Flash は関数呼び出しと構造化出力をサポートしていますか？

他のプロバイダーの動画ペイロードをコピーしてもよいですか？

おすすめ記事

Product

RESOURCES

Partners

Company

API を呼び出す前に必要なものは？

実装に関わる Step 3.7 Flash の事実は？

cURL で Step 3.7 Flash を呼び出すには？

Python から Step 3.7 Flash を呼び出すには？

マルチモーダル入力はどのように扱うべきか？

関数呼び出しと構造化出力はどのように機能するか？

本番前の予算策定とテストはどのように行うべきか？

FAQ

Step 3.7 Flash は Novita AI から利用できますか？

Step 3.7 Flash にはどのエンドポイントを使用すればよいですか？

Step 3.7 Flash は画像と動画の入力をサポートしていますか？

Step 3.7 Flash のコストはいくらですか？

Step 3.7 Flash は関数呼び出しと構造化出力をサポートしていますか？

他のプロバイダーの動画ペイロードをコピーしてもよいですか？

おすすめ記事

関連記事

Product

RESOURCES

Partners

Company