3.7단계 Novita AI의 Flash API: 멀티모달 빠른 시작

API를 호출하기 전에 무엇이 필요할까요?
구현에 중요한 Step 3.7 Flash 정보는 무엇인가요?
cURL로 Step 3.7 Flash를 어떻게 호출하나요?
Python에서 Step 3.7 Flash를 어떻게 호출하나요?
멀티모달 입력은 어떻게 처리해야 하나요?
함수 호출 및 구조화된 출력은 어떻게 적용되나요?
팀은 프로덕션 전에 어떻게 예산을 책정하고 테스트해야 하나요?
FAQ
추천 문서

Step 3.7 Flash는 Novita AI에서 모델 ID stepfun/step-3.7-flash를 사용하는 Serverless LLM으로 제공되며, OpenAI 호환 chat/completions, 텍스트, 이미지 및 비디오 입력 지원, 텍스트 출력, 함수 호출, 구조화된 출력, 그리고 모델 페이지에 명시된 추론 기능을 갖추고 있습니다. 이 빠른 시작 가이드는 개발자 워크플로우, 즉 API 호출 방법, 현재 안전하게 사용할 수 있는 요청 패턴, 예산에 반영해야 할 가격 항목, 그리고 프로덕션 환경에 멀티모달이나 추론 동작을 연결하기 전에 주의해야 할 사항에 중점을 둡니다. 모델의 기능과 포지셔닝에 대한 자세한 내용은 Step 3.7 Flash API 개요를 참조하세요.

API를 호출하기 전에 무엇이 필요할까요?

다음 세 가지 설정부터 시작하세요.

항목	값
API 키	Novita AI API 키를 생성하여 `NOVITA_API_KEY`와 같은 환경 변수에 저장합니다.
OpenAI 호환 기본 URL	`https://api.novita.ai/openai`
채팅 완료 엔드포인트	`POST https://api.novita.ai/openai/v1/chat/completions`
모델 ID	`stepfun/step-3.7-flash`

Novita AI 문서 인덱스는 OpenAI 호환 기본 URL을 나열하고, 채팅 완료 API 참조는 POST https://api.novita.ai/openai/v1/chat/completions의 요청 및 응답 필드를 문서화합니다.

API 키를 소스 코드 관리에서 제외하세요. 로컬 개발에서는 셸에 export 하십시오. 프로덕션에서는 시크릿 관리자에서 로드하세요.

export NOVITA_API_KEY="your_api_key"

애플리케이션이 이미 OpenAI 호환 채팅 완료를 사용하고 있다면, 마이그레이션 경로는 일반적으로 간단합니다. 클라이언트를 Novita AI의 기본 URL로 지정하고, Authorization bearer 토큰을 설정하며, Step 3.7 Flash 모델 ID를 사용하면 됩니다.

구현에 중요한 Step 3.7 Flash 정보는 무엇인가요?

코드에는 정확한 모델 ID를 사용하고 사용자 대상 UI에는 표시 이름을 사용하세요. 현재 Novita 모델 페이지는 Step 3.7 Flash를 StepFun 시리즈의 채팅 모델로 나열합니다.

필드	현재 Novita 값
표시 이름	Step 3.7 Flash
API 모델 ID	`stepfun/step-3.7-flash`
Novita가 표시하는 모델 제품군	StepFun
호스팅 유형	Serverless LLM
엔드포인트	`chat/completions`
입력 모달리티	텍스트, 이미지, 비디오
출력 모달리티	텍스트
컨텍스트 윈도우	262,144 토큰
최대 출력 토큰	256,000
나열된 기능	Serverless, 함수 호출, 구조화된 출력, 추론
나열된 레이블	MoE, >100B, NEW, Featured
기본 나열된 T1 속도 제한	30 RPM 및 50,000,000 TPM

2026년 6월 18일 기준, Novita는 stepfun/step-3.7-flash에 대해 다음과 같은 토큰 가격을 제시합니다.

토큰 유형	나열된 가격
입력 토큰	100만 토큰당 $0.20
출력 토큰	100만 토큰당 $1.15
캐시 읽기 입력 토큰	100만 토큰당 $0.04

가격, 모델 가용성, 속도 제한 및 지원되는 요청 매개변수는 변경될 수 있습니다. 조달 검토, 프로덕션 출시 또는 고객 대상 가격 약정 전에 Step 3.7 Flash 모델 페이지와 Novita AI 가격 페이지를 확인하세요.

cURL로 Step 3.7 Flash를 어떻게 호출하나요?

첫 번째 간단한 테스트에서는 요청을 텍스트 전용으로 유지하세요. 이렇게 하면 도구, 스키마, 이미지 또는 비디오를 추가하기 전에 인증, 모델 라우팅, 응답 파싱 및 기본 생성이 확인됩니다.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "stepfun/step-3.7-flash",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise technical assistant."
      },
      {
        "role": "user",
        "content": "Create a four-step checklist for testing a multimodal support bot before release."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

성공적인 응답은 Novita AI가 문서화한 채팅 완료 형태를 따릅니다. choices 배열, 생성된 content가 있는 메시지, 생성/모델 메타데이터, 그리고 사용량이 반환될 때 usage 객체가 포함됩니다. 스트리밍 응답의 경우 API 참조는 사용량이 최종 응답 청크에 나타난다고 명시합니다.

이 간단한 테스트를 사용하여 다음을 확인하세요.

API 키가 유효한지 확인합니다.
모델 ID가 허용되는지 확인합니다.
클라이언트가 choices[0].message.content를 파싱할 수 있는지 확인합니다.
로깅이 시크릿을 저장하지 않고 프롬프트, 완료 및 총 토큰 사용량을 캡처하는지 확인합니다.
타임아웃 및 재시도 정책이 프롬프트 크기에 적절한지 확인합니다.

Python에서 Step 3.7 Flash를 어떻게 호출하나요?

OpenAI Python SDK 패턴은 Novita 기본 URL을 설정할 때 Novita AI에서 작동합니다. 자체 프로젝트의 종속성 정책에 따라 SDK를 설치하고 버전을 고정하세요.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {"role": "system", "content": "You are a concise technical assistant."},
        {
            "role": "user",
            "content": "Summarize the release risks for a customer support workflow that accepts screenshots and long text tickets.",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)

애플리케이션 코드의 경우, 코드베이스 전체에 원시 API 호출을 분산하는 대신 소형 모델 게이트웨이로 래핑하세요. 게이트웨이를 사용하면 기본 토큰 제한을 적용하고, 경로별 타임아웃을 설정하고, 오류를 정규화하고, 비즈니스 로직을 변경하지 않고 평가를 위해 모델을 전환할 수 있습니다.

실용적인 프로덕션 래퍼는 다음을 캡처해야 합니다.

model, prompt_tokens, completion_tokens 및 total_tokens.
요청 지연 시간 및 재시도 횟수.
HTTP 상태 및 API 오류 범주.
도구, JSON 스키마, 이미지 입력 또는 비디오 입력이 사용되었는지 여부.
API 키와 민감한 사용자 콘텐츠를 제외한 수정된 요약.

이러한 텔레메트리는 Step 3.7 Flash가 큰 컨텍스트 윈도우와 높은 최대 출력 제한을 가지고 있기 때문에 중요합니다. 이러한 제한은 유용하지만, 프로덕션 시스템은 여전히 명시적인 max_tokens를 설정하고, 모델 호출 전에 과도하게 큰 사용자 업로드를 거부하며, 출력 길이를 모니터링해야 합니다.

멀티모달 입력은 어떻게 처리해야 하나요?

Novita는 Step 3.7 Flash의 입력 모달리티로 텍스트, 이미지 및 비디오를, 출력 모달리티로 텍스트를 나열합니다. 이를 지원되는 기능 경계로 간주한 후, 멀티모달 통합을 배포하기 전에 현재 Novita 문서 또는 콘솔에서 정확한 페이로드 형태를 확인하세요.

빠른 시작을 위해 다음 순서를 사용하세요.

텍스트 전용 간단한 테스트를 실행합니다.
현재 문서화된 Novita 채팅 메시지 형식을 사용하여 하나의 이미지 입력을 추가합니다.
실제 작업에 대한 응답 품질과 응답 형태를 검증합니다.
요청 형식, 크기 제한, 지연 시간 및 비용 동작을 확인한 후에만 더 큰 이미지 배치나 비디오를 추가하세요.

모든 OpenAI 호환 멀티모달 페이로드 형태가 모든 Novita 호스팅 모델에서 허용된다고 가정하지 마세요. Step 3.7 Flash 모델 페이지는 이미지 및 비디오 입력 지원을 확인하지만, 비디오 요청 예제는 파일 처리, URL 접근, 지속 시간, 크기 및 모델별 형식에 더 민감합니다. 현재 문서나 콘솔 예제에 필요한 정확한 비디오 페이로드 형태가 표시되지 않으면 다른 제공업체 문서에서 하드코딩하지 마세요.

좋은 첫 번째 이미지 사용 사례는 다음과 같습니다.

사용자의 티켓 텍스트와 함께 지원 스크린샷 요약.
내부 트라이어즈 어시스턴트를 위한 제품 스크린샷에서 UI 상태 추출.
시각적 QA 이미지 검토 및 텍스트 체크리스트 생성.

비디오는 더 보수적으로 테스트해야 합니다. 짧은 클립으로 시작하고, 작동하는 정확한 요청 형식을 기록하고, 지연 시간과 토큰 사용량을 캡처하고, 비디오 입력이 거부되거나, 너무 크거나, 특정 경로에 너무 느린 경우 대체 동작을 정의하세요.

함수 호출 및 구조화된 출력은 어떻게 적용되나요?

Step 3.7 Flash는 함수 호출 및 구조화된 출력과 함께 나열됩니다. 채팅 완료 API에서 함수 호출은 tools를 통해 노출되고, 구조화된 출력은 response_format을 통해 노출됩니다.

모델이 사용자에게 직접 응답하는 대신 도구를 선택하고 JSON 인수를 반환해야 할 때 함수 호출을 사용하세요. API 참조는 type이 function이고, function.name, description, JSON Schema parameters 및 선택적 strict 설정이 있는 함수 도구를 문서화합니다.

tools = [
    {
        "type": "function",
        "function": {
            "name": "create_support_ticket",
            "description": "Create an internal support ticket from a user-reported issue.",
            "parameters": {
                "type": "object",
                "properties": {
                    "summary": {"type": "string"},
                    "priority": {
                        "type": "string",
                        "enum": ["low", "medium", "high"],
                    },
                    "needs_human_review": {"type": "boolean"},
                },
                "required": ["summary", "priority", "needs_human_review"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="stepfun/step-3.7-flash",
    messages=[
        {
            "role": "user",
            "content": "The payment settings page returns a 500 error after I upload a screenshot.",
        }
    ],
    tools=tools,
    temperature=0.1,
)

애플리케이션에 검증된 JSON 응답이 필요하고 외부 도구 호출이 필요하지 않은 경우 구조화된 출력을 사용하세요. Novita의 채팅 완료 API 참조는 json_schema와 함께 response_format을 문서화하고, 엄격 모드가 JSON Schema의 하위 집합을 지원한다고 명시합니다. 초기 스키마는 작게 유지하고, 이국적인 스키마 기능을 피하며, 모델 응답이 검증되지 않을 때 안전하게 실패(fail closed)하세요.

추론의 경우, 모델 기능과 요청 동작을 구분하세요. Step 3.7 Flash 모델 페이지는 추론을 기능으로 나열하는 반면, 채팅 완료 API 참조는 모델별 지원 참고 사항과 함께 추론 관련 매개변수를 문서화합니다. 프로덕션 파서에서 추론 필드에 의존하기 전에 stepfun/step-3.7-flash로 API 테스트를 실행하고 계정이 수신하는 정확한 응답 형태를 처리하세요.

팀은 프로덕션 전에 어떻게 예산을 책정하고 테스트해야 하나요?

나열된 토큰 가격을 사용하여 초기 예산을 추정한 다음 실제 사용량 로그로 검증하세요. Step 3.7 Flash는 입력, 출력 및 캐시 읽기에 대해 가격이 다르게 책정되므로, 긴 프롬프트, 자세한 출력 및 반복되는 컨텍스트는 비용 프로필이 다릅니다. Novita AI를 다른 LLM API 제공업체와 비교하는 경우, 2026년 최고의 LLM API 제공업체 가이드에서 가격 등급, 속도 제한 및 제공업체 간 장단점을 다룹니다. 어떤 추론 제공업체가 에이전트 워크로드에 적합한지 여전히 평가 중인 팀의 경우, AI 에이전트를 위한 추론 제공업체 선택에서 주요 평가 기준을 설명합니다.

예를 들어, 대용량 지원 기록을 전송하는 애플리케이션은 예산의 대부분을 입력 토큰에 사용할 수 있습니다. 긴 계획을 요청하는 에이전트는 출력 토큰에 더 많은 비용을 사용할 수 있습니다. 컨텍스트를 재사용하는 검색 또는 메모리 워크플로우는 캐시 동작이 배포된 요청 패턴에 적용되는 경우 캐시 읽기 가격의 혜택을 볼 수 있습니다.

프로덕션 전에 다음을 포함하는 평가 세트를 실행하세요.

지연 시간 및 기준 답변 품질을 위한 짧은 텍스트 전용 프롬프트.
최대 컨텍스트 윈도우가 아닌 예상 상한선에 가까운 긴 컨텍스트 프롬프트.
실제 업로드 소스 및 파일 처리와 일치하는 이미지 프롬프트.
올바른 동작이 함수를 호출하는 것인 도구 호출 프롬프트.
의도적으로 유효하지 않거나, 누락되었거나, 경계 사례 필드를 테스트하는 JSON 스키마 프롬프트.
과도하게 큰 입력, 누락된 미디어, 유효하지 않은 API 키 및 타임아웃에 대한 실패 사례.

기능 목록만을 기반으로 모든 트래픽을 새 모델로 라우팅하지 마세요. 기능 플래그는 사용 가능한 것을 알려주지만, 평가는 모델이 워크로드에서 사용자의 지침, 스키마, 안전 규칙 및 지연 시간 예산을 따르는지 알려줍니다.

FAQ

Step 3.7 Flash는 Novita AI를 통해 사용할 수 있나요?

네. Novita는 Step 3.7 Flash를 API 모델 ID stepfun/step-3.7-flash를 사용하는 Serverless LLM으로 나열합니다.

Step 3.7 Flash에 어떤 엔드포인트를 사용해야 하나요?

OpenAI 호환 채팅 완료 엔드포인트인 POST https://api.novita.ai/openai/v1/chat/completions를 사용하세요.

Step 3.7 Flash는 이미지 및 비디오 입력을 지원하나요?

Novita는 Step 3.7 Flash의 입력 모달리티로 텍스트, 이미지 및 비디오를, 출력 모달리티로 텍스트를 나열합니다. 프로덕션 전에 현재 Novita 문서 또는 콘솔 예제를 사용하여 정확한 이미지 또는 비디오 페이로드 형태를 확인하세요.

Step 3.7 Flash의 비용은 얼마인가요?

2026년 6월 18일 기준, Novita는 stepfun/step-3.7-flash에 대해 입력 토큰 100만 개당 $0.20, 출력 토큰 100만 개당 $1.15, 캐시 읽기 입력 토큰 100만 개당 $0.04로 가격을 제시합니다.

Step 3.7 Flash는 함수 호출 및 구조화된 출력을 지원하나요?

네. Novita는 함수 호출 및 구조화된 출력을 Step 3.7 Flash 기능으로 나열합니다. 함수 호출에는 tools를, 구조화된 출력에는 response_format을 사용한 다음, 프로덕션 전에 정확한 스키마와 파서를 테스트하세요.

다른 제공업체의 비디오 페이로드를 복사해야 하나요?

아니요. API가 OpenAI 호환인 경우에도 멀티모달 파일 및 URL 처리는 다를 수 있습니다. 현재 Novita 문서, 콘솔 예제 또는 stepfun/step-3.7-flash에 대한 자체 성공적인 API 테스트에서 확인된 페이로드 형태를 사용하세요.

3.7단계 Novita AI의 Flash API: 멀티모달 빠른 시작

API를 호출하기 전에 무엇이 필요할까요?

구현에 중요한 Step 3.7 Flash 정보는 무엇인가요?

cURL로 Step 3.7 Flash를 어떻게 호출하나요?

Python에서 Step 3.7 Flash를 어떻게 호출하나요?

멀티모달 입력은 어떻게 처리해야 하나요?

함수 호출 및 구조화된 출력은 어떻게 적용되나요?

팀은 프로덕션 전에 어떻게 예산을 책정하고 테스트해야 하나요?

FAQ

Step 3.7 Flash는 Novita AI를 통해 사용할 수 있나요?

Step 3.7 Flash에 어떤 엔드포인트를 사용해야 하나요?

Step 3.7 Flash는 이미지 및 비디오 입력을 지원하나요?

Step 3.7 Flash의 비용은 얼마인가요?

Step 3.7 Flash는 함수 호출 및 구조화된 출력을 지원하나요?

다른 제공업체의 비디오 페이로드를 복사해야 하나요?

추천 문서

Product

RESOURCES

Partners

Company

API를 호출하기 전에 무엇이 필요할까요?

구현에 중요한 Step 3.7 Flash 정보는 무엇인가요?

cURL로 Step 3.7 Flash를 어떻게 호출하나요?

Python에서 Step 3.7 Flash를 어떻게 호출하나요?

멀티모달 입력은 어떻게 처리해야 하나요?

함수 호출 및 구조화된 출력은 어떻게 적용되나요?

팀은 프로덕션 전에 어떻게 예산을 책정하고 테스트해야 하나요?

FAQ

Step 3.7 Flash는 Novita AI를 통해 사용할 수 있나요?

Step 3.7 Flash에 어떤 엔드포인트를 사용해야 하나요?

Step 3.7 Flash는 이미지 및 비디오 입력을 지원하나요?

Step 3.7 Flash의 비용은 얼마인가요?

Step 3.7 Flash는 함수 호출 및 구조화된 출력을 지원하나요?

다른 제공업체의 비디오 페이로드를 복사해야 하나요?

추천 문서

관련 게시글

Product

RESOURCES

Partners

Company