Novita AI의 Kling V2.5 Turbo API: 텍스트-투-비디오 및 이미지-투-비디오

Novita AI의 Kling V2.5 Turbo API: 텍스트-투-비디오 및 이미지-투-비디오

Kling V2.5 Turbo가 Novita AI에서 제공되어, 개발자들이 호스팅된 비동기 API를 통해 짧은 형식의 텍스트-투-비디오 및 이미지-투-비디오 생성 기능을 사용할 수 있습니다. Novita AI는 Kling V2.5 Turbo에 대해 두 개의 개별 항목을 제공합니다: 텍스트-투-비디오용 kling-2.5-turbo-t2v와 이미지-투-비디오용 kling-2.5-turbo-i2v입니다. 두 모드 모두 5초 및 10초 비디오 생성을 지원하며, 먼저 task_id를 반환하고, 공유된 Task Result API를 사용하여 생성된 비디오를 가져옵니다.

핵심 요약

  • Novita AI의 Kling V2.5 Turbo는 텍스트-투-비디오 및 이미지-투-비디오 두 가지 생성 모드를 지원합니다.
  • Novita에서 호스팅하는 두 API 경로는 별도로 제공됩니다: /v3/async/kling-2.5-turbo-t2v/v3/async/kling-2.5-turbo-i2v.
  • 현재 Novita 가격은 두 모드 모두 5초 1080P 비디오당 $0.35, 10초 1080P 비디오당 $0.70로 책정되어 있습니다.
  • API는 비동기 방식입니다: 비디오 작업을 제출하고 반환된 task_id를 저장한 후, /v3/async/task-result에서 결과를 가져옵니다.
  • 이 런칭 개요는 전체 구현 튜토리얼보다는 가용성, API 구조, 가격 및 적합성에 초점을 맞춥니다.

Kling V2.5 Turbo란?

Kling V2.5 Turbo는 Novita AI에서 프롬프트 기반 비디오 생성을 위해 제공되는 비디오 생성 모델 제품군입니다. 텍스트-투-비디오 항목은 텍스트 프롬프트에서 비디오를 생성합니다. 이미지-투-비디오 항목은 소스 이미지와 프롬프트를 사용하여 초기 시각적 프레임에서 움직임을 만듭니다.

개발자 입장에서 실용적인 구분은 간단합니다:

현재 Novita 모델 페이지는 두 항목을 비디오 모델로 설명하며, 비동기 API 제출 및 작업 결과 검색을 보여줍니다. API 레퍼런스 페이지에서도 초기 제출 응답이 task_id만 반환하므로, 첫 번째 응답에서 비디오 파일을 기대하기보다는 폴링 또는 작업 상태 처리를 중심으로 애플리케이션을 구축해야 합니다.

Novita AI에서의 Kling V2.5 Turbo API 접근

Novita AI는 Kling V2.5 Turbo의 두 모드에 대해 별도의 모델 페이지와 모델별 문서를 제공합니다. 텍스트-투-비디오 API는 POST https://api.novita.ai/v3/async/kling-2.5-turbo-t2v 엔드포인트를 사용합니다. 이미지-투-비디오 API는 POST https://api.novita.ai/v3/async/kling-2.5-turbo-i2v 엔드포인트를 사용합니다.

두 엔드포인트 모두 JSON 요청과 Bearer 토큰 인증이 필요합니다. 작업이 수락되면 두 엔드포인트 모두 task_id를 반환합니다. 그런 다음 개발자는 해당 작업 ID로 Novita AI Task Result API를 호출하여 작업 상태를 확인하고 생성된 미디어를 검색합니다. 비디오 작업의 경우, 작업이 성공하면 응답에 video_url, video_url_ttl, video_type 등의 필드가 포함된 videos 배열이 포함될 수 있습니다.

이러한 구조 덕분에 Kling V2.5 Turbo는 비동기 생성을 처리할 수 있는 애플리케이션(예: 크리에이티브 도구, 내부 캠페인 에셋 파이프라인, 배치 프롬프트 테스트, 제품 목업 워크플로, 짧은 형식의 비디오 자동화)에 적합합니다.

사양 및 가격 요약

필드 세부사항
표시 이름 Kling V2.5 Turbo Text to Video; Kling V2.5 Turbo Image to Video
텍스트-투-비디오 모델 ID 및 경로 kling-2.5-turbo-t2v; POST /v3/async/kling-2.5-turbo-t2v
이미지-투-비디오 모델 ID 및 경로 kling-2.5-turbo-i2v; POST /v3/async/kling-2.5-turbo-i2v
결과 검색 GET /v3/async/task-result?task_id=...
텍스트-투-비디오 필수 입력 prompt
이미지-투-비디오 필수 입력 image, prompt
프롬프트 제한 긍정 및 부정 프롬프트에 대해 2,500자
지속 시간 옵션 5초 및 10
텍스트-투-비디오 가로세로 비율 옵션 16:9, 9:16, 1:1
이미지 입력 요구 사항 .jpg, .jpeg, .png; 최대 10 MB; 최소 300x300 픽셀
모드 pro
현재 가격 5초 1080P 비디오당 $0.35; 10초 1080P 비디오당 $0.70 (두 모드 동일)

가격 경계는 나열된 단위가 텍스트 토큰이 아닌 생성된 비디오이기 때문에 쉽게 추정할 수 있습니다. 각각 5초짜리 100개의 프롬프트를 테스트하는 워크플로의 경우, 나열된 생성 비용은 수락률 필터링이나 제품별 예산 제어 전에 100 곱하기 $0.35입니다. 워크플로에서 5초와 10초 출력을 혼합하는 경우 지속 시간 선택과 수락된 클립 수를 모두 추적하세요.

개발자를 위한 주요 기능

프롬프트를 통한 텍스트-투-비디오 생성

텍스트-투-비디오 엔드포인트는 언어로 지정할 수 있는 장면에 대한 직접적인 경로입니다. 개발자는 주제, 움직임, 카메라 프레이밍, 장면 컨텍스트 및 부정적 제약 조건을 설명한 다음 Novita AI의 호스팅 엔드포인트에 작업을 제출할 수 있습니다.

이 모드는 팀이 프로덕션 에셋을 확정하기 전에 여러 장면 아이디어를 탐색하려는 경우에 유용합니다. 또한 출력이 특정 소스 이미지를 보존할 필요가 없을 때도 잘 작동합니다.

소스 프레임을 통한 이미지-투-비디오 생성

이미지-투-비디오 엔드포인트는 정지 이미지가 주제, 구도 또는 시작 프레임을 정의해야 할 때 더 적합합니다. 현재 문서에는 image 입력과 prompt가 필요하며, 지원되는 이미지 형식 및 크기 제한은 API 레퍼런스에 문서화되어 있습니다.

이 모드는 제품 스틸 이미지 애니메이션, 디자인 프레임에서 짧은 모션 개념 생성, 참조 이미지를 검토용 짧은 클립으로 변환하는 등의 워크플로를 지원할 수 있습니다.

비동기 비디오 작업 처리

두 모드 모두 비동기 작업 제출을 사용합니다. 이는 애플리케이션 설계에 중요합니다: 사용자는 생성이 실행되는 동안 진행 상태, 대기 상태 또는 보류 상태를 확인할 수 있어야 합니다. Task Result API는 대기 중, 처리 중, 성공, 실패 상태와 지원되는 비디오 작업의 진행 정보를 포함한 작업 상태 값을 노출합니다.

예측 가능한 지속 시간 및 가격 경계

Kling V2.5 Turbo는 현재 5초 및 10초 지속 시간 옵션으로 나열되어 있습니다. 가격은 텍스트 토큰당이 아니라 비디오당입니다. 반복 가능한 워크플로를 구축하는 팀의 경우 생성된 클립 수, 지속 시간 혼합 및 수락률을 기준으로 비용을 더 쉽게 추정할 수 있습니다.

Kling V2.5 Turbo를 사용해야 하는 경우

Kling V2.5 Turbo는 제품 요구 사항이 전체 비디오 편집 스택보다는 "짧은 클립을 생성하고, 작업을 추적하며, 비디오 URL을 반환하는 것"일 때 적합합니다. 따라서 사용자가 비동기 생성 결과를 기다릴 수 있는 크리에이티브 도구, 캠페인 에셋 실험, 제품 목업 비디오 및 내부 미디어 파이프라인에 실용적입니다.

텍스트-투-비디오는 개념이 작성된 장면(프롬프트에 설명된 카메라 움직임, 제품 순간, 배경 또는 시각적 스타일)에서 시작될 때 선택하세요. 이미지-투-비디오는 첫 번째 시각 자료가 이미 중요할 때(예: 제품 스틸 이미지, 캐릭터 참조, 디자인 프레임 또는 생성된 움직임을 안내해야 하는 승인된 브랜드 에셋) 선택하세요.

비동기 API 형태는 또한 팀이 검토 가능한 워크플로를 구축하는 데 도움이 됩니다. 애플리케이션에서 작업을 제출하고, 대기 또는 처리 중 상태를 표시하고, 결과를 저장한 후, 생성된 클립이 고객에게 노출되기 전에 사람이 검토하는 큐로 보낼 수 있습니다.

Kling V2.5 Turbo를 사용하지 말아야 하는 경우

오디오가 핵심 전달물의 일부라면 이 모델을 확정하기 전에 다른 비디오 모델이나 워크플로를 확인하세요. 여기서 다루는 Kling V2.5 Turbo 항목은 텍스트-투-비디오 및 이미지-투-비디오 API입니다. 현재 이 모델에 대한 Novita 가격 행에는 기본 오디오 생성이 나열되어 있지 않습니다.

클립이 로고, 제품 세부 정보, 얼굴 또는 텍스트 줄을 정확하게 보존해야 하는 경우 처음부터 검토 및 재시도를 구축하세요. 비디오 출력은 프롬프트, 소스 이미지 품질, 움직임 복잡성 및 수용 기준에 따라 달라지므로, 브랜드 또는 규정 준수 요구 사항이 엄격한 팀은 대표 에셋을 먼저 검증해야 합니다.

마지막으로, 모델 매개변수와 비용 가정을 영구적인 구성으로 취급하지 마세요. 비디오 모델 가격, 지원되는 필드 및 결과 처리는 변경될 수 있으므로, 프로덕션 시스템은 이러한 값을 쉽게 업데이트할 수 있도록 유지하고 출시 또는 대규모 배치 실행 전에 Novita AI 문서를 다시 확인해야 합니다.

Kling V2.5 Turbo가 API 워크플로에 적합한 방법

일반적인 애플리케이션 흐름은 세 단계로 구성됩니다. 첫째, 모드를 선택합니다: 프롬프트 전용 생성의 경우 텍스트-투-비디오, 소스 이미지가 필요한 경우 이미지-투-비디오. 둘째, Bearer 토큰 인증과 함께 관련 모델별 엔드포인트에 JSON 작업을 제출합니다. 셋째, 반환된 task_id를 저장하고 작업이 성공하거나 실패할 때까지 Task Result API를 쿼리합니다.

응답 처리를 위해 task 객체와 생성된 미디어 배열을 중심으로 설계하세요. Task Result API는 작업 상태, 실패 이유, 작업 유형, 예상 완료 시간, 진행률 백분율 및 미디어 출력 배열을 문서화합니다. 성공적인 비디오 작업의 경우 애플리케이션은 videos 배열에서 생성된 클립을 읽어야 합니다.

비용 제어를 위해 생성 횟수와 지속 시간 선택을 추적하세요. Kling V2.5 Turbo 텍스트-투-비디오 및 이미지-투-비디오 모두 나열된 가격은 5초 1080P 비디오당 $0.35, 10초 1080P 비디오당 $0.70입니다.

최종 권장 사항

호스팅된 비동기 API를 통해 짧은 1080P 텍스트-투-비디오 또는 이미지-투-비디오 생성이 필요할 때 Novita AI에서 Kling V2.5 Turbo를 사용하세요. 워크플로가 프롬프트로 시작하는 경우 Kling V2.5 Turbo Text to Video API로 시작하고, 입력 이미지가 클립을 안내해야 하는 경우 Kling V2.5 Turbo Image to Video API로 시작하세요.

프로덕션으로 전환하기 전에 자체 프롬프트, 입력 이미지, 예상 움직임 패턴, 거부 기준 및 예산 가정을 사용하여 소규모 평가 세트를 실행하세요. 이것이 지원되지 않는 벤치마크나 품질 주장에 의존하지 않고 모델이 콘텐츠 워크플로에 적합한지 검증하는 가장 안전한 방법입니다.

FAQ

Kling V2.5 Turbo가 Novita AI에서 사용 가능한가요?

네. Novita AI는 Kling V2.5 Turbo Text to Video 및 Kling V2.5 Turbo Image to Video에 대한 별도의 호스팅 항목과 API 문서를 제공합니다.

Novita AI에서 Kling V2.5 Turbo의 모델 ID는 무엇인가요?

텍스트-투-비디오 API 경로는 kling-2.5-turbo-t2v를 사용합니다. 이미지-투-비디오 API 경로는 kling-2.5-turbo-i2v를 사용합니다.

Novita AI에서 Kling V2.5 Turbo의 비용은 얼마인가요?

Novita AI는 Kling V2.5 Turbo Text to Video 및 Kling V2.5 Turbo Image to Video 모두 5초 1080P 비디오당 $0.35, 10초 1080P 비디오당 $0.70로 책정되어 있습니다.

Kling V2.5 Turbo가 텍스트-투-비디오와 이미지-투-비디오를 모두 지원하나요?

네. Novita AI는 별도의 텍스트-투-비디오 및 이미지-투-비디오 항목을 제공합니다. 텍스트-투-비디오 엔드포인트는 프롬프트가 필요합니다. 이미지-투-비디오 엔드포인트는 이미지와 프롬프트가 필요합니다.

Kling V2.5 Turbo API가 처음에 어떤 응답을 반환하나요?

모델별 제출 엔드포인트는 task_id를 반환합니다. 개발자는 해당 작업 ID를 Task Result API와 함께 사용하여 상태 및 생성된 비디오 출력을 검색합니다.

추천 문서