비용을 낮추고 빠르게 반복하거나 대량의 비디오 테스트가 필요할 때는 먼저 Vidu Q3 Turbo를 선택하고, Pro 변형의 초당 더 높은 가격을 기꺼이 지불하고 Turbo와 비교하여 최종 크리에이티브 패스를 원할 때는 Vidu Q3 Pro를 선택하세요. Novita AI에서는 두 변형 모두 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오 엔드포인트를 제공하며, 비동기 생성을 지원하고 세 가지 모드에서 동일한 공개 초당 가격 패턴을 사용합니다.
Vidu Q3 Pro vs Turbo 선택 요약
Novita AI에서 Vidu Q3 Pro와 Vidu Q3 Turbo의 가장 명확한 소스 기반 차이점은 가격입니다. 공개된 Novita AI 가격 페이로드는 Turbo가 Pro보다 540p, 720p, 1080p에서 더 낮은 초당 요금을 제공함을 보여줍니다. API 문서는 또한 두 변형이 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오에 대해 별도의 비동기 엔드포인트를 통해 사용 가능함을 나타냅니다.
| 결정 포인트 | Vidu Q3 Turbo로 시작 | Vidu Q3 Pro로 시작 |
|---|---|---|
| 주요 목표 | 프롬프트 탐색, 더 많은 변형 실행, 초당 지출 감소 | 최종 후보 클립에 대한 Pro 변형 비교 |
| 예산 프로필 | 나열된 모든 해상도에서 더 낮은 피크 및 오프피크 가격 | 나열된 모든 해상도에서 더 높은 초당 가격 |
| Novita AI의 API 모드 | 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오 | 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오 |
| 문서의 출력 옵션 | 최대 1080p, 1-16초 | 최대 1080p, 1-16초 |
| 문서의 오디오 지원 | Q3 오디오-비디오 생성 컨트롤 사용 가능 | Q3 오디오-비디오 생성 컨트롤 사용 가능 |
| 최적의 첫 테스트 | 대량 반복, 프롬프트 검색, 러프 컷, 소셜 변형 | Turbo가 프롬프트와 모드를 좁힌 후 최종 비교 패스 |
Turbo와 Pro는 단순한 좋음-나쁨 순위보다는 두 가지 가격 및 워크플로 옵션으로 보는 것이 좋습니다. 공개 문서와 가격 페이지는 비용과 엔드포인트 비교를 지원하지만, 모든 프롬프트에 대해 문제를 해결하는 보편적인 벤치마크, 지연 시간 점수 또는 장면 품질 순위를 게시하지 않습니다. 출력이 정말 중요하다면, 더 신뢰할 수 있는 결정 방법은 동일한 프롬프트 또는 이미지 세트를 두 변형으로 실행하고 결과를 나란히 비교하는 것입니다.
Vidu Q3 텍스트-투-비디오, 이미지-투-비디오 및 시작-종 모드
Vidu Q3는 단일 설정이 아닙니다. Novita AI에서 유용한 선택은 2차원적입니다: Pro 또는 Turbo를 선택한 다음, 소스 자료에 맞는 생성 모드를 선택하세요.
| 모드 | 제공하는 항목 | 사용 시기 | Pro 엔드포인트 | Turbo 엔드포인트 |
|---|---|---|---|---|
| 텍스트-투-비디오 | 텍스트 프롬프트 | 새로운 장면, 캐릭터, 카메라 움직임, 광고 컨셉 또는 스토리보드 아이디어를 처음부터 탐색할 때 | /v3/async/vidu-q3-pro-t2v |
/v3/async/vidu-q3-turbo-t2v |
| 이미지-투-비디오 | 하나의 참조 이미지와 선택적 모션 프롬프트 | 이미 제품 이미지, 캐릭터 프레임, 스타일 참조 또는 애니메이션할 정지 구성이 있을 때 | /v3/async/vidu-q3-pro-i2v |
/v3/async/vidu-q3-turbo-i2v |
| 시작-종-투-비디오 | 두 개의 이미지, 시작 프레임과 종료 프레임 | 모델이 알려진 첫 번째 프레임과 마지막 프레임 사이를 보간해야 할 때 | /v3/async/vidu-q3-pro-f2v |
/v3/async/vidu-q3-turbo-f2v |
텍스트-투-비디오의 경우 문서에는 필수 prompt, audio 불리언, duration, resolution, aspect_ratio, off_peak 및 워터마크 컨트롤이 나열됩니다. Pro 텍스트-투-비디오는 최대 2,000자까지 프롬프트를 허용하며, Turbo 텍스트-투-비디오는 최대 5,000자까지 허용합니다.
이미지-투-비디오의 경우 문서에는 images 배열이 필요합니다. Pro 이미지-투-비디오는 현재 하나의 이미지 입력을 지원하며, JPG, JPEG, PNG, WebP 형식을 허용하고 이미지당 최대 50MB, 종횡비는 1:4에서 4:1 사이입니다. Pro 이미지-투-비디오 문서에는 audio가 배경 음악을 위한 사용자 정의 오디오 URL 필드로 나열됩니다. Turbo 이미지-투-비디오도 참조 이미지 배열을 사용하며, 동일한 이미지 형식과 50MB 제한을 지원하고 audio 불리언과 audio_type 옵션(all, speech_only, sound_effect_only)을 나열합니다.
시작-종-투-비디오의 경우 Pro와 Turbo 문서 모두 정확히 두 개의 이미지가 필요합니다: 첫 번째 이미지는 시작 프레임, 두 번째 이미지는 종료 프레임입니다. 문서에는 1-16초 지속 시간과 540p, 720p, 1080p 해상도 옵션이 나열됩니다. 이 모드는 빈 프롬프트에서 장면을 발견하는 것보다 전환이 시작되고 끝나는 위치에 더 신경 쓸 때 사용하세요.
Vidu Q3 Pro 및 Turbo 가격
Novita AI 가격은 Vidu Q3 Pro와 Vidu Q3 Turbo에 대해 초당으로 나열됩니다. 2026년 6월 23일에 확인된 현재 공개 가격은 각 변형 및 해상도에 대해 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오에서 동일한 요율을 보여줍니다.
| 해상도 | Vidu Q3 Pro 피크 | Vidu Q3 Pro 오프피크 | Vidu Q3 Turbo 피크 | Vidu Q3 Turbo 오프피크 |
|---|---|---|---|---|
| 540p | $0.0625/s | $0.0313/s | $0.0357/s | $0.0179/s |
| 720p | $0.1339/s | $0.0670/s | $0.0536/s | $0.0268/s |
| 1080p | $0.1429/s | $0.0714/s | $0.0714/s | $0.0357/s |
일반적인 테스트 클립에 대해 의미하는 바는 다음과 같습니다:
| 테스트 클립 | Pro 피크 | Pro 오프피크 | Turbo 피크 | Turbo 오프피크 |
|---|---|---|---|---|
| 540p에서 5초 | $0.3125 | $0.1565 | $0.1785 | $0.0895 |
| 720p에서 10초 | $1.3390 | $0.6700 | $0.5360 | $0.2680 |
| 1080p에서 16초 | $2.2864 | $1.1424 | $1.1424 | $0.5712 |
오프피크 모드는 처리 시간이 유연할 때 가장 적합합니다. Vidu Q3 API 문서는 오프피크 작업을 48시간 내에 처리되는 저비용 작업으로 설명하며, 프롬프트를 탐색하고 더 낮은 비용으로 더 넓은 배치 테스트를 원할 때 잘 작동할 수 있습니다. 사용자 대면 흐름을 구축하는 경우, 지연된 전달이 이미 제품 경험의 일부가 아닌 이상 피크 모드가 여전히 더 안전한 기본값입니다.
어떤 Vidu Q3 모드를 먼저 테스트해야 할까요?
모드를 선택하는 가장 쉬운 방법은 이미 가지고 있는 입력부터 시작하는 것입니다. 많은 실망스러운 테스트는 보유한 자료에 가장 잘 맞는 옵션 대신 가장 흥미로운 옵션을 먼저 선택하는 데서 비롯됩니다.
| 상황 | 첫 번째 테스트 모드 | 권장 변형 | 이유 |
|---|---|---|---|
| 작성된 아이디어만 있음 | 텍스트-투-비디오 | Turbo | 더 낮은 초당 비용으로 더 많은 프롬프트 방향을 탐색할 수 있습니다. |
| 제품 렌더링 또는 캐릭터 스틸 이미지가 있음 | 이미지-투-비디오 | 먼저 Turbo, 그 다음 최종 후보에 Pro | 참조 이미지가 시각적 대상을 제한하며, Turbo는 반복 비용을 낮춥니다. |
| 알려진 첫 번째 및 마지막 프레임이 있는 스토리보드가 있음 | 시작-종-투-비디오 | 먼저 Turbo, 필요시 Pro | 두 이미지가 모델에 명시적인 엔드포인트를 제공하므로 통제된 전환에 유용합니다. |
| 나중에 편집할 무음 클립이 필요함 | 오디오 비활성화된 텍스트-투-비디오 또는 이미지-투-비디오 | Turbo | 문서에 audio 컨트롤이 있으므로 대체할 오디오 생성을 피할 수 있습니다. |
| 최종 후보 클립 사이에서 결정 중 | 동일한 모드를 두 변형에서 | Pro와 Turbo 나란히 | 일반적인 가정에 의존하는 대신 동일한 입력을 사용하고 장면에 대한 출력을 비교하세요. |
Novita AI에서 Vidu Q3를 처음 사용하는 경우, 일반적으로 다음과 같은 순서가 가장 매끄럽습니다:
- Turbo 텍스트-투-비디오를 540p 또는 720p로 실행하여 프롬프트 방향을 찾습니다.
- 정지 이미지에서 정체성, 제품 또는 시각적 스타일 제어가 필요한 경우 이미지-투-비디오로 이동합니다.
- 실제 첫 번째 프레임과 마지막 프레임이 있는 경우에만 시작-종-투-비디오를 사용합니다.
- 대상 해상도에서 Pro로 가장 강력한 후보를 다시 실행하여 해당 장면에 대해 더 높은 가격이 정당화되는지 결정합니다.
이 순서는 더 비싼 비교 단계를 최종 결정에 가깝게 유지하여, 이미 유망한 방향이 있을 때 사용합니다. 또한 결국 폐기할 수 있는 초기 프롬프트 탐색에 Pro 예산을 소비하는 것을 방지하는 데 도움이 됩니다.
Vidu Q3 API 엔드포인트 및 요청 흐름
이 비교의 6개 Vidu Q3 엔드포인트는 모두 Novita AI의 v3 비동기 작업 패턴을 사용합니다. 생성 요청을 제출하고 task_id를 받은 다음, Task Result API를 호출하여 작업이 성공하면 생성된 비디오를 검색합니다.
| 엔드포인트 | 메서드 | 결과 패턴 |
|---|---|---|
/v3/async/vidu-q3-pro-t2v |
POST |
task_id 반환 |
/v3/async/vidu-q3-pro-i2v |
POST |
task_id 반환 |
/v3/async/vidu-q3-pro-f2v |
POST |
task_id 반환 |
/v3/async/vidu-q3-turbo-t2v |
POST |
task_id 반환 |
/v3/async/vidu-q3-turbo-i2v |
POST |
task_id 반환 |
/v3/async/vidu-q3-turbo-f2v |
POST |
task_id 반환 |
/v3/async/task-result |
GET |
사용 가능할 때 작업 상태 및 생성된 미디어 반환 |
최소한의 Turbo 텍스트-투-비디오 요청은 다음과 같습니다:
curl --request POST \
--url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
--header "Authorization: Bearer $NOVITA_API_KEY" \
--header "Content-Type: application/json" \
--data '{
"prompt": "A close-up product launch video on a clean studio table, soft camera push-in, subtle lighting movement",
"duration": 5,
"resolution": "720p",
"aspect_ratio": "16:9",
"audio": true,
"off_peak": false
}'
그런 다음 작업 결과 엔드포인트를 폴링합니다:
curl --request GET \
--url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
--header "Authorization: Bearer $NOVITA_API_KEY"
이미지-투-비디오의 경우 엔드포인트를 I2V 엔드포인트로 바꾸고 images 배열을 제공합니다. 시작-종-투-비디오의 경우 F2V 엔드포인트를 사용하고 두 이미지를 순서대로 제공합니다: 먼저 시작 프레임, 그 다음 종료 프레임.
실용적인 Vidu Q3 테스트 계획
일회성 인상 대신 작은 테스트 매트릭스를 사용하세요. 목표는 보편적인 승자를 입증하는 것이 아니라 사용 사례에 적합한 변형과 모드를 선택하는 것입니다.
| 테스트 패스 | 변형 | 모드 | 해상도 | 평가할 내용 |
|---|---|---|---|---|
| 프롬프트 검색 | Turbo | 텍스트-투-비디오 | 540p 또는 720p | 어떤 프롬프트 구조가 올바른 장면, 움직임 및 프레이밍을 제공하는가? |
| 참조 제어 | Turbo | 이미지-투-비디오 | 720p | 모델이 사용 사례에 충분히 피사체나 제품을 보존하는가? |
| 전환 제어 | Turbo | 시작-종-투-비디오 | 720p | 첫 번째 프레임과 마지막 프레임 사이의 움직임이 사용 가능한가? |
| 최종 비교 | Turbo 및 Pro | 동일한 승리 모드 | 대상 해상도 | 이 장면에 대해 Pro 결과가 더 높은 초당 비용을 정당화하는가? |
| 비용 패스 | 승리 변형 | 동일한 승리 모드 | 대상 해상도 | 피크로 실행해야 하는가, 아니면 오프피크로 전환할 수 있는가? |
Pro와 Turbo를 비교할 때는 다음 변수를 동일하게 유지하세요:
- 동일한 프롬프트, 이미지 입력, 지속 시간, 해상도 및 종횡비.
- 동일한 오디오 설정.
- 출력 결과를 비교할 때 동일한 오프피크 설정.
- 동일한 평가 기준: 정체성 일관성, 모션 선명도, 카메라 움직임, 오디오 유용성 및 편집 가능성.
프롬프트와 모델 변형을 동시에 변경하면 어떤 변경이 결과를 실제로 개선했는지 더 이상 알 수 없기 때문에 비교가 불분명해집니다.
FAQ
Vidu Q3 Turbo가 Novita AI에서 Vidu Q3 Pro보다 저렴한가요?
예. 2026년 6월 23일에 확인된 현재 Novita AI 가격은 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오에 대해 540p, 720p, 1080p에서 Turbo가 Pro 아래에 있음을 보여줍니다.
Vidu Q3 Pro와 Turbo가 동일한 모드를 지원하나요?
Novita AI 문서는 텍스트-투-비디오, 이미지-투-비디오, 시작-종-투-비디오에 대해 별도의 Pro 및 Turbo 엔드포인트를 나열합니다. 각 엔드포인트는 task_id를 반환하고 v3 비동기 작업 결과 흐름을 사용합니다.
텍스트-투-비디오 또는 이미지-투-비디오를 먼저 사용해야 하나요?
아이디어나 작성된 장면만 있을 때는 텍스트-투-비디오를 먼저 사용하세요. 제품 사진, 캐릭터 프레임 또는 고정된 시각적 스타일과 같은 참조 이미지가 중요할 때는 이미지-투-비디오를 먼저 사용하세요.
시작-종-투-비디오는 언제 사용해야 하나요?
두 개의 프레임이 있고 모델이 그 사이의 움직임을 생성해야 할 때 시작-종-투-비디오를 사용하세요. 첫 번째 프레임과 마지막 프레임이 모두 지정되므로 세 가지 모드 중 가장 구조화된 모드입니다.
Vidu Q3가 오디오 컨트롤을 지원하나요?
예. Vidu Q3 문서에는 오디오 컨트롤이 포함됩니다. 텍스트-투-비디오 및 시작-종-투-비디오는 audio 불리언을 제공합니다. Pro 이미지-투-비디오는 audio를 배경 음악을 위한 사용자 정의 오디오 URL 필드로 나열하는 반면, Turbo 이미지-투-비디오는 audio 불리언과 all, speech_only, sound_effect_only에 대한 audio_type 옵션을 나열합니다.
동일한 프롬프트에 대해 Vidu Q3 Turbo와 Pro를 모두 실행해야 하나요?
프롬프트, 참조, 지속 시간 및 종횡비를 탐색할 때는 먼저 Turbo를 실행하세요. 하나의 결과가 필요한 것에 가깝다면 Pro에서 동일한 설정을 다시 실행하여 비교가 프롬프트 및 입력 변경을 혼합하는 대신 모델 변형을 분리하도록 합니다.
