在 Novita AI 上的 MiniMax Hailuo 2.3 最容易通过你的输入来选择:当场景仅以提示形式存在时,使用文本转视频;当第一帧或参考图像必须锚定片段时,使用图像转视频;当你已经有一张图像并希望在标准 I2V 上花费之前测试更低价的 Fast I2V 端点时,使用快速图像转视频。
MiniMax Hailuo 2.3 模式选择表
| 决策 | 起始点 | 原因 |
|---|---|---|
| 你只有一个书面场景 | Hailuo 2.3 文本转视频 | T2V 端点需要 prompt,不需要图像。 |
| 你有一个产品帧、角色帧、分镜帧或已批准的视觉素材 | Hailuo 2.3 图像转视频 | I2V 端点需要 prompt 和 image,因此输入图像锚定第一个视觉状态。 |
| 你有一张图像,需要更便宜的首次 I2V 测试 | Hailuo 2.3 快速图像转视频 | 对于相同的可见时长和分辨率组合,Fast I2V 的价格行低于标准 I2V。 |
| 你需要 1080P 输出 | 三种模式中的任何一种,限于 6 秒 | Novita 文档列出 1080P 支持 6 秒的 Hailuo 2.3 任务;10 秒任务仅列出 768P。 |
| 你需要一个 10 秒的片段 | T2V、I2V 或 Fast I2V,768P | 文档列出 10 秒为可用时长,768P 为支持的 10 秒分辨率。 |
| 你需要 API 参考中记录的提示性摄像机命令 | T2V 或标准 I2V | T2V 和 I2V 文档列出了 15 个支持的摄像机命令;Fast I2V 页面没有列出那个摄像机命令部分。 |
| 你正在预算一个广泛的测试批次 | 从 6 秒 768P 开始;仅当有图像可用时使用 Fast I2V | 6 秒 768P 是每种模式中最小的可见行,Fast I2V 是最小的可见 Hailuo 2.3 I2V 行。 |
| 你正在制作一个近乎最终的仅提示片段 | 以目标分辨率和时长的 T2V | T2V 是这里唯一不需要图像输入的 Hailuo 2.3 系列端点。 |
| 你正在制作一个近乎最终的资产导向片段 | 以目标分辨率和时长的标准 I2V | 标准 I2V 保持了图像导向的工作流程,同时使用非快速端点。 |
重要的区别不是抽象上的“哪个模式最好”。而是你的第一个有用测试应该是仅提示、图像导向还是更低价的 Fast I2V 通道。如果没有源图像,快速模式不是一个选项,因为 Fast Hailuo 2.3 被记录为图像转视频端点。
Novita AI 上的 MiniMax Hailuo 2.3 API 模式
Novita AI 记录了三个独立的异步 MiniMax Hailuo 2.3 视频 API:
| 模式 | Novita API 路径 | 必需输入 | 共享控制 |
|---|---|---|---|
| MiniMax Hailuo 2.3 文本转视频 | POST /v3/async/minimax-hailuo-2.3-t2v |
prompt |
duration、resolution、enable_prompt_expansion、fast_pretreatment |
| MiniMax Hailuo 2.3 图像转视频 | POST /v3/async/minimax-hailuo-2.3-i2v |
prompt、image |
duration、resolution、enable_prompt_expansion、fast_pretreatment |
| MiniMax Hailuo 2.3 快速图像转视频 | POST /v3/async/minimax-hailuo-2.3-fast-i2v |
prompt、image |
duration、resolution、enable_prompt_expansion |
所有三个端点都是异步的。创建请求返回一个 task_id,而不是完成的视频 URL。应用程序应存储任务 ID,并使用 Novita AI Task Result API 在任务完成时检索生成的输出。
2026 年 6 月 23 日检查的 Hailuo 2.3 API 参考列出了 duration 选项 6 和 10。它们列出 resolution 默认为 768P,6 秒视频可用 768P 和 1080P,10 秒视频可用 768P。prompt 字段在所有三种模式下都是必需的,支持 1 到 2000 个字符。
对于图像导向模式,image 字段支持公共 URL 或 Base64 数据 URL,例如 data:image/jpeg;base64,...。这使得 I2V 和 Fast I2V 更适合视觉种子已存在于存储、设计工具、产品目录或前一代步骤中的工作流程。
T2V、I2V 和 Fast I2V 之间有什么区别?
当片段的第一个版本应仅来自语言时,选择 Hailuo 2.3 文本转视频。对于概念探索、场景构思、镜头规划以及尚未有固定产品图像或角色框架的提示测试,这是一个更清晰的起点。
T2V 也是最简单的请求形式。它没有图像上传或图像 URL 要求,因此产品可以收集提示、选择时长和分辨率、提交任务并轮询结果。当验收标准是关于场景创意而不是对特定起始图像的保真度时,使用它。
当输入图像是验收标准的一部分时,选择 Hailuo 2.3 图像转视频。如果你已经拥有资产,不应从文本重新创建产品静帧、批准的字符帧、品牌视觉、分镜面板或生成的关键帧。使用 I2V,以便生成从你提供的图像开始。
标准 I2V 也适用于审查工作流程,其中设计师、营销人员或产品团队在添加动作之前对静帧进行批准。输入图像成为片段的参考点,而提示描述场景应如何移动。
当你已经有一张图像并想测试 Fast I2V 端点的更低列出的价格时,选择 Hailuo 2.3 快速图像转视频。Fast I2V 不是仅提示模式;它仍然需要 image 加 prompt。因此,它是图像导向工作流程中的成本和端点选择,而不是 T2V 的替代品。
文档将 Fast Hailuo 2.3 描述为加速的,旨在以更经济高效的速率平衡质量和性能。对于实际规划,将其视为早期使用你自己的资产进行测试的理由,而不是假设它将始终取代标准 I2V。如果 Fast I2V 通过了你的视觉验收标准,它可能是更好的迭代通道。如果没有,将相同的图像和提示方向移动到标准 I2V。
有一个记录的控制差异需要注意。T2V 和标准 I2V 请求体包含 fast_pretreatment;文档中显示的 Fast I2V 请求体没有。T2V 和标准 I2V 文档还列出了 15 个支持的摄像机命令,包括平移、俯仰、变焦、横移、推进、拉远、升降、晃动、跟踪镜头和静态镜头。本文检查的 Fast I2V 页面不包括该摄像机命令部分,因此避免在所有三种模式中承诺相同的摄像机命令行为,除非你自己的测试确认了它。
Hailuo 2.3 在 Novita AI 上多少钱?
2026 年 6 月 23 日检查的当前 Novita 模型库和定价数据列出了以下 MiniMax Hailuo 2.3 行:
| 模式 | 时长 | 分辨率 | 价格 |
|---|---|---|---|
| Hailuo 2.3 文本转视频 | 6 秒 | 768P | $0.28/视频 |
| Hailuo 2.3 文本转视频 | 10 秒 | 768P | $0.56/视频 |
| Hailuo 2.3 文本转视频 | 6 秒 | 1080P | $0.49/视频 |
| Hailuo 2.3 图像转视频 | 6 秒 | 768P | $0.28/视频 |
| Hailuo 2.3 图像转视频 | 10 秒 | 768P | $0.56/视频 |
| Hailuo 2.3 图像转视频 | 6 秒 | 1080P | $0.49/视频 |
| Hailuo 2.3 快速图像转视频 | 6 秒 | 768P | $0.19/视频 |
| Hailuo 2.3 快速图像转视频 | 10 秒 | 768P | $0.32/视频 |
| Hailuo 2.3 快速图像转视频 | 6 秒 | 1080P | $0.33/视频 |
两个定价要点对规划很重要。首先,标准 T2V 和标准 I2V 在相同的时长和分辨率下具有相同的可见价格行。根据输入而不是成本在它们之间选择。其次,在可见的 Hailuo 2.3 行中,Fast I2V 的价格低于标准 I2V,但它需要图像,并且应针对你自己的输出标准进行评估。
对于早期探索,6 秒 768P 是每种模式中最低的可见选项。对于仅提示测试,这意味着使用 T2V 为 $0.28/视频。对于图像导向测试,这意味着使用标准 I2V 为 $0.28/视频或使用 Fast I2V 为 $0.19/视频。
对于 1080P,可见的 Hailuo 2.3 行是 6 秒任务:T2V 或标准 I2V 为 $0.49/视频,Fast I2V 为 $0.33/视频。对于 10 秒任务,可见行是 768P:T2V 或标准 I2V 为 $0.56/视频,Fast I2V 为 $0.32/视频。
价格可能变化。在高批量之前,请在 Novita AI 模型库 或控制台定价视图中验证确切行。
你应该首先测试哪种模式?
如果想法仍然仅存在于简报中,从 T2V 开始。保持第一个提示简短,选择 6 秒 768P,并且仅在会影响审查时添加摄像机方向。这使第一次测试轻量化:无需图像准备,无需资产上传,只需快速检查场景概念是否值得开发。
如果图像已经是简报的一部分,首先使用标准 I2V。一个产品静帧、角色帧或分镜面板将工作从“发明场景”变为“动画这个精确的起点”。T2V 可能创建一些看似合理的东西,但它无法保留特定的源图像,除非该图像被传递到 I2V 端点。
当你已经拥有图像并希望在选出最终作品之前有更多实验空间时,Fast I2V 很有用。因为它对图像导向任务具有最低的可见 Hailuo 2.3 价格行,它是测试运动方向、提示措辞以及源图像是否作为种子起作用的合理通道。在该通道之后,如果输出符合你的标准,继续使用 Fast I2V,或者将更强的候选移动到标准 I2V。
主要的陷阱是过早选择 Fast I2V。它仍然是图像转视频,因此对于没有附带图像的书面简报来说不是捷径。在这种情况下,T2V 是更好的首次测试。
对于广泛探索,768P 通常足以判断提示方向、图像适配和运动想法。将 1080P 保留给足够接近以详细检查的较小片段集。
当额外时间改变创作决策时使用 10 秒测试,而不是作为默认的第一次测试。文档记录的 10 秒任务的 Hailuo 2.3 行是 768P;如果你的团队需要 1080P,请围绕 6 秒任务进行规划,或在承诺批次之前确认实时控制台是否已添加更新的选项。
MiniMax Hailuo 2.3 API 工作流程
一个生产集成分将 Hailuo 2.3 视为异步工作流程:
- 从可用输入中选择 T2V、I2V 或 Fast I2V。
- 选择 6 秒或 10 秒的时长。
- 选择
768P或1080P,注意 1080P 是针对 6 秒任务记录的。 - 将请求提交到特定模型的异步端点。
- 存储返回的
task_id。 - 轮询任务结果 API,直到任务成功或失败。
- 根据你的产品保留规则存储返回的媒体 URL。
这是一个最简的文本转视频请求:
curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-t2v' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${NOVITA_API_KEY}" \
--data-raw '{
"prompt": "A compact smart speaker on a kitchen counter lights up as the camera slowly pushes in. Soft morning light, clean product demo, no text overlays.",
"duration": 6,
"resolution": "768P",
"enable_prompt_expansion": true,
"fast_pretreatment": false
}'
这是一个最简的图像转视频请求:
curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-i2v' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${NOVITA_API_KEY}" \
--data-raw '{
"image": "https://example.com/product-frame.jpg",
"prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
"duration": 6,
"resolution": "768P",
"enable_prompt_expansion": true,
"fast_pretreatment": false
}'
这是使用 Fast I2V 的相同图像导向测试:
curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-fast-i2v' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer ${NOVITA_API_KEY}" \
--data-raw '{
"image": "https://example.com/product-frame.jpg",
"prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
"duration": 6,
"resolution": "768P",
"enable_prompt_expansion": true
}'
在所有三种情况下,为排队、处理、成功和失败状态构建。初始响应给你一个任务 ID;并不意味着视频已可用。
最终推荐
对于大多数团队,第一个 MiniMax Hailuo 2.3 测试应是 6 秒 768P。如果你只有提示,使用 T2V。如果第一帧或参考图像是不可协商的,使用标准 I2V。如果你有一张图像并希望在决定哪些输出值得标准 I2V 或 1080P 审查之前有一个更低价格的迭代通道,使用 Fast I2V。
这个序列使第一次测试与实际输入约束相关联。它还避免了一个常见错误:将快速模式视为通用捷径。Fast Hailuo 2.3 是一个图像转视频端点,因此只有在存在图像后才有用。
常见问题
MiniMax Hailuo 2.3 在 Novita AI 上是否可用于文本转视频?
是的。Novita AI 记录了 POST /v3/async/minimax-hailuo-2.3-t2v 用于 MiniMax Hailuo 2.3 文本转视频。
MiniMax Hailuo 2.3 在 Novita AI 上是否可用于图像转视频?
是的。Novita AI 记录了 POST /v3/async/minimax-hailuo-2.3-i2v 用于标准图像转视频和 POST /v3/async/minimax-hailuo-2.3-fast-i2v 用于快速图像转视频。
Hailuo 2.3 I2V 和 Fast I2V 之间有什么区别?
两者都需要 prompt 和 image。Fast I2V 端点具有比标准 I2V 更低的可见价格行,并作为 minimax-hailuo-2.3-fast-i2v 单独记录。标准 I2V 在记录的请求体中包含 fast_pretreatment;Fast I2V 没有显示该字段。
Hailuo 2.3 是否支持 1080P?
是的,支持 6 秒任务。2026 年 6 月 23 日检查的 Hailuo 2.3 文档列出了 6 秒视频的 768P 和 1080P,仅 10 秒视频的 768P。
MiniMax Hailuo 2.3 在 Novita AI 上多少钱?
2026 年 6 月 23 日检查的可见行起价为 $0.28/视频(6 秒 768P T2V 或标准 I2V)、$0.19/视频(6 秒 768P Fast I2V)、$0.49/视频(6 秒 1080P T2V 或标准 I2V)和 $0.33/视频(6 秒 1080P Fast I2V)。
