在 Novita AI 上的 MiniMax Hailuo 2.3:文本转视频 vs 图像转视频 vs 快速模式

在 Novita AI 上的 MiniMax Hailuo 2.3:文本转视频 vs 图像转视频 vs 快速模式

在 Novita AI 上的 MiniMax Hailuo 2.3 最容易通过你的输入来选择:当场景仅以提示形式存在时,使用文本转视频;当第一帧或参考图像必须锚定片段时,使用图像转视频;当你已经有一张图像并希望在标准 I2V 上花费之前测试更低价的 Fast I2V 端点时,使用快速图像转视频。

MiniMax Hailuo 2.3 模式选择表

决策 起始点 原因
你只有一个书面场景 Hailuo 2.3 文本转视频 T2V 端点需要 prompt,不需要图像。
你有一个产品帧、角色帧、分镜帧或已批准的视觉素材 Hailuo 2.3 图像转视频 I2V 端点需要 promptimage,因此输入图像锚定第一个视觉状态。
你有一张图像,需要更便宜的首次 I2V 测试 Hailuo 2.3 快速图像转视频 对于相同的可见时长和分辨率组合,Fast I2V 的价格行低于标准 I2V。
你需要 1080P 输出 三种模式中的任何一种,限于 6 秒 Novita 文档列出 1080P 支持 6 秒的 Hailuo 2.3 任务;10 秒任务仅列出 768P。
你需要一个 10 秒的片段 T2V、I2V 或 Fast I2V,768P 文档列出 10 秒为可用时长,768P 为支持的 10 秒分辨率。
你需要 API 参考中记录的提示性摄像机命令 T2V 或标准 I2V T2V 和 I2V 文档列出了 15 个支持的摄像机命令;Fast I2V 页面没有列出那个摄像机命令部分。
你正在预算一个广泛的测试批次 从 6 秒 768P 开始;仅当有图像可用时使用 Fast I2V 6 秒 768P 是每种模式中最小的可见行,Fast I2V 是最小的可见 Hailuo 2.3 I2V 行。
你正在制作一个近乎最终的仅提示片段 以目标分辨率和时长的 T2V T2V 是这里唯一不需要图像输入的 Hailuo 2.3 系列端点。
你正在制作一个近乎最终的资产导向片段 以目标分辨率和时长的标准 I2V 标准 I2V 保持了图像导向的工作流程,同时使用非快速端点。

重要的区别不是抽象上的“哪个模式最好”。而是你的第一个有用测试应该是仅提示、图像导向还是更低价的 Fast I2V 通道。如果没有源图像,快速模式不是一个选项,因为 Fast Hailuo 2.3 被记录为图像转视频端点。

Novita AI 上的 MiniMax Hailuo 2.3 API 模式

Novita AI 记录了三个独立的异步 MiniMax Hailuo 2.3 视频 API:

模式 Novita API 路径 必需输入 共享控制
MiniMax Hailuo 2.3 文本转视频 POST /v3/async/minimax-hailuo-2.3-t2v prompt durationresolutionenable_prompt_expansionfast_pretreatment
MiniMax Hailuo 2.3 图像转视频 POST /v3/async/minimax-hailuo-2.3-i2v promptimage durationresolutionenable_prompt_expansionfast_pretreatment
MiniMax Hailuo 2.3 快速图像转视频 POST /v3/async/minimax-hailuo-2.3-fast-i2v promptimage durationresolutionenable_prompt_expansion

所有三个端点都是异步的。创建请求返回一个 task_id,而不是完成的视频 URL。应用程序应存储任务 ID,并使用 Novita AI Task Result API 在任务完成时检索生成的输出。

2026 年 6 月 23 日检查的 Hailuo 2.3 API 参考列出了 duration 选项 610。它们列出 resolution 默认为 768P,6 秒视频可用 768P1080P,10 秒视频可用 768Pprompt 字段在所有三种模式下都是必需的,支持 1 到 2000 个字符。

对于图像导向模式,image 字段支持公共 URL 或 Base64 数据 URL,例如 data:image/jpeg;base64,...。这使得 I2V 和 Fast I2V 更适合视觉种子已存在于存储、设计工具、产品目录或前一代步骤中的工作流程。

T2V、I2V 和 Fast I2V 之间有什么区别?

当片段的第一个版本应仅来自语言时,选择 Hailuo 2.3 文本转视频。对于概念探索、场景构思、镜头规划以及尚未有固定产品图像或角色框架的提示测试,这是一个更清晰的起点。

T2V 也是最简单的请求形式。它没有图像上传或图像 URL 要求,因此产品可以收集提示、选择时长和分辨率、提交任务并轮询结果。当验收标准是关于场景创意而不是对特定起始图像的保真度时,使用它。

当输入图像是验收标准的一部分时,选择 Hailuo 2.3 图像转视频。如果你已经拥有资产,不应从文本重新创建产品静帧、批准的字符帧、品牌视觉、分镜面板或生成的关键帧。使用 I2V,以便生成从你提供的图像开始。

标准 I2V 也适用于审查工作流程,其中设计师、营销人员或产品团队在添加动作之前对静帧进行批准。输入图像成为片段的参考点,而提示描述场景应如何移动。

当你已经有一张图像并想测试 Fast I2V 端点的更低列出的价格时,选择 Hailuo 2.3 快速图像转视频。Fast I2V 不是仅提示模式;它仍然需要 imageprompt。因此,它是图像导向工作流程中的成本和端点选择,而不是 T2V 的替代品。

文档将 Fast Hailuo 2.3 描述为加速的,旨在以更经济高效的速率平衡质量和性能。对于实际规划,将其视为早期使用你自己的资产进行测试的理由,而不是假设它将始终取代标准 I2V。如果 Fast I2V 通过了你的视觉验收标准,它可能是更好的迭代通道。如果没有,将相同的图像和提示方向移动到标准 I2V。

有一个记录的控制差异需要注意。T2V 和标准 I2V 请求体包含 fast_pretreatment;文档中显示的 Fast I2V 请求体没有。T2V 和标准 I2V 文档还列出了 15 个支持的摄像机命令,包括平移、俯仰、变焦、横移、推进、拉远、升降、晃动、跟踪镜头和静态镜头。本文检查的 Fast I2V 页面不包括该摄像机命令部分,因此避免在所有三种模式中承诺相同的摄像机命令行为,除非你自己的测试确认了它。

Hailuo 2.3 在 Novita AI 上多少钱?

2026 年 6 月 23 日检查的当前 Novita 模型库和定价数据列出了以下 MiniMax Hailuo 2.3 行:

模式 时长 分辨率 价格
Hailuo 2.3 文本转视频 6 秒 768P $0.28/视频
Hailuo 2.3 文本转视频 10 秒 768P $0.56/视频
Hailuo 2.3 文本转视频 6 秒 1080P $0.49/视频
Hailuo 2.3 图像转视频 6 秒 768P $0.28/视频
Hailuo 2.3 图像转视频 10 秒 768P $0.56/视频
Hailuo 2.3 图像转视频 6 秒 1080P $0.49/视频
Hailuo 2.3 快速图像转视频 6 秒 768P $0.19/视频
Hailuo 2.3 快速图像转视频 10 秒 768P $0.32/视频
Hailuo 2.3 快速图像转视频 6 秒 1080P $0.33/视频

两个定价要点对规划很重要。首先,标准 T2V 和标准 I2V 在相同的时长和分辨率下具有相同的可见价格行。根据输入而不是成本在它们之间选择。其次,在可见的 Hailuo 2.3 行中,Fast I2V 的价格低于标准 I2V,但它需要图像,并且应针对你自己的输出标准进行评估。

对于早期探索,6 秒 768P 是每种模式中最低的可见选项。对于仅提示测试,这意味着使用 T2V 为 $0.28/视频。对于图像导向测试,这意味着使用标准 I2V 为 $0.28/视频或使用 Fast I2V 为 $0.19/视频。

对于 1080P,可见的 Hailuo 2.3 行是 6 秒任务:T2V 或标准 I2V 为 $0.49/视频,Fast I2V 为 $0.33/视频。对于 10 秒任务,可见行是 768P:T2V 或标准 I2V 为 $0.56/视频,Fast I2V 为 $0.32/视频。

价格可能变化。在高批量之前,请在 Novita AI 模型库 或控制台定价视图中验证确切行。

你应该首先测试哪种模式?

如果想法仍然仅存在于简报中,从 T2V 开始。保持第一个提示简短,选择 6 秒 768P,并且仅在会影响审查时添加摄像机方向。这使第一次测试轻量化:无需图像准备,无需资产上传,只需快速检查场景概念是否值得开发。

如果图像已经是简报的一部分,首先使用标准 I2V。一个产品静帧、角色帧或分镜面板将工作从“发明场景”变为“动画这个精确的起点”。T2V 可能创建一些看似合理的东西,但它无法保留特定的源图像,除非该图像被传递到 I2V 端点。

当你已经拥有图像并希望在选出最终作品之前有更多实验空间时,Fast I2V 很有用。因为它对图像导向任务具有最低的可见 Hailuo 2.3 价格行,它是测试运动方向、提示措辞以及源图像是否作为种子起作用的合理通道。在该通道之后,如果输出符合你的标准,继续使用 Fast I2V,或者将更强的候选移动到标准 I2V。

主要的陷阱是过早选择 Fast I2V。它仍然是图像转视频,因此对于没有附带图像的书面简报来说不是捷径。在这种情况下,T2V 是更好的首次测试。

对于广泛探索,768P 通常足以判断提示方向、图像适配和运动想法。将 1080P 保留给足够接近以详细检查的较小片段集。

当额外时间改变创作决策时使用 10 秒测试,而不是作为默认的第一次测试。文档记录的 10 秒任务的 Hailuo 2.3 行是 768P;如果你的团队需要 1080P,请围绕 6 秒任务进行规划,或在承诺批次之前确认实时控制台是否已添加更新的选项。

MiniMax Hailuo 2.3 API 工作流程

一个生产集成分将 Hailuo 2.3 视为异步工作流程:

  1. 从可用输入中选择 T2V、I2V 或 Fast I2V。
  2. 选择 6 秒或 10 秒的时长。
  3. 选择 768P1080P,注意 1080P 是针对 6 秒任务记录的。
  4. 将请求提交到特定模型的异步端点。
  5. 存储返回的 task_id
  6. 轮询任务结果 API,直到任务成功或失败。
  7. 根据你的产品保留规则存储返回的媒体 URL。

这是一个最简的文本转视频请求:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A compact smart speaker on a kitchen counter lights up as the camera slowly pushes in. Soft morning light, clean product demo, no text overlays.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

这是一个最简的图像转视频请求:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

这是使用 Fast I2V 的相同图像导向测试:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-fast-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true
  }'

在所有三种情况下,为排队、处理、成功和失败状态构建。初始响应给你一个任务 ID;并不意味着视频已可用。

最终推荐

对于大多数团队,第一个 MiniMax Hailuo 2.3 测试应是 6 秒 768P。如果你只有提示,使用 T2V。如果第一帧或参考图像是不可协商的,使用标准 I2V。如果你有一张图像并希望在决定哪些输出值得标准 I2V 或 1080P 审查之前有一个更低价格的迭代通道,使用 Fast I2V。

这个序列使第一次测试与实际输入约束相关联。它还避免了一个常见错误:将快速模式视为通用捷径。Fast Hailuo 2.3 是一个图像转视频端点,因此只有在存在图像后才有用。

常见问题

MiniMax Hailuo 2.3 在 Novita AI 上是否可用于文本转视频?

是的。Novita AI 记录了 POST /v3/async/minimax-hailuo-2.3-t2v 用于 MiniMax Hailuo 2.3 文本转视频。

MiniMax Hailuo 2.3 在 Novita AI 上是否可用于图像转视频?

是的。Novita AI 记录了 POST /v3/async/minimax-hailuo-2.3-i2v 用于标准图像转视频和 POST /v3/async/minimax-hailuo-2.3-fast-i2v 用于快速图像转视频。

Hailuo 2.3 I2V 和 Fast I2V 之间有什么区别?

两者都需要 promptimage。Fast I2V 端点具有比标准 I2V 更低的可见价格行,并作为 minimax-hailuo-2.3-fast-i2v 单独记录。标准 I2V 在记录的请求体中包含 fast_pretreatment;Fast I2V 没有显示该字段。

Hailuo 2.3 是否支持 1080P?

是的,支持 6 秒任务。2026 年 6 月 23 日检查的 Hailuo 2.3 文档列出了 6 秒视频的 768P1080P,仅 10 秒视频的 768P

MiniMax Hailuo 2.3 在 Novita AI 上多少钱?

2026 年 6 月 23 日检查的可见行起价为 $0.28/视频(6 秒 768P T2V 或标准 I2V)、$0.19/视频(6 秒 768P Fast I2V)、$0.49/视频(6 秒 1080P T2V 或标准 I2V)和 $0.33/视频(6 秒 1080P Fast I2V)。

推荐文章