构建AI智能体日益简单,但大规模部署仍是重大挑战。传统基础设施(如容器、虚拟机、无服务器函数)是为传统Web应用设计的,无法满足AI智能体工作负载的独特需求。
Novita Agent Runtime 通过提供专为部署AI智能体而构建的无服务器基础设施解决了这一差距。它基于Novita的智能体沙箱构建,支持LangGraph工作流、Microsoft AutoGen多智能体系统以及自定义实现。以最少的代码更改和零基础设施管理,将现有智能体部署到生产环境。
阻碍AI智能体的基础设施缺口
传统应用遵循可预测的模式:接收请求、处理请求、返回响应。整个生命周期在毫秒或秒内完成,每个请求独立处理。
AI智能体的运作方式不同。它们在交互中保持推理状态,运行扩展工作流,以不可预测的延迟调用外部服务,并且需要对处理敏感数据的并发用户进行强隔离。
现有基础设施无法很好地满足这些需求:
| 特性 | Agent沙箱 | 容器 | 无服务器 | 虚拟机 |
| 启动时间 | <200ms(MicroVM) | 秒级 | 1秒 | 30秒以上 |
| 安全隔离 | 强(MicroVM) | 弱(共享内核) | 强 | 强 |
| 状态持久化 | 即时挂起/恢复 | 支持 | 无状态 | 慢速快照恢复 |
| 最大执行时间 | 数小时 | 无限制 | 通常15分钟限制 | 无限制 |
| 开发者体验 | 智能体优化API | 通用API | 函数级API | 基础设施级API |
Novita Agent Sandbox 结合了毫秒级启动、MicroVM隔离、有状态执行和智能体原生API。Novita Agent Runtime 构建于Agent Sandbox之上,让您以最少的代码更改将现有智能体部署到该基础设施上。
Novita Agent Runtime:专为AI智能体打造

Novita Agent Runtime 是一款轻量级、框架无关的无服务器部署工具包,基于兼容AgentCore的架构构建。它使您能够安全高效地将现有AI智能体部署到生产环境,无需深入的DevOps专业知识或基础设施管理。
该工具包支持实时交互和长时间运行的工作负载,从需要亚秒级响应的对话界面到可能需要数小时完成的复杂推理任务。
Novita Agent Runtime 包含SDK和CLI工具。SDK提供基于装饰器的API,可将您的智能体暴露为标准HTTP服务,以及以编程方式调用智能体的方法。CLI支持一键配置和部署到Novita Agent Sandbox生态系统。
Novita Agent Runtime 的关键能力

框架无关。 Novita Agent Runtime 兼容 LangGraph、Microsoft AutoGen、Google ADK、OpenAI Agents SDK、CrewAI 以及自定义实现。使用您偏好的框架,无需受基础设施限制。
模型无关。 该运行时独立于您的模型选择。可与 Novita AI、Anthropic Claude、Google Gemini、OpenAI 以及任何其他提供商配合使用。
亚200毫秒冷启动。 轻量级虚拟化技术实现了接近容器的启动速度,同时具备硬件级环境隔离。即使是首次请求也能获得亚秒级响应。
完整会话隔离。 每个用户会话在专用的微虚拟机中运行,具有独立的CPU、内存和文件系统资源。会话完成后,整个微虚拟机会终止并被清理。
数小时执行。 该平台支持跨越数小时的长时间运行工作负载,支持复杂的智能体推理、异步工作流和多智能体协作。
按用量计费。 只为实际使用付费。从原型到生产环境的扩展,无需为未使用的容量超支或担心资源规划。
从代码到云端,三步完成
第一步:集成SDK。 使用SDK基于装饰器的API,在现有智能体实现中添加几行代码。SDK会自动处理请求路由、响应格式化和健康检查。
from novita_sandbox.agent_runtime import AgentRuntimeApp
app = AgentRuntimeApp()
@app.entrypoint
def my_agent(request: dict):
# 智能体业务逻辑
return {"result": "..."}
第二步:一键部署。 使用CLI配置并部署您的智能体:
# 配置智能体
novita-sandbox-cli agent configure
# 部署到云端
novita-sandbox-cli agent launch
CLI会生成Dockerfile和.novita-agent.yaml配置文件,构建沙箱模板并上传,然后生成一个格式为<agent_name>-<template_id>的Agent ID。
第三步:调用您的智能体。 部署后,通过CLI快速测试调用:
# 使用CLI快速测试
novita-sandbox-cli agent invoke "你好,智能体!"
或通过SDK以编程方式调用:
import json
from novita_sandbox.agent_runtime import AgentRuntimeCliendevet
client = AgentRuntimeClient(api_key="your-api-key")
# 准备请求数据(转换为JSON字符串并编码为字节)
payload = json.dumps({"prompt": "Hello, Agent!"}).encode()
response = await client.invoke_agent_runtime(
agentId="agent-xxxxx",
payload=payload
)
每次调用都会创建一个隔离的沙箱实例,在该安全环境中执行智能体,并返回结果。
关于详细的代码示例演练,请参阅快速入门指南。有关完整的安装说明,请参阅安装指南。
兼容所有主流AI框架
所有框架集成都遵循一致的模式:初始化AgentRuntimeApp、设置框架、使用装饰器定义入口点、运行应用。SDK可与LangGraph、OpenAI Agents SDK、Microsoft AutoGen、Google ADK以及自定义实现无缝配合。
from novita_sandbox.agent_runtime import AgentRuntimeApp
# 1. 创建Agent Runtime应用实例
app = AgentRuntimeApp()
# 2. 初始化您的Agent框架
# 3. 使用装饰器定义入口点
@app.entrypoint
def agent_invocation(request: dict) -> dict:
"""
Args:
request: 请求数据,通常包含prompt等字段
Returns:
响应数据字典
"""
prompt = request.get("prompt", "")
# 调用您的Agent框架
result = your_agent.run(prompt)
return {"result": result}
# 4. 运行应用
if __name__ == "__main__":
app.run()
有关详细的集成示例,请参阅Agent框架集成指南。关于流式响应、多轮对话和环境变量管理等高级功能,请参考高级功能文档。
透明的按秒计费模式
Novita Agent Runtime 采用按用量计费,粒度为每秒计费。
CPU
| vCPU | 单价(每秒) |
| 1× CPU | $0.00000784/s |
| 2× CPU | $0.00001568/s |
| 3× CPU | $0.00002352/s |
| 4× CPU | $0.00003136/s |
| 5× CPU | $0.0000392/s |
| 6× CPU | $0.00004704/s |
| 7× CPU | $0.00005488/s |
| 8× CPU | $0.00006272/s |
内存
| 内存 | 单价 |
| 有效值:512 MiB 的倍数,从512 MiB到8192 MiB(每GiB/秒) | $0.00000256 / GiB / s |
| 512 MiB | $0.00000128 / s |
| 1 GiB | $0.00000256 / s |
| 2 GiB | $0.00000512 / s |
存储:每个账户包含60 GB免费存储。额外存储按 $0.000072/GB/h 计费。
立即开始构建生产级AI智能体
Novita Agent Runtime 消除了传统上拖慢AI智能体部署的基础设施复杂性。专为智能体设计的无服务器基础设施,拥有亚200毫秒冷启动、完整会话隔离和框架灵活性,使开发团队能够专注于构建智能体行为,而非管理基础设施。
立即开始:安装SDK和CLI,然后在数分钟内部署您的第一个智能体。如需额外支持,请加入Novita AI Discord社区或联系我们的销售团队。
关于Novita AI
Novita AI 是一个AI云平台,为开发者提供通过简单API部署AI模型的便捷方式,同时提供经济实惠且可靠的GPU云用于构建和扩展。
