$0.55/小时的 L40s:面向 AI、图形和 HPC 的全能 GPU

$0.55/小时的 L40s:面向 AI、图形和 HPC 的全能 GPU

NVIDIA L40S 是一款高度通用的 GPU,专为 AI 训练、推理、图形和科学工作负载而设计——全部集成在一张卡中。

Novita AI 上,您只需 **$0.55/小时 ** 即可使用 L40S。相比之下,RunPod 上同一 GPU 的定价为 $0.86/小时,这使得 Novita AI 成为云端高性能计算更具成本效益的选择。

Novita AI

Runpod

L40S 是什么?

NVIDIA L40S GPU 基于 Ada Lovelace 架构构建,是一款专为处理苛刻的 AI、图形和高性能计算(HPC)工作负载而设计的性能怪兽。L40S 的独特之处在于其 全能性,在 AI 推理与训练、专业可视化及视频处理任务中提供了原始计算能力的平衡。

l40s

关键性能指标

**指标 ** ** 数值**
Tensor Cores 568(第四代)
CUDA Cores 18,176
RT Cores 142(第三代)
FP32 性能 90.5 TFLOPS
TF32 性能(密集) 733 TFLOPS
TF32 性能(稀疏) 1466 TFLOPS
FP8 性能(密集) 1466 TFLOPS
FP8 性能(稀疏) 2.93 PFLOPS
FP64 性能 1.4 TFLOPS
内存容量 48GB GDDR6 ECC
内存带宽 1006 GB/s
TDP 300W - 350W

1. 核心计算性能

l40s 核心计算性能

2. 内存与带宽

L40S 提供巨大的内存和带宽,使其非常适合数据密集型工作负载:

  • **内存容量 **:配备 48GB GDDR6 ECC 内存
  • **内存带宽 **:L40S 提供高达 1006 GB/s 的内存带宽。

3. 多实例 GPU(MIG)技术

NVIDIA L40S 不支持 MIG。

4. FP64 性能

虽然 L40S 更侧重于 AI、图形和通用计算,但它仍提供 1.4 TFLOPS 的 FP64(双精度)性能。

虽然这一性能水平低于 H100 等专用 GPU,但对于某些需要更高数值精度的科学和工程应用来说已经足够。

L40S 的成本效益

l40s 成本

虽然 L40S 较高的初始成本 看起来相当可观,但在某些使用场景下(例如需要处理多种计算密集型任务的企业、研究机构和数据中心),它随着时间的推移提供了更好的成本效益。L40S 带来的长期效益足以抵消其较高的前期成本:

  • 整合能力:用更少的卡处理更多样的任务。
  • 更高生产力:更快完成任务,处理更大的数据集和模型。
  • 降低运营成本:节省电力和冷却费用。
  • 更优的可靠性与可用性:减少因硬件故障或数据错误导致的停机时间和返工。
  • **更高资源利用率 **:通过 MIG(多实例 GPU) 提升 GPU 效率,实现更好的资源共享。

长远来看,这些因素共同促成了 更低的总拥有成本(TCO),使 L40S 成为高性能、多任务环境中的更经济高效之选。

L40S 的应用

极致的全能性

L40S 融合了 AI、图形和高精度工作负载三大领域的优势,而无需其他 GPU 的极端专业化:

  • 图形渲染 ** 方面 ** 优于 H100,同时在 ** 中规模 AI** 任务中依然高效。
  • 凭借其 Tensor Cores 和 ** 大容量内存 ,在 AI 方面 ** 比专业图形卡更强大
  • 凭借 **ECC 内存 **、MIG 支持 ** 和 ** 数据中心级可靠性 优于消费级 GPU

l40s 关键亮点

1. AI 训练与推理

  • 训练 :借助 48GB 内存 ** 和 ** 第四代 Tensor Cores,L40S 可以高效地训练大型模型,如 LLM 计算机视觉 ** 和 ** 推荐系统
  • **推理 **:提供 ** 高吞吐量 ** 和 ** 低延迟 **,非常适合 ** 图像识别 NLP 和 ** 实时转录 等 AI 应用。

2. 图形与可视化

  • **3D 内容创作 **:加速 ** 建模 动画渲染 ** 和 VFX 制作
  • **实时光线追踪 :提供顶级的 ** 虚拟制作 ** 能力,完美适用于 ** 电影 ** 和 ** 广播 行业。
  • CAD/CAE/AEC:为 ** 工程 ** 和 ** 建筑** 应用提供快速渲染。

3. 高精度工作负载

  • **科学计算 **:FP32 性能 ** 支持 CFD(计算流体动力学)、FEA(有限元分析)以及 ** 数据分析 基因组学 ** 和 ** 物理建模 中的模拟。

如何以极低价格使用 L40S?

Novita AI 提供了一个基于云的高性能 GPU 实例平台。凭借强大的 GPU,它确保复杂任务的性能,通过跨多种硬件的部署提升可访问性,与维护本地硬件用于大规模 AI 部署相比,提供了经济的解决方案。

步骤 1:注册账号

通过我们的网站创建您的 Novita AI 账号。注册后,导航至左侧边栏的 “Explore” 部分,查看我们的 GPU 产品,开始您的 AI 开发之旅。

Novita AI 网站截图

立即体验 Novita AI

步骤 2:探索模板和 GPU 服务器

从符合项目需求的模板(如 PyTorch、TensorFlow 或 CUDA)中进行选择。然后选择您偏好的 GPU 配置——选项包括强大的 L40S、RTX 4090 或 A100 SXM4,每种配置都提供不同的 VRAM、RAM 和存储规格。

Novita AI 网站截图 — 使用云端 GPU

步骤 3:定制您的部署

通过选择偏好的操作系统和配置选项来自定义您的环境,以确保为特定的 AI 工作负载和开发需求提供最佳性能。

l40s

步骤 4:启动实例

选择 “Launch Instance” 开始部署。您的高性能 GPU 环境将在几分钟内准备就绪,您可以立即开始机器学习、渲染或计算项目。

启动实例

NVIDIA L40S GPU 是 AI、图形和科学计算的真正全能之选。凭借强大的规格、48GB ECC 内存和 MIG 支持,它为现代工作负载在性能和成本之间取得了平衡。对于希望无需购买硬件即可轻松使用的用户,Novita AI 提供基于云的 L40S 实例——快速、灵活且经济实惠。

常见问题解答

NVIDIA L40S GPU 有何特别之处?

它在一张卡上处理 AI、图形和高精度任务——这是少数 GPU 才能做到的。

L40S 是否适合 AI 训练和推理?

是的。它的 Tensor Cores 和 48GB 内存使其非常适合两者。

如何在不购买的情况下试用 L40S?

使用 Novita AI 随时启动 L40S 云端实例——无需任何设置。

[Novita AI](https://novita.ai/?utm_source=blogs_GPU&utm_medium=article&utm_campaign=NVIDIA A100 GPU Performance: Why It’s Still the Go-to Choice for AI Training) 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的简便方法,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。

推荐阅读