NVIDIA GeForce RTX 5090于 30 年 2025 月 XNUMX 日发射,代表着 GPU 该技术拥有 92 亿个晶体管,每秒可进行 3,352 万亿次 AI 运算 (TOPS)。 Novita AI 使这款旗舰 Blackwell 架构 GPU 通过竞价型实例,其价格为每小时 0.25 美元,这是前所未有的,而按需定价则为每小时 0.50 美元。
RTX 21,760 拥有 32 个 CUDA 核心、7GB GDDR1,792 内存以及 5090 GB/s 内存带宽,性能比上一代产品高出 2 倍。 Novita AI的 Spot 实例模型通过利用备用资源节省高达 50% GPU 容量,类似于平台提供的 RTX 4090 GPU每小时 0.18 美元,而按需实例则为每小时 0.35 美元。每个 Spot 实例都包含 1 小时的保护窗口和提前中断通知,使开发人员能够以初创公司友好的价格利用企业级计算能力。
RTX 5090 的规格是什么?
RTX 5090 的 Blackwell 架构引入了突破性的功能,NVIDIA 首席执行官黄仁勋称之为“自可编程着色以来最重要的计算机图形创新”。这款显卡基于 92 亿个晶体管构建, GPU 为游戏和 AI 工作负载提供前所未有的性能。
核心架构和处理能力
RTX 5090 拥有 21,760 个 CUDA 核心,分布在 170 个流多处理器 (SM) 上,比 RTX 33 的 4090 个核心数量增加了 16,384%。这些核心的基本频率为 2.0 GHz,最高加速可达 2.41 GHz。尽管核心数量众多,NVIDIA 仍保持了较高的频率,从而为并行处理任务提供了卓越的吞吐量。
此 GPU 包含 680 个专为 AI 加速优化的第五代 Tensor Core。这些 Tensor Core 可提供 3,352 AI TOPS(每秒万亿次运算),使 RTX 5090 具备卓越的深度学习能力。此外,170 个第四代 RT Core 可支持高级光线追踪,并提升了光线三角形相交性能,从而在实时应用中呈现逼真的光照和阴影。
内存配置:32GB GDDR7
32GB GDDR7 显存标志着一项重大升级,比 RTX 33 的 4090GB 显存容量提升了 24%。该配置采用 512 位显存总线,可提供 1,792 GB/s 的带宽,比上一代产品高出 78%。如此强大的带宽确保 21,760 个 CUDA 核心即使在处理大型数据集或高分辨率纹理时也能得到充分利用。
升级到 GDDR7 技术不仅提升了容量,还提升了效率。GDDR28 的有效速度为 4090 Gbps,而 RTX 21 的有效速度仅为 XNUMX Gbps,这使得数据在内存和处理核心之间传输速度更快,从而消除了之前制约性能的瓶颈。 GPU 内存密集型应用程序中的性能。
电源要求和冷却
RTX 5090 Founders Edition 的总设计功耗 (TDP) 为 575W,远高于 RTX 4090 的 450W。NVIDIA 设计了革命性的双槽散热解决方案,配备 3D 均热板、集成式热管和双面风扇,使气流比传统设计提升一倍。该卡采用 16 针 PCIe 5.0 电源接口,需要强大的电源才能进行本地安装。
On Novita AI的云平台,这些电源和冷却需求对用户来说变得无关紧要。数据中心基础设施负责处理所有电力输送和热管理,让您可以专注于利用 GPU的计算能力。
RTX 5090 的价格是多少 Novita AI?
RTX 5090 创始人版的建议零售价为 1,999 美元,使其成为最昂贵的消费级显卡之一 GPU从未发布过。 Novita AI 通过两种定价模式将高昂的前期成本转化为可承受的小时费率。
Spot 实例与按需实例定价
| 定价模式 | RTX 5090 速率 | 每月费用(720 小时) | 储蓄 |
|---|---|---|---|
| 竞价实例 | $ 0.25 /小时 | $180 | 50% |
| 点播 | $ 0.50 /小时 | $360 | - |
竞价型实例每小时 0.25 美元的价格,让预算有限的项目也能轻松使用 RTX 5090。连续运行一个月仅需 180 美元,而硬件购买价格则高达 1,999 美元。具体来说,您需要运行 GPU 按 Spot 实例费率租用 8,000 小时(333 天),以匹配初始投资,不包括电力成本或折旧。
按需定价为每小时 0.50 美元,可保证可用性,且无中断风险。此定价套餐适用于生产工作负载、面向客户的应用程序以及时间关键型计算,因为任何中断都可能影响运营。
Novita AI GPU 产品组合比较
Novita AI 提供多个 GPU 不同价位的选择:
| GPU 型号 | 现货价格 | 按需价格 | 储蓄 | 内存 |
|---|---|---|---|---|
| RTX 5090 | $ 0.25 /小时 | $ 0.50 /小时 | 50% | 32GB GDDR7 |
| RTX 4090 | $ 0.18 /小时 | $ 0.35 /小时 | 〜49% | 24GB GDDR6X |
| RTX 4090 高频 | $ 0.35 /小时 | $ 0.69 /小时 | 〜49% | 24GB GDDR6X |
高频 RTX 4090 变体通过优化的 CPU 将 AI 图像生成速度提高高达 150%GPU 协调、示范 Novita AI致力于超越原始硬件规格的性能优化。
盈亏平衡分析
对于一家每月训练模型 200 小时的机器学习初创公司来说,竞价型实例的成本为 50 美元,而按需实例的成本为 100 美元,每年可节省 600 美元。对于一家每月运行 500 小时模拟的研究实验室来说,使用竞价型实例每月可节省 125 美元(每年可节省 1,500 美元)。这些节省下来的资金可以用来资助额外的实验、延长训练周期或其他研究资源。
如何在 Novita AI 只需 3 个步骤?
在 Novita AI 遵循与其他方法相同的简化流程 GPU 部署。

步骤 1:访问您的控制台
登录到您的 Novita AI GPU 安慰. 仪表板显示实时 GPU 可用性、当前 Spot 实例容量以及您最近的部署情况。此概述可帮助您做出明智的决策,确定何时何地部署实例。
第 2 步:切换到现货结算
在右侧边栏的“筛选条件”下,将计费方式从“按需”更改为“现货”,即可查看折扣价格。界面会立即更新,显示 RTX 5090 的价格为每小时 0.25 美元(而非每小时 0.50 美元),并清晰地标注了 50% 的优惠。这种透明性可确保您在部署前准确了解所需支付的费用。
步骤3:部署
选择您的 RTX 5090 配置,然后点击“部署”。您的实例将在几秒钟内启动:
- 保证 1 小时的保护期
- 节省高达 50% 的成本
- 配置提前 1 小时中断通知
- 预装 AI 框架
专业提示:在您的应用程序中实施检查点,以妥善处理潜在的中断。
每个实例都预配置了 PyTorch 2.0+、TensorFlow、CUDA 12.x、cuDNN 以及 Hugging Face Transformers 等热门库。这免除了数小时的设置时间,让您立即获得生产力。
怎么做 Novita AI Spot 实例有效吗?
Spot 实例利用 Novita AI备用 GPU 容量,从而以更低的价格提供这些容量,因为当常规实例需求增加时,这些容量可以回收。该模型已在 RTX 4090 上证明成功 GPUs,价格低至 0.18 美元/小时,而按需价格为 0.35 美元/小时。
主要特征
可变可用性:Spot 实例可能会在以下情况下中断 Novita AI 要求恢复容量。然而,这并不意味着随机终止——平台遵循结构化流程,并会提前通知。
显著节约成本:访问相同的 GPU 性能比按需价格低高达 50%。硬件和性能完全相同,仅可用性保证不同。
保护期:每个 Spot 实例在启动后都包含 1 小时的保护期。在此期间,无论容量需求如何,您的实例都不会中断。
提前通知:在回收前 1 小时收到中断通知,并额外提前 5 分钟发出警告。这些通知可让您保存工作、检查点进度并正常关闭应用程序。
与按需实例的比较
| 特性 | 竞价实例 | 按需实例 |
|---|---|---|
| 定价 | 最多可节省 50% | 标准费率 |
| 可用性 | 视容量而定 | 始终可用 |
| 中断风险 | 可经通知收回 | 没有打扰 |
| 保护期 | 发射后 1 小时 | 持续 |
| 用例 | 灵活、容错的工作负载 | 关键、不间断的工作负载 |
通过为适当的工作负载选择 Spot 实例,您可以访问同样强大的 GPU 资源,同时优化计算成本。
了解更多: Novita AI Spot 实例指南
为什么 RTX 5090 是人工智能和机器学习的理想选择?
RTX 5090 的架构专门针对人工智能和机器学习工作负载,其功能以前仅限于数据中心 GPU强大的计算能力、海量内存和先进的精度支持相结合,使其非常适合现代人工智能应用。
Tensor Core 演进与 AI 计算
第五代 Tensor Core 支持更新的精度格式,包括 FP8 和实验性 FP4,可在最大程度降低准确度影响的情况下,使某些模型的 AI 吞吐量翻倍。3,352 AI TOPS 的计算能力接近 NVIDIA 的 A100 和 H100 数据中心加速器,但格式更易于访问。
从实际角度来看,这意味着更快的训练时间和更高的推理吞吐量。在 RTX 6 上训练需要 4090 小时的 Transformer 模型,在 RTX 4 上可能只需 5090 小时即可完成。Stable Diffusion XL 图像生成速度从每张图像 3.5 秒提升至约 2 秒,从而加快了迭代和实验速度。
大型语言模型功能
32GB GDDR7 内存支持以半精度训练高达 13 亿个参数的 Transformer 模型,无需模型并行或梯度检查点。这比 RTX 4090 的 24GB 显存有了显著提升,因为后者通常需要优化技术来处理超过 7 亿个参数的模型。
预训练模型的微调效率显著提升。LoRA 微调此前曾突破内存限制,现在能够轻松运行,并支持更大的批量大小。内存的增加还能处理更长的上下文长度和更复杂的模型架构,避免出现内存不足的错误。
与数据中心的比较 GPUs
令人惊讶的是,RTX 5090 的 92 亿个晶体管甚至超过了 H100 的 80 亿个。虽然缺少 ECC 内存、NVLink 互连和多实例等功能 GPU (MIG)支持,RTX 5090 以极低的成本提供接近数据中心的性能。
RTX 5090 的 FP83 计算能力为 32 TFLOPS,而 A100 为 19.5 TFLOPS,接近 H100 的 67 TFLOPS。对于许多 AI 从业者来说,这在消费级市场提供了类似数据中心的性能。 GPU 定价,尤其是通过 Novita AI的 Spot 实例价格为每小时 0.25 美元。
哪些工作负载最适合 RTX 5090 Spot 实例?
Spot 实例最适合能够处理中断或在 1 小时保护窗口内完成的工作负载。了解哪些应用程序受益最多,有助于最大限度地提高价值,同时最大限度地降低运营复杂性。
理想应用场景
批处理和分布式训练:大规模模型训练并定期设置检查点,可节省 50% 的成本。跨多个 Spot 实例进行分布式训练可以大幅缩短训练时间,同时保持成本可控。由于各个实验之间相互独立,超参数调优和架构搜索非常适合 Spot 模型。
开发和测试环境:机器学习模型的原型开发、性能基准测试和 CI/CD 流水线在 Spot 实例上运行良好。节省的成本让您无需担心预算问题,即可进行更多实验并延长测试运行时间。
容错应用程序:具有负载均衡、渲染和视频处理管道、蒙特卡洛模拟以及遗传算法的无状态推理服务都可以有效地利用 Spot 实例。这些工作负载固有的抗中断能力使其成为理想的选择。
灵活期限的工作量:没有严格截止日期的研究计算、隔夜训练运行、数据迁移和转换任务以及档案处理可从 Spot 实例经济学中受益,而不会危及关键截止日期。
在你开始之前
确保您的工作负载能够处理中断并从检查点恢复。任务应在 1 小时的保护窗口内完成,或允许潜在的中断。将检查点保存到持久存储,并使用基于队列的作业分配来提高弹性。
更适合按需的工作负载
某些工作负载需要按需实例的可用性保证:实时生产服务、面向客户的应用程序、无法处理中断的工作负载,以及无需检查点的时间关键型计算。对于这些用例,0.50 美元/小时的按需定价可确保安心无虞,并实现运营稳定性。
结语
NVIDIA RTX 5090 代表了 GPU 技术,拥有 92 亿个晶体管、21,760 个 CUDA 核心和 32GB GDDR7 内存,每秒可进行 3,352 万亿次 AI 运算。这款旗舰 Blackwell 架构 GPU售价 1,999 美元,性能是其前代产品的 2 倍。
Novita AI 通过竞价实例,以每小时仅 0.25 美元的价格,让用户轻松访问这款尖端硬件,相比按需定价节省 50%。该模型沿用了 RTX 4090 的成功经验 GPU每小时 0.18 美元, Novita AI的 Spot 实例利用闲置容量,让每个人都能负担得起企业级计算。
开始利用 RTX 5090 的强大功能 今天通过 Novita AI简单的三步部署流程。体验 92 亿晶体管的计算能力,每小时 0.25 美元,如何加速您的创新,而无需增加开支。
常见问题
NVIDIA RTX 5090 什么时候发布?
NVIDIA 于 5090 年 30 月 2025 日正式发布了 GeForce RTX 2025。该产品于当月初在 CES XNUMX 期间发布,并于 XNUMX 月底限量上架。
RTX 5090 Founders Edition 的建议零售价为 1,999 美元。华硕、微星等合作伙伴的显卡价格可能更高。 Novita AI,您可以通过竞价型实例以每小时 5090 美元的价格或按需实例以每小时 0.25 美元的价格访问 RTX 0.50 的性能,从而避免大量的前期投资。
NVIDIA 宣称在某些场景下,RTX 2 的性能最高可达 4090 倍。实际使用中,许多游戏和基准测试显示 20K 分辨率下的帧率提升了 50-4%。使用 DLSS 4 的多帧生成技术时,性能差距可能会显著扩大。例如 GPU 计算任务(如渲染)预计可提高约 35-45%。
Spot 实例利用备用 GPU 容量最高可享五折优惠。RTX 50 Spot 实例价格为每小时 5090 美元,而按需实例价格为每小时 0.25 美元。每个实例包含 0.50 小时的保护窗口和提前 1 小时的中断通知。此模型非常适合批处理、带检查点的机器学习训练以及灵活的研究工作负载。
是的,您可以在 Novita AI 用于分布式训练。这种方法允许你将训练扩展到多个 GPU秒,缩短完成时间。竞价型实例每小时 0.25 美元 GPU,即使对于较小的团队来说,分布式培训也具有经济可行性。
是的,Spot 实例提供的硬件和性能与按需实例相同。唯一的区别在于可用性——Spot 实例可能会在通知后中断,而按需实例则持续运行。两者都能提供 RTX 5090 的全部性能。
Novita AI 是一个 AI 云平台,它为开发人员提供了一种使用我们简单的 API 轻松部署 AI 模型的方法,同时还提供经济实惠且可靠的 GPU 用于构建和扩展的云。
探索 Novita 的更多内容
订阅即可将最新帖子发送到您的电子邮箱。





