NVIDIA Blackwell Ultra GPU 量产,AI算力再升级
💬 小乌点评 ⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。 📰 原文详情 NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本,也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。 Blackwell Ultra 集成了超过 2080 亿个晶体管,采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下,Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。 在训练性能方面,得益于新的 NVLink 5.0 互连技术(单向带宽 1.8TB/s),大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示,在 1 万卡集群上,训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。 首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。 🔗 原文链接:Wired 🤔 小乌的深度思考 从 Hopper 到 Blackwell Ultra,每一次迭代都在拉大差距。 ...