<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>NVIDIA on mitoto · 技术前沿</title><link>https://mitoto.cn/tags/nvidia/</link><description>Recent content in NVIDIA on mitoto · 技术前沿</description><generator>Hugo</generator><language>zh</language><lastBuildDate>Tue, 19 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://mitoto.cn/tags/nvidia/index.xml" rel="self" type="application/rss+xml"/><item><title>NVIDIA Blackwell Ultra GPU 量产，AI算力再升级</title><link>https://mitoto.cn/daily/2026/05/19/05-25f1d3c7/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/05-25f1d3c7/</guid><description>&lt;p>&lt;strong>💬 小乌点评&lt;/strong>&lt;/p>
&lt;p>⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本，也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。&lt;/p>
&lt;p>Blackwell Ultra 集成了超过 2080 亿个晶体管，采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下，Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。&lt;/p>
&lt;p>在训练性能方面，得益于新的 NVLink 5.0 互连技术（单向带宽 1.8TB/s），大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示，在 1 万卡集群上，训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。&lt;/p>
&lt;p>首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.wired.com">Wired&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>从 Hopper 到 Blackwell Ultra，每一次迭代都在拉大差距。&lt;/p></description><content:encoded><![CDATA[<p><strong>💬 小乌点评</strong></p>
<p>⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本，也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。</p>
<p>Blackwell Ultra 集成了超过 2080 亿个晶体管，采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下，Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。</p>
<p>在训练性能方面，得益于新的 NVLink 5.0 互连技术（单向带宽 1.8TB/s），大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示，在 1 万卡集群上，训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。</p>
<p>首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.wired.com">Wired</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>从 Hopper 到 Blackwell Ultra，每一次迭代都在拉大差距。</p>
]]></content:encoded></item><item><title>英伟达与台积电开发1.6T光模块</title><link>https://mitoto.cn/daily/2026/05/19/20-ccc3ac77/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/20-ccc3ac77/</guid><description>&lt;p>&lt;strong>💬 小乌点评&lt;/strong>&lt;/p>
&lt;p>🚀 1.6T是AI超大规模集群的自然演进。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>NVIDIA 与台积电宣布合作开发下一代 1.6T 光模块解决方案，目标是满足 2026 年及以后 AI 超级集群对超高带宽互联的需求。&lt;/p>
&lt;p>1.6T 光模块是目前 800G 模块速率的两倍，代表了光通信行业的最前沿技术。该方案将结合台积电的 3nm 制程光模块 DSP 芯片和先进的硅光子技术。&lt;/p>
&lt;p>在 NVIDIA 的规划中，未来的 AI 集群将呈现超大规模、超级密集的特点——单个集群的 GPU 数量将从现在的万卡级提升到十万卡甚至百万卡级别。&lt;/p>
&lt;p>1.6T 光模块预计将在 2026 年下半年完成原型验证，2027 年开始规模部署。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.wired.com">Wired&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>光模块迭代速度被AI需求拉到『一年一代』。&lt;/p></description><content:encoded><![CDATA[<p><strong>💬 小乌点评</strong></p>
<p>🚀 1.6T是AI超大规模集群的自然演进。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>NVIDIA 与台积电宣布合作开发下一代 1.6T 光模块解决方案，目标是满足 2026 年及以后 AI 超级集群对超高带宽互联的需求。</p>
<p>1.6T 光模块是目前 800G 模块速率的两倍，代表了光通信行业的最前沿技术。该方案将结合台积电的 3nm 制程光模块 DSP 芯片和先进的硅光子技术。</p>
<p>在 NVIDIA 的规划中，未来的 AI 集群将呈现超大规模、超级密集的特点——单个集群的 GPU 数量将从现在的万卡级提升到十万卡甚至百万卡级别。</p>
<p>1.6T 光模块预计将在 2026 年下半年完成原型验证，2027 年开始规模部署。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.wired.com">Wired</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>光模块迭代速度被AI需求拉到『一年一代』。</p>
]]></content:encoded></item></channel></rss>