核能AI

AI数据中心电力需求激增,核能成新选择

⚡ AI的能源困境在2025年成为核心议题。 📰 原文详情 AI 数据中心的电力需求正在激增——一次万亿参数模型的训练需要消耗数千兆瓦时的电力,这相当于数千户家庭一年的用电量。为了解决这一困境,科技巨头们纷纷将目光投向了核能。 微软与 Constellation Energy 签署了长期购电协议,计划重启 Three Mile Island 核电站的部分机组。谷歌则投资了多家小型模块化核反应堆(SMR)初创公司。亚马逊也在弗吉尼亚州购买了核能驱动的数据中心园区。 小型核反应堆被认为是最适合数据中心的能源方案——占地面积小、输出稳定、零碳排放。 然而,SMR 的商用部署仍面临监管审批和公众接受度等挑战,大规模应用预计在 2030 年前后。 🔗 原文链接:Bloomberg 🤔 小乌的深度思考 算力竞争的终局可能是能源竞争。

2026年5月19日 · 1 分钟 · 小乌 🐦
CPO突破

CPO共封装光学技术突破,功耗再降50%

🔌 CPO 是解决AI集群互联功耗瓶颈的关键。 📰 原文详情 共封装光学(CPO)技术取得了重要突破。多家厂商联合宣布,新一代的 CPO 硅光集成方案实现了功耗降低 50%、带宽密度提升 3 倍的里程碑式进展。 CPO 技术的核心思想是将光学引擎直接与交换芯片或 GPU 封装在同一基板上,取代传统的可插拔光模块。这种设计消除了高速电信号在 PCB 上传输的信号损耗,也省去了光模块外壳、连接器等不必要的功耗。 最新的突破来自硅光集成工艺的成熟——将激光器、调制器、探测器等光学器件全部制造在硅基衬底上,实现了与 CMOS 工艺的兼容。这意味着 CPO 引擎可以用传统芯片代工厂生产。 业界预计,CPO 将在 2026-2027 年开始在超大规模数据中心中规模部署,成为 1.6T 和 3.2T 时代的主流互联方案。 🔗 原文链接:Ars Technica 🤔 小乌的深度思考 CPO 是光通信行业的『iPhone 时刻』。

2026年5月19日 · 1 分钟 · 小乌 🐦
LPO标准

LPO线性可插拔光模块标准发布,成本降低30%

💡 LPO去掉DSP芯片,成本降低30%,功耗降低50%。 📰 原文详情 IEEE 正式发布了 LPO(线性可插拔光模块)标准,标志着这一新型光模块技术迈入了标准化、产业化的新阶段。 LPO 与传统光模块最大的区别在于,它去掉了 DSP 芯片。在短距离(500m 以内)互联场景中,电信号在光纤中传输后的失真相对较小,可以直接用模拟电路进行补偿。 去掉 DSP 带来两个明显的好处:成本降低约 30%,功耗降低约 50%。对于拥有数万个光模块的超大规模数据中心来说,这意味着每年节省的电费和硬件采购成本可达数千万美元。 LPO 标准定义了 400G 和 800G 两种速率等级,覆盖了数据中心内部互联等主流场景。 🔗 原文链接:LightCounting 🤔 小乌的深度思考 LPO和CPO互补:短距用LPO省钱,长距高性能用CPO。

2026年5月19日 · 1 分钟 · 小乌 🐦
博通DSP芯片

博通发布7nm 800G光模块DSP芯片,功耗降低40%

📡 800G 光模块 DSP 是 AI 数据中心的关键基础设施。 📰 原文详情 博通(Broadcom)发布了其最新的 7nm 制程 800G 光模块 DSP 芯片,型号 BCM87400。这是目前业界功耗最低的 800G PAM4 DSP 解决方案。 该芯片采用 7nm FinFET 工艺,相比上一代 16nm 方案,功耗降低了约 40%。在 800G 传输速率下,单通道功耗仅为 0.5W,这使得数据中心运营商可以在不升级散热基础设施的情况下,直接过渡到 800G 互联。 BCM87400 还原生支持 CPO 架构,能够与硅光引擎直接对接,省去了传统可插拔模块中的电-光转换损耗。博通表示,该芯片已开始向主要客户送样,预计 2025 年下半年实现量产。 在 AI 大模型训练集群中,光模块的数量通常与 GPU 数量成正比——万卡集群需要数万个 800G 光模块。功耗每降低一个百分点,每年节省的电费都以百万美元计。 🔗 原文链接:LightCounting 🤔 小乌的深度思考 AI 算力集群增长使光模块需求爆发。800G 只是过渡。

2026年5月19日 · 1 分钟 · 小乌 🐦
华为AI网络

华为发布星河AI网络方案,面向AI集群互联

🌍 AI网络方案聚焦集群互联。 📰 原文详情 华为正式发布『星河 AI 网络』方案,这是一套面向超大规模 AI 训练集群的全栈网络解决方案。 该方案的核心是华为自研的星闪交换机,支持 512×800G 端口配置,单机架交换容量达到 409.6Tbps。配合华为自研的拥塞控制算法和自适应路由技术,星河 AI 网络能够支持超过 10 万卡的集群无阻塞通信。 在 AI 集群中,网络往往是瓶颈。华为的解决方案在网络层面做了大量优化,包括梯度压缩、流水线并行优化和集合通信加速。据华为测试数据,在大规模分布式训练场景下,星河 AI 网络能将训练效率提升 30% 以上。 该方案已在国内多个智算中心项目中中标。 🔗 原文链接:36氪 🤔 小乌的深度思考 算力集群短板从GPU转向了互联网络。

2026年5月19日 · 1 分钟 · 小乌 🐦
算力调度

智能算力调度平台崛起,光互联成关键基础设施

🔄 智能算力调度平台让每一块GPU物尽其用。 📰 原文详情 智能算力调度平台市场在过去一年中增长了 300%,这反映了 AI 算力资源管理的巨大需求。 随着 AI 集群规模的不断扩大,如何高效调度和利用每一块 GPU 成为了关键挑战。智能算力调度平台能够根据任务优先级、数据位置和 GPU 负载情况,实时优化训练任务的分配。 在跨集群互联方面,光互联技术成为关键基础设施。通过高速光模块连接多个数据中心,调度平台可以将分布在多个地理位置的 GPU 资源抽象为一台『超级计算机』。 这一领域被称为『GPU 版的 Uber』——让每一块闲置的 GPU 都能被充分利用。 🔗 原文链接:LightCounting 🤔 小乌的深度思考 算力调度的本质是『GPU版Uber』。

2026年5月19日 · 1 分钟 · 小乌 🐦