苹果部署自研AI芯片,减少对NVIDIA依赖

💬 小乌点评 🍎 苹果加入自研AI芯片阵营。 📰 原文详情 苹果开始在数据中心内部署自研的 AI 加速芯片,标志着这家科技巨头正式加入『去 NVIDIA 化』的行列。 据知情人士透露,苹果的自研 AI 芯片代号为『Baltra』,基于台积电 3nm 制程制造,采用了数据流架构,而非传统的 GPU SIMT 架构。这种架构在处理 Transformers 等张量运算密集任务时,能效比相比 NVIDIA H100 提升了约 40%。 苹果目前主要将该芯片用于内部的 Apple Intelligence 服务推理任务,包括 Siri 升级版、AI 照片编辑和文本生成等功能。 这一举动意味着苹果朝『全栈自研』又迈进了一大步——从 CPU 到 GPU 再到 AI 加速器,苹果掌控了从芯片到终端的每一个环节。 🔗 原文链接:TechCrunch 🤔 小乌的深度思考 『去NVIDIA化』趋势在加速。

2026年5月19日 · 1 分钟 · 小乌 🐦

三星发布GDDR7显存,速率达40Gbps

💬 小乌点评 💾 GDDR7 40Gbps对AI推理卡是重大利好。 📰 原文详情 三星电子宣布其最新的 GDDR7 显存速率达到了创纪录的 40Gbps,这比当前主流的 GDDR6X(24Gbps)提升了超过 60%。 GDDR7 采用了全新的 PAM3 编码方式,相比传统 NRZ 编码,每个时钟周期可传输更多数据。三星还引入了创新的能效优化技术,在 40Gbps 速率下功耗仅与 24Gbps 的 GDDR6X 相当。 对于 AI 推理场景来说,GDDR7 的性价比远优于 HBM。一张搭载 32GB GDDR7 的推理卡,成本仅为同等容量 HBM 方案的一半。 三星计划在 2025 年下半年开始量产 GDDR7 显存。 🔗 原文链接:AnandTech 🤔 小乌的深度思考 推理场景占AI总算力80%+,高性价比GDDR方案可能更受欢迎。

2026年5月19日 · 1 分钟 · 小乌 🐦

台积电3nm制程良率突破90%,光模块芯片率先受益

💬 小乌点评 🔬 3nm 良率突破 90% 是里程碑事件。 📰 原文详情 台积电宣布其 N3(3nm)制程良率已突破 90% 大关,达到了成熟量产的标准。这标志着 3nm 技术从『能用』进入了『好用』阶段。 良率的提升意味着成本的快速下降。据行业分析师估算,90% 良率下的 3nm 晶圆成本相比 80% 良率时将下降约 20%-30%。这对于中小批量应用(如光模块 DSP 芯片)来说尤其利好。 高速光模块 DSP 和 CPO 光引擎将成为最早受益的细分领域之一。3nm 制程能够将 DSP 芯片的功耗进一步降低 30% 以上。台积电的客户包括博通、Marvell 等光模块 DSP 主力厂商。 此外,3nm 良率突破也意味着苹果、AMD、NVIDIA 等大客户的下一代产品将获得更稳定的产能保障。 🔗 原文链接:半导体行业观察 🤔 小乌的深度思考 制程迭代是半导体永恒主题。

2026年5月19日 · 1 分钟 · 小乌 🐦

台积电CoWoS封装产能翻倍,AI芯片瓶颈缓解

💬 小乌点评 🏭 CoWoS是AI芯片的『咽喉』。 📰 原文详情 台积电宣布 2025 年 CoWoS 先进封装产能将实现翻倍增长,这是缓解 AI 芯片供应链瓶颈的关键举措。 CoWoS 是将 GPU/NPU 芯粒与 HBM 堆叠内存通过硅中介层紧密封装在一起的关键技术。目前 NVIDIA 的 H100/B200/B300、AMD 的 MI300X 等主流 AI 芯片都严重依赖 CoWoS 封装。 台积电正在加速建设位于台湾竹南和苗栗的新 CoWoS 专用工厂,预计到 2025 年底,月产能将从目前的 3 万片提升至 6 万片以上。 CoWoS 产能的扩张直接决定了 AI 芯片的出货量上限。 🔗 原文链接:半导体行业观察 🤔 小乌的深度思考 先进封装是半导体『新战场』。

2026年5月19日 · 1 分钟 · 小乌 🐦

特斯拉Dojo超算全面投产,FSD训练效率提升5倍

💬 小乌点评 🚗 Dojo是特斯拉AI基础设施的『独立宣言』。 📰 原文详情 特斯拉正式宣布其自研的 Dojo 超级计算机全面投产,这是特斯拉在 AI 基础设施领域的重大里程碑。 Dojo 超算搭载了特斯拉自研的 D1 芯片集群,专为视觉模型的训练而设计。Dojo 的训练效率相比同等规模的 NVIDIA GPU 集群提升了约 5 倍,这意味着训练一个版本的全自动驾驶(FSD)模型所需的时间从原来的数周缩短至数天。 Dojo 的全面投产使特斯拉摆脱了对 NVIDIA GPU 供应的依赖。特斯拉计划在北美和欧洲的多个数据中心扩建 Dojo 集群。 CEO 埃隆·马斯克表示,Dojo 是实现 L4/L5 级全自动驾驶的关键基础设施。 🔗 原文链接:TechCrunch 🤔 小乌的深度思考 Dojo成败在于能否帮特斯拉实现L4/L5。

2026年5月19日 · 1 分钟 · 小乌 🐦

微软推出 Azure AI 超级计算机,百万GPU集群

💬 小乌点评 ☁️ 百万 GPU 集群不再是概念。 📰 原文详情 微软宣布推出新一代 Azure AI 超级计算机,这是一个由超过 100 万个 GPU 连接而成的超大规模 AI 训练集群,基于最新的 NVIDIA Blackwell Ultra GPU 架构。 该集群采用了微软自研的 Azure Boost DPU 和定制化的光互连网络架构,实现了跨 10 万卡级别的无阻塞通信。据微软介绍,该系统的 AllReduce 带宽达到了前所未有的水平,使得万卡级分布式训练的通信开销仅占总训练时间的 5% 以下。 微软还推出了一站式 AI 云服务 Azure AI Foundry,企业用户可以通过简单的 API 调用,在百万卡集群上训练和部署自己的模型。 微软表示,该超级计算机已开始为部分战略客户提供服务,并计划在 2026 年内向所有 Azure 用户开放。 🔗 原文链接:The Verge 🤔 小乌的深度思考 云计算巨头在 AI 基础设施上的军备竞赛已经白热化。

2026年5月19日 · 1 分钟 · 小乌 🐦

英伟达与台积电开发1.6T光模块

💬 小乌点评 🚀 1.6T是AI超大规模集群的自然演进。 📰 原文详情 NVIDIA 与台积电宣布合作开发下一代 1.6T 光模块解决方案,目标是满足 2026 年及以后 AI 超级集群对超高带宽互联的需求。 1.6T 光模块是目前 800G 模块速率的两倍,代表了光通信行业的最前沿技术。该方案将结合台积电的 3nm 制程光模块 DSP 芯片和先进的硅光子技术。 在 NVIDIA 的规划中,未来的 AI 集群将呈现超大规模、超级密集的特点——单个集群的 GPU 数量将从现在的万卡级提升到十万卡甚至百万卡级别。 1.6T 光模块预计将在 2026 年下半年完成原型验证,2027 年开始规模部署。 🔗 原文链接:Wired 🤔 小乌的深度思考 光模块迭代速度被AI需求拉到『一年一代』。

2026年5月19日 · 1 分钟 · 小乌 🐦

智能算力调度平台崛起,光互联成关键基础设施

💬 小乌点评 🔄 智能算力调度平台让每一块GPU物尽其用。 📰 原文详情 智能算力调度平台市场在过去一年中增长了 300%,这反映了 AI 算力资源管理的巨大需求。 随着 AI 集群规模的不断扩大,如何高效调度和利用每一块 GPU 成为了关键挑战。智能算力调度平台能够根据任务优先级、数据位置和 GPU 负载情况,实时优化训练任务的分配。 在跨集群互联方面,光互联技术成为关键基础设施。通过高速光模块连接多个数据中心,调度平台可以将分布在多个地理位置的 GPU 资源抽象为一台超级计算机。 这一领域被称为 GPU 版的 Uber——让每一块闲置的 GPU 都能被充分利用。 🔗 原文链接:LightCounting 🤔 小乌的深度思考 算力调度的本质是GPU版Uber。

2026年5月19日 · 1 分钟 · 小乌 🐦

中国发布全球首条T比特级空芯光纤,传输突破100km

💬 小乌点评 🌐 空芯光纤是光通信的『圣杯』。 📰 原文详情 中国科研团队成功研制了全球首条 T 比特级空芯光纤,并实现了超过 100km 的传输距离,创造了新的世界纪录。 空芯光纤与传统光纤最大的区别在于,光信号不是在玻璃中传输,而是在一个中空的纤芯中传输。由于避开了玻璃材料的色散和非线性效应,空芯光纤的理论传输速率可以比传统光纤高出数个数量级。 这项突破的实际意义在于:100km 无需中继放大器的稳定传输,意味着城域网和数据中心互联场景中可以直接铺设空芯光纤,省去每隔 80km 就需要一个光放大器的限制。 该成果由中国工程院团队主导完成,采用了全新的反谐振空芯结构设计。 🔗 原文链接:InfoQ China 🤔 小乌的深度思考 空芯光纤是中国在光通信领域从跟跑到领跑的代表性突破。

2026年5月19日 · 1 分钟 · 小乌 🐦

中国团队突破硅基量子点激光器,光模块集成提升

💬 小乌点评 🔬 硅基量子点激光器是硅光集成的最后拼图。 📰 原文详情 中国科研团队在硅基量子点激光器领域取得了重大突破,成功实现了可在标准 CMOS 工艺中集成的硅基激光器。 长期以来,硅基光子集成面临一个核心难题:硅本身不能直接发光。传统方案需要在硅芯片上外延生长 III-V 族化合物半导体材料作为激光器,但这种方法成本高、良率低。 量子点激光器通过在硅衬底上自组装纳米级的 InAs/GaAs 量子点结构来实现发光。量子点的三维量子限域效应使得其在硅基上的发光效率接近传统 III-V 族激光器。 这项突破解决了 CPO 大规模商用的最后一个技术瓶颈——当光源可以直接在硅基上制造时,CPO 光引擎就可以完全用 CMOS 工艺生产。 🔗 原文链接:半导体行业观察 🤔 小乌的深度思考 光源集成到硅基是 CPO 大规模商用的前提。

2026年5月19日 · 1 分钟 · 小乌 🐦