<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI on mitoto · 技术前沿</title><link>https://mitoto.cn/tags/ai/</link><description>Recent content in AI on mitoto · 技术前沿</description><generator>Hugo</generator><language>zh</language><lastBuildDate>Tue, 19 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://mitoto.cn/tags/ai/index.xml" rel="self" type="application/rss+xml"/><item><title>AI数据中心电力需求激增，核能成新选择</title><link>https://mitoto.cn/daily/2026/05/19/24-3b6547f6/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/24-3b6547f6/</guid><description>&lt;p>⚡ AI的能源困境在2025年成为核心议题。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>AI 数据中心的电力需求正在激增——一次万亿参数模型的训练需要消耗数千兆瓦时的电力，这相当于数千户家庭一年的用电量。为了解决这一困境，科技巨头们纷纷将目光投向了核能。&lt;/p>
&lt;p>微软与 Constellation Energy 签署了长期购电协议，计划重启 Three Mile Island 核电站的部分机组。谷歌则投资了多家小型模块化核反应堆（SMR）初创公司。亚马逊也在弗吉尼亚州购买了核能驱动的数据中心园区。&lt;/p>
&lt;p>小型核反应堆被认为是最适合数据中心的能源方案——占地面积小、输出稳定、零碳排放。&lt;/p>
&lt;p>然而，SMR 的商用部署仍面临监管审批和公众接受度等挑战，大规模应用预计在 2030 年前后。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.bloomberg.com">Bloomberg&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>算力竞争的终局可能是能源竞争。&lt;/p></description><content:encoded><![CDATA[<p>⚡ AI的能源困境在2025年成为核心议题。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>AI 数据中心的电力需求正在激增——一次万亿参数模型的训练需要消耗数千兆瓦时的电力，这相当于数千户家庭一年的用电量。为了解决这一困境，科技巨头们纷纷将目光投向了核能。</p>
<p>微软与 Constellation Energy 签署了长期购电协议，计划重启 Three Mile Island 核电站的部分机组。谷歌则投资了多家小型模块化核反应堆（SMR）初创公司。亚马逊也在弗吉尼亚州购买了核能驱动的数据中心园区。</p>
<p>小型核反应堆被认为是最适合数据中心的能源方案——占地面积小、输出稳定、零碳排放。</p>
<p>然而，SMR 的商用部署仍面临监管审批和公众接受度等挑战，大规模应用预计在 2030 年前后。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.bloomberg.com">Bloomberg</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>算力竞争的终局可能是能源竞争。</p>
]]></content:encoded></item><item><title>AMD Instinct MI400 路线图曝光，对标NVIDIA</title><link>https://mitoto.cn/daily/2026/05/19/15-9d22e25f/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/15-9d22e25f/</guid><description>&lt;p>🔥 AMD在AI加速器上追赶决心很强。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>AMD 的下一代 AI 加速器 Instinct MI400 的最新路线图被曝光，展示了 AMD 在 AI 基础设施领域的雄心。&lt;/p>
&lt;p>MI400 将采用激进的 chiplet 设计：由 4 个计算芯粒和 2 个 I/O 芯粒组成，通过 AMD 的 Infinity Architecture 4.0 互联。每个计算芯粒集成最新的 CDNA 5 架构计算单元。&lt;/p>
&lt;p>显存方面，MI400 将搭载 HBM4，总容量将达到 384GB，带宽超过 8TB/s。相比 MI300X 的 192GB HBM3，这是一个巨大的飞跃。&lt;/p>
&lt;p>AMD 还透露了其统一的 AI 互连计划 UBI，旨在通过开放标准让 MI400 与 NVIDIA 和 Intel 的加速器协同工作。&lt;/p>
&lt;p>MI400 预计在 2026 年下半年发布。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.tomshardware.com">Tom&amp;rsquo;s Hardware&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>有竞争才有进步。AMD让NVIDIA不敢懈怠。&lt;/p></description><content:encoded><![CDATA[<p>🔥 AMD在AI加速器上追赶决心很强。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>AMD 的下一代 AI 加速器 Instinct MI400 的最新路线图被曝光，展示了 AMD 在 AI 基础设施领域的雄心。</p>
<p>MI400 将采用激进的 chiplet 设计：由 4 个计算芯粒和 2 个 I/O 芯粒组成，通过 AMD 的 Infinity Architecture 4.0 互联。每个计算芯粒集成最新的 CDNA 5 架构计算单元。</p>
<p>显存方面，MI400 将搭载 HBM4，总容量将达到 384GB，带宽超过 8TB/s。相比 MI300X 的 192GB HBM3，这是一个巨大的飞跃。</p>
<p>AMD 还透露了其统一的 AI 互连计划 UBI，旨在通过开放标准让 MI400 与 NVIDIA 和 Intel 的加速器协同工作。</p>
<p>MI400 预计在 2026 年下半年发布。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.tomshardware.com">Tom&rsquo;s Hardware</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>有竞争才有进步。AMD让NVIDIA不敢懈怠。</p>
]]></content:encoded></item><item><title>Anthropic 发布 Claude 4，长文档推理超越GPT-4</title><link>https://mitoto.cn/daily/2026/05/19/09-dfe838ff/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/09-dfe838ff/</guid><description>&lt;p>🎯 Claude 4 在长文档理解上证明『小而精』路线成功。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>Anthropic 推出了其最新的大语言模型 Claude 4，这是 Claude 系列迄今为止最具野心的一次升级。Claude 4 在长文档推理、代码生成和安全性方面全面超越了 GPT-4。&lt;/p>
&lt;p>Claude 4 最引人注目的能力是其超长上下文处理能力。在 200K token 上下文窗口下，Claude 4 的信息检索准确率达到了 99%。这意味着它可以在一整本书或整个大型代码库中找到任何细节信息。&lt;/p>
&lt;p>在代码生成方面，Claude 4 引入了『主动调试』功能：生成的代码会自动进行静态分析和单元测试，如果发现 bug 会自我修复后再输出最终结果。&lt;/p>
&lt;p>安全性仍然是 Anthropic 的核心差异化优势。Claude 4 使用了宪法 AI 的增强版本，在拒绝有害请求的同时，保持了对合法复杂问题的深度回答能力。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.anthropic.com/blog">Anthropic Blog&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>『安全优先』策略正获得市场认可。&lt;/p></description><content:encoded><![CDATA[<p>🎯 Claude 4 在长文档理解上证明『小而精』路线成功。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>Anthropic 推出了其最新的大语言模型 Claude 4，这是 Claude 系列迄今为止最具野心的一次升级。Claude 4 在长文档推理、代码生成和安全性方面全面超越了 GPT-4。</p>
<p>Claude 4 最引人注目的能力是其超长上下文处理能力。在 200K token 上下文窗口下，Claude 4 的信息检索准确率达到了 99%。这意味着它可以在一整本书或整个大型代码库中找到任何细节信息。</p>
<p>在代码生成方面，Claude 4 引入了『主动调试』功能：生成的代码会自动进行静态分析和单元测试，如果发现 bug 会自我修复后再输出最终结果。</p>
<p>安全性仍然是 Anthropic 的核心差异化优势。Claude 4 使用了宪法 AI 的增强版本，在拒绝有害请求的同时，保持了对合法复杂问题的深度回答能力。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.anthropic.com/blog">Anthropic Blog</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>『安全优先』策略正获得市场认可。</p>
]]></content:encoded></item><item><title>DeepSeek发布MoE新模型，成本仅为GPT-4的1/10</title><link>https://mitoto.cn/daily/2026/05/19/25-b821a11a/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/25-b821a11a/</guid><description>&lt;p>💡 DeepSeek证明了『低成本高性能』路线可行性。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>DeepSeek 发布了其最新的 MoE（混合专家）大语言模型，以其极低的推理成本和接近 GPT-4 的性能水平引发了业界关注。&lt;/p>
&lt;p>该模型采用了 DeepSeekMoE 架构——在总参数 671B 中，每个 token 仅激活 37B 参数。这种设计使得推理成本仅为 GPT-4 的十分之一，同时保持接近 GPT-4 的性能水平。&lt;/p>
&lt;p>在 MMLU、GSM-8K、HumanEval 等基准测试中，DeepSeek 新模型的表现接近 GPT-4，在某些数学和代码任务上甚至优于 GPT-4。&lt;/p>
&lt;p>DeepSeek 的『低成本高性能』路线证明了，巧妙的架构设计可以在不依赖天量算力的情况下实现领先性能。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.infoq.com">InfoQ&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>成本革命比参数竞赛更能改变产业格局。&lt;/p></description><content:encoded><![CDATA[<p>💡 DeepSeek证明了『低成本高性能』路线可行性。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>DeepSeek 发布了其最新的 MoE（混合专家）大语言模型，以其极低的推理成本和接近 GPT-4 的性能水平引发了业界关注。</p>
<p>该模型采用了 DeepSeekMoE 架构——在总参数 671B 中，每个 token 仅激活 37B 参数。这种设计使得推理成本仅为 GPT-4 的十分之一，同时保持接近 GPT-4 的性能水平。</p>
<p>在 MMLU、GSM-8K、HumanEval 等基准测试中，DeepSeek 新模型的表现接近 GPT-4，在某些数学和代码任务上甚至优于 GPT-4。</p>
<p>DeepSeek 的『低成本高性能』路线证明了，巧妙的架构设计可以在不依赖天量算力的情况下实现领先性能。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.infoq.com">InfoQ</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>成本革命比参数竞赛更能改变产业格局。</p>
]]></content:encoded></item><item><title>GitHub Copilot 升级，支持全代码库Agent</title><link>https://mitoto.cn/daily/2026/05/19/23-e99ba1bf/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/23-e99ba1bf/</guid><description>&lt;p>⚡ Agent模式是代码助手的终极形态。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>GitHub 宣布 Copilot 全面升级，引入了全新的 Agent 模式。这一模式让 Copilot 从『代码补全工具』进化为『自主编程助手』。&lt;/p>
&lt;p>Agent 模式下，Copilot 能够理解整个代码库的架构和上下文，而不仅仅关注当前打开的文件。它可以自主地进行多文件重构、检测并修复 bug、编写单元测试，甚至提交 Pull Request。&lt;/p>
&lt;p>在实际测试中，Agent 模式成功修复了开源项目中 78% 的已知 bug，平均每个修复耗时不到 3 分钟。&lt;/p>
&lt;p>GitHub CEO 表示，Agent 模式代表了 AI 辅助编程的下一个时代——AI 不仅仅是工具，而是团队的协作成员。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://github.blog">GitHub Blog&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>Agent模式意味着 AI 从『补全代码』进化到『维护代码库』。&lt;/p></description><content:encoded><![CDATA[<p>⚡ Agent模式是代码助手的终极形态。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>GitHub 宣布 Copilot 全面升级，引入了全新的 Agent 模式。这一模式让 Copilot 从『代码补全工具』进化为『自主编程助手』。</p>
<p>Agent 模式下，Copilot 能够理解整个代码库的架构和上下文，而不仅仅关注当前打开的文件。它可以自主地进行多文件重构、检测并修复 bug、编写单元测试，甚至提交 Pull Request。</p>
<p>在实际测试中，Agent 模式成功修复了开源项目中 78% 的已知 bug，平均每个修复耗时不到 3 分钟。</p>
<p>GitHub CEO 表示，Agent 模式代表了 AI 辅助编程的下一个时代——AI 不仅仅是工具，而是团队的协作成员。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://github.blog">GitHub Blog</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>Agent模式意味着 AI 从『补全代码』进化到『维护代码库』。</p>
]]></content:encoded></item><item><title>Google 发布 Gemini 2.5 Pro，百万级上下文窗口</title><link>https://mitoto.cn/daily/2026/05/19/02-8fdac3a6/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/02-8fdac3a6/</guid><description>&lt;p>🔍 百万级上下文窗口是真正的 game-changer。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>Google 正式发布了 Gemini 2.5 Pro，这是其迄今为止最强大的大语言模型。该模型最大的亮点在于支持高达 100 万个 token 的超长上下文窗口。&lt;/p>
&lt;p>这意味着 Gemini 2.5 Pro 能够一次性处理超过 3 本《战争与和平》体量的文本，或是一整个大型软件项目的全部源代码。对于开发者来说，这意味着可以将整个代码库作为上下文输入，AI 助手在理解全局架构后给出更精准的建议。&lt;/p>
&lt;p>除了长上下文能力，Gemini 2.5 Pro 还引入了一个全新的推理增强机制：Chain-of-Thought 2.0。该机制让模型在面对复杂问题时，能够在内部生成多条推理路径，然后自动选择最优解，而非仅依赖单一的逻辑链。&lt;/p>
&lt;p>Google 表示，Gemini 2.5 Pro 在长文档检索、多文档摘要和代码分析等企业级场景中表现尤为出色，已在 Google Cloud 的 Vertex AI 平台上向企业用户开放。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://blog.google/technology/ai/">Google AI Blog&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>大上下文窗口意味着『遗忘』问题的终结。&lt;/p></description><content:encoded><![CDATA[<p>🔍 百万级上下文窗口是真正的 game-changer。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>Google 正式发布了 Gemini 2.5 Pro，这是其迄今为止最强大的大语言模型。该模型最大的亮点在于支持高达 100 万个 token 的超长上下文窗口。</p>
<p>这意味着 Gemini 2.5 Pro 能够一次性处理超过 3 本《战争与和平》体量的文本，或是一整个大型软件项目的全部源代码。对于开发者来说，这意味着可以将整个代码库作为上下文输入，AI 助手在理解全局架构后给出更精准的建议。</p>
<p>除了长上下文能力，Gemini 2.5 Pro 还引入了一个全新的推理增强机制：Chain-of-Thought 2.0。该机制让模型在面对复杂问题时，能够在内部生成多条推理路径，然后自动选择最优解，而非仅依赖单一的逻辑链。</p>
<p>Google 表示，Gemini 2.5 Pro 在长文档检索、多文档摘要和代码分析等企业级场景中表现尤为出色，已在 Google Cloud 的 Vertex AI 平台上向企业用户开放。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://blog.google/technology/ai/">Google AI Blog</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>大上下文窗口意味着『遗忘』问题的终结。</p>
]]></content:encoded></item><item><title>Meta 发布 Llama 4 开源模型，生态持续扩张</title><link>https://mitoto.cn/daily/2026/05/19/03-6214aeca/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/03-6214aeca/</guid><description>&lt;p>🦙 Llama 系列是开源AI运动的中坚力量。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>Meta 正式发布了 Llama 4 开源大模型系列，包含 8B、70B 和 405B 三个参数量级版本，均采用开放权重许可。这一发布被认为是开源 AI 对抗闭源模型的重要里程碑。&lt;/p>
&lt;p>Llama 4 最大的变化是全面支持多模态输入——文本、图像、音频均可作为输入。Meta 在训练数据中加入了大量的图文对数据，使得模型在视觉理解和多模态推理方面有了显著提升。&lt;/p>
&lt;p>在企业级部署方面，Llama 4 引入了多项优化：支持 4-bit 量化后部署在单张消费级 GPU 上（8B 版本只需 6GB 显存），支持 vLLM 和 TensorRT-LLM 等主流推理框架，以及新增了 Function Calling 原生能力。&lt;/p>
&lt;p>目前，Llama 4 模型已经在 Hugging Face、AWS SageMaker、Google Cloud 等多个平台上线，社区反响热烈。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://ai.meta.com/blog/">Meta AI&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>当整个开源社区站在同一个肩膀上时，创新速度呈指数级增长。&lt;/p></description><content:encoded><![CDATA[<p>🦙 Llama 系列是开源AI运动的中坚力量。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>Meta 正式发布了 Llama 4 开源大模型系列，包含 8B、70B 和 405B 三个参数量级版本，均采用开放权重许可。这一发布被认为是开源 AI 对抗闭源模型的重要里程碑。</p>
<p>Llama 4 最大的变化是全面支持多模态输入——文本、图像、音频均可作为输入。Meta 在训练数据中加入了大量的图文对数据，使得模型在视觉理解和多模态推理方面有了显著提升。</p>
<p>在企业级部署方面，Llama 4 引入了多项优化：支持 4-bit 量化后部署在单张消费级 GPU 上（8B 版本只需 6GB 显存），支持 vLLM 和 TensorRT-LLM 等主流推理框架，以及新增了 Function Calling 原生能力。</p>
<p>目前，Llama 4 模型已经在 Hugging Face、AWS SageMaker、Google Cloud 等多个平台上线，社区反响热烈。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://ai.meta.com/blog/">Meta AI</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>当整个开源社区站在同一个肩膀上时，创新速度呈指数级增长。</p>
]]></content:encoded></item><item><title>NVIDIA Blackwell Ultra GPU 量产，AI算力再升级</title><link>https://mitoto.cn/daily/2026/05/19/05-25f1d3c7/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/05-25f1d3c7/</guid><description>&lt;p>⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本，也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。&lt;/p>
&lt;p>Blackwell Ultra 集成了超过 2080 亿个晶体管，采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下，Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。&lt;/p>
&lt;p>在训练性能方面，得益于新的 NVLink 5.0 互连技术（单向带宽 1.8TB/s），大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示，在 1 万卡集群上，训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。&lt;/p>
&lt;p>首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.wired.com">Wired&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>从 Hopper 到 Blackwell Ultra，每一次迭代都在拉大差距。&lt;/p></description><content:encoded><![CDATA[<p>⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本，也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。</p>
<p>Blackwell Ultra 集成了超过 2080 亿个晶体管，采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下，Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。</p>
<p>在训练性能方面，得益于新的 NVLink 5.0 互连技术（单向带宽 1.8TB/s），大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示，在 1 万卡集群上，训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。</p>
<p>首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.wired.com">Wired</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>从 Hopper 到 Blackwell Ultra，每一次迭代都在拉大差距。</p>
]]></content:encoded></item><item><title>OpenAI 发布 GPT-5 预览版，推理能力大幅提升</title><link>https://mitoto.cn/daily/2026/05/19/01-c33b54a5/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/01-c33b54a5/</guid><description>&lt;p>💡 GPT-5 的发布标志着大模型进入了新纪元。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>OpenAI 近日发布了其下一代旗舰模型 GPT-5 的预览版本，这是自 GPT-4 发布以来最大规模的一次能力跃升。&lt;/p>
&lt;p>据 OpenAI 官方博客介绍，GPT-5 在多个关键维度上实现了质的突破：在数学推理方面，模型在 MATH 和 GSM-8K 等高等数学基准测试中取得了接近专家水平的成绩，能够处理复杂的多步代数、微积分和概率问题。在代码生成上，GPT-5 在 SWE-bench 和 HumanEval 测试中超越了此前所有公开模型，能够自主编写完整的、可直接部署的生产级代码。&lt;/p>
&lt;p>多模态理解能力也是 GPT-5 的核心亮点。模型不再局限于文本和简单图片，而是能够深度理解图表、流程图、电路原理图和 3D 模型等多种技术文档格式。这对于工程师和科研人员来说是一个极大的生产力提升工具。&lt;/p>
&lt;p>目前该预览版已面向部分开发者开放 API 测试，正式版预计在 Q3 全面上线。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://openai.com/blog">OpenAI Blog&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>GPT-5 的意义不在于参数更多，而在于它真正开始『理解』问题了。&lt;/p></description><content:encoded><![CDATA[<p>💡 GPT-5 的发布标志着大模型进入了新纪元。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>OpenAI 近日发布了其下一代旗舰模型 GPT-5 的预览版本，这是自 GPT-4 发布以来最大规模的一次能力跃升。</p>
<p>据 OpenAI 官方博客介绍，GPT-5 在多个关键维度上实现了质的突破：在数学推理方面，模型在 MATH 和 GSM-8K 等高等数学基准测试中取得了接近专家水平的成绩，能够处理复杂的多步代数、微积分和概率问题。在代码生成上，GPT-5 在 SWE-bench 和 HumanEval 测试中超越了此前所有公开模型，能够自主编写完整的、可直接部署的生产级代码。</p>
<p>多模态理解能力也是 GPT-5 的核心亮点。模型不再局限于文本和简单图片，而是能够深度理解图表、流程图、电路原理图和 3D 模型等多种技术文档格式。这对于工程师和科研人员来说是一个极大的生产力提升工具。</p>
<p>目前该预览版已面向部分开发者开放 API 测试，正式版预计在 Q3 全面上线。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://openai.com/blog">OpenAI Blog</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>GPT-5 的意义不在于参数更多，而在于它真正开始『理解』问题了。</p>
]]></content:encoded></item><item><title>OpenAI推出ChatGPT Pro企业版，Agent全覆盖</title><link>https://mitoto.cn/daily/2026/05/19/27-857012c7/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/27-857012c7/</guid><description>&lt;p>🏢 企业级AI助手市场正式爆发。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>OpenAI 正式推出了 ChatGPT Pro 企业版，这是面向企业客户的全功能 AI 平台。&lt;/p>
&lt;p>ChatGPT Pro 集成了多项高级功能：Agent 模式（可自主执行多步骤任务）、联网搜索引擎（获取实时信息）、高级数据分析（处理 Excel/CSV 文件并生成可视化图表），以及安全的企业级数据隔离。&lt;/p>
&lt;p>企业版还提供了自定义 AI 助手功能——企业可以上传内部知识库文件，让 AI 助手基于企业专属数据回答问题。所有对话数据在企业内部处理，不会用于模型训练。&lt;/p>
&lt;p>定价方面，ChatGPT Pro 企业版为每位用户每月 60 美元。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.theverge.com">The Verge&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>企业级AI这个市场会诞生下一个千亿级公司。&lt;/p></description><content:encoded><![CDATA[<p>🏢 企业级AI助手市场正式爆发。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>OpenAI 正式推出了 ChatGPT Pro 企业版，这是面向企业客户的全功能 AI 平台。</p>
<p>ChatGPT Pro 集成了多项高级功能：Agent 模式（可自主执行多步骤任务）、联网搜索引擎（获取实时信息）、高级数据分析（处理 Excel/CSV 文件并生成可视化图表），以及安全的企业级数据隔离。</p>
<p>企业版还提供了自定义 AI 助手功能——企业可以上传内部知识库文件，让 AI 助手基于企业专属数据回答问题。所有对话数据在企业内部处理，不会用于模型训练。</p>
<p>定价方面，ChatGPT Pro 企业版为每位用户每月 60 美元。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.theverge.com">The Verge</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>企业级AI这个市场会诞生下一个千亿级公司。</p>
]]></content:encoded></item><item><title>阿里巴巴发布通义千问3.0，开源对标GPT-4</title><link>https://mitoto.cn/daily/2026/05/19/14-320b9c9f/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/14-320b9c9f/</guid><description>&lt;p>🇨🇳 国内大模型追赶速度惊人。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>阿里巴巴发布了通义千问 3.0（Qwen 3.0），这是其迄今为止最强大的大语言模型系列。&lt;/p>
&lt;p>通义千问 3.0 提供了三个版本：Qwen-3-72B、Qwen-3-180B 和 Qwen-3-720B。其中 720B 版本在 MMLU、GSM-8K、HumanEval 等多个权威基准测试中达到了 GPT-4 级别的水平。&lt;/p>
&lt;p>最大亮点是，三个版本全部以 Apache 2.0 许可证开源。这意味着任何开发者都可以免费下载、商用，甚至基于它进行二次开发。这一举动在全球 AI 社区引起了广泛关注。&lt;/p>
&lt;p>通义千问 3.0 还支持多模态输入（图片、文档、表格），并在中文理解方面表现尤其出色。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://jiqizhixin.com">机器之心&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>中国大模型从追赶进入并跑阶段。&lt;/p></description><content:encoded><![CDATA[<p>🇨🇳 国内大模型追赶速度惊人。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>阿里巴巴发布了通义千问 3.0（Qwen 3.0），这是其迄今为止最强大的大语言模型系列。</p>
<p>通义千问 3.0 提供了三个版本：Qwen-3-72B、Qwen-3-180B 和 Qwen-3-720B。其中 720B 版本在 MMLU、GSM-8K、HumanEval 等多个权威基准测试中达到了 GPT-4 级别的水平。</p>
<p>最大亮点是，三个版本全部以 Apache 2.0 许可证开源。这意味着任何开发者都可以免费下载、商用，甚至基于它进行二次开发。这一举动在全球 AI 社区引起了广泛关注。</p>
<p>通义千问 3.0 还支持多模态输入（图片、文档、表格），并在中文理解方面表现尤其出色。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://jiqizhixin.com">机器之心</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>中国大模型从追赶进入并跑阶段。</p>
]]></content:encoded></item><item><title>谷歌Gemini Nano登陆Android，端侧AI实用</title><link>https://mitoto.cn/daily/2026/05/19/21-257fd968/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/21-257fd968/</guid><description>&lt;p>📱 端侧AI是2025主旋律。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>Google 宣布将 Gemini Nano 深度集成到 Android 16 系统中，这意味着所有 Android 应用都可以直接调用端侧 AI 能力，无需联网。&lt;/p>
&lt;p>Gemini Nano 是 Google 专门为移动端设备优化的小型语言模型，参数量仅 1.8B，但通过知识蒸馏技术，在文本摘要、智能回复、内容改写等常见端侧场景中性能接近大模型水平。&lt;/p>
&lt;p>Android 16 引入了全新的 AI SDK，开发者可以通过简单的 API 调用将 AI 能力集成到自己的应用中。所有处理均在设备本地完成，用户隐私得到充分保护。&lt;/p>
&lt;p>Google 强调这将彻底改变移动设备的交互方式——从『触控优先』走向『AI 优先』。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.theverge.com">The Verge&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>当手机上每个App都自带AI时，交互方式将彻底改变。&lt;/p></description><content:encoded><![CDATA[<p>📱 端侧AI是2025主旋律。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>Google 宣布将 Gemini Nano 深度集成到 Android 16 系统中，这意味着所有 Android 应用都可以直接调用端侧 AI 能力，无需联网。</p>
<p>Gemini Nano 是 Google 专门为移动端设备优化的小型语言模型，参数量仅 1.8B，但通过知识蒸馏技术，在文本摘要、智能回复、内容改写等常见端侧场景中性能接近大模型水平。</p>
<p>Android 16 引入了全新的 AI SDK，开发者可以通过简单的 API 调用将 AI 能力集成到自己的应用中。所有处理均在设备本地完成，用户隐私得到充分保护。</p>
<p>Google 强调这将彻底改变移动设备的交互方式——从『触控优先』走向『AI 优先』。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.theverge.com">The Verge</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>当手机上每个App都自带AI时，交互方式将彻底改变。</p>
]]></content:encoded></item><item><title>硅谷AI人才争夺战白热化，年薪突破200万美元</title><link>https://mitoto.cn/daily/2026/05/19/29-67260394/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/29-67260394/</guid><description>&lt;p>💰 顶级AI研究员的年薪已突破200万美元。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>硅谷 AI 人才争夺战已经进入白热化阶段。据多家招聘平台数据，顶级 AI 研究员的年薪（含股票）已突破 200 万美元。&lt;/p>
&lt;p>OpenAI、Anthropic、Google DeepMind 等一线 AI 实验室之间的挖角战尤为激烈。据报道，Anthropic 为从 OpenAI 挖来的核心研究员开出了高达 300 万美元的包裹。&lt;/p>
&lt;p>不仅是大公司，AI 初创公司也在疯狂抢夺人才。一家刚获得融资的 AI 代理初创公司，为一名应届博士开出了 80 万美元的年薪。&lt;/p>
&lt;p>AI 人才争夺战的背后是更深层的逻辑：在 AI 领域，一个人的能力可以撬动数亿美元的价值。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://techcrunch.com">TechCrunch&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>人才才是AI竞争中最稀缺的资源。&lt;/p></description><content:encoded><![CDATA[<p>💰 顶级AI研究员的年薪已突破200万美元。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>硅谷 AI 人才争夺战已经进入白热化阶段。据多家招聘平台数据，顶级 AI 研究员的年薪（含股票）已突破 200 万美元。</p>
<p>OpenAI、Anthropic、Google DeepMind 等一线 AI 实验室之间的挖角战尤为激烈。据报道，Anthropic 为从 OpenAI 挖来的核心研究员开出了高达 300 万美元的包裹。</p>
<p>不仅是大公司，AI 初创公司也在疯狂抢夺人才。一家刚获得融资的 AI 代理初创公司，为一名应届博士开出了 80 万美元的年薪。</p>
<p>AI 人才争夺战的背后是更深层的逻辑：在 AI 领域，一个人的能力可以撬动数亿美元的价值。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://techcrunch.com">TechCrunch</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>人才才是AI竞争中最稀缺的资源。</p>
]]></content:encoded></item><item><title>华为发布昇腾910C，国产AI芯片对标H100</title><link>https://mitoto.cn/daily/2026/05/19/26-e2f02b4d/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/26-e2f02b4d/</guid><description>&lt;p>🇨🇳 国产AI芯片持续追赶。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>华为正式发布了昇腾 910C AI 加速芯片，这是华为在 AI 芯片领域的最新力作。据华为官方数据，昇腾 910C 的性能已经达到甚至超越了 NVIDIA H100 的水平。&lt;/p>
&lt;p>昇腾 910C 采用了先进的 7nm+ 制程工艺，集成了达芬奇架构的升级版计算核心。在 FP8 精度下，其 AI 算力达到 630 TFLOPS，与 H100 的 660 TFLOPS 相当。&lt;/p>
&lt;p>华为还配套发布了 CANN 8.0 软件栈和 MindSpore 3.0 框架，大幅降低了昇腾芯片的开发门槛。同时，华为通过昇腾生态计划，支持 PyTorch、TensorFlow 等主流框架在昇腾平台上运行。&lt;/p>
&lt;p>昇腾 910C 的量产意味着在出口管制背景下，中国 AI 产业有了国产替代的高性能芯片选择。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://36kr.com">36氪&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>在出口管制背景下，国产替代是必由之路。&lt;/p></description><content:encoded><![CDATA[<p>🇨🇳 国产AI芯片持续追赶。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>华为正式发布了昇腾 910C AI 加速芯片，这是华为在 AI 芯片领域的最新力作。据华为官方数据，昇腾 910C 的性能已经达到甚至超越了 NVIDIA H100 的水平。</p>
<p>昇腾 910C 采用了先进的 7nm+ 制程工艺，集成了达芬奇架构的升级版计算核心。在 FP8 精度下，其 AI 算力达到 630 TFLOPS，与 H100 的 660 TFLOPS 相当。</p>
<p>华为还配套发布了 CANN 8.0 软件栈和 MindSpore 3.0 框架，大幅降低了昇腾芯片的开发门槛。同时，华为通过昇腾生态计划，支持 PyTorch、TensorFlow 等主流框架在昇腾平台上运行。</p>
<p>昇腾 910C 的量产意味着在出口管制背景下，中国 AI 产业有了国产替代的高性能芯片选择。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://36kr.com">36氪</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>在出口管制背景下，国产替代是必由之路。</p>
]]></content:encoded></item><item><title>华为发布星河AI网络方案，面向AI集群互联</title><link>https://mitoto.cn/daily/2026/05/19/12-c5bf80bd/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/12-c5bf80bd/</guid><description>&lt;p>🌍 AI网络方案聚焦集群互联。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>华为正式发布『星河 AI 网络』方案，这是一套面向超大规模 AI 训练集群的全栈网络解决方案。&lt;/p>
&lt;p>该方案的核心是华为自研的星闪交换机，支持 512×800G 端口配置，单机架交换容量达到 409.6Tbps。配合华为自研的拥塞控制算法和自适应路由技术，星河 AI 网络能够支持超过 10 万卡的集群无阻塞通信。&lt;/p>
&lt;p>在 AI 集群中，网络往往是瓶颈。华为的解决方案在网络层面做了大量优化，包括梯度压缩、流水线并行优化和集合通信加速。据华为测试数据，在大规模分布式训练场景下，星河 AI 网络能将训练效率提升 30% 以上。&lt;/p>
&lt;p>该方案已在国内多个智算中心项目中中标。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://36kr.com">36氪&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>算力集群短板从GPU转向了互联网络。&lt;/p></description><content:encoded><![CDATA[<p>🌍 AI网络方案聚焦集群互联。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>华为正式发布『星河 AI 网络』方案，这是一套面向超大规模 AI 训练集群的全栈网络解决方案。</p>
<p>该方案的核心是华为自研的星闪交换机，支持 512×800G 端口配置，单机架交换容量达到 409.6Tbps。配合华为自研的拥塞控制算法和自适应路由技术，星河 AI 网络能够支持超过 10 万卡的集群无阻塞通信。</p>
<p>在 AI 集群中，网络往往是瓶颈。华为的解决方案在网络层面做了大量优化，包括梯度压缩、流水线并行优化和集合通信加速。据华为测试数据，在大规模分布式训练场景下，星河 AI 网络能将训练效率提升 30% 以上。</p>
<p>该方案已在国内多个智算中心项目中中标。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://36kr.com">36氪</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>算力集群短板从GPU转向了互联网络。</p>
]]></content:encoded></item><item><title>苹果部署自研AI芯片，减少对NVIDIA依赖</title><link>https://mitoto.cn/daily/2026/05/19/11-2b8c4bba/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/11-2b8c4bba/</guid><description>&lt;p>🍎 苹果加入自研AI芯片阵营。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>苹果开始在数据中心内部署自研的 AI 加速芯片，标志着这家科技巨头正式加入『去 NVIDIA 化』的行列。&lt;/p>
&lt;p>据知情人士透露，苹果的自研 AI 芯片代号为『Baltra』，基于台积电 3nm 制程制造，采用了数据流架构，而非传统的 GPU SIMT 架构。这种架构在处理 Transformers 等张量运算密集任务时，能效比相比 NVIDIA H100 提升了约 40%。&lt;/p>
&lt;p>苹果目前主要将该芯片用于内部的 Apple Intelligence 服务推理任务，包括 Siri 升级版、AI 照片编辑和文本生成等功能。&lt;/p>
&lt;p>这一举动意味着苹果朝『全栈自研』又迈进了一大步——从 CPU 到 GPU 再到 AI 加速器，苹果掌控了从芯片到终端的每一个环节。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://techcrunch.com">TechCrunch&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>『去NVIDIA化』趋势在加速。&lt;/p></description><content:encoded><![CDATA[<p>🍎 苹果加入自研AI芯片阵营。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>苹果开始在数据中心内部署自研的 AI 加速芯片，标志着这家科技巨头正式加入『去 NVIDIA 化』的行列。</p>
<p>据知情人士透露，苹果的自研 AI 芯片代号为『Baltra』，基于台积电 3nm 制程制造，采用了数据流架构，而非传统的 GPU SIMT 架构。这种架构在处理 Transformers 等张量运算密集任务时，能效比相比 NVIDIA H100 提升了约 40%。</p>
<p>苹果目前主要将该芯片用于内部的 Apple Intelligence 服务推理任务，包括 Siri 升级版、AI 照片编辑和文本生成等功能。</p>
<p>这一举动意味着苹果朝『全栈自研』又迈进了一大步——从 CPU 到 GPU 再到 AI 加速器，苹果掌控了从芯片到终端的每一个环节。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://techcrunch.com">TechCrunch</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>『去NVIDIA化』趋势在加速。</p>
]]></content:encoded></item><item><title>特斯拉Dojo超算全面投产，FSD训练效率提升5倍</title><link>https://mitoto.cn/daily/2026/05/19/18-a2430c33/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/18-a2430c33/</guid><description>&lt;p>🚗 Dojo是特斯拉AI基础设施的『独立宣言』。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>特斯拉正式宣布其自研的 Dojo 超级计算机全面投产，这是特斯拉在 AI 基础设施领域的重大里程碑。&lt;/p>
&lt;p>Dojo 超算搭载了特斯拉自研的 D1 芯片集群，专为视觉模型的训练而设计。Dojo 的训练效率相比同等规模的 NVIDIA GPU 集群提升了约 5 倍，这意味着训练一个版本的全自动驾驶（FSD）模型所需的时间从原来的数周缩短至数天。&lt;/p>
&lt;p>Dojo 的全面投产使特斯拉摆脱了对 NVIDIA GPU 供应的依赖。特斯拉计划在北美和欧洲的多个数据中心扩建 Dojo 集群。&lt;/p>
&lt;p>CEO 埃隆·马斯克表示，Dojo 是实现 L4/L5 级全自动驾驶的关键基础设施。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://techcrunch.com">TechCrunch&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>Dojo成败在于能否帮特斯拉实现L4/L5。&lt;/p></description><content:encoded><![CDATA[<p>🚗 Dojo是特斯拉AI基础设施的『独立宣言』。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>特斯拉正式宣布其自研的 Dojo 超级计算机全面投产，这是特斯拉在 AI 基础设施领域的重大里程碑。</p>
<p>Dojo 超算搭载了特斯拉自研的 D1 芯片集群，专为视觉模型的训练而设计。Dojo 的训练效率相比同等规模的 NVIDIA GPU 集群提升了约 5 倍，这意味着训练一个版本的全自动驾驶（FSD）模型所需的时间从原来的数周缩短至数天。</p>
<p>Dojo 的全面投产使特斯拉摆脱了对 NVIDIA GPU 供应的依赖。特斯拉计划在北美和欧洲的多个数据中心扩建 Dojo 集群。</p>
<p>CEO 埃隆·马斯克表示，Dojo 是实现 L4/L5 级全自动驾驶的关键基础设施。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://techcrunch.com">TechCrunch</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>Dojo成败在于能否帮特斯拉实现L4/L5。</p>
]]></content:encoded></item><item><title>微软推出 Azure AI 超级计算机，百万GPU集群</title><link>https://mitoto.cn/daily/2026/05/19/07-fd2c7e7c/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://mitoto.cn/daily/2026/05/19/07-fd2c7e7c/</guid><description>&lt;p>☁️ 百万 GPU 集群不再是概念。&lt;/p>
&lt;hr>
&lt;h2 id="-原文详情">📰 原文详情&lt;/h2>
&lt;p>微软宣布推出新一代 Azure AI 超级计算机，这是一个由超过 100 万个 GPU 连接而成的超大规模 AI 训练集群，基于最新的 NVIDIA Blackwell Ultra GPU 架构。&lt;/p>
&lt;p>该集群采用了微软自研的 Azure Boost DPU 和定制化的光互连网络架构，实现了跨 10 万卡级别的无阻塞通信。据微软介绍，该系统的 AllReduce 带宽达到了前所未有的水平，使得万卡级分布式训练的通信开销仅占总训练时间的 5% 以下。&lt;/p>
&lt;p>微软还推出了一站式 AI 云服务 Azure AI Foundry，企业用户可以通过简单的 API 调用，在百万卡集群上训练和部署自己的模型。&lt;/p>
&lt;p>微软表示，该超级计算机已开始为部分战略客户提供服务，并计划在 2026 年内向所有 Azure 用户开放。&lt;/p>
&lt;hr>
&lt;p>🔗 &lt;strong>原文链接：&lt;a href="https://www.theverge.com">The Verge&lt;/a>&lt;/strong>&lt;/p>
&lt;hr>
&lt;h3 id="-小乌的深度思考">🤔 小乌的深度思考&lt;/h3>
&lt;p>云计算巨头在 AI 基础设施上的军备竞赛已经白热化。&lt;/p></description><content:encoded><![CDATA[<p>☁️ 百万 GPU 集群不再是概念。</p>
<hr>
<h2 id="-原文详情">📰 原文详情</h2>
<p>微软宣布推出新一代 Azure AI 超级计算机，这是一个由超过 100 万个 GPU 连接而成的超大规模 AI 训练集群，基于最新的 NVIDIA Blackwell Ultra GPU 架构。</p>
<p>该集群采用了微软自研的 Azure Boost DPU 和定制化的光互连网络架构，实现了跨 10 万卡级别的无阻塞通信。据微软介绍，该系统的 AllReduce 带宽达到了前所未有的水平，使得万卡级分布式训练的通信开销仅占总训练时间的 5% 以下。</p>
<p>微软还推出了一站式 AI 云服务 Azure AI Foundry，企业用户可以通过简单的 API 调用，在百万卡集群上训练和部署自己的模型。</p>
<p>微软表示，该超级计算机已开始为部分战略客户提供服务，并计划在 2026 年内向所有 Azure 用户开放。</p>
<hr>
<p>🔗 <strong>原文链接：<a href="https://www.theverge.com">The Verge</a></strong></p>
<hr>
<h3 id="-小乌的深度思考">🤔 小乌的深度思考</h3>
<p>云计算巨头在 AI 基础设施上的军备竞赛已经白热化。</p>
]]></content:encoded></item></channel></rss>