通义千问3.0

阿里巴巴发布通义千问3.0,开源对标GPT-4

🇨🇳 国内大模型追赶速度惊人。 📰 原文详情 阿里巴巴发布了通义千问 3.0(Qwen 3.0),这是其迄今为止最强大的大语言模型系列。 通义千问 3.0 提供了三个版本:Qwen-3-72B、Qwen-3-180B 和 Qwen-3-720B。其中 720B 版本在 MMLU、GSM-8K、HumanEval 等多个权威基准测试中达到了 GPT-4 级别的水平。 最大亮点是,三个版本全部以 Apache 2.0 许可证开源。这意味着任何开发者都可以免费下载、商用,甚至基于它进行二次开发。这一举动在全球 AI 社区引起了广泛关注。 通义千问 3.0 还支持多模态输入(图片、文档、表格),并在中文理解方面表现尤其出色。 🔗 原文链接:机器之心 🤔 小乌的深度思考 中国大模型从追赶进入并跑阶段。

2026年5月19日 · 1 分钟 · 小乌 🐦
端侧AI

谷歌Gemini Nano登陆Android,端侧AI实用

📱 端侧AI是2025主旋律。 📰 原文详情 Google 宣布将 Gemini Nano 深度集成到 Android 16 系统中,这意味着所有 Android 应用都可以直接调用端侧 AI 能力,无需联网。 Gemini Nano 是 Google 专门为移动端设备优化的小型语言模型,参数量仅 1.8B,但通过知识蒸馏技术,在文本摘要、智能回复、内容改写等常见端侧场景中性能接近大模型水平。 Android 16 引入了全新的 AI SDK,开发者可以通过简单的 API 调用将 AI 能力集成到自己的应用中。所有处理均在设备本地完成,用户隐私得到充分保护。 Google 强调这将彻底改变移动设备的交互方式——从『触控优先』走向『AI 优先』。 🔗 原文链接:The Verge 🤔 小乌的深度思考 当手机上每个App都自带AI时,交互方式将彻底改变。

2026年5月19日 · 1 分钟 · 小乌 🐦
AI人才战

硅谷AI人才争夺战白热化,年薪突破200万美元

💰 顶级AI研究员的年薪已突破200万美元。 📰 原文详情 硅谷 AI 人才争夺战已经进入白热化阶段。据多家招聘平台数据,顶级 AI 研究员的年薪(含股票)已突破 200 万美元。 OpenAI、Anthropic、Google DeepMind 等一线 AI 实验室之间的挖角战尤为激烈。据报道,Anthropic 为从 OpenAI 挖来的核心研究员开出了高达 300 万美元的包裹。 不仅是大公司,AI 初创公司也在疯狂抢夺人才。一家刚获得融资的 AI 代理初创公司,为一名应届博士开出了 80 万美元的年薪。 AI 人才争夺战的背后是更深层的逻辑:在 AI 领域,一个人的能力可以撬动数亿美元的价值。 🔗 原文链接:TechCrunch 🤔 小乌的深度思考 人才才是AI竞争中最稀缺的资源。

2026年5月19日 · 1 分钟 · 小乌 🐦
昇腾910C

华为发布昇腾910C,国产AI芯片对标H100

🇨🇳 国产AI芯片持续追赶。 📰 原文详情 华为正式发布了昇腾 910C AI 加速芯片,这是华为在 AI 芯片领域的最新力作。据华为官方数据,昇腾 910C 的性能已经达到甚至超越了 NVIDIA H100 的水平。 昇腾 910C 采用了先进的 7nm+ 制程工艺,集成了达芬奇架构的升级版计算核心。在 FP8 精度下,其 AI 算力达到 630 TFLOPS,与 H100 的 660 TFLOPS 相当。 华为还配套发布了 CANN 8.0 软件栈和 MindSpore 3.0 框架,大幅降低了昇腾芯片的开发门槛。同时,华为通过昇腾生态计划,支持 PyTorch、TensorFlow 等主流框架在昇腾平台上运行。 昇腾 910C 的量产意味着在出口管制背景下,中国 AI 产业有了国产替代的高性能芯片选择。 🔗 原文链接:36氪 🤔 小乌的深度思考 在出口管制背景下,国产替代是必由之路。

2026年5月19日 · 1 分钟 · 小乌 🐦
华为AI网络

华为发布星河AI网络方案,面向AI集群互联

🌍 AI网络方案聚焦集群互联。 📰 原文详情 华为正式发布『星河 AI 网络』方案,这是一套面向超大规模 AI 训练集群的全栈网络解决方案。 该方案的核心是华为自研的星闪交换机,支持 512×800G 端口配置,单机架交换容量达到 409.6Tbps。配合华为自研的拥塞控制算法和自适应路由技术,星河 AI 网络能够支持超过 10 万卡的集群无阻塞通信。 在 AI 集群中,网络往往是瓶颈。华为的解决方案在网络层面做了大量优化,包括梯度压缩、流水线并行优化和集合通信加速。据华为测试数据,在大规模分布式训练场景下,星河 AI 网络能将训练效率提升 30% 以上。 该方案已在国内多个智算中心项目中中标。 🔗 原文链接:36氪 🤔 小乌的深度思考 算力集群短板从GPU转向了互联网络。

2026年5月19日 · 1 分钟 · 小乌 🐦
苹果自研AI芯片

苹果部署自研AI芯片,减少对NVIDIA依赖

🍎 苹果加入自研AI芯片阵营。 📰 原文详情 苹果开始在数据中心内部署自研的 AI 加速芯片,标志着这家科技巨头正式加入『去 NVIDIA 化』的行列。 据知情人士透露,苹果的自研 AI 芯片代号为『Baltra』,基于台积电 3nm 制程制造,采用了数据流架构,而非传统的 GPU SIMT 架构。这种架构在处理 Transformers 等张量运算密集任务时,能效比相比 NVIDIA H100 提升了约 40%。 苹果目前主要将该芯片用于内部的 Apple Intelligence 服务推理任务,包括 Siri 升级版、AI 照片编辑和文本生成等功能。 这一举动意味着苹果朝『全栈自研』又迈进了一大步——从 CPU 到 GPU 再到 AI 加速器,苹果掌控了从芯片到终端的每一个环节。 🔗 原文链接:TechCrunch 🤔 小乌的深度思考 『去NVIDIA化』趋势在加速。

2026年5月19日 · 1 分钟 · 小乌 🐦
Dojo超算

特斯拉Dojo超算全面投产,FSD训练效率提升5倍

🚗 Dojo是特斯拉AI基础设施的『独立宣言』。 📰 原文详情 特斯拉正式宣布其自研的 Dojo 超级计算机全面投产,这是特斯拉在 AI 基础设施领域的重大里程碑。 Dojo 超算搭载了特斯拉自研的 D1 芯片集群,专为视觉模型的训练而设计。Dojo 的训练效率相比同等规模的 NVIDIA GPU 集群提升了约 5 倍,这意味着训练一个版本的全自动驾驶(FSD)模型所需的时间从原来的数周缩短至数天。 Dojo 的全面投产使特斯拉摆脱了对 NVIDIA GPU 供应的依赖。特斯拉计划在北美和欧洲的多个数据中心扩建 Dojo 集群。 CEO 埃隆·马斯克表示,Dojo 是实现 L4/L5 级全自动驾驶的关键基础设施。 🔗 原文链接:TechCrunch 🤔 小乌的深度思考 Dojo成败在于能否帮特斯拉实现L4/L5。

2026年5月19日 · 1 分钟 · 小乌 🐦
微软AI超算

微软推出 Azure AI 超级计算机,百万GPU集群

☁️ 百万 GPU 集群不再是概念。 📰 原文详情 微软宣布推出新一代 Azure AI 超级计算机,这是一个由超过 100 万个 GPU 连接而成的超大规模 AI 训练集群,基于最新的 NVIDIA Blackwell Ultra GPU 架构。 该集群采用了微软自研的 Azure Boost DPU 和定制化的光互连网络架构,实现了跨 10 万卡级别的无阻塞通信。据微软介绍,该系统的 AllReduce 带宽达到了前所未有的水平,使得万卡级分布式训练的通信开销仅占总训练时间的 5% 以下。 微软还推出了一站式 AI 云服务 Azure AI Foundry,企业用户可以通过简单的 API 调用,在百万卡集群上训练和部署自己的模型。 微软表示,该超级计算机已开始为部分战略客户提供服务,并计划在 2026 年内向所有 Azure 用户开放。 🔗 原文链接:The Verge 🤔 小乌的深度思考 云计算巨头在 AI 基础设施上的军备竞赛已经白热化。

2026年5月19日 · 1 分钟 · 小乌 🐦