英伟达COMPUTEX连发重磅,MiniMax M3登场,OpenAI造机器人

要点速览
  • 英伟达在COMPUTEX一口气发布Vera Rubin超级芯片、Cosmos 3物理AI模型、人形机器人参考设计等多项重磅产品,黄仁勋称"AI抢工作"是胡说八道
  • MiniMax发布M3旗舰大模型,编程能力超过GPT-5.5,同时启动A股科创板上市
  • OpenAI正式重启机器人业务,Sam Altman宣布组建硬件团队造实体机器人
  • 微软因为Claude太贵,决定自研AI编程大模型,直接对标Cursor和Claude Code
  • 字节扣子3.0上线,支持多人多Agent协作,编程和视频项目都能用AI团队完成
  • AI算力带火"算力金属"锡,半年涨价40%,全球锡矿只够开采15年
  • OpenAI被佛罗里达州起诉,微软面临新一轮反垄断调查
  • 贝恩报告显示四成企业AI降本效果不及预期,问题出在数据而非模型

英伟达COMPUTEX连发重磅,MiniMax M3登场,OpenAI造机器人

芯片与算力:英伟达 COMPUTEX 2026 重磅连发

Vera Rubin AI超级芯片平台全面投产

英伟达CEO黄仁勋在COMPUTEX 2026主题演讲中宣布,下一代AI超级芯片平台Vera Rubin已全面投产。该平台大规模智能体吞吐量较上代Grace Blackwell提高10倍,供应链规模是前代的两倍,覆盖30多个国家350多家工厂。戴尔同日向CoreWeave交付了全球首套可运行的Vera Rubin NVL72系统(集成72个Rubin GPU + 36颗Vera CPU),将于秋季正式发货。

同步推出的Vera CPU配备88个Olympus核心,比x86处理器快1.8倍,CPU与GPU间带宽达1.8TB/s。首批客户包括OpenAI、Anthropic、SpaceXAI、字节跳动等。

Cosmos 3:全球首款全开源全模态物理AI大模型

英伟达发布Cosmos 3,采用混合Transformer架构,在单一系统中融合视觉推理、世界生成与动作预测,可原生处理文本、图像、视频、音效及动作内容。在Artificial Analysis、Physics-IQ等多个物理仿真基准中排名开源第一,能将物理AI训练周期从数月压缩到数天。

  • Cosmos 3 Super:面向机器人与自动驾驶再训练(已上线)
  • Cosmos 3 Nano:数秒完成视频解析与动作推理(已上线)
  • Cosmos 3 Edge:边缘端实时推理(即将上线)

英伟达同步发起"Cosmos联盟",成员包括Runway、Skild AI等。

深度解读 & 洞察:Cosmos 3的核心突破在于把"理解物理世界"和"生成物理世界"统一到同一架构。此前机器人训练依赖碎片化的仿真工具和有限数据,Cosmos 3通过数十亿级别的多模态数据训练,让AI先理解"物体怎么运动、怎么交互",再预测"接下来会发生什么",最后输出机器人可执行的动作指令。这是具身智能(让AI在真实物理世界中行动的技术方向)的关键基础设施,降低了全球开发者进入机器人领域的门槛。

Isaac GR00T人形机器人参考设计:英伟达×宇树联手

英伟达联合宇树科技发布全球首款基于Jetson Thor平台的开放式人形机器人参考设计,整合宇树H2 Plus本体 + Sharpa Wave触觉五指灵巧手 + 英伟达Jetson AGX Thor计算系统。身高1.8米,75个自由度,续航约3小时,2026年底由宇树推出。

5500亿参数Nemotron 3 Ultra开源模型

面向全天候运行AI智能体,推理速度较同级模型最高提升5倍,成本降低30%。已适配Hermes Agent、LangChain、OpenClaw等主流框架,6月4日通过Hugging Face等平台推出。

DGX Station for Windows:桌面AI超级计算机

基于GB300芯片,748GB内存,20 petaflops FP4性能,支持万亿参数模型和数百个智能体同时运行。2026年Q4由华硕、戴尔、惠普等推出。

N1X笔记本芯片:英伟达进军PC处理器

英伟达与联发科联合开发,3nm工艺,20核ARM CPU + 6144 CUDA单元 + 128GB统一内存,主打本地运行大模型,直接挑战苹果M系列。

英伟达×台积电:AI进入晶圆制造

台积电全面采用英伟达AI技术覆盖计算光刻、仿真、制程控制、缺陷检测和数字孪生等环节,计算光刻成本优化20%-50%,化学仿真速度提升50倍。

影响:

  • 利多英伟达及AI硬件产业链,Vera Rubin投产+全栈产品线扩展巩固算力霸主地位
  • 利空传统x86阵营,Vera CPU性能领先1.8倍加速行业向ARM架构迁移
  • 利多机器人产业链,开源参考设计降低进入门槛

大模型突破:MiniMax M3 震撼登场

MiniMax M3:国产首个编程+百万上下文+多模态旗舰

MiniMax稀宇科技发布新一代大模型M3,采用自研MSA稀疏注意力架构,是国内首个同时具备前沿编程、百万token上下文和原生多模态三项能力的模型,也是全球唯一开源的。

评测基准M3成绩对比
SWE-Bench Pro(编程)59.0%超GPT-5.5、Gemini 3.1 Pro
BrowseComp(智能体)83.5超Opus 4.7
Claw-Eval(Agent)最高分
OmniDocBench(多模态)最高分超Gemini 3.1 Pro

实测中M3自主运行12小时复现了ICLR 2025获奖论文实验,还在无参考代码的情况下将CUDA算子硬件利用率从7.6%提升至71.3%。MSA架构在100万上下文下每token计算量仅为上代的1/20,解码加速超15倍。

API已开放,512K以内限时五折;10天内开源权重。配套推出MiniMax Code智能体产品和Plus/Max/Ultra三档订阅(49/119/469元每月)。

MiniMax拟申请A股科创板上市

MiniMax已于5月29日与中信证券签署上市辅导协议,启动"A+H"双平台资本布局。2025年总收入7903.8万美元(同比+158.9%),港股市值超2600亿港元。消息带动A股AI应用概念股集体走强,软通动力涨停。

深度解读 & 洞察:M3的MSA架构解决了大模型处理超长文本时计算量爆炸的核心难题——传统方案中上下文越长计算量呈平方级增长,MSA通过稀疏注意力将100万token下的计算量压缩到上代的5%。M3在编程评测中超GPT-5.5,标志着国产大模型在核心能力上已逼近海外顶尖闭源模型。加上即将开源,这会显著降低国内开发者的AI应用门槛。

影响:

  • 利多国内AI应用概念股,MiniMax A股IPO预期带动板块情绪
  • 利多开发者生态,开源+低价API降低AI应用构建成本

OpenAI 与 Anthropic:机器人、安全与全球博弈

OpenAI正式重启机器人业务

Sam Altman宣布OpenAI成立Robotics团队,招聘全栈硬件、运营、系统及机器学习工程师。短期目标是研发协助技术工人建设基础设施的机器人,长期愿景是"每个人都拥有自己的机器人"。项目由Aditya Ramesh领导,强调硬件与机器学习的深度融合。

OpenAI向日本金融机构开放GPT-5.5 Cyber

OpenAI已向日本三大银行开放GPT-5.5 Cyber模型用于网络安全防御。日本后续也将接入Anthropic的Claude Mythos模型,多模型协同构建金融安全防线。

Anthropic向欧盟网络安全局开放Mythos

Anthropic计划通过"玻璃之翼"计划让欧盟网络安全局在Mythos发布前进行测试。Mythos拥有异常强大的网络安全漏洞洞察能力,开放策略备受关注。

OpenAI遭佛罗里达州起诉

佛罗里达州总检察长起诉OpenAI及Sam Altman,指控其将利润置于安全之上、助长暴力,涉及ChatGPT被用于策划校园枪击案。OpenAI回应称工具并未鼓励非法行为。

OpenAI下线GPT-4.5和o3

GPT-4.5将于6月27日下线,o3将于8月26日停用(仅网页端/手机端),API仍可用。此举为新模型释放服务器资源。

深度解读 & 洞察:OpenAI重启机器人意义深远——2020年曾解散机器人团队专注大模型,如今回归说明多模态大模型的成熟度已达到可以赋能实体机器人的阶段。GPT-5.5 Cyber和Mythos向政府机构开放则反映了一个现实:AI能力越强,双刃剑效应越明显。政府在"用AI防御网络攻击"和"防止AI被滥用"之间必须找到平衡,这也催生了新的"AI安全外交"——日美、美欧之间的AI安全合作正在制度化为常态机制。


AI Agent 工程化进入新阶段

扣子3.0上线:多人多Agent协作

字节跳动发布AI智能体平台扣子3.0,核心升级:

  • 支持接入Claude Code、Codex CLI、OpenClaw等本地Agent
  • 引入"项目空间",多人+多Agent围绕同一目标分工协作
  • 编程项目支持多人协作开发,视频项目搭载Seedance 2.0全流程AI生成
  • 三端协同(手机/电脑/网页),可远程调度Agent处理本地文件

Claude Code动态工作流:11天迁移75万行代码

Anthropic为Claude Code推出动态工作流功能,可动态生成编排脚本、启动数百个并行子Agent。标志性案例:Bun创始人11天将整个项目从Zig迁移至Rust(75万行代码,测试通过率99.8%),数百个Agent同时并行运作。

微软因Claude太贵,自研AI编程大模型

微软要求员工6月停止使用Claude改用GitHub Copilot,主因第三方模型租赁成本过高。此前受与OpenAI独家协议限制无法自研,4月修改条款后获得自研权限。自研编程模型将在Build大会发布,费用可降低3-10倍。除编程外,还计划推出转录、推理、语音、图像等多领域自研模型。

深度解读 & 洞察:三件事共同指向AI Agent从"单点工具"进化为"团队协作者"的趋势。扣子3.0解决多Agent编排——不同Agent分工调研、写代码、做视频;Claude Code动态工作流解决大规模并行——一次启动几百个子Agent同时干活;微软自研模型解决成本瓶颈——当Agent需要频繁调用模型时,第三方API成本成为最大制约。这三者结合,正在把"AI帮你做事"从概念变成可落地的工程体系。


AI 安全威胁持续升温

ChatGPT官方域名被用于钓鱼攻击

安全公司Push Security发现"LLMShare"攻击活动:黑客在ChatGPT Canvas的官方域名下伪造页面,通过谷歌广告投放假链接,诱导用户下载恶意木马。同样的手法也出现在Claude平台。由于链接确实来自官方域名,安全软件几乎无法识别。

ChatGPT表格插件存在严重漏洞

"ChatGPT for Google Sheets"扩展存在间接提示词注入漏洞,攻击者可通过外部数据嵌入恶意指令,窃取用户财务数据并横向攻击关联工作簿。还能伪造官方弹窗窃取登录凭证。

影响:

  • AI安全问题正在从"理论风险"变成"实际威胁",企业需立即审查AI扩展权限
  • 对网络安全板块利多,AI安全需求持续增长

产业链与市场信号

AI带火"算力金属"锡,半年涨价40%

锡价从每吨30万元涨至42万元。AI服务器用锡量是传统服务器3倍以上,但全球锡矿仅够开采15年(国内仅12年)。缅甸、印尼等主产国收紧出口,供需缺口持续扩大。

贝恩报告:四成企业AI降本不及预期

贝恩调查951家大型企业,40%企业AI降本幅度未超10%。根本原因是企业无法有效获取和使用自身数据,而非模型能力不足。

软银750亿欧元在法国建AI数据中心

软银在欧洲最大规模AI基础设施投资,开发5吉瓦数据中心容量。作为OpenAI主要投资方,此举意在抢占欧洲AI算力枢纽。

OpenRouter完成1.13亿美元B轮融资

AI模型路由平台周处理量从5万亿增至25万亿token,由CapitalG领投,英伟达、Snowflake、MongoDB等参投。模型路由正成为企业AI架构标准组件。

微软面临新一轮反垄断调查

FTC正调查微软在Azure云服务和AI领域是否存在排他行为,涉及商业协议、授权安排及产品捆绑策略。

影响:

  • 利多锡及有色金属板块,AI需求推动长期上涨趋势
  • 利多AI基础设施板块,软银巨资投资印证算力需求
  • 企业AI降本不及预期可能压制短期市场情绪,但利好数据治理和AI咨询服务商

更多动态

具身智能 & 机器人

AI硬件 & 消费品

开源 & 技术工具

行业与社会


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码