- 谷歌 I/O 大会发布 Gemini 3.5 Flash、Gemini Omni 多模态模型和 Gemini Spark 个人 AI 智能体,同时推出智能眼镜和 100 美元/月 AI 订阅
- Meta 全球裁员 10%,同时将 7000 人转入 AI 部门,公司大规模向 AI 原生组织转型
- AI 市场 89% 收入被 OpenAI 和 Anthropic 两家瓜分,34 家 AI 公司总收入近 800 亿美元
- 马斯克诉 OpenAI 案因超过诉讼时效被陪审团驳回,OpenAI IPO 障碍清除
- Anthropic 收购 Stainless 锁定 AI 开发工具链,禁止未经批准的股权转让
- Cursor 发布 Composer 2.5 编码模型,性能比肩 GPT-5.5 但成本仅 1/10
- 阿里通义千问 Qwen 3.7 预览版上线,文本和视觉均排国产第一
- 月之暗面完成 20 亿美元融资,国资和央企入场,估值翻了 4 倍多
- 波士顿动力 Atlas 学会搬冰箱,宇树科技实现语音驱动机器人实时生成动作
- 三大运营商推出 AI Token 套餐,百度 Q1 财报 AI 收入首次超 50%

Google I/O 2026:谷歌全面迈入智能体时代
谷歌发布 Gemini 3.5 Flash:速度 4 倍于 GPT-5.5,下月还有 Pro 版
谷歌在 I/O 2026 大会上正式发布 Gemini 3.5 Flash,这是首个将前沿智能与行动能力结合的模型系列。核心数据:
- 输出速度达每秒 289 tokens,是 Claude Opus 4.7 和 GPT-5.5 xhigh 的 4 倍
- 在 Terminal-Bench 2.1 编程测试中得分 76.2%,多模态理解基准 CharXiv Reasoning 得分 84.2%
- 已通过 Gemini 应用和 Google 搜索 AI 模式向全球开放,开发者可通过 Gemini API 和 Google AI Studio 使用
- Gemini 3.5 Pro 官宣下月发布,谷歌内部已在使用
深度解读 & 洞察:
Gemini 3.5 的定位很明确——不只是更聪明的聊天机器人,而是能"干活"的智能体。谷歌演示了一个惊人案例:12 小时内启动 93 个子智能体,生成了 26 亿 tokens,从零构建了一个可运行的操作系统核心。这标志着 AI 从"回答问题"转向"执行任务"的关键节点。对于企业而言,谷歌声称将 80% 工作负载迁移到 3.5 Flash,每年可节省超 10 亿美元。速度和成本的突破意味着 AI 智能体(能自主执行复杂任务的 AI 系统)的大规模部署即将成为现实。
Gemini Omni 发布:任意输入生成任意输出,一句话修改视频
谷歌发布全新全模态模型 Gemini Omni,宣称能从任何输入(文字、图像、视频、音频)生成任何模态的输出。首款模型 Gemini Omni Flash 已开放,支持对话式视频编辑——用户可以用一句话改变视频中的角色、背景等元素。初期以视频为核心,后续将扩展至图像和文本。
深度解读 & 洞察:
Omni 的意义在于打破了 AI 生成能力的边界。过去文本、图像、视频生成是独立的模型,Omni 将它们统一到一个框架下。这为创作者提供了全新的工作流——不再是"先生成再编辑",而是"边对话边创作"。长期看,这种全模态能力是通向通用人工智能的重要一步。
Gemini Spark:谷歌的 24/7 个人 AI 智能体
谷歌发布 Gemini Spark——一个全天候运行的个人 AI 智能体。核心特性:
- 运行在专有虚拟环境中,用户关电脑后 AI 仍在后台工作
- 可连接 Gmail、日历等 Google 全家桶,也能通过 MCP 协议接入第三方工具
- 支持语音指令创建任务,手机一句话就能让它整理邮件、筹划活动
- 下周面向美国 AI Ultra 订阅用户(月费 100 美元)推出 Beta 版
深度解读 & 洞察:
Gemini Spark 代表了 AI 助手的终极形态——不再是你问它答,而是它主动替你做事。从日程管理到信息整理,从预订服务到邮件处理,AI 成为一个"永不休息的数字管家"。这将极大改变人与技术的关系,但同时也带来隐私边界和依赖性的深层问题。
谷歌 I/O 更多重要发布
- 第八代 TPU:TPU 8t 专为预训练优化,算力提升近 3 倍;TPU 8i 专为推理设计,提升能效比。谷歌今年资本支出将达 1800-1900 亿美元
- AI Ultra 订阅:新增 100 美元/月档位,比 Pro 高 5 倍额度;原 250 美元 Ultra 降至 200 美元
- 智能眼镜:今年秋季推出,支持导航、发短信、拍照,无需掏手机
- Universal Cart 通用购物车:联合亚马逊、Meta、微软打造 UCP 和 AP2 协议,AI 可跨平台购物和支付
- Workspace 语音功能:Gmail、Docs、Keep 全部支持语音交互
- Google Pics:基于 Nano Banana 模型的图像创作工具
- Gemini for Science:专供科研的 Gemini,可追踪论文、写实验代码
- Flow 平台升级:整合 Gemini Omni Flash,支持角色一致性视频编辑
- Genie 街景版:用真实街景创建可交互的想象世界
- SynthID 扩展:已为 10 亿+媒体资产添加 AI 水印,集成 C2PA 内容凭证
- Token 处理量:月均超 3200 万亿,同比增长 7 倍;Gemini App 月活突破 9 亿
AI 产业格局:并购、裁员与资本集中
Meta 全球裁员 10%,7000 人转入 4 个 AI 部门
Meta 启动大规模重组:
- 5 月 20 日裁员约 8000 人(10%),关闭 6000 个招聘岗位,年内还可能继续裁员
- 同时将约 7000 人转入 4 个新 AI 组织,包括应用 AI 工程和 AI 智能体加速器等部门
- 扎克伯格今年计划 AI 投入 1150-1350 亿美元
- 公司强制安装鼠标追踪软件训练 AI 模型,超 1000 名员工联署反对,英国员工开始组建工会
深度解读 & 洞察:
这可能是科技行业 AI 转型中最激进的一次组织重构。Meta 的做法揭示了 AI 时代的残酷现实:股价飙升、AI 估值暴涨的同时,大量员工因为 AI 能力增强而被裁。更值得关注的是"一边裁员一边扩招 AI 人才"的剪刀差——这不是简单的降本增效,而是组织 DNA 的彻底重写。7000 人转入 AI 部门意味着公司从社交平台向 AI 公司的底层转型。但强制追踪员工操作来训练 AI 的做法引发了伦理争议,凸显了 AI 发展与劳工权益之间的深层矛盾。
影响: 短期对 Meta 股价偏利多(成本控制+AI 加码),但内部文化动荡可能影响产品迭代速度。
AI 市场赢家通吃:OpenAI 和 Anthropic 独吞 89% 收入
The Information 调查 34 家主流 AI 初创公司发现:
- 总年收入接近 800 亿美元,半年增长 112%
- OpenAI + Anthropic 合计拿走约 89% 的年化营收
- Anthropic 年化营收从年初 10 亿美元预计跳至 6 月底的 50 亿美元
- OpenAI 月营收 20 亿美元(年化约 240 亿美元),但需向微软分成 20%
- Perplexity、Cursor、ElevenLabs 等应用层公司年销售额均超 5 亿美元,但要向头部模型公司支付数十亿接入费
深度解读 & 洞察:
这份报告揭示了一个残酷现实:AI 不是百花齐放,而是赢者通吃。更关键的是形成了一种"生态锁"——应用公司增长越快,对 OpenAI/Anthropic 的依赖越深。这种结构意味着未来的 AI 产业可能不是多家共存的生态,而是少数几个"模型帝国"+大量依附其上的应用公司。对创业者和投资者来说,这意味着:要么成为基础设施层的极少数赢家,要么在应用层找到足够垂直的护城河。
影响: 对 AI 相关投资有指向意义——头部公司集中度极高,中长尾公司风险较大。
Anthropic 收购 Stainless:锁定 AI 开发工具链
Anthropic 以超 2.8 亿欧元(约 22 亿人民币)收购 Stainless。关键影响:
- Stainless 能将 API 规范自动生成多语言 SDK(软件开发工具包),支持 Python、TypeScript、Java 等
- 收购后关闭所有外部托管服务,OpenAI、谷歌等竞争对手失去该工具支持
- Anthropic 同时发布 Claude Design Token 上限翻倍、Claude Code 快速模式默认切换至 Opus 4.7
深度解读 & 洞察:
这笔收购的战略意义远超交易金额。Stainless 相当于 AI 模型连接开发者的"桥梁",谁控制了这座桥,谁就能让开发者更方便地接入自己的模型,同时给竞争对手制造障碍。在大模型能力逐渐趋同的背景下,开发者生态和工具链体验成为新的竞争高地。这也解释了为什么 Anthropic 同时禁止未经批准的股权转让(严格管控股东结构),为可能的 IPO 做准备。
马斯克诉 OpenAI 案败诉,将提起上诉
加州陪审团一致驳回马斯克对 OpenAI 的诉讼,认定其超过了法定诉讼时效。核心要点:
- 陪审团不到两小时达成共识,驳回马斯克高达 1500 亿美元的赔偿诉求
- 马斯克誓言上诉至第九巡回法院,称陪审团仅依据时间程序而非案件实质做出裁定
- 法官表示上诉之路可能相当艰难
- 此判决为 OpenAI 的 IPO 计划清除重大法律障碍
深度解读 & 洞察:
虽然马斯克败诉,但案件本身揭示了 AI 行业最核心的矛盾:非营利理想与商业现实的冲突。OpenAI 从"造福人类"的非营利机构转型为估值 8520 亿美元的营利公司,这背后的合法性争议并没有因为程序性判决而消失。对整个行业来说,这是一个警示——AI 治理结构的设计需要更严谨的制度保障。
影响: 对 OpenAI 及其投资者明显利多,IPO 道路更顺畅;对马斯克旗下 xAI 影响中性。
Anthropic 禁止未经批准的股权转让
Anthropic 宣布禁止未经董事会批准的股权转让,明确二级市场和私募平台流通的股票均属未经授权。大量通过 SPV(特殊目的载体)、远期合约等方式间接持有 Anthropic 权益的投资者面临权益不确定性。
深度解读 & 洞察:
这戳破了 AI 投资热的一个尴尬泡沫——大量投资者通过灰色渠道买入未上市 AI 公司的"影子股票",但公司根本不认这些权益。当估值越高,想提前进场的人越多,公司就越要筑高墙。对普通投资者而言,这是一个重要提醒:高估值不等于高回报,尤其是当你的"投资"连最基本的权益确权都没有的时候。
大模型竞速:新一轮迭代潮
Cursor 发布 Composer 2.5:性能比肩顶级模型,成本仅 1/10
AI 编程工具 Cursor 发布 Composer 2.5 模型,核心数据:
- 基于 Kimi K2.5 构建,训练规模是上代的 25 倍,85% 算力投入强化学习
- SWE-Bench Multilingual 得分 79.8%,与 Opus 4.7 的 80.5% 几乎持平
- 每百万 token 输入 0.50 美元、输出 2.50 美元,约为 Opus 4.7 的十分之一
- 正与 SpaceX 合作,利用百万 H100 的 Colossus-2 集群训练更大模型
深度解读 & 洞察:
Composer 2.5 的出现打破了一个行业假设:顶级编程 AI 必须很贵。Cursor 用 85% 的算力做后训练(而非基础模型训练),证明了"小模型+大力度领域微调"可以打败"大模型通用训练"。但更值得关注的是背后的商业博弈——Cursor 的上游供应商 Anthropic 已经推出了竞品 Claude Code,这迫使 Cursor 必须自研模型。而马斯克通过算力合作获得了以 600 亿美元收购 Cursor 的优先权,Cursor 的命运已被锁定进马斯克的版图。
阿里通义千问 Qwen 3.7 预览版上线
两款预览版模型上线 Arena AI:
- Qwen3.7-Max-Preview:文本综合排名全球第 13(国产第一),数学全球第 7,编程第 10
- Qwen3.7-Plus-Preview:视觉综合排名第 16,推动通义千问视觉榜升至全球第 5
- 迭代节奏从每 4-6 个月缩短到每月发布,5 月 20 日阿里云峰会正式发布
深度解读 & 洞察:
Qwen 正在用"高频交付"的策略追赶海外头部模型。从 3.5 到 3.6 再到 3.7,几乎每月一个版本。这种策略的优势是快速收集社区反馈,风险是开发者和用户可能产生"预览疲劳"——每个版本都用不久就被替代,正式版和开源版迟迟不放出。真正决定 Qwen 生态上限的,不是跑分排名,而是开源节奏和开发者社区的信任积累。
月之暗面完成 20 亿美元融资,国资央企入场
月之暗面正在进行的 20 亿美元融资接近尾声,国智投、北京人工智能基金、中国移动等国资央企入场。不到半年累计融资超 39 亿美元,估值较去年 11 月翻了 4 倍多,成为国内大模型创业公司中融资最多的企业。
深度解读 & 洞察:
国资和运营商的入场意味着中国大模型竞争已进入"国家队"阶段。月之暗面拿到的不仅是资金,更是算力资源(运营商的 GPU 集群)和政策通道。这改变了中国 AI 创业的游戏规则——纯市场化竞争正在让位于"资本+资源+政策"的综合博弈。
具身智能与机器人:落地加速
波士顿动力 Atlas 学会搬冰箱
波士顿动力发布视频,展示 Atlas 人形机器人搬运一台冰箱:双手抬起、行走、上半身旋转 180 度稳稳放置在桌上。Atlas 利用强化学习在仿真中学习适应不同重量和形状的物体,通过触觉和本体感觉(身体对自身姿态和运动的内部感知)实现精细控制。
深度解读 & 洞察:
搬冰箱看似简单,实则是机器人领域的高难度动作——需要同时处理重物平衡、动态重心调整和精确放置。Atlas 的突破在于:它不是靠预编程完成的,而是通过强化学习"学会了"如何应对未知物体。这意味着机器人的泛化能力正在从实验室走向真实场景。
宇树科技:语音驱动机器人实时生成动作
宇树科技发布一镜到底视频,展示通过语音指令直接控制 G1 机器人实时生成各种动作。官方承认目前有延迟和动作不够流畅的问题。
Figure AI 机器人 vs 人类分拣包裹:人类险胜
Figure AI 让机器人与实习生比拼 10 小时分拣包裹。结果:人类 12924 件 vs 机器人 12732 件,人类仅多 192 件。CEO 称"这将是人类最后一次赢得此类比拼"。机器人已在连续直播中不间断工作 6 天,累计分拣超 3 万件。
深度解读 & 洞察:
虽然人类赢了,但差距仅 1.5%,而且机器人可以 24 小时不休息。这次比赛最大的信号是:在重复性体力劳动领域,机器人的性价比拐点已经到来。当机器人能以接近人类的速度工作,且不需要休息、不会磨出水泡,商业部署只是时间问题。
地平线开源 HoloMotion-1:4 亿参数机器人"小脑"大模型
地平线发布并开源 HoloMotion-1,面向人形机器人全身控制的 4 亿参数模型。端侧推理速度约 300FPS(远超 50Hz 控制需求),支持从互联网视频、动捕数据等多源学习动作,已实现舞蹈、健身、搬箱子等零样本迁移。代码和模型已开源。
更多机器人动态
- 智元 WITA 大模型成为全国首款完成合规备案的具身智能交互大模型,计划三季度推出 WITA Omni 1.0,交互时延压缩至 500ms 以内
- 矩阵超智 MATRIX-3旗舰人形机器人发布,售价 58 万元起,自研直线关节负载能力达半吨级,一期规划年产 10000 台
- 摩尔线程 MT Lambda具身智能仿真平台发布,首次在全国产 GPU 上完成 Sim-to-Real 验证
- 英伟达 Vera CPU首批交付 Anthropic、OpenAI、SpaceX 等客户,专为 Agentic AI 设计
AI 商业化与应用落地
三大运营商推出 AI Token 套餐
中国移动、电信、联通同时推出 AI Token 套餐,将大模型算力包装成类似手机流量包的产品,最低 9.9 元/月,支持话费直付和跨平台通用。
深度解读 & 洞察:
这是 AI 从"大厂专属"走向"全民可用"的关键一步。运营商的介入解决了一个核心问题——支付渠道。不需要信用卡、不需要海外账号,用话费就能买 AI 算力。这可能会激活大量原本被挡在门槛外的个人用户和中小企业,为 AI 应用的大规模普及铺平道路。
百度 Q1 财报:AI 收入首次突破 50%
百度 2026 年 Q1 总营收 321 亿元,AI 业务收入 136 亿元占比 52%。其中 AI 云收入 88 亿元(同比增 79%),AI 应用 25 亿元,AI 营销 23 亿元。萝卜快跑完成 320 万次全无人驾驶订单。
深度解读 & 洞察:
这份财报标志着 AI 从"烧钱投入"正式进入"赚钱支柱"阶段。百度是第一个用财务数据证明 AI 商业化跑通的中国大厂。GPU 云收入 184% 的增速尤为亮眼——说明算力需求正在从训练向推理阶段转移。
OpenAI 让 ChatGPT 连接你的银行账户
OpenAI 为 ChatGPT Pro 用户推出财务工具,通过 Plaid 连接超 1.2 万家银行。AI 可分析消费习惯、制定理财计划、追踪投资组合,用户可随时断开并清除数据。
更多 AI 应用动态
- 微信读书 AI Skill:授权后 AI 帮你查书架、分析阅读习惯、导出笔记、推荐书单
- Alexa+ 按需播客:一句话生成播客,已与美联社、路透社等合作保证内容质量
- 联想天禧 AI 4.0:引入仿生记忆、个人知识库、Skills 技能广场
- 腾讯云 Hy3/DeepSeek-V4-Pro结束免费公测,5 月 27 日起正式商业化
- DeepSeek 回应特殊字符异常:
<think字符触发模型幻觉,非隐私泄露 - 谷歌 AI Studio 移动应用:手机上用自然语言构建 AI 应用,已在 Google Play 开放预注册
- 豆包博物馆讲解:已与 20+ 博物馆合作,5 家场馆聘为官方 AI 讲解员
基础设施与硬件
谷歌联手黑石 250 亿美元建 AI 云公司
谷歌与黑石集团合作组建 AI 云算力公司,黑石注入 50 亿美元股权,总计算投资约 250 亿美元。核心目标:利用谷歌自研 TPU 芯片,2027 年上线 500 兆瓦算力规模,直接与 CoreWeave 等算力服务商竞争。
深度解读 & 洞察:
这笔交易标志着 AI 竞争进入"资本耐力赛"阶段。单纯的技术优势已经不够了,谁能在算力基础设施上砸下足够多的钱、建得足够快,谁才能支撑下一轮模型训练的需求。谷歌的 TPU 芯片正式进入外部市场,直接叫板英伟达在 AI 算力领域的垄断地位。
AMD AI 开发者日首次在中国举办
苏姿丰在上海发表演讲,指出预计 2030 年全球将有 50 亿人每日使用 AI。AMD 大中华区拥有超 4000 名工程师,发布 Radeon AI PRO R9700 显卡(32GB 显存)和锐龙 Threadripper PRO 9000 系列处理器。
更多动态
- 腾讯联合发布古文字 OCR 评测基准 Chronicles-OCR:28 个主流模型古字识别最高准确率仅 27.1%,开启推理模式反而变差
- SandboxAQ 与 Claude 合作:药物发现工具接入对话平台,科学家无需搭建计算基础设施
- Odyssey 发布 Agora-1:世界模型首次跑通多人实时 FPS 游戏,无游戏引擎、无预制资源
- Grafana 源码遭窃取:黑客通过访问令牌进入 GitHub,公司拒绝支付赎金
- 英特尔持续归档开源项目:本月再归档 7 项技术项目,涵盖 AI 工具、边缘计算等
- AMD 开源驱动传奇 Marek Olšák 加入 Valve:Steam Deck 开源图形团队再添核心开发者
- AI 编程 Token 消耗研究:10 倍成本只换来 2 倍产出,广泛中等采用比极端使用更有效
- 华为开源蜂群智能体框架:大幅提升多机协作效率
- Runway 估值超 53 亿美元:不赌语言赌视频,成立机器人研发部门
- AI 电力危机:太浩湖面临断电,电力被转向 AI 数据中心
- Peter Salus 去世:Unix 发展史关键记录者,享年 88 岁
- 搜狐张朝阳:过度依赖 AI 易致"思维萎缩",AI 时代科普应注重原理推导
