GPT-5.6内测启动,AI编程工具补贴战全面爆发

要点速览
  • GPT-5.6已进入内部测试阶段,OpenAI同步推出ultrafast模式响应速度提升2-3倍
  • OpenAI与Anthropic打响AI编程工具补贴战:OpenAI免费送两个月Codex,Anthropic提Claude Code额度50%
  • 阿里2026财年Q4财报:AI收入占云业务外部收入30%,百炼平台ARR突破80亿元
  • 田渊栋参与创办的RSI获46.5亿美元估值,押注AI递归式自我改进
  • 百度提出DAA新指标取代DAU,发布通用智能体产品DuMate
  • MiniMax推出多智能体协作产品Mavis,一个Leader带多个Worker和Verifier
  • Anthropic CFO称公司90%代码已由AI编写,人类角色从执行者转向监督者
  • TanStack供应链蠕虫攻击波及OpenAI,macOS用户需在6月12日前更新
  • Kimi完成20亿美元融资,估值突破200亿美元
  • 腾讯Q1营收1965亿元,AI研发投入225亿同比增19%,Hy3模型登顶OpenRouter
  • 奥特曼被曝在与OpenAI有业务往来的公司持有超20亿美元资产,面临利益冲突质疑

GPT-5.6内测启动,AI编程工具补贴战全面爆发

AI编程工具进入补贴战时代

GPT-5.6进入内部测试,OpenAI推出ultrafast模式

GPT-5.5发布仅三周,GPT-5.6的消息已开始流出:

  • GPT-5.6已在全速开发,首批内部检查点启动测试,内部代码名为 ember-alpha 和 beacon-alpha
  • OpenAI Codex日志中已出现GPT-5.6测试痕迹
  • 本周四Codex上线ultrafast模式,响应速度提升2-3倍,使用全尺寸主力模型(非简化版)
  • 这是OpenAI第三次加速:GPT-5.4的/fast模式快1.5倍,GPT-5.3-Codex-Spark借助Cerebras芯片快15倍

深度解读 & 洞察:GPT-5.6的开发速度本身就是AI自我进化的缩影。GPT-5.3是OpenAI第一个自己参与训练的模型,GPT-5.5时期内部85%的员工每周用Codex写代码,GPT-5.6几乎可以确定是在GPT-5.5的深度参与下开发的——AI正在帮OpenAI造更强的AI。同时,Codex已有300万周活跃用户,AI生成的代码反过来又用于AI的训练和部署,这个循环正在加速自转。

影响:

  • 利好英伟达、Cerebras等芯片厂商,AI推理加速对算力的需求持续增长
  • 利好开发者生态,模型能力提升直接降低开发成本

OpenAI Codex登陆移动端

OpenAI宣布Codex正式登陆ChatGPT移动端(预览阶段):

  • 用户可在手机上查看Codex任务状态、批准命令、更换模型、启动新线程
  • 文件和凭据保留在原始机器上,截图、终端输出、差异对比实时同步到手机
  • 底层使用安全转发层(Relay Layer),不暴露公共网络
  • Remote SSH功能正式GA,可直接连接受管理的远程开发环境
  • 同时发布程序化访问令牌、Hooks功能GA、HIPAA合规支持

深度解读 & 洞察:移动端Codex解决的不是「在手机上写代码」的问题,而是「在碎片时间里持续驱动AI工作流」的问题。当AI代理处理耗时任务时,开发者需要在关键时刻做决策——批准操作、调整方向、回答问题。移动端让这种介入变得即时,有效防止不必要的返工。每周400万Codex用户的协作节奏正在从「坐在电脑前」变成「随时随地」。

Anthropic反击:Claude Code额度提升50%+Opus4.7Fast

Anthropic在OpenAI ultrafast上线前先出手:

  • 6月15日起Claude Code每周使用限额提升50%,持续至7月13日
  • 可与上周"加倍至5小时"限制累加
  • 发布Opus4.7Fast模式,号称比Codex更快

OpenAI反应迅速:任何从其他平台迁移到Codex的企业,直接免费使用两个月(按Pro计划每月200美元计算,相当于免费送400美元)。奥特曼亲自下场称Codex是"市面上最强的AI编程产品"。几小时内,2000名开发者在3小时内主动联系OpenAI。

深度解读 & 洞察:两家万亿级公司用补贴战争夺开发者,对开发者而言是直接利好。但更深层的信号是:AI编程工具正从试验品变成生产标配,谁能最先锁定开发者的工作流,谁就掌握了AI时代的基础设施入口。

Anthropic CFO:AI已编写90%代码,人类转向监督角色

Anthropic CFO Krishna Rao透露:

  • Anthropic超过90%的代码由Claude Code完成
  • 每月财务审查流程在人工介入前,Claude已能完成90%-95%的内容
  • 过去需要数小时的内部报告现在只需30分钟
  • “每个人都会逐渐变成管理者”

深度解读 & 洞察:Anthropic没有因为AI写代码而裁员,反而招聘了更多员工——因为AI提升了团队整体效率,让公司能承担更多项目。这代表一种乐观的AI替代观:自动化不会消灭岗位,而是让人类从「执行者」升级为「监督者」。但这种模式能否在所有企业复制,仍是未知数。


智能体产品集中爆发

百度提出DAA新指标,发布DuMate通用智能体

百度在Create 2026大会上提出DAA(Daily Active Agents,日活智能体数),试图取代DAU成为AI时代的核心度量衡:

  • 核心判断:Token衡量投入,DAA衡量产出——不是烧了多少算力,而是有多少智能体真正替人完成了任务
  • 发布DuMate通用智能体,定位"第二代入口",能调度其他独立智能体并行工作
  • 秒哒3.0面向零代码用户,已服务超1000万用户,81%为非技术人员
  • 伐谋2.0瞄准决策专家,青岛港案例中自动化码头调度指标提升10.21%

深度解读 & 洞察:DAA的提出直指行业痛点:当智能体7×24小时自主运行时,“有多少人点击"已失去意义。百度是第一个系统性地提出"Agent时代该怎么计分"的组织。DuMate的架构设计也体现了这一逻辑——它不是单体助手,而是"智能体编排器”,一次请求可能触发多个agent并行工作。如果DAA成为行业共识,意味着衡量企业竞争力的标准将从"有多少员工"变成"有多少智能体"。

MiniMax推出多智能体协作产品Mavis

MiniMax将Agent产品升级更名为Mavis,核心变化:

  • 推出Agent Teams功能,自动组建多Agent团队(Leader + Worker + Verifier三角色)
  • Worker与Verifier是对抗关系:Verifier尽可能发现问题,驱动Worker迭代
  • 底层Team Engine状态机引擎控制流程,不靠模型自由发挥
  • 实测:一句话prompt,28分钟交付完整交互式HTML页面,全程无人工干预
  • 订阅体系合并,一份订阅打通CLI、API、Agent全部权益

深度解读 & 洞察:Mavis解决的是单Agent的先天缺陷——上下文焦虑、注意力衰减、缺乏制衡。三角色分工本质上复刻了企业中研发+质检的制衡机制,但关键在于这是引擎层面的硬约束而非模型自觉。不过多Agent不是万能药,Token消耗可能达到单Agent的2-4倍,MiniMax务实地将"何时需要多Agent"的判断也交给了引擎。

Anthropic推出中小企业专属Claude服务

Anthropic推出Claude for Small Business:

  • 通过Claude Cowork平台交付,首批支持QuickBooks、PayPal、HubSpot、Canva、DocuSign等工具
  • 提供15个代理工作流程(月末结算、发票催收、营销活动等)和15项专项技能
  • 核心承诺:Claude不会默认使用用户业务数据进行模型训练
  • 计划全美10城巡回推广,每站免费AI培训100名中小企业负责人

深度解读 & 洞察:中小企业贡献美国44%的GDP,但AI使用率远落后大企业。Anthropic的选择是「深度集成」而非「简单对话」——让AI直接嵌入财务、营销工作流,而非停留在聊天窗口层面。AI平台之争的下一个主战场不再是财富500强,而是3600万家中小企业。

Runway发布Runway Agent:对话式视频创作

Runway推出Agent产品,用户通过对话即可从创意到成片:

  • 描述需求 → Agent提出概念和故事结构 → 生成多场景视频(含配音、对话、音乐)
  • 覆盖品牌营销、社媒内容、短片创作、产品发布等场景
  • 分钟级产出高分辨率多镜头视频

Notion转型AI代理编排中心

Notion推出开发者平台和Workers云端沙箱环境:

  • 用户已创建超100万个自定义代理
  • Workers支持运行自定义代码、从任何API数据库同步数据
  • 支持直接调度Claude Code、Cursor、Codex等第三方AI代理

AI商业化进入关键验证期

阿里2026财年Q4财报:AI收入占比突破30%

阿里巴巴发布全年财报,核心数据:

  • 全年总收入10,237亿元,同比增长3%(剔除银泰等业务后增速11%)
  • 云业务外部商业化收入增速40%,AI相关收入占比达30%——每10元外部收入中3元来自AI
  • 百炼MaaS平台ARR突破80亿元,预计本季度跨越100亿元,半年内平台流量增长超10倍
  • 全年自由现金流转为净流出466亿元,主要消耗于AI基础设施、千问App获客和即时零售
  • 企业级Agent平台"悟空"开始规模化放量,非技术背景用户成为主要使用者

深度解读 & 洞察:这份财报是AI从"成本中心"向"收入支柱"转换的关键验证。30%的AI收入占比意味着商业化不再停留在PPT阶段。但代价同样清晰:自由现金流转负,全年净流出466亿元,本质上是用真金白银为AI铺设基础设施。好消息是集团仍有5,208亿元现金储备,短期弹药充足。关键看点是下季度百炼ARR能否破100亿,以及自由现金流何时回正。

影响:

  • 利好阿里云生态合作伙伴,MaaS平台放量带动上下游
  • 投资者需关注自由现金流回正节奏,短期估值承压

腾讯Q1财报:营收1965亿,AI投入225亿

腾讯第一季度核心数据:

  • 营收1964.6亿元,同比增长9%;Non-IFRS经营利润756.3亿元,同比增长9%
  • AI研发投入225.4亿元,同比增长19%;资本开支319.4亿元,同比增长16%
  • Hy3 preview模型自4月28日在OpenRouter token消耗量稳居前列,限免结束后连续三周保持榜首
  • 马化腾回应AI发展:“一年前像上了船却发现船漏水,现在站稳了”

ChatGPT网页端流量份额暴跌:77.6%→53.7%

Similarweb数据显示,ChatGPT网站流量份额一年内从77.6%跌至53.7%:

  • 谷歌Gemini从7.3%飙升至26.7%,成最大赢家
  • Claude从1.4%攀升至近8%
  • DeepSeek从6%降至4%,Grok稳定在3%
  • 注意:此数据仅统计网页端,OpenAI和Anthropic主要营收来自API和移动端

Anthropic企业市场份额首超OpenAI

Ramp平台AI指数报告显示:

  • Anthropic企业级市场份额达34.4%,OpenAI下滑至32.3%
  • 过去一年Anthropic市占率增长4倍,OpenAI几乎停滞(仅增0.3%)
  • 但Anthropic面临三大挑战:高成本模型与企业降本需求矛盾、服务中断和质量波动、Opus4.7导致图像处理成本翻倍

资本、人才与法律博弈

田渊栋AI公司RSI获46.5亿美元估值

Meta前研究科学家总监田渊栋参与创办的Recursive Superintelligence(RSI):

  • 完成6.5亿美元早期融资,估值46.5亿美元
  • 由谷歌GV与Greycroft联合领投,英伟达、AMD跟投
  • 团队仅30人,8位联创包括Richard Socher、Vision Transformer作者Alexey Dosovitskiy等
  • 核心赌注:递归式自我改进——让AI自主发现短板、设计实验、改写自身代码
  • 首步目标:训练相当于5万名博士能力的系统,自动化科学研究

深度解读 & 洞察:RSI代表的趋势是2025年以来顶级科学家集体出走大厂的缩影。David Silver的Ineffable Intelligence(51亿估值)、Ilya Sutskever的SSI、Yann LeCun的AMI Labs(10亿美元),加上RSI——这些公司的共同判断是:传统Scaling Law边际收益递减,下一代能力跃迁需要让AI接管研发闭环。这不是渐进式优化,而是对AI自我进化能力的一次豪赌。

奥特曼被曝持超20亿美元资产,面临利益冲突质疑

法庭文件披露:

  • 奥特曼在与OpenAI有业务往来的公司持有超20亿美元资产
  • 包括Helion Energy(约17亿美元)、Stripe(约6.33亿美元)、Retro Biosciences(约2.58亿美元)等
  • 马斯克律师质疑OpenAI与Helion、Cerebras(100亿算力合作)、Reddit的合作
  • 美国十州总检察长要求SEC在OpenAI IPO前审查利益冲突防范政策

奥特曼法庭作证四小时:马斯克因控制权未果而离开

OpenAI vs Musk案件最新进展:

  • 奥特曼称马斯克2015年未兑现资金承诺,离开原因是对完全控制权的渴望
  • 马斯克曾建议将OpenAI与特斯拉合并,奥特曼因担心摧毁非营利使命而拒绝
  • 奥特曼评价马斯克"不懂如何管理研究实验室"
  • 结案陈词定于周四进行,陪审团仅具咨询性质

Kimi融资20亿美元,估值突破200亿美元

Kimi完成20亿美元融资,资金主要用于:

  • 研发下一代模型,强化代码能力和复杂任务处理
  • 扩大推理基础设施,降低成本提升稳定性
  • 推进全球化战略,重点布局东南亚和中东

黄仁勋基金会捐赠1.08亿美元算力

黄仁勋夫妇基金会向CoreWeave购买1.08亿美元AI算力捐赠给大学和非营利机构:

  • 受赠机构将具备训练数十亿参数模型的能力
  • 英伟达同时提供免费工程技术服务
  • 发生于美国收紧芯片出口管制背景下,捐赠路径与商业销售存在监管差异

安全攻防与隐私博弈

TanStack供应链蠕虫攻击波及OpenAI

"Mini Shai-Hulud"供应链攻击事件详情:

  • 攻击者串联三重漏洞链:pull_request_target → GitHub Actions缓存投毒 → OIDC令牌提取
  • 6分钟内发布84个恶意版本,波及42个@tanstack/*命名空间下的npm包
  • OpenAI两台员工设备受影响,代码签名证书泄露(iOS/macOS/Windows/Android)
  • macOS用户需在6月12日前更新ChatGPT Desktop、Codex App、Codex CLI和Atlas
  • 次生影响:Mistral AI、UiPath(40+包)、Squawk(19个航空数据包)等均受波及,Snyk记录至少170个受影响包
  • 这是首个携带合法SLSA来源证明的恶意npm包案例

深度解读 & 洞察:这次攻击的精妙之处在于三重漏洞的链式利用,以及最终产出的恶意包携带了合法的SLSA来源证明——Sigstore正确验证了构建过程,但无法保证被构建代码的安全性。这本质上暴露了当前软件供应链信任模型的结构性缺陷。对OpenAI而言,三个月内遭遇两起重大供应链攻击(3月Axios事件+本次),安全问题已不容忽视。

Meta推出WhatsApp AI隐身模式

Meta在WhatsApp上线AI隐身对话功能:

  • 使用最新Muse Spark模型,对话在隔离安全环境中运行
  • 关闭窗口、锁屏或退出应用后自动清除所有内容
  • 基于去年发布的私有处理基础架构,不破坏端到端加密
  • 正在开发Side Chat功能,允许群聊中私下调用AI

深度解读 & 洞察:时机耐人寻味:路透社上月报道AI聊天记录在诉讼中可能被用作呈堂证据。Meta推出隐身模式不是单纯的功能更新,而是应对一个正在浮现的法律风险。这也预示着AI隐私竞争将进入更深层次——谁能证明"AI不会记住你说的话",谁就能赢得用户信任。

被裁员工一小时清空96个政府数据库

两名有犯罪前科的科技从业者被裁后的事件:

  • 会议结束5分钟后开始删除数据库,一小时清空约96个美国政府数据库
  • 穆尼布在删除后立即向AI询问"如何清除SQL服务器系统日志"
  • 下载1805个EEOC文件至U盘,获取至少450人联邦税务信息
  • 暴露三大管理漏洞:权限远超工作所需、离职流程存在致命空窗、AI工具被用于消除痕迹

Windows再现两个零日漏洞

匿名安全研究员Nightmare-Eclipse公开两个Windows零日:

  • YellowKey:BitLocker全磁盘加密绕过,仅需USB驱动器+按键操作即可获得shell访问
  • GreenPlasma:SYSTEM权限提升,但触发时有UAC弹窗,尚不具备静默利用能力
  • 该研究员今年已披露5个零日,暗示仍握有更多未公开漏洞

AI安全的双重标准

OpenAI数据显示每周120-300万用户在ChatGPT中流露精神危机信号,但AI安全框架对此类"认知伤害"的重视程度远低于"灾难性风险"——防生物武器有硬墙阻断,防自杀意念仅弹出热线链接后继续对话。


更多动态

产品更新

开源与基础设施

行业动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码