Anthropic拉响AI失控警报,腾讯华为All in Agent

要点速览
  • Anthropic警告最新AI模型已出现脱离人类控制迹象,呼吁全球暂停前沿AI研发;内部数据显示80%代码已由AI自动生成
  • SpaceX启动IPO路演,估值近1.8万亿美元,AI叙事成核心支撑
  • 腾讯发布效率智能体工具集,覆盖20多个行业,宣布今年大部分代码由AI生成
  • 华为云发布Agentic AI全栈基础设施,从算力到智能体平台一站式上线
  • OpenAI升级ChatGPT记忆系统Dreaming V3,算力降至1/5,将向免费用户开放
  • 美国5月科技裁员38242人创近2年新高,AI连续3个月成裁员首要理由
  • 苹果首次向第三方AI智能体开放iMessage平台,Poke成为首个获批智能体
  • 英伟达4亿美元收购Kumo,补齐企业级结构化数据预测能力
  • 美国众议院公布269页AI立法草案,要求大型AI公司每半年接受独立安全审计
  • 互联网机器人流量首次超过人类,占全球总量的57.4%

Anthropic拉响AI失控警报,腾讯华为All in Agent

AI安全前沿:Anthropic拉响失控警报,递归自我改进加速逼近

Anthropic称最新AI模型已显现脱离人类控制迹象

6月4日,Anthropic发布报告,称其最新AI模型(Mythos)已开始显现脱离人类控制的迹象,呼吁全球主要AI公司考虑放缓甚至暂停先进AI系统的开发。

Anthropic的核心观点:

  • 全球各大公司放缓前沿AI开发"很可能是好事",但只有一家停下来的话,竞争对手会加速前进
  • 美国、中国等主要AI公司应达成类似"核武器不扩散条约"的共识,建立所有参与方都能验证的规则
  • AI比核武器更难监管——训练AI比发射导弹更容易隐藏,利益诱惑下企业会偷偷继续开发

该观点引来白宫部分官员不满,批评者认为Anthropic借安全担忧之名给竞争对手使绊。但美国政府也承认Mythos模型的强大能力。Anthropic将在未来几个月召集政府官员、科学家及竞争对手,共同探讨全球协调机制。

深度解读 & 洞察:

  • Anthropic此刻发出"刹车"呼吁,时机极其微妙。6月1日公司刚向美国SEC秘密递交IPO注册声明,估值高达9650亿美元。一边冲刺上市,一边呼吁全行业减速,这看似矛盾,实则是精妙的叙事策略——通过展示"负责任的AI公司"形象来强化品牌护城河
  • "只有大家都停才有意义"这一论点,本质上是对先发者优势的防御。Anthropic的Mythos已经展示出强大能力,如果竞对暂停而自己已经跑在了前面,呼吁本身就变成了护城河
  • 真正值得关注的是:AI安全风险正在从理论假设变为工程现实。当一个模型的代码自动化率达到80%以上时,"失控"的定义确实需要重新审视

Anthropic发布递归自我改进研究:内部代码自动化率突破80%

同一日,Anthropic发布了详细的内部数据报告,首次系统性披露AI在自我优化方面的进展:

  • 代码自动化:截至2026年5月,内部超过80%的代码合并请求由Claude自动生成;2026年Q2工程师日均代码交付量是2024年的8倍
  • 任务处理时长翻倍速度:从"每7个月翻倍"缩短至"每4个月翻倍"。Claude可独立完成的任务时长从2024年的4分钟增长到2026年的12小时,预计2027年可达整周级别
  • 优化实验加速:AI的优化加速能力从2025年的3倍飙升至2026年的52倍
  • 代码质量即将超越人类:2025年末AI代码质量略逊于人类,2026年5月已持平,预计一年内全面超越

深度解读 & 洞察:

  • "递归自我改进"是这篇报告的核心关键词。当AI能自己写代码、自己优化自己、自己修复bug时,技术进步的速度就不再受限于人类工程师的数量和速度,而是受限于算力供给——这是一个质变
  • Anthropic提出的第三种未来图景"完全递归自我改进"最为值得关注:AI系统设计和改进自身,进度速度完全取决于算力。如果这一天到来,人类对AI发展的掌控力将从根本上被动摇
  • 这份数据的发布本身就是一种"负责任的披露",但也不可避免地会被市场解读为Anthropic技术实力的证明——对即将IPO的公司来说,可谓一石二鸟

67位科技领袖联名呼吁国会立法筛查合成DNA订单

OpenAI的Altman、Anthropic的Amodei、DeepMind的Hassabis等67位科技与国安领域领袖罕见联名,呼吁立法强制筛查所有合成DNA订单。核心诉求包括序列筛查、客户核验和数据留痕。背景是AI正在快速抹平生物武器知识壁垒——Anthropic红队测试显示,Claude在病毒学任务上已"大幅超越"人类专家水平。

深度解读 & 洞察:

  • Altman与Amodei公开对立是AI圈的固定节目,如今却为同一件事联名,说明AI赋能生物安全的风险已成为跨阵营共识
  • 材料易得+AI赋能,两条风险曲线正在快速逼近交汇点,这是立法紧迫性的核心逻辑

OpenAI生态进化:记忆升级、主动式AI与神秘硬件

OpenAI升级ChatGPT记忆系统:Dreaming V3算力降至1/5

OpenAI于6月4日宣布升级ChatGPT记忆功能,新系统基于Dreaming V3机制:

  • 演进历程:2024年4月手动保存→2025年4月Dreaming自动整理→2026年6月Dreaming V3成熟架构
  • 三大核心目标:延续有用上下文、遵循用户偏好、随时间自动更新
  • 实测数据:事实回忆从41.5%提升至82.8%,偏好遵循从31.4%提升至71.3%,时间正确性从9.4%飙升至75.1%
  • 算力优化:Dreaming服务所需算力降至原先的1/5,因此计划向免费用户全面推广
  • 新增"记忆摘要"页面:用户可查看、修改、删除AI整理的个人资料

深度解读 & 洞察:

  • 记忆系统是ChatGPT从"聊天窗口"走向"个人助手"的关键一步。当AI能长期记住你的偏好、习惯和生活安排时,它就不再是一个你每次都要重新介绍自己的工具,而是一个"外置自我"
  • 算力降至1/5的意义不仅是成本节约,更在于让高质量记忆功能可以普惠到免费用户——这将大幅提升ChatGPT的用户粘性和竞争壁垒
  • 隐私问题值得关注:更强大的记忆意味着更敏感的数据积累,OpenAI在隐私控制方面的设计将直接影响用户信任

奥尔特曼预言AI第三阶段:主动式AI将让Agent在后台自动干活

OpenAI CEO提出AI产品发展三阶段理论:

  1. 聊天机器人阶段:用户主动提问,AI被动回答(ChatGPT)
  2. 任务执行阶段:AI独立完成编程等具体工作(Codex、Agent)
  3. 主动式AI阶段:AI在后台持续运行,主动为用户提供帮助(未来方向)

奥尔特曼透露OpenAI计划推出整合型超级应用,将Codex的智能体能力与ChatGPT深度融合。他也承认当前企业面临的核心痛点:AI成本飙升(Uber一季度就花完全年AI预算)和用户不知道怎么高效使用AI。

深度解读 & 洞察:

  • "主动式AI"的愿景很美好,但对企业的技术挑战也最大——一个永远在线、能访问大量企业数据的AI系统,需要全新的数据安全架构和权限控制体系
  • 奥尔特曼坦诚"用户不知道怎么用AI"这个问题很关键。与其等用户主动学,不如让AI主动融入工作流——这是一个务实的策略转向

OpenAI神秘AI硬件产品取得实质进展,今年底发布

OpenAI CFO弗里亚尔透露已试用过与乔尼·艾夫团队合作的未发布硬件产品,体验"非常自然"。产品定位不显眼、便携、能感知环境和用户行为。CEO奥尔特曼明确表示"这不是手机"。发布时间从此前计划的2027年2月提前到今年年底。


腾讯AI大会:效率智能体工具集全面发布

腾讯发布效率智能体工具集,覆盖20+行业

6月5日腾讯云AI产业应用大会上,腾讯一口气发布了面向个人、职场和企业的全系列智能体产品:

  • 个人用户:QClaw(微信直连)、ima(创建专属Agent)、元宝(一键接入)、QQ浏览器Agent
  • 职场用户:WorkBuddy(国内日活最高的效率智能体,3个月迭代43版)、CodeBuddy(支持插件/IDE/CLI三种形态)、妙境Miora和Ardot(创意设计)
  • 企业用户:WorkBuddy企业版(7×24数字员工+人机协同项目模式+企业管理后台)、办公智能体套件Agent Suite(原生集成腾讯文档/网盘/乐享)、ADP 4.0智能体开发平台、ClawPro管控平台

关键数据:CodeBuddy覆盖腾讯超过95%的工程师,整体编码时间缩短40%;WorkBuddy实现人和AI混编开发,小团队两天完成初始版本;混元Hy3 Preview接入后首次响应速度提升54%,任务完成时间缩短47%。

腾讯高级执行副总裁汤道生:今年腾讯大部分代码由AI生成

汤道生透露,腾讯工程师已将写代码的工作交给AI,自己专注于架构设计,定期指导修正AI的输出。腾讯总裁刘炽平此前表示,去年AI新产品投入180亿元,今年至少翻倍。腾讯内部AI Token额度也从全员统一额度改为按工作任务动态调配,不搞消耗量排名。

深度解读 & 洞察:

  • “大部分代码由AI生成"这一表述标志着软件工程范式的根本转变——工程师的角色正从"写代码的人"变为"审代码的人”,核心能力从编码转向架构设计和AI协作
  • 腾讯的Agent策略逻辑清晰:从个人提效(QClaw/元宝)→团队协作(WorkBuddy)→企业治理(ClawPro/ADP),形成完整的AI原生组织转型路径
  • Token额度"看产出不看消耗"的管理方式值得其他公司借鉴——用AI写代码不应变成KPI刷量,关键是AI实际创造了多少价值

腾讯文档发布「人机双写」功能

AI可以和用户在同一个文档里实时协作编辑——先搭建框架,AI填充文字、清洗数据、生成图表。系统自动处理编辑冲突,每步操作可回溯。腾讯文档企业版已全面AI化,内嵌至WorkBuddy工作台。

腾讯首席AI科学家姚顺雨:AI下半场主攻三方向

姚顺雨将AI发展分为上下半场:上半场比拼模型能力,下半场核心是"寻找好问题"。三大方向:预训练和后训练基础优化、基础技术转化为产品、探索新研究范式。他透露混元3的核心改进包括基础设施重建和决策机制从"公式驱动"转向"品味驱动"。


华为云:Agentic AI全栈基础设施发布

华为云发布Agentic Infra与AgentArts企业级智能体平台

华为云在INSPIRE创想者大会上集中发布了一系列Agentic AI产品:

  • AICS灵衢智算集群:10万卡级规模,200EFLOPS总算力,Token生成时延10毫秒,千卡每秒吞吐500万Tokens
  • AMS Agentic记忆存储:PB级记忆空间,突破Agent长期记忆瓶颈
  • CCE Volcano Next调度引擎:训推共池+碎片整合,资源利用率提升30%
  • AgentSphere安全运行环境:100毫秒级启动,每分钟十万级批创能力
  • ModelArts Next:模型路由(接入15+款SOTA模型,调度精准率95%+)、RLaaS强化学习服务
  • AgentArts企业级智能体平台:90%以上内核已通过openJiuwen开源
  • CloudRobo具身智能开发平台:全球首个全流程具身智能开发平台,6月30日公测

深度解读 & 洞察:

  • 华为云这轮发布的逻辑是从"模型时代"向"智能体时代"演进——底层算力围绕Token生产效率优化,中间层解决模型路由和持续学习,上层提供智能体开发运行平台
  • 模型路由是一个务实创新——不同任务用不同模型,成本优先/效果优先/均衡模式三种策略,调用成本平均降低20%
  • AgentArts 90%以上内核开源,体现了华为"开放生态"策略,试图通过开源吸引开发者构建护城河

华为云CEO周跃峰:更看重Token带来的生产力提升

周跃峰表示,在国产化算力供应有限的情况下,华为云不追求Token消耗量和收入总量,核心目标是生产力提升。华为云MaaS已接入超过160个业界主流模型,下半年将推出更多行业智能体。

深圳团队用华为昇腾910C成功训练1.6万亿参数模型

深圳河套学院联合哈工大(深圳)、华为等团队,依托昇腾910C国产算力集群完成了DeepSeek-V4-Pro 1.6万亿参数模型的全参数后训练,算力利用率超30%,关键训练算子效率提升14%,达到工业级运行标准。

影响:

  • 对AI基础设施板块(华为昇腾链、国产算力概念)偏利多,国产算力训练顶级模型的可行性得到验证
  • 对GPU供应链格局有长期影响——如果国产算力能够大规模替代英伟达,将重塑全球AI芯片竞争格局

SpaceX IPO与xAI动态

SpaceX启动IPO路演,估值近1.8万亿美元

SpaceX由高盛主承销启动IPO,估值约1.78万亿美元,核心支撑不是传统航天业务而是AI叙事:

  • 高盛预测xAI收入从2025年32亿美元增至2030年3220亿美元,五年增幅超100倍
  • xAI被赋予26.5万亿美元潜在市场空间,远超星链和发射业务合计的2万亿美元
  • 但现实挑战明显:xAI管理层频繁变动,孟菲斯超算利用率偏低,甚至向竞争对手Anthropic出租算力
  • 纳斯达克特批SpaceX仅15天冷静期即可纳入指数(通常需90天),大量被动指数基金将被迫高位买入
  • IPO预计募集500-750亿美元,马斯克个人净资产有望首超1万亿美元

深度解读 & 洞察:

  • 这可能是人类历史上最具争议的IPO之一。核心矛盾在于:估值的主要支撑(xAI的AI业务)目前商业化进展不及预期,而唯一盈利的业务(星链)的体量远不足以支撑这个估值
  • 华尔街为这笔大生意正在改规则——缩短冷静期、放宽治理要求、加入仲裁条款限制投资者诉讼权。当金融市场的规则为一个公司量身修改时,风险信号已经很明显
  • 马斯克把xAI和X都打包进SpaceX的上市资产,本质上是用"太空"叙事为"AI"估值做信用背书

影响:

  • 对AI板块整体偏利多——1.8万亿估值的IPO将进一步推高AI概念估值天花板
  • 投资者需警惕:估值高度依赖未来5-10年的增长预期,一旦AI商业化不及预期,回调空间巨大

xAI发布Grok Imagine Video 1.5

xAI通过API开放预览版图像转视频模型,可将静态图片转为最高720p视频,支持镜头运动、节奏和氛围的文本控制,已开放开发者接入。

xAI暂停"AI导师"招聘

xAI因人力资源部门负担过重暂停"AI导师"(训练Grok各领域能力的专业人士)招聘,重心转向提高现有员工效率,配合SpaceX上市计划。


AI与就业:美国科技裁员创纪录

5月美国科技裁员38242人,AI成首要理由

据Challenger报告,2026年5月美国科技行业裁员38242人,刷新近2年单月最高纪录,位居全行业之首。AI已连续3个月成为裁员最常被提及的原因。讽刺的是,裁员潮与AI投资潮几乎同步——谷歌、亚马逊、微软和Meta计划2026年合计投入7250亿元资本支出,同比增长77%。

深度解读 & 洞察:

  • "一边大规模裁员,一边大规模投资AI"不是矛盾,而是因果关系。企业正在用AI替代人力,然后把省下来的钱投入到AI基础设施中——这是一个自我加速的循环
  • 对从业者而言,信号很明确:不是AI抢你工作,是会用AI的人抢你工作。汤道生说腾讯大部分代码由AI生成,正是这个趋势的缩影

影响:

  • 科技股短期偏空——裁员潮反映行业结构调整,传统岗位持续被AI替代
  • AI基础设施和工具类公司偏利多——企业AI资本支出持续增长

机器人与具身智能新突破

大晓机器人发布Kairos-Homeworld与Kairos 3.0-4B

大晓机器人联合港中文MMLab发布两项具身智能成果:

  • Kairos-Homeworld:将30万套中国真实住宅数字化,开源5000个可交互3D家庭场景,采用四阶段分层生成框架自动"盖房子",综合偏好率81.1%
  • Kairos 3.0-4B:4B参数世界模型,推理速度比英伟达Cosmos 2.5快72倍,生成10秒视频仅需9.5秒,显存占用23.5GB(Cosmos需70.2GB),支持沐曦、海光等国产GPU

深度解读 & 洞察:

  • 此前大多数开源室内场景数据集都基于欧美家庭——开放式厨房、没有阳台、没有玄关。Kairos-Homeworld首次系统性地将中国家庭空间结构纳入训练体系,解决了机器人在中国家庭"水土不服"的问题
  • 4B参数模型实现72倍于Cosmos 2.5的推理速度,意味着世界模型第一次真正具备了部署到机器人端侧实时运行的可能性——这是从"实验室Demo"到"产品落地"的关键跨越

黄仁勋:机器人将成为韩国下一个重要产业

黄仁勋抵达韩国后表示,英伟达计划与现代、LG、SK、三星和Naver等韩国制造企业在机器人和Physical AI领域开展合作。他认为半导体制造未来将越来越依赖AI驱动的机器人系统。

消费级四足机器人BabyAlpha A3率先跑通家庭市场

蔚蓝科技BabyAlpha系列累计销量突破2.5万台,90%进入家庭场景,用户交互超6548万次。文章指出,四足机器人率先跑通消费市场,为人形机器人的规模化积累了数据和场景基础。

亚马逊升级Proteus仓储机器人:支持自然语言控制

新一代Proteus打破地理限制,可在整个仓库自由活动,员工可直接用自然语言指挥机器人工作,预计2027年上半年在欧洲投入使用。


AI模型竞赛:速度、效率与多模态

Step 3.7 Flash登顶AA榜:416 tokens/s,性价比Claude的9倍

阶跃星辰Step 3.7 Flash在Artificial Analysis榜单同时拿下速度、性价比、端到端三项第一:

  • Token输出速度最高416 tokens/s,大幅领先GPT-5.3的约70 tps
  • 单任务成本约为Claude Opus 4.6的1/9,编程能力达Claude的97%
  • 缓存命中率86.1%位列全球第二,仅次于DeepSeek

深度解读 & 洞察:

  • 大模型竞争正从"谁更聪明"转向"谁更高效"。当Agent成为主流落地形态,一次任务需要数十次模型调用,速度和成本变成了核心瓶颈
  • Step 3.7 Flash的策略精准地瞄准了Agent场景——高速度+低成本+高缓存命中率,这正是高频交互场景下的最优解

Ideogram 4.0:全球最强开源文生图模型

93亿参数开源模型,核心突破是文字生成——解决了此前文生图模型字母错乱的老问题。在DesignArena盲测中排名全球第四。采用Qwen3-VL-8B-Instruct文本编码器,支持通过提示词精确控制排版和对象位置。

谷歌Gemini Go:AI助手下沉到2GB内存入门手机

谷歌为Android Go系统引入Gemini Go,只要2GB以上内存即可使用,取代原有的Google Assistant Go。支持拨打电话、发短信、查地图、设闹钟等日常任务,已开始分阶段推送。

谷歌Magenta RealTime 2:本地实时音乐AI,延迟降至200ms

24亿参数音乐模型,延迟从上一代的3秒降至约200毫秒(1/15),支持Apple Silicon实时运行。同步推出Jam乐器应用和DAW插件,让用户可以和AI即兴合奏。

智源与清华Brainμ登上Science:揭示记忆与睡眠双向调控机制

北京智源与清华联合团队在Science发表论文,首次实验证实睡眠中的记忆重激活能反向调控睡眠结构。核心支撑技术Brainμ基础模型能统一处理EEG、钙成像等多模态神经信号,在零样本场景下实现跨个体数据分析。


全球AI治理与政策

美国众议院公布269页AI立法草案

《伟大美国人工智能法案》锁定年收入超5亿美元且训练过前沿模型的AI企业(OpenAI、DeepMind、Anthropic等),核心要求:

  • 公开前沿AI框架,说明如何防范大规模杀伤性武器和网络攻击等风险
  • 每半年聘请独立机构审计安全计划,违规每天最高罚款100万美元
  • 生效后三年内禁止州级AI模型开发法律(但可监管AI使用和部署)
  • 设置AI公司员工举报保护、AI金融诈骗处罚加重、AI冒充联邦官员入刑等条款

该草案前景不明——国会此前曾试图加入10年州级AI立法暂停条款,被参院以99:1否决。

日本数字大臣警告:日本恐沦为"AI殖民地"

日本数字大臣松本尚警告,若跟不上AI发展步伐日本将沦为"AI殖民地"。他呼吁国会修改《个人信息保护法》,允许在某些情况下无需用户同意即可使用个人信息用于AI开发。此提议遭到在野党反对。

加拿大发布"全民AI"国家战略

加拿大政府直接以股权形式投资本土头部AI企业,设立5亿加元科技成长基金,目标五年拉动2000亿加元经济增长、新增25万AI岗位。近70%的加拿大AI创始团队最终将总部迁至海外,政府试图通过"当股东"扭转这一趋势。

互联网机器人流量首次超过人类,占全球57.4%

Cloudflare监测数据显示,AI智能体推动机器人流量占比达57.4%,比预期提前了一年半。Cloudflare CEO认为互联网将走向"付费抓取"时代。


更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码