GPT-5.4首发原生计算机操作,AI智能体爆发

要点速览
  • OpenAI发布GPT-5.4,首个支持原生计算机操作的大模型,桌面操作成功率超过人类
  • 小米发布移动端AI智能体miclaw,一句话操控手机和米家设备
  • 阿里澄清千问团队离职传闻,宣布春节完成2亿笔AI办事订单
  • 博通预测2027年AI芯片收入超1000亿美元,甲骨文裁员数千人押注AI云
  • Transformer作者用Rust重写OpenClaw,推出安全版IronClaw

GPT-5.4首发原生计算机操作,AI智能体爆发

大模型发布与智能体产品化

GPT-5.4 正式发布

OpenAI 今日发布 GPT-5.4 系列模型,这是其首个将推理、编程、计算机原生交互、深度网页搜索及百万级 Token 上下文能力整合到单一模型中的"大一统模型"。核心突破包括:

  • 原生计算机使用能力:模型通过截图理解软件界面,执行鼠标点击和键盘输入操作。在 OSWorld-Verified 基准测试中,桌面操作成功率达 75.0%,首次超过人类平均水平(72.4%)
  • 百万 Token 上下文窗口:支持处理约 75 万字文本或完整代码库,有效缓解长对话中的"灾难性遗忘"问题
  • 专业工作能力大幅提升:在 44 个职业领域的 GDPval 基准中,83.0% 项目达到或超过专业水平;内部投行级电子表格建模得分从 68.4% 提升至 87.3%
  • 效率优化:引入工具搜索机制,Token 消耗降低 47%

深度解读 & 洞察:GPT-5.4 的核心意义不在于单项能力的提升,而在于能力整合方式的转变。此前,不同任务需要调用不同的专门模型——推理用 o 系列、编程用 Codex、计算机操作需要 Claude。现在,这些能力被整合在同一个模型中。这种"大一统"使 AI 从"多模型协作"进化为"单模型全能",大幅降低了应用开发的复杂度。

更重要的是,原生计算机使用能力标志着 AI 从"聊天工具"向"数字员工"的质变。模型不再只是生成文本或代码,而是能够像人类一样操作电脑完成真实工作。当 AI 能自主发邮件、建日程、操作软件时,它就从"辅助工具"变成了能独立负责业务的"智能体"。

影响:

  • 对科技股和AI概念股形成利好,可能加速AI在企业工作流中的落地
  • 长期看,部分重复性白领工作面临被替代风险,投资者需关注AI赋能型企业的机会

Xiaomi miclaw 移动端 AI 智能体开启封测

小米今日官宣 Xiaomi miclaw,这是基于小米 MiMo 大模型构建的移动端 AI 智能体,已开启小范围封闭测试。核心能力包括:

  • 自主决策:识别模糊任务,自动选择系统工具完成操作
  • 三级智能记忆:自动保留关键决策点,动态压缩冗余交互,可节省 50%-90% 的 Token 开销
  • 米家 IoT 控制:实现对所有接入米家的 IoT 设备的语音或意图控制
  • 生态扩展:支持 MCP 标准和开放 SDK,可接入第三方应用和 PC 端 MCP 工具

深度解读 & 洞察:这是国内首个真正在手机上落地的类 OpenClaw AI 智能体应用,代表了手机厂商从"集成现有AI功能"向"开发原生AI助手"的战略转变。Xiaomi miclaw 的核心价值在于系统级集成——以系统应用身份运行,已封装 50+ 系统能力和生态服务。这意味着 AI 不再是独立应用,而是深入手机操作系统底层,能够调度通讯、日程、文件等核心功能。

从"生成式AI"(生成内容)向"行动式AI"(执行操作)的转变,将彻底改变人机交互方式。用户无需学习各种 App 的操作逻辑,只需一句话就能让 AI 完成跨应用的任务。手机作为 AI 入口的地位将进一步巩固。

阿里开源 HiClaw:Team 版 OpenClaw

阿里开源团队发布 HiClaw,这是 OpenClaw 的升级版,通过引入 Manager Agent 架构解决安全性、多任务协作、移动端体验等核心痛点。核心创新包括:

  • Manager Agent + Worker Agent 双层架构:Manager 负责任务拆解和分配,Worker 负责执行
  • 安全性提升:通过 AI Gateway 代理调用,Worker 不持有真实凭证,避免泄露风险
  • 移动端优化:内置 Matrix 服务器,支持 Element Mobile 等客户端,消息实时推送
  • 5 分钟完成本地安装:提供一键安装脚本

深度解读 & 洞察:HiClaw 解决了 OpenClaw 的两大短板:安全性和团队协作。原生 OpenClaw 中每个 Agent 需持有真实 API Key,存在泄露风险;当需要多个 Agent 协作时,用户必须逐一指挥,效率低下。HiClaw 通过 Manager Agent 实现自动化协调,用户只需向 Manager 下达指令,系统自动分配任务、监控进度。

这代表了 AI 智能体从"个人工具"向"团队系统"的演进。未来,用户可能拥有一个 AI 管家,管理着一群各有所长的 AI 专业员工——有的负责编程、有的负责数据分析、有的负责写作,协同完成复杂项目。

Transformer 作者推出安全版 IronClaw

Transformer 论文作者 Illia Polosukhin 用 Rust 语言从零重写了 OpenClaw,构建了具备四层纵深防御架构的安全版 AI 智能体运行环境 IronClaw:

  • Rust 内存安全:消除缓冲区溢出等传统漏洞
  • WASM 沙箱隔离:第三方工具在独立容器中运行
  • 加密凭证保险库:API Key 通过 AES-256-GCM 加密存储,绑定域名策略
  • 可信执行环境(TEE):硬件级隔离保护

深度解读 & 洞察:OpenClaw 在快速走红的同时暴露出严重安全隐患:超过 25,000 个公开实例暴露在互联网上,面临远程代码执行、提示注入攻击等风险。核心问题在于,用户的凭证会被直接送入 LLM 提供商服务器。IronClaw 的关键设计是:大模型本身永远接触不到原始凭证。凭证仅在网络边界注入,即使模型遭受提示注入攻击,凭证存储层也会拒绝非法请求。

这反映了 AI 智能体发展中的核心矛盾:能力越强,权限越大,风险越高。当 AI 能操作你的邮箱、银行账户、工作系统时,安全性就成为生死线。IronClaw 代表了"用户自有 AI"的愿景——用户完全掌控自己的数据和资产,AI 在可信环境中执行任务。

AI 编程与开发工具

OpenAI 发布 Codex Security:AI 安全代理进入研究预览

OpenAI 推出 Codex Security,这是新一代 AI 应用程序安全代理,通过深度理解项目上下文识别复杂漏洞。核心能力包括:

  • 构建系统上下文与威胁模型:扫描存储库理解安全相关结构
  • 优先级划分与验证:在沙盒环境中对发现的问题进行压力测试
  • 基于系统上下文的修复:根据系统意图提出修复建议

在过去 30 天内,Codex Security 对 120 多万次 commit 进行扫描,发现 792 项危急漏洞和 10,561 项高风险漏洞。已向 OpenSSH、GnuTLS、Chromium 等知名项目报告关键漏洞,获得 14 个 CVE 编号。

深度解读 & 洞察:传统安全扫描工具面临两大问题:漏报率高(错过真正漏洞)和噪声大(大量误报)。Codex Security 的突破在于理解代码的"意图"——它不只检查语法层面的漏洞,而是理解整个系统的业务逻辑和安全模型。这使其能够发现传统工具遗漏的复杂漏洞,如跨租户身份验证问题、业务逻辑缺陷等。

更深远的意义在于,AI 正在从"帮人写代码"进化到"帮人保代码安全"。当 AI 能自动发现和修复漏洞时,软件开发的门槛将进一步降低,安全团队的工作重心将从"发现漏洞"转向"审查AI的修复方案"。

GitHub Copilot 数小时完成 GPT-5.4 接入

在 OpenAI 发布 GPT-5.4 后,GitHub Copilot 迅速宣布完成接入。根据 GitHub 内部测试,GPT-5.4 在处理多步骤任务时成功率明显提高,能够更准确地执行复杂逻辑推理和跨工具调用。

开发者现在可在 Visual Studio Code v1.104.1、Visual Studio 17.14.19、JetBrains 1.5.66 等主流 IDE 的最新版本中,通过聊天、编辑和代理模式使用 GPT-5.4。

深度解读 & 洞察:GitHub 快速响应展示了微软与 OpenAI 的紧密协同,更重要的是标志着 AI 编程助手从"代码补全"向"具备自主解决问题能力的智能体"转变。随着 GPT-5.4 原生计算机操作能力的推出,软件开发模式可能发生深层转变:从"人工驱动、AI辅助"变为"AI领航、人工审核"。

Cursor 推出 Automations 自动化智能体模式

Cursor 推出 Automations 工具,打破传统的"提示与监控"模式,通过代码库更新、Slack 消息或定时器自动触发智能体。系统每小时可运行数百次自动化任务,支持代码审查、事件响应等场景。

深度解读 & 洞察:单名工程师目前可能需要同时监督数十个编程智能体,管理负担巨大。Automations 的核心价值是让 AI 智能体"自主运行",仅在需要时让人类介入。这就像工厂自动化——工人不再是每个环节都手动操作,而是在关键节点监控和干预。人从"发起者"变成"节点参与者",大幅提升了工程师的管理半径。

AI 基础设施与算力投资

博通预测 2027 年 AI 芯片收入超 1000 亿美元

博通 CEO Hock Tan 在财报电话会议上预测,到 2027 年公司 AI 芯片收入将"大幅超过 1000 亿美元"。作为对比,博通 2025 财年第一季度总销售额为 193 亿美元,其中 AI 业务收入为 84 亿美元。

增长动力来自大客户的定制芯片需求:谷歌、Anthropic 规划了 3 GW 算力产能,Meta 至少 2 GW,OpenAI 为 1 GW。博通已确保实现目标所需的供应链。

深度解读 & 洞察:博通的定位与英伟达形成差异化竞争:英伟达主推通用 GPU,博通则与头部客户深度绑定,提供定制化解决方案。这种策略的优势是精准匹配客户特定需求,但意味着对少数大客户的高度依赖。

千亿美元目标意味着两年内要实现超过十倍增长,这反映了科技巨头对 AI 算力的疯狂投入。当 Anthropic、OpenAI 这样的 AI 公司都规划 GW 级算力时,说明 AI 正从"实验"走向"基础设施化"——算力将成为水和电一样的基础公共服务。

影响:

  • 利好半导体设备和AI算力产业链
  • 博通股价盘后上涨超5%,可能带动AI芯片板块估值重塑

甲骨文计划裁员数千人押注 AI 云服务

甲骨文计划裁减云部门及其他部门数千个工作岗位,以筹集资金支持 AI 数据中心扩张计划。裁员主要针对需求量较小的岗位,本质是"资源置换"——将释放的资金全额拨付给 AI 云服务部门。

深度解读 & 洞察:这反映了传统企业软件巨头在 AI 浪潮中的转型压力:要么缩减传统业务、重仓基础设施,要么在技术代际更迭中逐渐边缘化。建设大规模数据中心和购买 GPU 芯片需要巨额资金,连甲骨文这样的科技巨头也必须通过裁员来控制人力成本,填补算力基础设施建设的资金缺口。

这预示着科技行业的"人才再配置":传统业务的工程师岗位减少,AI 基础设施相关岗位激增。这不是简单的裁员,而是整个行业人才结构的重塑。

政策与产业发展

国家发改委:"十五五"末 AI 相关产业规模将增长到 10 万亿元以上

国家发展改革委主任郑栅洁表示,将深化"人工智能+"行动,"十五五"末人工智能相关产业规模将增长到 10 万亿元以上。2024 年我国人工智能核心产业规模超过 9000 亿元,预计 2025 年将超 1.2 万亿元。

郑栅洁以春晚机器人为例,指出这些机器人并非单单为了炫技,而是具有丰富的技术内涵。中国将重点打造六大新兴支柱产业,包括智能机器人。六大新兴支柱产业相关产值在 2025 年已接近 6 万亿元,预计到 2030 年有望翻番。

深度解读 & 洞察:从9000亿到10万亿,意味着未来几年 AI 产业将迎来超过10倍的增长空间。政策层面已将 AI 定位为新质生产力的核心引擎,"人工智能+"行动将推动 AI 深入制造、医疗、教育等实体经济。

春晚机器人的亮相不是简单的技术展示,而是中国机器人产业"立体化状态"的呈现。当机器人"浓度"超高的春晚开启"数智化元年"时,说明 AI 已从实验室走向大众生活,从概念变成文化符号。

阿里澄清千问团队离职传闻:核心团队稳定,坚持开源路线

针对千问模型核心团队"集体离职"传闻,阿里正式回应:目前千问模型团队运行稳定,未出现核心成员集体离职的情况。阿里强调千问将坚持开源路线,基础模型团队从未被设置 DAU 等商业化 KPI,大模型的目标是不断追求模型智能上限,实现通用人工智能(AGI)。

阿里 CEO 吴泳铭已在内部邮件中批准了千问基础模型团队核心成员林俊旸的离职申请。

深度解读 & 洞察:这次风波源于一位核心成员的正常离职被放大为"集体出走",反映了市场对 AI 人才竞争的极度敏感。阿里的回应强调了两点:一是团队整体稳定,二是坚持开源和技术驱动而非商业化 KPI。这种定位在商业化压力日益增大的 AI 竞争中,代表了另一种发展路径——不追求短期商业变现,而是深耕技术积累和开源生态。

千问春节完成 2 亿笔 AI 办事订单

千问宣布将继续投入 AI 办事领域,用户只需说一句话就能下单各类生活服务。数据显示,千问在今年春节期间累计完成了 2 亿笔真实订单,证明 AI 能在复杂生活场景中处理高频任务。

深度解读 & 洞察:2亿笔真实订单是AI从"聊天"走向"办事"的重要里程碑。这意味着用户不再只是在问AI问题,而是让AI代替他们完成真实操作——购物、点餐、订票。当AI能跨越不同应用的界限、代替用户完成工作并处理支付时,AI经济的生产力将迎来质的飞跃。

融资与企业动态

VAST 完成 5000 万美元 A 融资

VAST 完成 5000 万美元 A 轮融资,由阿里、恒旭资本联合领投。VAST 已成为全球多模态领域领军者,旗下 Tripo Studio 平台聚集超过 650 万创作者,累计生成近 1 亿个 3D 模型。

VAST 同时发布全新 AI 3D 大模型家族:Tripo H3.1 在各项核心指标上保持行业第一;Tripo P1.0 可在 2 秒内输出专业建模师级别的 3D 资产,速度提升百倍以上。VAST 已重点研发世界模型,首款世界模型将于近期发布。

深度解读 & 洞察:VAST 代表了 AI 从"生成内容"向"构建世界"的演进。3D 生成是 AI 理解并模拟现实世界的重要路径,而世界模型是通用模型的终极形态。当 AI 能生成可交互的虚拟世界、具备感知理解和物理推演能力时,它将服务于具身智能、仿真模拟等前沿场景。

陈天桥投入 20 亿美元开发 AGI

盛大集团创始人陈天桥在隐退九年后首次接受国际媒体采访,宣布投入 20 亿美元开发"发现式 AI",目标是实现通用人工智能。他计划利用 2018 年收购的约 70 万英亩林地,通过地热能建立数据中心,为 AI 研究提供清洁能源。

陈天桥提出"发现式 AI"概念:通过整合长期记忆、因果推理和预测建模,发现新知识并预测复杂现实事件,而不仅限于模仿人类内容生成。

深度解读 & 洞察:陈天桥的"发现式 AI"代表了 AGI 的另一种路径——不追求模仿人类,而是追求超越人类的能力。他的布局有两个独特之处:一是利用大规模林地资源建设绿色算力中心,二是将神经科学与 AI 结合。这种"基础设施+认知架构"的双轮驱动,可能是通往 AGI 的另一条路。

他开玩笑称,未来历史或许不再以公元前(BC)和公元后(AD)划分,而是以"ChatGPT 之前"和"ChatGPT 之后"来划分——我们才刚刚进入"ChatGPT 后"的第三年,AI 的未来是一段漫长的旅程。

更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码