- OpenAI GPT-5.2推理速度提升40%
- 苹果Xcode 26.3首次原生集成智能体编程
- 面壁智能开源MiniCPM-o 4.5:端侧全双工交互
- 阿里Qwen3-Coder-Next开源:3B参数媲美大模型
- 英伟达拟向OpenAI注资200亿美元
- 昆仑万维发布Skywork桌面版:本地AI助手
- OpenClaw曝严重安全漏洞,可传播macOS病毒
- OpenAI ChatGPT今晨突发全球大规模中断

模型与核心技术突破
OpenAI:GPT-5.2/Codex 模型的速度现已提升 40%
OpenAI 开发者官方账号宣布,GPT-5.2 与 GPT-5.2-Codex 两款模型在不更换模型结构与参数权重的前提下,实现了约 40% 的整体速度提升。此次性能提升主要来源于对推理堆栈的系统级优化,覆盖所有 API 客户,模型能力保持不变。
深度解读 & 洞察:
- 技术逻辑:这次优化不是通过重新训练模型或增加参数来提升性能,而是纯粹在推理阶段的工程优化。类似于给一辆性能已经很强的汽车做了更精密的传动系统调校,让引擎动力输出更高效。
- 为什么重要:40%的速度提升意味着延迟降低,响应更快。对于实时交互场景(如对话、代码补全)、企业级应用(自动化工作流)来说,这是质的飞跃。开发者在无需任何改动的情况下就能直接获得性能提升,降低了AI集成到生产系统的门槛。
- 成本效益:在不改变价格的情况下提供更好的性能,实际上是变相降低了单位算力成本,这对商业化应用非常关键。
上海 AI 实验室发布书生 Intern-S1-Pro:全球开源参数规模最大的科学多模态模型
上海 AI 实验室宣布开源基于"通专融合"技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro。该模型采用混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。
深度解读 & 洞察:
- MoE架构的意义:就像一群专家医生坐诊,每次只有几个相关专家参与诊断,而不是所有医生都要在场。这使得模型在拥有庞大知识储备的同时,实际计算成本可控。
- 科学多模态的价值:将物理直觉(通过傅里叶位置编码)和复杂数理逻辑推理能力结合,目标是让AI不仅能"看"和"说",还能"理解科学原理"。这对AI4S(AI for Science)领域——如药物研发、材料科学——具有重要意义。
- 开源战略:在万亿参数级别开源,体现了中国在AGI4S基础设施上的投入和开放态度。对科研机构和企业来说,可以直接在现有基础上进行研究,而不需要从零开始。
开发工具与智能体革命
初探苹果 Xcode 26.3:一句人话,2 分钟 AI 搞定番茄钟 App
苹果公司发布了 Xcode 26.3 更新,首次将"智能体编程"(Agentic Coding)引入原生开发环境,标志着该工具正式从"被动编辑"转型为"主动协作"。Xcode 26.3 引入了基于大语言模型(LLM)的智能工具,支持集成 Anthropic Claude Agent 和 OpenAI Codex 等主流模型。这些智能体能够根据项目架构自主拆解任务、修复错误并制定决策。
实测显示,即使是"零 Swift 基础"的用户,通过输入简单的自然语言需求,AI 智能体在不到两分钟内就生成了完整的番茄钟 App 项目代码,并构建出包含完整功能的可用 App。
深度解读 & 洞察:
- 从"助手"到"同事"的转变:传统的AI编程工具像是给你写建议的助手,你还是需要自己决定怎么用。而智能体编程更像是给你一个能干活同事,你告诉目标,它自己规划路径、执行任务、解决问题。
- Vibe Coding的通俗解释:就是"意图导向编程"。你不需要懂编程语言,只需要用自然语言描述你想要什么(“我想做一个提醒休息的应用”),AI理解你的意图后,把技术细节都包了。
- 行业影响的两面性:正面看,开发门槛大幅降低,创意更容易落地;负面看,App Store可能涌入大量同质化、低质量的应用。就像当年短视频平台兴起后,内容创作门槛降低,但也带来了质量参差不齐的问题。
面壁智能开源 MiniCPM-o 4.5:原生全双工架构开启端侧全模态交互新范式
面壁智能正式开源了新一代全模态旗舰模型 MiniCPM-o 4.5。作为一款原生全双工架构的全模态大模型,它通过"边看、边听、主动说"的实时感知与交互能力,突破了传统 AI 对话系统"回合制"交互模式的局限,实现了行业首个"即时自由对话"大模型的能力。该模型仅以 9B 参数就在全模态、视觉理解、文档解析、语音理解与生成以及声音克隆等多个维度达到了 SOTA(行业领先)水平。
深度解读 & 洞察:
- 全双工是什么:想象打电话,全双工就是双方可以同时说、同时听,不需要等对方说完才能开口。传统AI对话像对讲机(半双工),我说完一句,你等一下再回复。MiniCPM-o 4.5像真正的电话对话,可以边听边思考边回应,甚至主动插话。
- 端侧部署的价值:所有处理在本地完成,数据不上云,隐私安全;不需要联网就能用,响应更快;降低了使用成本(不用持续付云服务费)。这对于企业、政府等对数据安全敏感的场景特别重要。
- 小参数大能力的意义:9B参数能做到SOTA水平,说明模型架构和训练方法的效率在提升,而不是单纯靠堆参数。这对算力资源有限的场景(如手机、边缘设备)来说意义重大。
阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
阿里巴巴千问宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重语言模型。该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE(混合专家模型)的新架构,总参数量为 800 亿,但每次推理实际激活的参数仅有 30 亿。在 SWE-Bench Verified 基准测试中,配合 SWE-Agent 框架,问题解决率超过 70%,能媲美激活参数量高出 10 到 20 倍的大型模型。
深度解读 & 洞察:
- MoE架构的效率优势:总参数800亿但只激活30亿,意味着每次计算只用到需要用到的"专家",大大降低了实际算力消耗。就像一个大型医院,所有科室医生加起来几百人,但每次看某个病,只需要相关科室的几个医生会诊。
- "模型即Agent"的理念:不是简单地训练一个会写代码的模型,而是把Agent所需的能力——任务规划、工具使用、错误恢复——直接训练到模型里。这样模型本身就具备驱动Agent执行任务的能力,不需要在外部套一层复杂的Agent框架。
- 商业价值:低成本部署是关键。3B激活参数意味着可以在普通电脑甚至高性能手机上跑,而性能又不输给大几十倍的模型。这对降低企业AI应用门槛、推动本地化部署具有重要意义。
产业与资本动态
英伟达计划向OpenAI注资200亿美元
英伟达计划向OpenAI注资200亿美元,目前协议已接近完成。这笔投资若最终落实,将成为AI产业近年来规模最大的单笔投资之一。从产业逻辑来看,这并非单纯的财务投资,而是两家公司在AI算力与应用层深度绑定的延续。
深度解读 & 洞察:
- 战略绑定的深层逻辑:OpenAI需要大量GPU训练和推理模型,英伟达需要稳定的大客户消化其芯片产能。这次投资让双方从"买卖关系"升级为"资本绑定",OpenAI的算力需求有了保障,英伟达的芯片销售有了稳定渠道。
- 行业整合信号:算力厂商与应用厂商的边界正在模糊。英伟达不再只是卖铲子的,也开始下场挖矿(投资应用层)。这可能会加速行业整合,中小公司面临的竞争压力会更大。
- 对市场的影响:强化了"算力-模型-应用"产业链协同的趋势。对于投资者来说,关注上下游深度绑定的公司可能更有价值。
松下宣布设立首席人工智能官(CAIO)
松下于 2 月 4 日宣布高管架构调整,将于 4 月 1 日生效:新设首席人工智能官,由榊原彰担任,旨在加速运用 AI 解决客户问题并提升内部运营效率;新设解决方案营收官,由 Hirofumi Suzuki 担任,负责统筹跨领域举措,优化优先领域的盈利结构。
深度解读 & 洞察:
- 传统企业的AI转型信号:松下作为传统制造业巨头,设立CAIO职位意味着AI不再是"锦上添花"的技术部门,而是上升到战略层面的核心驱动力。这反映了传统企业正在从"数字化"向"智能化"转型。
- CAIO的职责边界:不同于CTO(关注技术实现),CAIO更关注如何用AI解决业务问题、创造商业价值。既要懂技术,又要懂业务,是连接技术和商业的桥梁角色。
- 行业趋势:预计会有更多传统企业设立类似职位。AI不再是IT部门的事,而是需要CEO级别关注、跨部门协同的战略议题。
产品与市场应用
昆仑万维发布"Skywork 桌面版":AI 帮你在电脑上直接干活
昆仑万维面向全球正式发布"天工 Skywork 桌面版"。该版本直接在本地执行任务,无需上传文件到云端,旨在成为每个人的 OS 助手。其核心特色包括:本地执行与安全隐私、深度理解桌面内容、多模型自由切换(支持 Claude Opus 4.5/Sonnet 4.5 和 Gemini 3 Pro)、原生 Windows 支持、集成 100+ 精选 Skill。
深度解读 & 洞察:
- 本地化AI的隐私价值:文件不出本地,在虚拟机隔离环境中处理,这对处理敏感数据的企业和用户非常重要。就像你有一个智能助手,它就在你家里的书房工作,不用把文件送到外面的办公室去处理。
- “理解项目"而非"处理文件”:不是简单的文件格式转换或内容提取,而是基于语义理解整个项目背景。比如给它一个项目文件夹,它能理解这个项目的结构、逻辑,然后帮忙做跨文件的重构、整理,这是更高阶的能力。
- 市场竞争态势:被称为"Windows 版 Claude Cowork",显示其定位是面向Windows办公人群的AI助手。在苹果生态有Claude Cowork,Windows生态需要类似的产品,这个定位很精准。
OpenAI发布Codex桌面应用
OpenAI发布Codex桌面应用,支持多Agent并行运行和自定义技能管理。根据 OpenAI 首席执行官 Sam Altman 表示,该应用发布首日的下载量已超过 20 万次。
深度解读 & 洞察:
- 桌面端成为AI新战场:从云端走向本地,从通用走向场景化。桌面应用意味着AI可以更深度地集成到工作流中,随时待命,不需要每次都打开浏览器。
- 多Agent协同的价值:一个Agent可能擅长代码,另一个擅长文档,再一个擅长设计。让它们协同工作,就像一个专业团队分工合作,能处理更复杂的任务。
- 自定义技能的意义:企业可以根据自己的业务需求,训练或定制特定的技能包。就像给AI装上专门做某事的"插件",让它更贴合实际业务场景。
基础设施与性能优化
腾讯混元 AI Infra 核心技术开源,推理吞吐提升 30%
腾讯混元 AI Infra 团队宣布推出开源生产级高性能 LLM 推理核心算子库 HPC-Ops。该算子库基于生产环境痛点,采用 CUDA 和 CuTe 从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,将核心算子性能逼近硬件峰值。在真实场景下,基于 HPC-Ops,混元模型推理 QPM 提升 30%,DeepSeek 模型 QPM 提升 17%。
南大团队基于华为昇腾突破 MoE 模型优化瓶颈
南京大学李猛博士团队依托南京大学鲲鹏昇腾科教创新孵化中心,基于华为昇腾平台,在 MoE(混合专家)模型优化研究中取得重要突破。通过专家等价性驱动的无损显存高效优化研究,成功实现了显存消耗降低 50% 以上、推理延迟显著提升。
安全与监管
爆火 AI 智能体 OpenClaw 被发现严重漏洞,可传播 / 植入 macOS 病毒
密码管理工具 1Password 发布博文,发现有攻击者利用爆火 AI 智能体 OpenClaw,向 macOS 用户散播和植入恶意软件。攻击者利用了 OpenClaw 的"技能"(Skills)文件,伪装成合法的集成教程,诱导用户复制并运行一段 Shell 命令。该命令会在后台解码隐藏载荷、下载后续脚本,并修改系统设置以移除"文件隔离(Quarantine)"标记,从而躲避 macOS 内置的安全检查。
深度解读 & 洞察:
- 社会工程学陷阱:这次攻击不是通过技术漏洞直接入侵系统,而是利用"教程"诱导用户自己执行恶意命令。就像有人冒充技术支持,打电话骗你自己在电脑上输入命令,本质上是被骗了,不是被黑了。
- AI Agent的安全悖论:Agent需要足够的权限才能帮你干事情(管理文件、操作程序),但权限太大也意味着一旦被滥用,后果严重。这是Agent安全设计的核心矛盾。
- 对行业的影响:随着Agent越来越普及,这类安全事件会越来越多。行业需要建立更完善的Agent安全框架——权限隔离、行为审计、异常检测等。用户也需要提高安全意识,不要随意执行来源不明的"教程"或"脚本"。
更多动态
OpenAI ChatGPT 于北京时间今晨 4 点 32 分突发大规模中断,导致全球大量用户无法访问。目前故障已排除,服务于今早 6 点 14 分恢复。受影响的功能包括基础 AI 对话服务、搜索功能、图像生成工具、面向开发者的 Codex 编程模型、Atlas 平台。
字节跳动旗下的火山引擎正式开源了 OpenViking,这是一个专为 AI Agent 设计的上下文数据库,其核心理念是抛弃传统 RAG 的碎片化向量存储模式,转而采用"文件系统范式"来重新组织 Agent 的记忆、资源与技能。
Soul App AI团队开源了名为 SoulX-FlashTalk 的实时数字人生成模型。这是一个 14B 参数规模的模型,在实时生成性能上实现了 0.87 秒的亚秒级响应延迟和 32fps 的高帧率输出。
武汉市发布《武汉市数智经济发展行动方案(2026—2028 年)》,提出到 2028 年全市 AI 产业规模超 2000 亿元,AI 相关企业突破 1500 家,初步建成超大规模人工智能城市。
摩尔线程推出了 AI Coding Plan 智能编程服务,该服务通过国产 GPU MTT S5000 作为算力基础,推理部分用了硅基流动提供的加速引擎,模型则选用 GLM-4 代码模型。
OpenAI 与企业数据云平台 Snowflake 达成一项价值约 2 亿美元的多年度战略合作,将 OpenAI 的先进模型直接嵌入 Snowflake 现有的企业数据生态系统中。
英特尔 CEO 陈立武宣布,公司正式进军 GPU 市场,已经组建了专门的工程团队来负责 GPU 项目。
支付宝首次上线 AI 眼镜扫福功能,用户只需佩戴兼容的 AI 眼镜,目光注视任何地方的"福"字,眼镜即可自动识别。
法国检方对埃隆·马斯克旗下社交平台 X 公司位于巴黎的办公室进行了突击搜查,主要针对 Grok 人工智能系统生成的色情深度伪造视频以及其他涉嫌犯罪行为展开调查。
Anthropic 宣布以至少 3500 亿美元估值进行员工股权回购,允许员工套现手中的部分股权,同时计划筹集高达 200 亿美元资金。
小米正在为预计八月发布的 HyperOS 4 做准备,此次更新的核心目标是彻底清除自 MIUI 一代累积至今的遗留代码,正式进入「零遗留」阶段。
Mozilla 宣布 Firefox 浏览器下月将推出新的 AI 功能,用户可以彻底关闭所有这些功能,以尊重用户的选择权。
腾讯元宝的"10亿春节红包"活动因诱导分享行为,被微信限制分享链接。官方回应称正在紧急调整分享机制,已改成了"口令红包"模式。
武汉将启动建设超大规模 AI 之城,提出到 2028 年全市 AI 产业规模超 2000 亿元。
我国"人工智能 + 电影虚拟拍摄融合创新实验室"在浙江德清揭牌,将围绕关键技术国产化攻关、中试项目孵化、AI 虚拟制片全流程平台建设等方向开展工作。
