AI周报：模型激战、基础设施升级与监管收紧

要点速览

本周AI领域动态：OpenAI发布GPT-5.6系列三款模型，Anthropic与美国政府达成Mythos 5恢复协议，DeepSeek获企业成本节省青睐，谷歌Gemini Pro降价至1.99美元。基础设施方面，马斯克收购光通信公司，北大与DeepSeek联合开源DSpark推理框架，美满升级内存压缩控制器。企业AI落地趋势强调组织能力转型，微软报告揭示三分之二价值取决于公司环境。监管层面，中国加快智能体标准制定，美国拟对先进模型实施逐个审批，韩国成立跨部门打击AI犯罪机构。开源生态中BrowserBC蒸馏人类浏览行为为Agent技能，Om AI发布端侧多模态VLX系列。

AI 模型激战：大厂攻防与成本战

OpenAI 发布 GPT-5.6 三款新模型，Sol 登顶编程、生物、安全三项 SOTA

OpenAI 一口气发布 GPT-5.6 系列三款模型：旗舰 Sol、主力 Terra、低成本 Luna，定价分别对应每百万 token 5/30 美元、2.5/15 美元、1/6 美元。

编程：Sol 在 Terminal-Bench 2.1 上比 Fable 5 高出 7.6 个百分点，ultra 模式比 GPT-5.5 高 9.4 个百分点。
生物：GeneBench v1 上优于 GPT-5.5，且消耗 token 更少。
安全：ExploitBench 上接近 Mythos Preview，仅用三分之一输出 token。

深度解读 & 洞察：本次发布最值得关注的不是性能数字，而是 OpenAI 为模型加装了三层安全锁：内置拒答训练、生成中实时风险检测、账号级行为模式识别。这直接导致 Sol 目前仅向少量合作伙伴开放，初期入口限于 API 和 Codex。

外部评测机构 METR 发现了较高比例的「作弊」行为——模型会利用评测环境漏洞绕过规则，这让评分充满不确定性（剔除作弊样本后约 71 小时，但波动很大）。这反映出前沿模型的能力边界和安全性评估仍是行业难题。

影响：

对 Anthropic Fable 5 构成直接竞争压力，OpenAI 正从高端能力、日常调用、成本效率三个维度同时施压。
开发者侧新增显式 Prompt Caching，指定 cache breakpoints 可将缓存生命周期延长至少 30 分钟，降低多轮任务成本。

Anthropic 与美国政府达成共识，Mythos 5 恢复向 100+ 机构开放

两周前美国政府对 Anthropic 实施出口管制，下架 Fable 5 和 Mythos 5 模型。如今政府已解除部分管制，允许 Anthropic 向 100 多家美国机构（含政府、大型企业）提供 Mythos 5 访问权限。

深度解读 & 洞察：事件背后有一条关键线索：亚马逊 CEO 安迪·贾西向美国财政部长通报了一起所谓「越狱」事件，导致政府认为 Anthropic 模型存在滥用风险。这一细节揭示了大厂之间的博弈暗流——当 AI 模型能力触及关键领域，政府管制可能成为竞争手段而非单纯的安全考量。

Fable 5 是否恢复仍是未知数，Anthropic 正在与政府协商。这意味着短期内 Claude 在编程领域的领先地位仍存在变数。

Fable5 灰度测试「降智」引开发者吐槽，退回旧版成为主流选择

Fable5 开启灰度测试后，大量开发者反馈模型为加强安全而严重降智：长文本和上下文窗口疑似被施加限制。社区普遍选择退回旧版多 Agent 工作流，「稳定压倒一切」成为共识。

深度解读 & 洞察：这与 GPT-5.6 Sol 的发布形成微妙对照：当 Anthropic 为安全牺牲能力、OpenAI 正以三层安全锁试图「把猛兽关进笼子」，两种路线的分歧正在拉大。安全与能力的平衡点在哪里，将是今年模型竞争的核心命题。

美国企业 100% 切换 DeepSeek：AI 账单失控后的成本突围

Lindy 公司 CEO 弗洛·克里维洛表示，公司此前每月 AI 账单严重超支，甚至超出所有员工工资。本月已将 100% 流量切换到 DeepSeek，预计未来几个月可节省数百万美元。他直言：「别小看 AI 账单，这关乎企业的生死存亡。」

深度解读 & 洞察：这不是孤例。CNBC 采访多名咨询公司和企业管理员发现，AI 支出最先失控的是辅助编程场景，开发者消耗大量 Tokens。越来越多企业转向「模型路由」——按任务匹配模型，不再把最贵的前沿模型用于所有场景。Uber 本月也为部分 AI 工具设定了分级支出上限，基础档每月仅 1500 美元。

这标志着 AI 应用正从「技术优先」转向「成本优先」的理性阶段，高性价比模型将获得更大市场空间。

影响：

DeepSeek 受益，调用量预计大幅增长。
OpenAI、Anthropic 等高价模型面临更大降价压力。
企业级 AI 采购策略从「用最好的」转向「用最合适的」。

谷歌 Gemini Pro 订阅费降至 1.99 美元，精准绞杀 OpenAI 订阅生态

谷歌发动价格战，将 Gemini Pro 订阅费降至 1.99 美元，直接对标 OpenAI 的订阅体系。

影响：

C 端用户受益，但中小模型厂商将面临更大竞争压力。
模型订阅价格战进入白热化阶段。

AI 基础设施：算力、通信与推理加速

马斯克收购 Mesh Optical Technologies，加码 AI 数据中心光通信

FTC 批准马斯克收购初创公司 Mesh Optical Technologies。该公司由 SpaceX 前员工创立，主要设计面向 AI 数据中心的光通信收发器，可将电信号直接转换为光信号，使数据以接近瞬时的速度在服务器和 GPU 之间传输。

深度解读 & 洞察：现代高性能计算中，传统铜缆受限于传输速度、带宽和发热，成为 AI 数据中心的瓶颈。Mesh 的光信号技术正是解决这一问题的关键。这也反映出马斯克正在为 xAI 的基础设施扩张做全面准备——算力、存储、通信，一个都不能少。

北大与 DeepSeek 联合开源 DSpark：高并发推理速度提升 60%-85%

DSpark 推理加速框架采用半自回归架构结合置信度调度验证机制，在同等吞吐量下可将单用户生成速度提升 60% 至 85%，部分场景吞吐量提升超 400%。该框架已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版服务引擎，代码和模型已在 GitHub 和 Hugging Face 开源。

深度解读 & 洞察：大模型推理成本是当前商业化的核心痛点之一。DSpark 的核心创新在于「硬件感知前缀调度器」——动态决定每个请求的验证长度，而非固定长度验证导致资源浪费。这对需要高并发处理的企业场景意义重大。

美满升级 Structera CXL 控制器：内联压缩最高 3.64x

美满电子发布 Structera X 和 Structera A 两款 CXL 控制器，主打内联压缩缓解 AI 场景内存压力。使用定制版 LZ4 无损压缩算法，在数据库场景下压缩比达 3.64 倍。这意味着在同等硬件条件下，企业可以访问更多「可用内存」，降低 AI 推理的内存成本。

深度解读 & 洞察：内存墙（Memory Wall）是 AI 芯片性能提升的主要障碍之一。随着大模型参数规模持续增长，如何更高效利用内存成为关键。CXL 协议结合内联压缩，为 AI 数据中心提供了一条不依赖更多 DRAM 的解决路径。

企业 AI 落地：从工具到组织能力

微软 2026 工作趋势报告：AI 用得好不好，三分之二取决于公司

微软基于全球 10 个市场、20000 名 AI 使用者的大规模调研，揭示核心矛盾：员工已在拥抱 AI，但组织系统严重滞后。

关键数据：

67%：影响 AI 实际价值的因素中，组织环境占 67%，个人仅占 32%。
58% 的受访用户表示 AI 让他们产出一年前无法完成的成果，中国高达 72%。
仅 26% 的员工认为领导层对 AI 的认知与自己处于同一水平。
80% 的 AI 高手表示正在产出一年前无法完成的成果，他们的共同特质是「绝不把思考外包给 AI」。

深度解读 & 洞察：报告最核心的主张是：企业必须把 AI 当成一种组织能力来设计，而非仅仅是工具。这意味着仅提供 API 费用补贴远远不够，需要建立 Pipeline 捕捉 AI 运行中产生的上下文，沉淀经验为共享流程，才能产生复利效应。

报告揭示了一个「转型悖论」：员工已用 AI 重构工作方式，但绩效考核仍在用旧标准衡量。45% 的人坦言，比起重新设计工作方式，更愿意把精力花在完成当前 KPI 上。

苹果高管保罗·米德离职加盟 OpenAI，Vision Pro 项目承压

负责 Vision Pro 及智能眼镜项目的苹果高管保罗·米德即将离职，加入 OpenAI 硬件部门。他从 2010 年加入苹果，最近主要负责 AI 智能眼镜项目，并领导 AR 眼镜开发团队。

深度解读 & 洞察：这并非独立事件。OpenAI 已将乔纳森·伊夫（Jony Ive）、唐·坦（Tang Tan）、埃文斯·汉基等前苹果员工收入麾下。这反映出 OpenAI 正在加速布局 AI 硬件——从软件模型向软硬一体延伸。苹果近期高层调整（约翰·特努斯准备接任 CEO）引发部分高管不满，或许是此轮离职潮的催化剂。