大模型价格战白热化，中国 AI 调用量超越美国

要点速览

DeepSeek V4-Pro API 永久降价 75%，成全球大模型性价比榜首
中国大模型周调用量连续四周超越美国，全球 AI 基础设施走向多极化
Figure AI 人形机器人 200 小时零故障分拣 25 万包裹，具身智能进入规模化验证阶段
一季度 AI 领域融资突破 1100 亿元，同比增长 185.4%，国产大模型单月获投超 300 亿
99% 企业高管预计 AI 两年内引发裁员，Cloudflare CEO 公开撰文阐述"用 AI 替代方案"
OpenAI 在新加坡投资 2.34 亿美元设立首个海外实验室
xAI 的 Grok V9-Medium（1.5 万亿参数）完成训练，预计 2-3 周内发布
李飞飞团队发布 ESI-Bench 评测基准，揭示具身智能模型在主动探索上的根本缺陷
华为发布"韬定律"半导体框架，主张以时间换空间突破工艺极限
国家标准委发布《AI 伦理安全指引 1.0》，大模型落地有了"安全闸"

价格战重塑大模型格局

DeepSeek 宣布其旗舰模型 V4-Pro API 永久降价 75%，调整为原定价的四分之一。此次降价不是临时促销，而是直接把之前的 2.5 折限时优惠变成永久定价。降价后每百万 tokens 输入（缓存命中）仅需 0.025 元，输入（缓存未命中）3 元，输出 6 元。根据第三方测试，V4-Pro 成为全球 AI 模型性价比榜首，运行同等智能指数测试的成本仅为 268 美元，是 OpenAI GPT-5.5 的十二分之一、Claude Opus 4.7 的十九分之一。

DeepSeek 同时正在进行新一轮融资，宁德时代、京东、网易等巨头正在接洽，融资规模可能高达 700 亿元，公司估值已飙升至 450 亿美元。创始人梁文锋明确表示公司优先方向是突破 AGI，而非追求短期商业利益。

这一轮价格战的深层逻辑在于：需求诱导定律正在发挥作用——模型单价在降，但用户调用的总量不减反增，因为更低的成本激发了更复杂的应用场景。大模型的竞争重心正从性能排名转向成本效率，而 DeepSeek 正在用更聪明的算法（如 MLA、DSA、CSA 等 KV 缓存压缩技术）压榨硬件的每一分潜力，重新定义内存层级，让中低端硬件也能运行世界一流模型。

中国大模型出海提速

全球 AI 大模型调用市场出现结构性变化。上周中国 AI 大模型周调用量达到 9.223 万亿 Token，环比增长 19.89%，已连续四周超越美国的 4.93 万亿 Token，领先优势还在扩大。

中国模型能跑出来有三个原因：一是价格优势，智谱 GLM 系列、DeepSeek、Qwen 等在保持性能的同时定价远低于国际竞品；二是工作流适配性改善，海外开发者愿意在复杂应用中使用中国模型；三是实用性提升，字节跳动的 Lance 3B、智谱 GLM-5.1 等新产品解决了实际业务痛点。

行业分析指出，这不是单纯的竞争胜负，而是全球 AI 基础设施走向多极化的结果。开发者越来越习惯同时使用中美两国模型，根据不同任务选择最优方案。中国模型调用量增加意味着能获取更多全球语料反馈，形成正向飞轮。

具身智能走向规模化落地

Figure AI 的人形机器人 Figure 03 完成了一项里程碑测试：三台机器人连续运行 200 小时，分拣近 25 万个包裹，全程零硬件故障。这些机器人搭载 Helix-02 人工智能系统，依靠机载摄像头与 AI 推理识别条形码，分拣速度已追平人类水平（约 3 秒一个）。没电了机器人会自主前往无线充电座，由其他机器人无缝接替，全程无需人工干预。

与此同时，李飞飞团队发布了 ESI-Bench 评测基准，将具身智能的评测从静态图文匹配转向真实物理交互。测试发现，给模型最优视角时准确率能从 14.6% 跳到 95.1%，但当模型必须自己探索环境时性能急剧下滑，暴露出当前模型在主动导航和错误恢复上的根本缺陷。

蚂蚁灵波的 LingBot-VA 世界模型被 RSS 2026 接收。该模型让机器人能够边预测环境变化、边生成动作指令，而非仅生成一段展示未来的视频。在 50 个双臂操作任务中成功率达 91% 以上，仅需 50 条真实示范数据即可完成跨场景适配。

英伟达则在新加坡设立了具身智能研发中心，聚焦 AI 与现实物理系统的融合，目标是提升模型训练效率并降低基础设施运营成本。黄仁勋判断 AI 与现实世界的交互将成为下一个前沿领域。

AI 投资热潮与产业洗牌

一季度全球 AI 领域发生近 600 起融资事件，总金额突破 1100 亿元，同比增长 185.4%。国产大模型企业尤为抢眼，月之暗面、阶跃星辰等头部公司 5 月单月合计获得超过 300 亿元融资。资金主要流向三个方向：研发投入（头部公司年度研发预算已达数十亿元，远超当期营收）、算力采购（GPU 和云服务租赁占融资总额的 30%-50%）、顶尖人才争夺。

融资热潮背后是残酷的产业分化。AI 漫剧赛道完成了它的历史使命——红果短剧取消 AI 仿真人剧的保底政策，从"保底加分成"改为"纯分成"，分成比例仅约 20%。原因很直接：AI 漫剧消耗占比从今年 1 月的 5% 飙升到 5 月的 70%，但爆款率不足 1%。平台完成了用补贴换流量的使命后，开始追求盈利。这标志着行业从"靠补贴抢流量"转向"拼内容、拼精品"。

AI 时代的劳动力重构

一份覆盖 825 名企业高管的调查显示，99% 预计 AI 会在未来两年内导致一定程度的裁员。2026 年初科技行业裁员人数已突破 10 万人，AI 在多数案例中被视为关键原因。Cloudflare 首席执行官更是在《华尔街日报》公开发表《我是如何决定用 AI 替代哪些员工的》，明确划定"中层管理者、运营岗位、纯粹做度量工作的角色"为首批替代目标——此时公司财务数据正处于历史最好时期。

这种"预防性调整"而非危机驱动的裁员，传递出一个明确信号：AI 的影响不是未来的威胁，而是正在发生的现实。但矛盾之处在于，企业一边裁员，一边又在担心人才短缺。真正处于"积极工作状态"的员工比例已从 2024 年的 66% 跌至 44%，35% 的员工表示如果无法公平获得 AI 工具或培训就会考虑离职。

更多动态

阿里千问发布 Qwen3.7-Max，设计为全能智能体基座，在 35 小时超 1000 次工具调用实验中展现稳定推理能力
OpenAI 宣布在新加坡投资 2.34 亿美元设立美国以外首个应用 AI 实验室，预计创造 200 多个技术岗位
xAI 的 Grok V9-Medium（1.5 万亿参数）完成训练，加入 Cursor 代码数据强化编程能力，预计 2-3 周内发布
华为发布"韬定律"半导体演进框架，主张以"时间缩微"替代"几何缩微"，不依赖先进工艺节点提升性能
面壁智能联合清华开源 BitCPM-CANN，中国首个基于华为昇腾训练的 1.58-bit 三值大模型，可在一台旗舰手机上运行 8B 参数模型
腾讯 ima 全面开放 Copilot，用户可将自己的工作流封装为 Skill 发布到知识广场共享
Anthropic 安全漏洞检测项目 Project Glasswing 上线一个月发现超过 1 万个高危和关键级别漏洞
蚂蚁灵波、清华大学联合发布"书生·智多星"AI 知识底座，引入自主进化机制，十人团队支撑上百业务线
国家发改委推动 AI 在医疗领域落地，蚂蚁阿福用户超 1 亿，55% 用户来自三线及以下城市
谷歌 CEO 皮查伊坦承编程能力落后于竞品，表示"向 AGI 迈进是必然趋势"且"比预想的要近"
上海出台 AI 微短剧新政，支持企业租用智能算力，对优秀剧本给予奖励
国家标准委发布《AI 伦理安全指引 1.0》，为 AI 大模型落地装上"安全闸"
领英开始打击 AI 生成的低质内容，机械化垃圾帖文将被限流
清华、腾讯混元团队在 MoE 模型推理优化挑战赛获全球冠军，性能加速 4.1 倍
腾讯《三角洲行动》全面打击 AI 视觉外挂，确认使用将封号十年并追究刑责
字节跳动与港科大发布 MMProLong 模型，用更少的训练数据实现超长上下文处理
微软发布 Fara1.5 浏览器智能体模型，在基准测试中超越 OpenAI Operator
美团开源数字人视频生成模型 LongCat-Video-Avatar 1.5，提升唇形同步和长视频稳定性
Linus Torvalds 披露 Linux 内核近两个版本 commit 数量比历史均值高出约 20%，AI 编程工具已被大规模使用
腾讯研究院报告显示 AI 岗位平均薪资比非 AI 岗位高出 7000-9500 元，溢价比例持续维持在 40% 以上
华为与清华大学开源 InternThinker-Knowledge AI 知识底座，具备代码自动优化和 A/B 测试验证能力
Deno 2.8 发布，新增安全审计、版本管理和 CI 场景的 CLI 工具链

想第一时间获取最新内容？

欢迎加入我们的 Telegram 群组 @ai_news_plus，抢先获取每日更新。

立即加入群组