大模型价格战白热化,中国 AI 调用量超越美国

要点速览
  • DeepSeek V4-Pro API 永久降价 75%,成全球大模型性价比榜首
  • 中国大模型周调用量连续四周超越美国,全球 AI 基础设施走向多极化
  • Figure AI 人形机器人 200 小时零故障分拣 25 万包裹,具身智能进入规模化验证阶段
  • 一季度 AI 领域融资突破 1100 亿元,同比增长 185.4%,国产大模型单月获投超 300 亿
  • 99% 企业高管预计 AI 两年内引发裁员,Cloudflare CEO 公开撰文阐述"用 AI 替代方案"
  • OpenAI 在新加坡投资 2.34 亿美元设立首个海外实验室
  • xAI 的 Grok V9-Medium(1.5 万亿参数)完成训练,预计 2-3 周内发布
  • 李飞飞团队发布 ESI-Bench 评测基准,揭示具身智能模型在主动探索上的根本缺陷
  • 华为发布"韬定律"半导体框架,主张以时间换空间突破工艺极限
  • 国家标准委发布《AI 伦理安全指引 1.0》,大模型落地有了"安全闸"

大模型价格战白热化,中国 AI 调用量超越美国

价格战重塑大模型格局

DeepSeek 宣布其旗舰模型 V4-Pro API 永久降价 75%,调整为原定价的四分之一。此次降价不是临时促销,而是直接把之前的 2.5 折限时优惠变成永久定价。降价后每百万 tokens 输入(缓存命中)仅需 0.025 元,输入(缓存未命中)3 元,输出 6 元。根据第三方测试,V4-Pro 成为全球 AI 模型性价比榜首,运行同等智能指数测试的成本仅为 268 美元,是 OpenAI GPT-5.5 的十二分之一、Claude Opus 4.7 的十九分之一。

DeepSeek 同时正在进行新一轮融资,宁德时代、京东、网易等巨头正在接洽,融资规模可能高达 700 亿元,公司估值已飙升至 450 亿美元。创始人梁文锋明确表示公司优先方向是突破 AGI,而非追求短期商业利益。

这一轮价格战的深层逻辑在于:需求诱导定律正在发挥作用——模型单价在降,但用户调用的总量不减反增,因为更低的成本激发了更复杂的应用场景。大模型的竞争重心正从性能排名转向成本效率,而 DeepSeek 正在用更聪明的算法(如 MLA、DSA、CSA 等 KV 缓存压缩技术)压榨硬件的每一分潜力,重新定义内存层级,让中低端硬件也能运行世界一流模型。


中国大模型出海提速

全球 AI 大模型调用市场出现结构性变化。上周中国 AI 大模型周调用量达到 9.223 万亿 Token,环比增长 19.89%,已连续四周超越美国的 4.93 万亿 Token,领先优势还在扩大。

中国模型能跑出来有三个原因:一是价格优势,智谱 GLM 系列、DeepSeek、Qwen 等在保持性能的同时定价远低于国际竞品;二是工作流适配性改善,海外开发者愿意在复杂应用中使用中国模型;三是实用性提升,字节跳动的 Lance 3B、智谱 GLM-5.1 等新产品解决了实际业务痛点。

行业分析指出,这不是单纯的竞争胜负,而是全球 AI 基础设施走向多极化的结果。开发者越来越习惯同时使用中美两国模型,根据不同任务选择最优方案。中国模型调用量增加意味着能获取更多全球语料反馈,形成正向飞轮。


具身智能走向规模化落地

Figure AI 的人形机器人 Figure 03 完成了一项里程碑测试:三台机器人连续运行 200 小时,分拣近 25 万个包裹,全程零硬件故障。这些机器人搭载 Helix-02 人工智能系统,依靠机载摄像头与 AI 推理识别条形码,分拣速度已追平人类水平(约 3 秒一个)。没电了机器人会自主前往无线充电座,由其他机器人无缝接替,全程无需人工干预。

与此同时,李飞飞团队发布了 ESI-Bench 评测基准,将具身智能的评测从静态图文匹配转向真实物理交互。测试发现,给模型最优视角时准确率能从 14.6% 跳到 95.1%,但当模型必须自己探索环境时性能急剧下滑,暴露出当前模型在主动导航和错误恢复上的根本缺陷。

蚂蚁灵波的 LingBot-VA 世界模型被 RSS 2026 接收。该模型让机器人能够边预测环境变化、边生成动作指令,而非仅生成一段展示未来的视频。在 50 个双臂操作任务中成功率达 91% 以上,仅需 50 条真实示范数据即可完成跨场景适配。

英伟达则在新加坡设立了具身智能研发中心,聚焦 AI 与现实物理系统的融合,目标是提升模型训练效率并降低基础设施运营成本。黄仁勋判断 AI 与现实世界的交互将成为下一个前沿领域。


AI 投资热潮与产业洗牌

一季度全球 AI 领域发生近 600 起融资事件,总金额突破 1100 亿元,同比增长 185.4%。国产大模型企业尤为抢眼,月之暗面、阶跃星辰等头部公司 5 月单月合计获得超过 300 亿元融资。资金主要流向三个方向:研发投入(头部公司年度研发预算已达数十亿元,远超当期营收)、算力采购(GPU 和云服务租赁占融资总额的 30%-50%)、顶尖人才争夺。

融资热潮背后是残酷的产业分化。AI 漫剧赛道完成了它的历史使命——红果短剧取消 AI 仿真人剧的保底政策,从"保底加分成"改为"纯分成",分成比例仅约 20%。原因很直接:AI 漫剧消耗占比从今年 1 月的 5% 飙升到 5 月的 70%,但爆款率不足 1%。平台完成了用补贴换流量的使命后,开始追求盈利。这标志着行业从"靠补贴抢流量"转向"拼内容、拼精品"。


AI 时代的劳动力重构

一份覆盖 825 名企业高管的调查显示,99% 预计 AI 会在未来两年内导致一定程度的裁员。2026 年初科技行业裁员人数已突破 10 万人,AI 在多数案例中被视为关键原因。Cloudflare 首席执行官更是在《华尔街日报》公开发表《我是如何决定用 AI 替代哪些员工的》,明确划定"中层管理者、运营岗位、纯粹做度量工作的角色"为首批替代目标——此时公司财务数据正处于历史最好时期。

这种"预防性调整"而非危机驱动的裁员,传递出一个明确信号:AI 的影响不是未来的威胁,而是正在发生的现实。但矛盾之处在于,企业一边裁员,一边又在担心人才短缺。真正处于"积极工作状态"的员工比例已从 2024 年的 66% 跌至 44%,35% 的员工表示如果无法公平获得 AI 工具或培训就会考虑离职。


更多动态

  • 阿里千问发布 Qwen3.7-Max,设计为全能智能体基座,在 35 小时超 1000 次工具调用实验中展现稳定推理能力
  • OpenAI 宣布在新加坡投资 2.34 亿美元设立美国以外首个应用 AI 实验室,预计创造 200 多个技术岗位
  • xAI 的 Grok V9-Medium(1.5 万亿参数)完成训练,加入 Cursor 代码数据强化编程能力,预计 2-3 周内发布
  • 华为发布"韬定律"半导体演进框架,主张以"时间缩微"替代"几何缩微",不依赖先进工艺节点提升性能
  • 面壁智能联合清华开源 BitCPM-CANN,中国首个基于华为昇腾训练的 1.58-bit 三值大模型,可在一台旗舰手机上运行 8B 参数模型
  • 腾讯 ima 全面开放 Copilot,用户可将自己的工作流封装为 Skill 发布到知识广场共享
  • Anthropic 安全漏洞检测项目 Project Glasswing 上线一个月发现超过 1 万个高危和关键级别漏洞
  • 蚂蚁灵波、清华大学联合发布"书生·智多星"AI 知识底座,引入自主进化机制,十人团队支撑上百业务线
  • 国家发改委推动 AI 在医疗领域落地,蚂蚁阿福用户超 1 亿,55% 用户来自三线及以下城市
  • 谷歌 CEO 皮查伊坦承编程能力落后于竞品,表示"向 AGI 迈进是必然趋势"且"比预想的要近"
  • 上海出台 AI 微短剧新政,支持企业租用智能算力,对优秀剧本给予奖励
  • 国家标准委发布《AI 伦理安全指引 1.0》,为 AI 大模型落地装上"安全闸"
  • 领英开始打击 AI 生成的低质内容,机械化垃圾帖文将被限流
  • 清华、腾讯混元团队在 MoE 模型推理优化挑战赛获全球冠军,性能加速 4.1 倍
  • 腾讯《三角洲行动》全面打击 AI 视觉外挂,确认使用将封号十年并追究刑责
  • 字节跳动与港科大发布 MMProLong 模型,用更少的训练数据实现超长上下文处理
  • 微软发布 Fara1.5 浏览器智能体模型,在基准测试中超越 OpenAI Operator
  • 美团开源数字人视频生成模型 LongCat-Video-Avatar 1.5,提升唇形同步和长视频稳定性
  • Linus Torvalds 披露 Linux 内核近两个版本 commit 数量比历史均值高出约 20%,AI 编程工具已被大规模使用
  • 腾讯研究院报告显示 AI 岗位平均薪资比非 AI 岗位高出 7000-9500 元,溢价比例持续维持在 40% 以上
  • 华为与清华大学开源 InternThinker-Knowledge AI 知识底座,具备代码自动优化和 A/B 测试验证能力
  • Deno 2.8 发布,新增安全审计、版本管理和 CI 场景的 CLI 工具链

想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码