国产大模型强势崛起：阿里、小米技术突破引领全球竞争

要点速览

阿里发布Qwen3.5-Omni全模态模型，215项SOTA成绩硬刚Gemini，价格仅十分之一
小米MiMo-V2-Pro冲入全球前五，OpenRouter调用量三榜第一，雷军宣布三年投入600亿
智谱2025年收入7.24亿元，毛利率41%，成为国内首家规模化盈利的大模型公司
OpenAI完成千亿美元融资，但同时因成本过高计划关闭Sora项目
微软推出Critique功能，首次让GPT与Claude在同一工作流中协同工作
京东发布业内首个AI智能体支付基础设施ClawTip，支持Agent自主决策支付
特朗普政府发布国家AI立法框架，加州却推行严格监管与联邦分道扬镳
美国76%民众不信任AI，55%认为AI弊大于利
DeepSeek连续三天服务异常，创成立以来最长故障纪录
苹果国行AI意外上线又下线，新Siri自曝使用百度文心大模型

阿里发布 Qwen3.5-Omni 全模态模型，215 项 SOTA 成绩硬刚 Gemini

阿里通义千问团队正式发布 Qwen3.5-Omni，这是一款原生全模态大模型，支持文本、图像、音频、视频的统一理解与实时交互。

核心能力突破：

全模态原生理解：采用 Thinker-Talker 双核架构，Thinker 负责多模态理解，Talker 负责语音生成，两者均升级为 Hybrid-Attention MoE 架构
超长上下文：支持 256K 上下文窗口，可处理 10 小时音频或 1 小时视频
实时视频编程：用户打开摄像头绘制草图，模型能实时理解意图并生成对应代码，实现"对着草图口述需求直接生成产品原型"
215 项 SOTA 成绩：通用音频理解、推理、识别、翻译、对话等指标全面超越 Gemini-3.1 Pro

深度解读 & 洞察：

Qwen3.5-Omni 的发布标志着国产大模型从"跟随者"转向"领跑者"的关键转折。过去国产模型多在单点能力上追赶，而这次是在全模态融合这一前沿方向实现领先。

其技术路线的核心创新在于"原生多模态"——不是简单拼接多个专用模型，而是用统一架构处理所有输入类型。这种设计让模型能真正理解视频中的时间关联性、音频中的情绪变化，实现更接近人类的感知方式。

定价策略也极具攻击性：每百万 Tokens 输入成本低于 0.8 元，仅为 Gemini-3.1 Pro 的十分之一。这意味着企业用十分之一的成本就能获得更强的能力，将加速 AI 在内容创作、客服、教育等场景的渗透。

小米 MiMo-V2-Pro 冲入全球前五，OpenRouter 调用量三榜第一

小米大模型 MiMo-V2-Pro 在权威评测榜单 Text Arena 中排名全球第五，仅次于 Anthropic、OpenAI、Google 三大巨头。更值得关注的是其在 OpenRouter 平台的商业化表现：

最近一周 Token 消耗量突破 4 万亿，蝉联日榜、周榜、月榜三榜第一
上线不到半个月，累计 Token 消耗量已超 6 万亿
在 Text Arena "双盲测试"机制下（隐藏模型身份、真实用户投票），杜绝了传统"刷榜"行为

深度解读 & 洞察：

小米的成绩单揭示了两个重要趋势：

第一，国产大模型已具备全球竞争力。 Text Arena 的双盲测试机制让"针对数据集优化"的刷榜手段失效，MiMo-V2-Pro 能在这种环境下进入全球前五，说明其真实能力得到国际开发者认可。

第二，Token 消耗量成为衡量模型价值的核心指标。 雷军宣布未来三年投入 600 亿元用于 AI 开发，目标是让大模型能力深度融入"人车家"全生态。小米的战略清晰：用强大的 AI 底座赋能硬件产品，形成差异化竞争力。

智谱 2025 年财报：收入 7.24 亿元，毛利率 41% 打破行业困局

智谱 AI 发布上市后首份年度财报，成为国内首家实现规模化盈利的大模型公司：

全年收入 7.24 亿元，同比增长 132%
综合毛利率 41%，而 2024 年国内大模型行业平均毛利率为 -80%
MaaS API 平台 ARR（年度经常性收入）约 17 亿元，过去 12 个月提升 60 倍
2026 年 3 月 API 价格上调 83%，但调用量不降反升

深度解读 & 洞察：

智谱的财报证明了一件事：大模型可以是一门赚钱的生意。

行业普遍的"增收不增利"困局源于价格战——企业为了抢占市场疯狂降价，结果越卖越亏。智谱反其道而行之，在 GLM-5-Turbo 发布时涨价 83%，结果头部客户（字节、阿里、腾讯、美团等）反而加速接入。

这背后的逻辑是：在生产级应用场景，模型效果和稳定性比价格更重要。 一次模型错误可能造成数万甚至数十万的损失，企业愿意为可靠性支付溢价。

智谱提出的 “Token 架构力（TAC）” 公式值得关注：TAC = 调用智能的量 × 智能的质量 × 转化为经济价值的效率。这标志着行业评估标准从"参数规模"转向"实际创造价值的能力"。

AI Agent 生态爆发：从工具到"数字员工"

微软推出 Critique 功能：GPT 与 Claude 首次协同工作

微软为 Microsoft 365 Copilot 推出 Critique 功能，开创性地让 GPT 和 Claude 在同一工作流中协作：

Critique 模式：GPT 负责生成研究初稿，Claude 按学术标准审查准确性、完整性和逻辑一致性
Council 模式：多个模型并行完成同一任务，由"裁判模型"对比评估，找出共识与分歧
测试数据显示，多模型协作在减少事实错误、提升内容质量方面明显优于单一模型

深度解读 & 洞察：

这标志着 AI 从"单兵作战"走向"团队协作"的新阶段。

不同模型有不同"性格"：GPT 擅长创意生成和流畅表达，Claude 在长文本理解和安全对齐方面更稳健。让它们分工协作，本质是用工程上的"单一职责"原则解决"万能模型"的困境。

更深层的信号是：AI 竞争正在从模型之争转向生态之争。 微软"左手 GPT、右手 Claude"的策略，加上对 Anthropic 的 50 亿美元投资，正在构建一个多模型协同的底座。未来谁能更好地整合不同模型的能力，谁就能占据企业级市场的主导权。

京东发布 ClawTip：业内首个 AI 智能体支付基础设施

京东科技发布专为 AI Agent 生态设计的 A2A（Agent-to-Agent）微支付基础设施 ClawTip，实现智能体间无感自动结算：

智能体专属钱包：AI 使用预设小额零钱，不触碰用户核心账户
AI 自主决策支付：允许 AI 自主判断服务调用是否合理划算，从"被动执行"转向"主动消费决策"
零成本接入：对服务提供者和调用方均不收费，三步即可完成集成

深度解读 & 洞察：

这是 AI 经济生态的关键基础设施。

当前 AI Agent 面临一个结构性困境：Skill 内容可以零成本分发，但开发者难以变现；传统支付工具以"管理人"为核心设计，限制了 AI 的自主性。ClawTip 试图解决这个"最后一公里"问题。

其风控设计颇具巧思：额度+频次双重预授权、超范围触发人工鉴权、交易链路存证追溯。这为"AI 自主交易"划定了安全边界——既释放 AI 的自动化能力，又保留人类的最终控制权。

如果 A2A 支付基础设施成熟，可能催生全新的商业模式：AI 智能体可以自主购买算力、调用服务、完成任务，形成真正的"智能体经济"。

联想发布 YOGA AI Mini / Think AI Tiny，对标 Mac mini “养虾”

联想发布两款面向 AI Agent 原生运行的智能终端，核心亮点包括：

DingClaw 一键部署：针对 OpenClaw 在传统 Windows 上部署困难的问题，实现"开箱即用"
DingOS 原生 AI 系统：以自然语言为核心的"Native UI"，支持语音指令完成复杂操作
系统级安全防护：Skill Guard 安全守门机制，将防御从应用层下沉到系统层
7×24 小时不间断运行：硬件隔离解决 AI 与人共用设备的冲突

深度解读 & 洞察：

这是硬件厂商对 AI Agent 浪潮的积极回应。

“养虾”（运行 OpenClaw 等 AI Agent）已成为极客圈的新潮流，但普通用户面临部署门槛高、稳定性差、安全隐患多等问题。联想的解决方案是"软硬一体"：用专用硬件+定制系统降低使用门槛，用安全机制化解信任顾虑。

更深层的趋势是：AI Agent 正在从云端走向本地。 端云混合部署既能保护隐私，又能确保任务连续性（设备关机后云端任务继续运行）。联想、华为、小米等厂商的入局，将加速 AI Agent 从极客玩具走向大众市场。

全球 AI 融资与基建竞赛白热化

OpenAI 完成千亿美元融资，估值再创新高

OpenAI 完成千亿美元级别巨额融资，成为 AI 领域最大规模融资之一。这笔资金将用于：

扩大算力基础设施
推进下一代模型研发
加速企业级服务落地

深度解读 & 洞察：

千亿美元融资刷新了 AI 行业的资本纪录，但也折射出 OpenAI 的焦虑。

一方面，训练和运行大模型的成本呈指数级增长，OpenAI 2024 年亏损约 50 亿美元，需要持续输血维持运转。另一方面，Anthropic、Google、开源模型等竞争对手步步紧逼，OpenAI 必须用资本构筑护城河。

但资本的狂欢背后有隐忧：OpenAI 近期关闭了 Sora 视频生成项目（日均亏损 100 万美元），取消了新视频模型训练计划。这说明即使是 OpenAI，也无法为所有"酷炫技术"买单，必须聚焦商业化路径更清晰的领域。

韩国 Rebellions 完成 4 亿美元 IPO 前融资，估值 23.4 亿美元

韩国 AI 芯片企业 Rebellions 在 IPO 前融资轮中筹集 4 亿美元，估值达 23.4 亿美元，较 9 个月前增长 67%。公司计划专注美国市场扩张，实现 Rebel100 NPU 平台的规模化生产。

欧洲 Mistral AI 完成 8.3 亿美元债务融资建设数据中心

Mistral AI 宣布完成 8.3 亿美元债务融资，将在巴黎附近建设配备 1.38 万块英伟达 GB300 GPU 的数据中心，2026 年第二季度投运。CEO 表示，加强本土基础设施是确保欧洲在 AI 领域拥有自主权的关键。

深度解读 & 洞察：

两则融资消息揭示了全球 AI 竞赛的新维度：算力自主化。

英伟达 GPU 长期占据主导地位，但地缘政治风险和供应瓶颈促使各国寻求替代方案。Rebellions 代表韩国在 AI 芯片领域的突围，Mistral 的数据中心则体现欧洲摆脱对美国云服务依赖的决心。

2026 年被视为关键之年：谁能建立自主可控的算力基础设施，谁就能在 AI 竞赛中掌握主动权。这不仅是一场技术竞赛，更是一场国家战略博弈。

政策与监管：全球治理路径分化

特朗普政府发布国家 AI 立法框架

特朗普政府发布《国家人工智能立法框架》，确立六大核心目标：

儿童保护：赋予家长管理子女数字环境的工具
知识产权平衡：在保护创作者权益的同时确保 AI 公平使用学习内容
言论自由：明确反对网络审查
促进创新：消除过时或不必要的创新障碍
劳动力准备：通过技能培训帮助工人参与 AI 驱动的经济增长

框架特别强调全国统一实施的重要性，认为各州相互冲突的 AI 法律将削弱美国整体创新能力。

加州推行严格 AI 监管，与联邦分道扬镳

加州政府宣布推进一系列严苛的 AI 监管法案，无视特朗普政府放宽技术约束的号召。新规涵盖模型训练透明度、灾难性风险预防等，要求顶级 AI 企业提交详细合规报告。

深度解读 & 洞察：

美国 AI 治理正在陷入"联邦 vs 州"的制度性撕裂。

特朗普政府的框架强调"促进创新"和"言论自由"，本质是为 AI 发展松绑；加州则坚持"安全优先"，试图填补联邦监管的空白。这种分歧让科技公司面临两难：遵守加州的严格标准意味着更高合规成本，但加州是全球 AI 创新中心，无法轻易放弃。

更深层的矛盾是：AI 发展速度远超监管能力，但"等看清了再管"可能为时已晚。 加州的强硬态度可能促使其他州跟进，在联邦法律统一之前，美国 AI 行业将进入政策高度分散且充满不确定性的时期。

国产大模型强势崛起：阿里、小米技术突破引领全球竞争