国产大模型强势崛起:阿里、小米技术突破引领全球竞争

要点速览
  • 阿里发布Qwen3.5-Omni全模态模型,215项SOTA成绩硬刚Gemini,价格仅十分之一
  • 小米MiMo-V2-Pro冲入全球前五,OpenRouter调用量三榜第一,雷军宣布三年投入600亿
  • 智谱2025年收入7.24亿元,毛利率41%,成为国内首家规模化盈利的大模型公司
  • OpenAI完成千亿美元融资,但同时因成本过高计划关闭Sora项目
  • 微软推出Critique功能,首次让GPT与Claude在同一工作流中协同工作
  • 京东发布业内首个AI智能体支付基础设施ClawTip,支持Agent自主决策支付
  • 特朗普政府发布国家AI立法框架,加州却推行严格监管与联邦分道扬镳
  • 美国76%民众不信任AI,55%认为AI弊大于利
  • DeepSeek连续三天服务异常,创成立以来最长故障纪录
  • 苹果国行AI意外上线又下线,新Siri自曝使用百度文心大模型

国产大模型强势崛起:阿里、小米技术突破引领全球竞争

国产大模型强势崛起:阿里、小米技术突破引领全球竞争

阿里发布 Qwen3.5-Omni 全模态模型,215 项 SOTA 成绩硬刚 Gemini

阿里通义千问团队正式发布 Qwen3.5-Omni,这是一款原生全模态大模型,支持文本、图像、音频、视频的统一理解与实时交互。

核心能力突破:

  • 全模态原生理解:采用 Thinker-Talker 双核架构,Thinker 负责多模态理解,Talker 负责语音生成,两者均升级为 Hybrid-Attention MoE 架构
  • 超长上下文:支持 256K 上下文窗口,可处理 10 小时音频或 1 小时视频
  • 实时视频编程:用户打开摄像头绘制草图,模型能实时理解意图并生成对应代码,实现"对着草图口述需求直接生成产品原型"
  • 215 项 SOTA 成绩:通用音频理解、推理、识别、翻译、对话等指标全面超越 Gemini-3.1 Pro

深度解读 & 洞察:

Qwen3.5-Omni 的发布标志着国产大模型从"跟随者"转向"领跑者"的关键转折。过去国产模型多在单点能力上追赶,而这次是在全模态融合这一前沿方向实现领先。

其技术路线的核心创新在于"原生多模态"——不是简单拼接多个专用模型,而是用统一架构处理所有输入类型。这种设计让模型能真正理解视频中的时间关联性、音频中的情绪变化,实现更接近人类的感知方式。

定价策略也极具攻击性:每百万 Tokens 输入成本低于 0.8 元,仅为 Gemini-3.1 Pro 的十分之一。这意味着企业用十分之一的成本就能获得更强的能力,将加速 AI 在内容创作、客服、教育等场景的渗透。


小米 MiMo-V2-Pro 冲入全球前五,OpenRouter 调用量三榜第一

小米大模型 MiMo-V2-Pro 在权威评测榜单 Text Arena 中排名全球第五,仅次于 Anthropic、OpenAI、Google 三大巨头。更值得关注的是其在 OpenRouter 平台的商业化表现:

  • 最近一周 Token 消耗量突破 4 万亿,蝉联日榜、周榜、月榜三榜第一
  • 上线不到半个月,累计 Token 消耗量已超 6 万亿
  • 在 Text Arena "双盲测试"机制下(隐藏模型身份、真实用户投票),杜绝了传统"刷榜"行为

深度解读 & 洞察:

小米的成绩单揭示了两个重要趋势:

第一,国产大模型已具备全球竞争力。 Text Arena 的双盲测试机制让"针对数据集优化"的刷榜手段失效,MiMo-V2-Pro 能在这种环境下进入全球前五,说明其真实能力得到国际开发者认可。

第二,Token 消耗量成为衡量模型价值的核心指标。 雷军宣布未来三年投入 600 亿元用于 AI 开发,目标是让大模型能力深度融入"人车家"全生态。小米的战略清晰:用强大的 AI 底座赋能硬件产品,形成差异化竞争力。


智谱 2025 年财报:收入 7.24 亿元,毛利率 41% 打破行业困局

智谱 AI 发布上市后首份年度财报,成为国内首家实现规模化盈利的大模型公司:

  • 全年收入 7.24 亿元,同比增长 132%
  • 综合毛利率 41%,而 2024 年国内大模型行业平均毛利率为 -80%
  • MaaS API 平台 ARR(年度经常性收入)约 17 亿元,过去 12 个月提升 60 倍
  • 2026 年 3 月 API 价格上调 83%,但调用量不降反升

深度解读 & 洞察:

智谱的财报证明了一件事:大模型可以是一门赚钱的生意。

行业普遍的"增收不增利"困局源于价格战——企业为了抢占市场疯狂降价,结果越卖越亏。智谱反其道而行之,在 GLM-5-Turbo 发布时涨价 83%,结果头部客户(字节、阿里、腾讯、美团等)反而加速接入。

这背后的逻辑是:在生产级应用场景,模型效果和稳定性比价格更重要。 一次模型错误可能造成数万甚至数十万的损失,企业愿意为可靠性支付溢价。

智谱提出的 “Token 架构力(TAC)” 公式值得关注:TAC = 调用智能的量 × 智能的质量 × 转化为经济价值的效率。这标志着行业评估标准从"参数规模"转向"实际创造价值的能力"。


AI Agent 生态爆发:从工具到"数字员工"

微软推出 Critique 功能:GPT 与 Claude 首次协同工作

微软为 Microsoft 365 Copilot 推出 Critique 功能,开创性地让 GPT 和 Claude 在同一工作流中协作:

  • Critique 模式:GPT 负责生成研究初稿,Claude 按学术标准审查准确性、完整性和逻辑一致性
  • Council 模式:多个模型并行完成同一任务,由"裁判模型"对比评估,找出共识与分歧
  • 测试数据显示,多模型协作在减少事实错误、提升内容质量方面明显优于单一模型

深度解读 & 洞察:

这标志着 AI 从"单兵作战"走向"团队协作"的新阶段。

不同模型有不同"性格":GPT 擅长创意生成和流畅表达,Claude 在长文本理解和安全对齐方面更稳健。让它们分工协作,本质是用工程上的"单一职责"原则解决"万能模型"的困境。

更深层的信号是:AI 竞争正在从模型之争转向生态之争。 微软"左手 GPT、右手 Claude"的策略,加上对 Anthropic 的 50 亿美元投资,正在构建一个多模型协同的底座。未来谁能更好地整合不同模型的能力,谁就能占据企业级市场的主导权。


京东发布 ClawTip:业内首个 AI 智能体支付基础设施

京东科技发布专为 AI Agent 生态设计的 A2A(Agent-to-Agent)微支付基础设施 ClawTip,实现智能体间无感自动结算:

  • 智能体专属钱包:AI 使用预设小额零钱,不触碰用户核心账户
  • AI 自主决策支付:允许 AI 自主判断服务调用是否合理划算,从"被动执行"转向"主动消费决策"
  • 零成本接入:对服务提供者和调用方均不收费,三步即可完成集成

深度解读 & 洞察:

这是 AI 经济生态的关键基础设施。

当前 AI Agent 面临一个结构性困境:Skill 内容可以零成本分发,但开发者难以变现;传统支付工具以"管理人"为核心设计,限制了 AI 的自主性。ClawTip 试图解决这个"最后一公里"问题。

其风控设计颇具巧思:额度+频次双重预授权、超范围触发人工鉴权、交易链路存证追溯。这为"AI 自主交易"划定了安全边界——既释放 AI 的自动化能力,又保留人类的最终控制权。

如果 A2A 支付基础设施成熟,可能催生全新的商业模式:AI 智能体可以自主购买算力、调用服务、完成任务,形成真正的"智能体经济"。


联想发布 YOGA AI Mini / Think AI Tiny,对标 Mac mini “养虾”

联想发布两款面向 AI Agent 原生运行的智能终端,核心亮点包括:

  • DingClaw 一键部署:针对 OpenClaw 在传统 Windows 上部署困难的问题,实现"开箱即用"
  • DingOS 原生 AI 系统:以自然语言为核心的"Native UI",支持语音指令完成复杂操作
  • 系统级安全防护:Skill Guard 安全守门机制,将防御从应用层下沉到系统层
  • 7×24 小时不间断运行:硬件隔离解决 AI 与人共用设备的冲突

深度解读 & 洞察:

这是硬件厂商对 AI Agent 浪潮的积极回应。

“养虾”(运行 OpenClaw 等 AI Agent)已成为极客圈的新潮流,但普通用户面临部署门槛高、稳定性差、安全隐患多等问题。联想的解决方案是"软硬一体":用专用硬件+定制系统降低使用门槛,用安全机制化解信任顾虑。

更深层的趋势是:AI Agent 正在从云端走向本地。 端云混合部署既能保护隐私,又能确保任务连续性(设备关机后云端任务继续运行)。联想、华为、小米等厂商的入局,将加速 AI Agent 从极客玩具走向大众市场。


全球 AI 融资与基建竞赛白热化

OpenAI 完成千亿美元融资,估值再创新高

OpenAI 完成千亿美元级别巨额融资,成为 AI 领域最大规模融资之一。这笔资金将用于:

  • 扩大算力基础设施
  • 推进下一代模型研发
  • 加速企业级服务落地

深度解读 & 洞察:

千亿美元融资刷新了 AI 行业的资本纪录,但也折射出 OpenAI 的焦虑。

一方面,训练和运行大模型的成本呈指数级增长,OpenAI 2024 年亏损约 50 亿美元,需要持续输血维持运转。另一方面,Anthropic、Google、开源模型等竞争对手步步紧逼,OpenAI 必须用资本构筑护城河。

但资本的狂欢背后有隐忧:OpenAI 近期关闭了 Sora 视频生成项目(日均亏损 100 万美元),取消了新视频模型训练计划。这说明即使是 OpenAI,也无法为所有"酷炫技术"买单,必须聚焦商业化路径更清晰的领域。


韩国 Rebellions 完成 4 亿美元 IPO 前融资,估值 23.4 亿美元

韩国 AI 芯片企业 Rebellions 在 IPO 前融资轮中筹集 4 亿美元,估值达 23.4 亿美元,较 9 个月前增长 67%。公司计划专注美国市场扩张,实现 Rebel100 NPU 平台的规模化生产。

欧洲 Mistral AI 完成 8.3 亿美元债务融资建设数据中心

Mistral AI 宣布完成 8.3 亿美元债务融资,将在巴黎附近建设配备 1.38 万块英伟达 GB300 GPU 的数据中心,2026 年第二季度投运。CEO 表示,加强本土基础设施是确保欧洲在 AI 领域拥有自主权的关键。

深度解读 & 洞察:

两则融资消息揭示了全球 AI 竞赛的新维度:算力自主化。

英伟达 GPU 长期占据主导地位,但地缘政治风险和供应瓶颈促使各国寻求替代方案。Rebellions 代表韩国在 AI 芯片领域的突围,Mistral 的数据中心则体现欧洲摆脱对美国云服务依赖的决心。

2026 年被视为关键之年:谁能建立自主可控的算力基础设施,谁就能在 AI 竞赛中掌握主动权。这不仅是一场技术竞赛,更是一场国家战略博弈。


政策与监管:全球治理路径分化

特朗普政府发布国家 AI 立法框架

特朗普政府发布《国家人工智能立法框架》,确立六大核心目标:

  • 儿童保护:赋予家长管理子女数字环境的工具
  • 知识产权平衡:在保护创作者权益的同时确保 AI 公平使用学习内容
  • 言论自由:明确反对网络审查
  • 促进创新:消除过时或不必要的创新障碍
  • 劳动力准备:通过技能培训帮助工人参与 AI 驱动的经济增长

框架特别强调全国统一实施的重要性,认为各州相互冲突的 AI 法律将削弱美国整体创新能力。

加州推行严格 AI 监管,与联邦分道扬镳

加州政府宣布推进一系列严苛的 AI 监管法案,无视特朗普政府放宽技术约束的号召。新规涵盖模型训练透明度、灾难性风险预防等,要求顶级 AI 企业提交详细合规报告。

深度解读 & 洞察:

美国 AI 治理正在陷入"联邦 vs 州"的制度性撕裂。

特朗普政府的框架强调"促进创新"和"言论自由",本质是为 AI 发展松绑;加州则坚持"安全优先",试图填补联邦监管的空白。这种分歧让科技公司面临两难:遵守加州的严格标准意味着更高合规成本,但加州是全球 AI 创新中心,无法轻易放弃。

更深层的矛盾是:AI 发展速度远超监管能力,但"等看清了再管"可能为时已晚。 加州的强硬态度可能促使其他州跟进,在联邦法律统一之前,美国 AI 行业将进入政策高度分散且充满不确定性的时期。


更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码