OpenAI 联手国防部引发抵制;AI 大模型多轮对话仍存短板

要点速览
  • OpenAI 与美国战争部达成协议,在机密网络部署 AI 模型,设立三条红线禁止大规模监控和自主武器
  • Anthropic 遭特朗普政府封杀,被列为供应链风险,后者表示将诉诸法律
  • 用户发起“取消 ChatGPT“运动抵制 OpenAI 与军事合作
  • 研究证实 AI 大模型跨多轮对话任务性能最高下降 39%,问题仍未解决
  • 国内人形机器人 2025 年发布超 330 款产品,整机企业超 140 家
  • Anthropic 的 Claude 登上苹果应用商店排行榜首位
  • Google Labs 升级 Opal 系统,微软发布 OPCD 训练框架

OpenAI 联手国防部引发抵制;AI 大模型多轮对话仍存短板

AI 与军事合作:OpenAI 协议引发争议与用户抵制

OpenAI 与美国战争部达成协议

OpenAI 首席执行官萨姆·奥尔特曼于当地时间周五晚间宣布,公司已与美国国防部(现更名为“战争部”)达成协议,允许后者在其机密网络中使用 OpenAI 的人工智能模型。

协议核心内容:

  • 安全红线三条:禁止大规模国内监控、禁止指挥自主武器系统、禁止高风险自动化决策
  • 工程支持:OpenAI 将向五角大楼派驻工程师,协助模型部署并保障其安全
  • 技术保障:确保模型按预期运行,且政府不会强迫 OpenAI 让模型执行其拒绝执行的任务
  • OpenAI 强调其协议比以往任何机密人工智能部署协议(包括 Anthropic 的协议)具备更多安全防护措施

Anthropic 遭封杀始末

此前,美国国防部与 Anthropic 陷入对峙。五角大楼要求人工智能公司允许其模型被用于“所有合法用途”,而 Anthropic 则试图为大规模国内监控和完全自主武器设置红线。

由于双方未能达成协议,美国总统唐纳德·特朗普在社交媒体上批评 Anthropic,并下令所有联邦机构在六个月过渡期后停止使用该公司产品。国防部长皮特·赫格塞思宣布将 Anthropic 列为供应链风险,禁止承包商与其开展业务。Anthropic 表示将在法庭上对任何风险认定提出异议。

用户抵制运动蔓延

OpenAI 宣布与战争部达成协议后,用户发起了“取消 ChatGPT“的运动,通过停止付费订阅来表达抵制。据报道,这一运动正在蔓延,并可能已影响到 OpenAI 的收入。

值得注意的是,谷歌去年从内部规定中删除了对相关技术的明确禁令;亚马逊在相关文档中也仅给出模糊的“负责任使用“表述。相比之下,Anthropic 因坚持原有立场而收获了一片好评。


AI 技术研究:多轮对话仍是痛点

大模型跨多轮任务表现不佳

研究员菲利普·拉班及其团队研究发现,新一代大语言模型在任务需要跨多轮对话完成时表现依然不佳。研究人员在代码、数据库、操作指令、数据转文本、数学计算、文本摘要这六大任务上进行了测试。

核心发现:

  • 当信息被拆分到多条消息中(分片式),而非集中在单次提示词里(拼接式)时,模型性能会显著下降
  • 更新的模型表现稍好,性能降幅从 39% 缩小到 33%,但问题仍未解决
  • 其中 Python 任务的提升最为明显,部分模型仅损失 10%–20% 的性能
  • 在实际场景中由于用户可能改变想法,性能损失可能更严重

研究建议: 调低温度值等技术微调无法解决该问题;一旦出现异常,应重新开启一段新对话,并先让模型总结之前的请求,再将该总结作为新对话的起点。

智能体记忆架构新突破

DAIR.AI 研究团队发现了智能体高效记忆的新规律,为人工智能记忆机制的研究带来突破性进展。研究人员同时提出了创新的三层智能体记忆架构,为 AI 系统的记忆处理提供了全新的理论框架和技术思路。


AI 产业格局:产品创新与市场动态

科技巨头产品更新

  • Google Labs 推出 Opal 系统,为用户提供更智能的代理服务,这是其智能代理流程的重要升级
  • 微软 发布全新的 OPCD 模型训练框架,为 AI 模型开发提供了新的技术方案和训练思路
  • 英伟达 推出并计划发布多款高性能芯片,持续推动 AI 硬件技术发展

AI 应用市场表现

  • Anthropic 开发的 Claude 应用登上苹果应用商店排行榜首位,展现了 AI 应用在消费市场的强大吸引力
  • 央视网 报道国产算力需求持续暴涨,反映出国内 AI 计算能力的快速提升和市场规模的扩大
  • 全球各大科技公司纷纷投入巨资建设 AI 基础设施,包括数据中心、算力平台等

行业测试与标准化

  • 开发者推出全球最高难度的 AI 考试,旨在测试人工智能系统的极限能力和综合智能水平
  • 行业报告发布 AI 产业规模预测数据,深入分析当前行业发展现状及未来趋势
  • 行业内积极推动 AI 代理技术进入大规模实测阶段,加速技术落地和应用普及

人形机器人:产业快速发展与标准体系建设

产业现状

工信部于 2 月 28 日正式发布《人形机器人与具身智能标准体系(2026 版)》。据央视报道,2025 年国内整机企业数量已超过 140 家,发布人形机器人产品超过 330 款。虽然产业仍处于起步阶段,但发展势头强劲。

行业瓶颈:

  • AI 模型泛化能力不足
  • 核心零部件依赖进口
  • 场景碎片化及成本高企
  • 数据匮乏是当前发展的紧要任务

标准体系架构

《体系》共设 6 个部分:基础共性标准、类脑与智算标准、肢体与部组件标准、整机与系统标准、应用标准、安全伦理标准。

业界普遍认为,人形机器人有望成为继智能手机、新能源汽车之后的新一代超级终端。文体娱乐、工业服务和银发经济等领域被看好为中短期内的增长点。


更多动态

  • 马斯克回呛维基百科创始人:维基百科创始人 Jimmy Wales 认为马斯克的 Grokipedia 只是“滑稽的模仿品”,荒谬至极、注定失败。马斯克则在 X 平台以简短地做出回击:“著名的临终遗言”。而维基百科另一名创始人 Larry Sanger 则持不同观点,认为这款产品的初上手体验“相当不错“
  • AI 技术深刻改变日常生活:从智能家居到出行助手,AI 应用无处不在

想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码