Anthropic 全面押注 AI 智能体

要点速览
  • Anthropic推出代码执行方案,降低AI智能体98.7%的token消耗
  • Anthropic发布Agent Skills,让AI能按需加载专业技能
  • Anthropic为Claude Code引入沙箱,减少84%权限提示
  • Anthropic将Claude Code SDK升级为通用Claude Agent SDK
  • Anthropic提出“上下文工程”新范式,应对LLM的注意力限制
  • DeepSeek发布mHC架构解决大模型训练不稳定问题
  • DAVE模型实现复杂文档的视觉理解突破
  • 特斯拉接入Grok视觉能力,或用于人形机器人

Anthropic 全面押注 AI 智能体

Anthropic 全面构建 AI 智能体技术栈

Code execution with MCP: Building more efficient agents

Anthropic 提出通过代码执行优化 AI 智能体与 MCP(Model Context Protocol)服务器的交互方式,核心是将工具以代码 API 的形式呈现,让智能体按需加载工具定义,并在隔离的执行环境中处理中间数据。

  • 该方案可减少高达 98.7% 的 token 消耗,显著缓解上下文窗口压力
  • 支持渐进式披露、高效控制流、隐私保护和状态持久化等能力
  • 需要权衡沙盒环境的安全性和运维复杂度

深度解读 & 洞察:
当前 AI 智能体面临的核心瓶颈之一是 token 成本和上下文长度限制。传统方式下,每个工具的完整定义、使用说明和中间结果都要塞进 LLM 的上下文,效率极低。Anthropic 的新方案本质是“把计算卸载到外部”,只把必要信息传给模型,大幅提升了系统效率。这标志着智能体架构正从“全靠大模型推理”向“模型+执行环境协同”演进。

影响:
对 AI 基础设施和开发者工具赛道构成利多。高效、低成本的智能体是商业化落地的前提,此技术有望加速 AI Agent 在企业服务、个人助理等场景的普及。

Equipping agents for the real world with Agent Skills

Anthropic 发布 Agent Skills 开放标准,这是一种模块化的技能包机制,允许 AI 智能体根据任务需求动态加载特定领域的专业知识。

  • 采用“渐进式披露”设计,避免一次性加载所有信息
  • 技能包包含文本指令和可执行代码,支持多层信息结构
  • 已集成至 Claude 多个平台,未来计划支持智能体自主创建技能

深度解读 & 洞察:
通用大模型缺乏专业深度,而为每个垂直领域训练专用模型成本过高。Agent Skills 提供了一种折中方案:用标准化的“插件”形式注入领域知识,既保持了基础模型的通用性,又赋予了其专业能力。这类似于人类通过学习特定技能(如编程、会计)来胜任不同工作。

Beyond permission prompts: making Claude Code more secure and autonomous

为提升 Claude Code 的安全性和自主性,Anthropic 引入了基于操作系统的沙箱机制。

  • 通过 文件系统隔离网络隔离,将权限提示减少了 84%
  • 推出沙盒化 Bash 工具和云端网页版 Claude Code
  • 基于 Linux bubblewrap 和 macOS seatbelt 实现,并已开源运行时

深度解读 & 洞察:
AI 编程助手需要执行代码、访问文件,这带来了巨大的安全风险。频繁的权限弹窗不仅打断用户体验,也阻碍了 AI 的自主性。Anthropic 的方案通过底层操作系统技术,在不牺牲安全的前提下,极大提升了流畅度。开源运行时也有助于建立行业信任,推动安全标准的统一。

Building agents with the Claude Agent SDK

Anthropic 将原有的 Claude Code SDK 正式升级并更名为 Claude Agent SDK,定位从编码工具转变为构建通用 AI 智能体的框架。

  • 核心理念:给 AI 一台计算机,让它像人类一样工作
  • 定义了智能体工作的三个阶段:收集上下文、采取行动、验证工作
  • 提供代理式搜索、工具调用、代码生成、MCP 集成、规则和视觉验证等能力

深度解读 & 洞察:
这次更名标志着 Anthropic 战略重心的转移——从打造一个更好的编程助手,到构建一个能在数字世界中自主行动的通用代理。SDK 提供的“感知-行动-验证”闭环,是构建可靠智能体的基础范式,适用于金融分析、客服、研究等广泛场景。

Effective context engineering for AI agents

Anthropic 提出 “上下文工程”(Context Engineering) 新概念,认为 AI 开发的重点应从优化单次提示词(Prompt Engineering),转向管理整个任务生命周期中的上下文状态。

  • 指出 LLM 存在“注意力预算”限制和“上下文衰减”问题
  • 提出针对长周期任务的三大核心技术:上下文压缩、结构化笔记、多智能体架构
  • 强调目标是找到“最小高信号 token 集合”

深度解读 & 洞察:
这是对当前 AI 开发范式的深刻反思。提示词工程是静态的、一次性的,而真实世界的任务是动态、长期的。上下文工程提供了一套系统性的方法论,指导开发者如何像管理内存一样管理上下文,确保智能体在长时间、多步骤的任务中保持高效和连贯。

前沿研究与行业动态

开源项目与其他动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码