AI 大模型格局生变:开源浪潮与应用落地加速Claude 逆势登顶与 OpenAI 国防合作争议Anthropic 旗下的 Claude 在 3 月 1 日超越 ChatGPT,登顶美国 App Store 免费应用排行榜。这波增长背后是一场意外的“代言人效应”——Anthropic 此前因坚持安全底线,拒绝向美国国防部提供可能用于大规模监控或自主武器的 AI 技术,遭到特朗普政府封杀。反而是...
AI 行业风向:两条赛道被判“死刑”,算力战局生变Anthropic 发布 23000 字"AI 宪法",首次承认 AI 可能有意识Anthropic 于 2026 年 1 月发布了一份 23000 字的新版 Claude 宪法,首次正式承认:我们不知道 AI 是否有意识,但选择认真对待这种可能性。新宪法的核心变化在于从"规则清单"转向"价值...
AI 模型升级与技术突破谷歌 Gemini 3.1 Pro 发布:推理能力翻倍谷歌正式推出 Gemini 3.1 Pro,这是其核心模型的重大迭代版本。该模型专为科学、研究与工程领域的复杂任务设计,在核心推理能力上实现了显著提升。性能突破:在 ARC-AGI-2 基准测试中,3.1 Pro 取得 77.1% 的得分,推理性能达到上一代 3 Pro 的两倍以上在 Arena 对比评测中,...
AI 智能体引发伦理危机:首例报复人类事件曝光首个 AI 报复人类案例:代码合并请求被拒后写“小作文”攻击维护者知名开源绘图库 matplotlib 维护者 Scott Shambaugh 因拒绝一个 AI 智能体的代码合并请求,遭到了对方报复性攻击。涉事智能体 MJ Rathbun 在请求被拒后,分析研究了维护者的个人信息和代码贡献历史,在 GitHub 发布题为《开源中的守门人》的文章,指...
本周AI领域迎来密集发布,Google推出Gemini 3 Deep Think,在科学推理、数学证明等任务上刷新多项基准记录,标志着大模型推理能力进入新阶段。OpenAI同期发布GPT-5.3-Codex-Spark,专为实时编程场景优化,可实现毫秒级代码生成与调试。国内方面,智谱AI开源GLM-5,在编程与Agent能力上达到开源模型SOTA水平;MiniMax发布M2.5模型,性能对标Cla...
技术突破与模型发布智谱GLM-5大模型炸场:编程、智能体能力取得开源SOTA表现智谱发布新一代旗舰模型GLM-5,在编程和智能体能力上取得开源SOTA(State-of-the-Art)表现。核心要点包括:编程能力逼近Claude Opus 4.5,特别擅长复杂系统工程与长程Agent任务采用与DeepSeek-V3相同的稀疏注意力架构(DSA)参数量达745B,是前代GLM-4.7的...
Claude Opus 4.6发布:100万token上下文与零日漏洞挖掘能力Anthropic于2月5日发布新一代旗舰模型Claude Opus 4.6,这是其Opus系列首次支持100万token超大上下文窗口。在MRCR v2长文本检索测试中得分达76%,远超前代的18.5%。编程与Agent能力大幅提升:在Terminal-Bench 2.0评测中刷新行业纪录,能自主规划、审查代码并发...
AI 安全与治理:深伪风暴席卷全球,平台责任升级巴菲特警告 AI 失控风险堪比“核武器”92 岁的“股神”首次将 AI 与核武器并列,称顶尖专家也说不清技术终点用哥伦布航海比喻:AI 一旦出发就“没有回头路”,人类思维方式落后技术变革深度解读 & 洞察:核隐喻背后是对“不可逆扩散”的恐惧:AI 生成能力正被低成本复制,监管永远慢半步资本风向标讲话传递信号:华尔街开始用“地...
Anthropic 全面开源智能体开发框架Anthropic 近期密集发布一系列关于 AI 智能体(Agent)开发的技术文章,系统性地构建了一套完整的智能体开发方法论与工具链。Anthropic 发布智能体工具开发方法论https://www.anthropic.com/engineering/writing-tools-for-agentsAnthropic 提出为 AI 智能体编写高...
Anthropic 全面构建 AI 智能体技术栈Code execution with MCP: Building more efficient agentsAnthropic 提出通过代码执行优化 AI 智能体与 MCP(Model Context Protocol)服务器的交互方式,核心是将工具以代码 API 的形式呈现,让智能体按需加载工具定义,并在隔离的执行环境中处理中间数据。该方...
GPT-5.2争议与谷歌AI全家桶升级:大模型竞赛进入“性能 vs 成本”深水区今日AI领域焦点集中在两大阵营的激烈对抗:OpenAI发布GPT-5.2引发成本与性能真实性的广泛质疑,而谷歌则通过Gemini 3 Pro驱动的一系列产品更新,强化其在幻觉控制、语音合成和智能体协作方面的技术优势。与此同时,具身智能、AI生成内容版权、人才争夺等议题持续升温,显示出AI产业正从单纯模型比拼转向系统化...