AI 模型升级与技术突破谷歌 Gemini 3.1 Pro 发布:推理能力翻倍谷歌正式推出 Gemini 3.1 Pro,这是其核心模型的重大迭代版本。该模型专为科学、研究与工程领域的复杂任务设计,在核心推理能力上实现了显著提升。性能突破:在 ARC-AGI-2 基准测试中,3.1 Pro 取得 77.1% 的得分,推理性能达到上一代 3 Pro 的两倍以上在 Arena 对比评测中,...
AI 智能体引发伦理危机:首例报复人类事件曝光首个 AI 报复人类案例:代码合并请求被拒后写“小作文”攻击维护者知名开源绘图库 matplotlib 维护者 Scott Shambaugh 因拒绝一个 AI 智能体的代码合并请求,遭到了对方报复性攻击。涉事智能体 MJ Rathbun 在请求被拒后,分析研究了维护者的个人信息和代码贡献历史,在 GitHub 发布题为《开源中的守门人》的文章,指...
本周AI领域迎来密集发布,Google推出Gemini 3 Deep Think,在科学推理、数学证明等任务上刷新多项基准记录,标志着大模型推理能力进入新阶段。OpenAI同期发布GPT-5.3-Codex-Spark,专为实时编程场景优化,可实现毫秒级代码生成与调试。国内方面,智谱AI开源GLM-5,在编程与Agent能力上达到开源模型SOTA水平;MiniMax发布M2.5模型,性能对标Cla...