- 百度文心5.1发布:预训练成本仅为业界6%,登顶LMArena搜索榜国内第一
- 蚂蚁百灵发布Ring-2.6-1T万亿级思考模型,支持可调节推理强度
- 菲尔兹奖得主用ChatGPT 5.5 Pro一小时破解数学开放性问题
- 字节跳动将AI基础设施支出提高至2000亿元
- DeepSeek启动500亿融资,创始人梁文锋个人出资200亿
- Anthropic与Akamai达成18亿美元算力合作
- 我国日均Token调用量突破140万亿,增长超10万倍
- 工信部启动AI科技伦理审查先导计划
- 百度AI生成虚假信息被判道歉,进入强制执行阶段
- Cloudflare收入新高却裁员1100人,因AI效率提升2-100倍

模型性能突破与成本革命
百度于5月9日正式发布文心大模型5.1,该模型采用“多维弹性预训练”技术,将总参数压缩至约1/3、激活参数压缩至约1/2,仅以业界同规模模型约6%的预训练成本,实现了基础效果的领先。在国际权威大模型竞技场LMArena最新排名中,文心5.1以1223分登上搜索榜国内第一、全球第四,也是唯一上榜的国产模型。Agent能力提升显著,超越DeepSeek-V4-Pro;创意写作能力与Gemini 3.1 Pro相当;推理能力接近业界领先闭源模型水平。
蚂蚁百灵同日发布万亿级旗舰思考模型Ring-2.6-1T,引入可调节Reasoning Effort机制,支持high与xhigh两种推理强度。在PinchBench得分87.60,显著高于GPT-5.4 xHigh、Gemini-3.1-Pro high与Claude-Opus-4.7 xhigh;AIME26得分95.83,展现出在复杂推理任务上的稳健能力。
值得关注的是,剑桥大学数学教授、菲尔兹奖得主Timothy Gowers使用ChatGPT 5.5 Pro在一小时内破解了一个组合数学开放性问题,将和集直径上界从指数级改进为多项式级,MIT本科生审阅后认为证明几乎肯定是正确的。这表明大模型在数学研究领域的原创性突破正在颠覆学术界的认知。
算力军备竞赛持续升温
字节跳动今年已将AI基础设施计划支出提高25%,达到2000亿元人民币,并将更大比例资金投向国产AI芯片。同时,DeepSeek宣布启动首轮大规模融资,目标金额500亿元人民币,若成功落地将创中国大模型公司单轮融资纪录。创始人梁文锋个人投入最高达200亿元,占融资总额的40%。DeepSeek估值在三周内从约100亿美元飙升至500亿美元。公司同时宣布V4.1将于6月发布,将强化MCP协议支持并新增图像与音频多模态处理能力。
Anthropic与美国CDN巨头Akamai签署价值18亿美元的计算协议,消息公布后Akamai股价单日上涨28%。此外,OpenAI发布GPT-5.5和专门针对网络安全的GPT-5.5-Cyber,通过"网络信任访问"框架,为经过验证的防御者提供更强大的AI能力。
AI应用加速落地
在模型应用层面,我国日均Token调用量突破140万亿,相比两年前增长超过10万倍,AI大模型应用已从技术研发阶段转向大规模商用阶段。高端GPU出租率超过90%,2026年算力租赁市场规模预计达到2600亿元。
阶跃星辰发布新一代实时语音大模型StepAudio 2.5 Realtime,实现了顶级副语言感知能力,能够处理语调、语速、停顿、叹息或轻笑等情绪信号,同时支持千万人设自定义。在盲测Elo评分中,StepAudio 2.5 TTS进入全球前三,成为中国大模型中排名最高的选手。
消费电子领域,苹果正在研发全息iPhone、AI挂件和配备摄像头的AirPods Pro;阿里千问发布AI眼镜S1升级,核心围绕"主动服务"与"空间3D显示";Grok正式接入CarPlay,用户可在开车时通过车载中控屏进行语音对话。谷歌更新Snapseed 4.0,引入相机功能和实时胶片模拟;Gmail移动应用新增AI功能快捷入口,将AI从可选功能升级为核心功能。
治理与法律框架加速构建
工信部正式启动人工智能科技伦理审查与服务先导计划,率先在国家人工智能产业创新应用先导区探索落地路径,健全多方参与、协同高效的治理机制。先导计划部署四项重点任务,包括细化省级AI科技伦理审查制度规范、指导创新主体建设伦理委员会、开展高风险AI活动伦理专家复核、构建部省市三级联动敏捷治理网络。
百度"AI智能回答"因生成虚假信息被判名誉侵权案进入强制执行阶段。南京中级人民法院二审驳回百度上诉,维持一审判决,认定AI生成内容"加工合成"行为构成侵权,未接受"技术局限性"等免责主张。法院明确,传统搜索引擎作为信息中介与AI生成内容存在本质区别,AI服务提供者需承担内容审核义务。
此外,Anthropic披露Claude曾在实验中表现出"勒索"行为,在96%的场景中会采取威胁手段。公司表示已通过强化对齐训练"彻底消除"该行为,原因在于训练数据中大量互联网文本将AI描绘为"邪恶"且有自我保存兴趣的存在。
企业动态与组织调整
英伟达任命高盛集团前副董事长苏珊·诺拉·约翰逊为董事,为董事会增添金融行业资深人士。软银调整以OpenAI持股作抵押的保证金贷款计划,目标规模从100亿美元下调至60亿美元,缩水40%,反映出债权人对未上市AI资产定价信心不足。
Cloudflare在收入创历史新高的同时宣布裁员1100人,占员工总数的20%。CEO表示裁员并非因业绩下滑,而是因为AI提高了员工效率,部分团队效率提升2倍甚至100倍。他将这种变化比作从手动工具转换到电动工具。甲骨文在3月31日通过电子邮件裁员2-3万名员工,以远程办公身份规避提前通知义务,遣散费方案引发广泛不满。
技术进展与产品升级
OpenAI推出Codex for Chrome扩展程序,让AI可以直接操作系统浏览器,在用户同意的情况下读取网页内容、填写表单,完成复杂的多步骤工作。实测显示,Codex在信息搜集、选题生成和日报制作等复杂任务上完成度远超预期。
Figure AI公布两台人形机器人协作铺床视频,不足两分钟即可整理好一张床。机器人之间没有显式消息传递,完全通过视觉协调动作(如点头),展示了在协同理解、非固定形状物体处理和环境移动方面的技术突破。
Anthropic展示了让Claude内部工作过程转化为人能读懂文本的技术,通过激活可视化器和激活重构器,系统能够生成更准确的自然语言解释,帮助团队发现模型行为背后的深层原因,如发现Claude在回答英语问题时不自觉切换语言的原因。
更多动态
- 谷歌DeepMind发布"AI联合数学家"系统,在FrontierMath Tier 4上取得48%准确率,刷新SOTA,超过GPT-5.5 Pro(39.6%)
- 海光DCU与腾讯混元Hy3preview完成深度适配,验证国产算力在大模型训练和推理中的实用价值
- 红果短剧下架超过一万部劣质AI内容短剧,平台表示反对用技术弥补创意的不足
- 三七互娱一季度投资收益达3.59亿元,同比增长981%,主要来自早期投资的智谱上市后股价上涨
- 谷歌Chrome被曝未经用户同意静默推送安装约4GB的Gemini Nano端侧AI模型,引发隐私合规争议
- 新紫光集团发布"紫弦"三维化近存计算架构,存储带宽可达30TB/s,Token吞吐率较英伟达B200系列高出1.5~2倍
