AI 模型军备赛加速：开源、落地与监管三线并进

要点速览

MiniMax M2.7 正式开源，编程能力追平 Claude Opus，首日完成华为昇腾等全栈适配
Anthropic 发布 Word 版 Claude 插件，监管机构紧急评估 Claude Mythos 数千漏洞说法（实为外推，严重漏洞仅约 10 个）
马斯克确认 Grok Computer 三天后公测，XChat 4 月 17 日登陆 App Store
奇瑞墨甲人形机器人在京东开卖（28.58 万元），智元远征 A3 完成首批交付
苹果前 AI 负责人詹南德雷亚本周正式离职，正测试四款智能眼镜
日本软银、NEC、本田、索尼联手成立 AI 大模型国家队，五年获政府 1 万亿日元支持
配音演员张珈铭声音被 AI 盗用，单日侵权超 700 例、商单被抢、生计受损
Linux 内核允许 AI 编程工具但开发者须担责，Hermes Agent 两日获 1.4 万星

MiniMax M2.7 开源：国产大模型加速自我进化

MiniMax 正式开源其新一代大模型 M2.7，这是国内首个实现"深度参与自身迭代"的模型。M2.7 可自主构建复杂 Agent Harness（智能体测试框架），驱动强化学习并优化自身记忆，在部分强化学习场景中已能承担 30%~50% 的工作流，标志大模型从"被动训练"进入"自我进化"阶段。

性能表现：

在软件工程基准测试 SWE-Pro 中得分 56.22%，与 GPT-5.3-Codex 持平，追平 Claude Opus 水平
专业办公领域在开源模型中排名第一
处理超过 2000 Token 的复杂指令时，仍保持 97% 的准确遵循率

生态适配： 开源首日即完成与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA 等海内外芯片厂商的推理适配，实现"Day 0"级覆盖。Together AI、Fireworks、Ollama 等海外平台同步接入。

争议： M2.7 采用的限制性许可证禁止商业用途，OpenRouter 等聚合平台和云厂商无法直接托管，引发社区对"假开源"的质疑。

Anthropic 连下数棋：Word 插件发布、Claude Mythos 引监管风暴

Anthropic 本周动作频繁。

Claude for Word 测试版： 继 Excel、PowerPoint 之后，Anthropic 推出 Word 插件，主打律师、金融从业者等文档密集型用户。核心功能包括：可点击段落引用（回答直接链接到原文位置）、智能修订模式（保留原有排版格式，逐条接受或拒绝修改）、评论线程理解与处理。例如律师可用其自动标记合同中偏离市场惯例的条款，并一键调整赔偿措辞。目前仅向 Team 和 Enterprise 套餐开放。

Claude Mythos 引发英美监管紧急评估： 英国央行、金融行为监管局、财政部正与国家网络安全中心磋商，评估 Claude Mythos Preview 模型的网络安全风险。消息称该模型已在操作系统、浏览器等常用软件中"发现数千个漏洞"。美国财政部长贝森特也已召集华尔街银行（摩根大通、高盛、花旗等）开会，讨论利用该模型加强防御。

争议： 据 Tomshardware 调查，所谓"数千漏洞"实为基于 198 份审计报告外推得出，实际测试中严重漏洞仅约 10 个，且多为旧版软件功能缺陷。Claude Mythos 已悄然在亚马逊和微软云平台上线，价格昂贵。社区质疑 Anthropic 采用"先造神、再限制"的营销策略。

马斯克三拳连发：Grok Computer 公测在即、XChat 定档 4 月 17

马斯克本周密集推进 AI 产品节奏：

Grok Computer 智能体： 马斯克确认私人测试版已向部分用户开放，三天后（4月16日前后）将发布更广泛的公测版。该智能体能够深度理解屏幕内容并操控鼠标键盘执行实时操作，马斯克将其比喻为：数字擎天柱（AI 执行）是"系统1（直觉）“，Grok（决策）是"系统2（思考）”。

XChat 应用： 将于 4 月 17 日正式登陆 App Store，中国大陆区已开启预约。采用 Rust 语言开发，安装包 175.8MB，深度集成 Grok AI，主打端到端加密、无广告、不追踪数据，被视为马斯克"微信级超级应用"战略的核心落地。

XChat 与 Grok 的协同： 两者构成"通讯+AI"闭环——XChat 提供社交关系链和隐私通讯，Grok 提供底层智能决策能力，X 平台提供内容生态，三者共同支撑马斯克对标微信的野心。

人形机器人商业化提速：奇瑞墨甲开卖、智元 A3 首批交付

机器人产业本周迎来商业化里程碑。

奇瑞墨甲机器人： 已在京东商城面向 C 端开卖，旗下两款产品上架：仿生人形机器人（28.58 万元）和机器狗（1.58 万元）。线下渠道招商同步启动，计划构建"专营店+汽车4S店+商超体验店"三位一体模式。墨甲已与超 300 家经销商签约，并支持租赁和分期购买。应用路线分三步：汽车销售场景→零售/政务场景→家庭场景。

智元机器人远征 A3 首批交付： 完成向启泓文旅和秀卡科技的正式交付，上半年产能已全部锁定、供不应求。A3 标称续航 10 小时（行业纪录），支持空翻、空中漫步，原生适配智元灵创平台。下半年将推出 A3 Ultra，主攻 24 小时待命部署态应用。

深圳乐聚中试产线投运： 乐聚机器人位于龙华的中试产线正式启用，解决从研发到量产之间"造不出、造不稳、造太贵"的验证环节。夸父机器人整机国产化率已超 95%，粤港澳大湾区基本实现人形机器人制造闭环。

魔法原子定档 4 月 28 日硅谷发布会： 将发布新一代灵巧手、全新人形机器人和具身智能模型，图灵奖得主马丁·赫尔曼将出席演讲。

苹果 AI 战略人事动荡：前负责人离职、智能眼镜四款并行

苹果 AI 业务迎来关键转折。

詹南德雷亚正式离职： 这位 2018 年从谷歌加入、负责苹果 AI 战略的负责人，在 Apple Intelligence 多次未达目标、Siri 升级反复延期后，职权已被逐步削减。其职责被分配给软件负责人费德里吉、服务负责人库伊和运营负责人汗。4 月 15 日股票归属期完成后，他将以"顾问"身份正式离开苹果。

苹果四款智能眼镜并行测试： 苹果正在测试四种镜框设计（大/小矩形、大/小椭圆或圆形），配色包括黑、海蓝和浅棕。产品定位为无显示屏的轻量级设备，聚焦拍摄、通话、音乐和语音交互，接近 Ray-Ban Meta Smart Glasses 路线。苹果在 Vision Pro 遇阻后转向更务实的可穿戴 AI 形态，最早有望 2027 年推出。

日本"国家队"入局 AI：软银、NEC、本田、索尼联手造大模型

软银、NEC、本田、索尼四大日企联合成立"日本 AI 基础模型开发公司"，计划招聘约 100 名 AI 开发人员，目标打造不依赖美国和中国的日本国产 AI 基础模型。日本政府将在五年内提供最高 1 万亿日元资金支持，NEDO 已启动项目征集。

各企业分工明确：软银和 NEC 负责开发，本田用于自动驾驶，Preferred Networks 参与技术。AI 将向所有日企开放，并探索机器人控制领域。日本同时修订《个人信息保护法》，取消部分场景的"事先同意"要求，欲打造"全球最容易开发 AI 应用的国家"。

开源生态与技术治理

Linux 内核允许 AI 编程工具，但开发者须担责： 新规允许使用 GitHub Copilot 等工具，但所有代码 Bug 和安全隐患由提交者负责，开发者须标注代码是否由 AI 生成。Linus Torvalds 认为全面禁止 AI 毫无意义，重点是责任归属而非工具限制。

Hermes Agent 两日狂揽 1.4 万星： NousResearch 的开源智能体项目成为近期最受关注的开源 AI 项目，强调长期记忆与技能进化，支持自动化技能提炼和多代理并行。

Anthropic 短暂封禁 OpenClaw 创始人引发争议： Peter Steinberger 的 Claude 账号因"可疑活动"被暂停两小时，Anthropic 工程师介入后恢复。此事暴露了开源软件依赖模型厂商决策的现实困境。

AI 渗透实体产业

小鹏 GX 搭载图灵芯片和线控转向： 4 月 15 日发布，配备 4 颗自研图灵 AI 芯片，全球量产首发博世新一代线控转向系统，全系标配 800V 高压平台和双电机四驱。

广汽星河智舱接入通义千问： 基于 375 万辆车的实际运行数据开发，多模态感知引擎 1.6 秒响应、识别精确度超 95%，支持 15 个 AI 技能协同，规划路线、订餐、停车预约等可"一次指令全部搞定"。

紫荆智康发布虚拟诊室： 医生可构建 AI 分身与虚拟患者进行模拟诊疗，系统覆盖 26 个临床科室，已在北京、广西多家医院测试。

SiFive 获 4 亿美元融资，估值 36.5 亿美元： 英伟达参与跟投。基于 RISC-V 开源指令集的芯片设计公司正加速进入 AI 数据中心 CPU 市场，其 CPU 设计与英伟达 CUDA 生态的兼容性是核心战略。

AI 争议与社会影响

配音演员集体谴责 AI 仿声侵权： 《哪吒》太乙真人配音张珈铭透露，其声音单日被盗用超 700 例，三个商单因甲方选择免费 AI 仿声而取消。他投入资金维权，但因侵权者多为未成年人、法律追责困难，至今无一例起诉成功。吕艳婷、季冠霖等行业头部配音演员均遭遇类似情况。行业组织已发声，明确即便标注"非商用"也须承担侵权责任。

美国五分之一全职员工称 AI 已替代部分工作： 调查显示 AI 带来的替代效应正在加速，但经济学家也在质疑 AI 的实际生产力表现，金融科技公司 Klarna 重新雇用人类员工的案例被反复引用。

Claude 在英超预测中垫底： 测试显示 Claude Opus 4.6 表现最佳（平均亏损 11%），而 Grok 在一次测试中直接亏光全部资金。研究反映当前 AI 在动态、长期环境中的泛化能力仍有明显局限。

想第一时间获取最新内容？

欢迎加入我们的 Telegram 群组 @ai_news_plus，抢先获取每日更新。

立即加入群组