AI 模型军备赛加速:开源、落地与监管三线并进

要点速览
  • MiniMax M2.7 正式开源,编程能力追平 Claude Opus,首日完成华为昇腾等全栈适配
  • Anthropic 发布 Word 版 Claude 插件,监管机构紧急评估 Claude Mythos 数千漏洞说法(实为外推,严重漏洞仅约 10 个)
  • 马斯克确认 Grok Computer 三天后公测,XChat 4 月 17 日登陆 App Store
  • 奇瑞墨甲人形机器人在京东开卖(28.58 万元),智元远征 A3 完成首批交付
  • 苹果前 AI 负责人詹南德雷亚本周正式离职,正测试四款智能眼镜
  • 日本软银、NEC、本田、索尼联手成立 AI 大模型国家队,五年获政府 1 万亿日元支持
  • 配音演员张珈铭声音被 AI 盗用,单日侵权超 700 例、商单被抢、生计受损
  • Linux 内核允许 AI 编程工具但开发者须担责,Hermes Agent 两日获 1.4 万星

AI 模型军备赛加速:开源、落地与监管三线并进

MiniMax M2.7 开源:国产大模型加速自我进化

MiniMax 正式开源其新一代大模型 M2.7,这是国内首个实现"深度参与自身迭代"的模型。M2.7 可自主构建复杂 Agent Harness(智能体测试框架),驱动强化学习并优化自身记忆,在部分强化学习场景中已能承担 30%~50% 的工作流,标志大模型从"被动训练"进入"自我进化"阶段。

性能表现:

  • 在软件工程基准测试 SWE-Pro 中得分 56.22%,与 GPT-5.3-Codex 持平,追平 Claude Opus 水平
  • 专业办公领域在开源模型中排名第一
  • 处理超过 2000 Token 的复杂指令时,仍保持 97% 的准确遵循率

生态适配: 开源首日即完成与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA 等海内外芯片厂商的推理适配,实现"Day 0"级覆盖。Together AI、Fireworks、Ollama 等海外平台同步接入。

争议: M2.7 采用的限制性许可证禁止商业用途,OpenRouter 等聚合平台和云厂商无法直接托管,引发社区对"假开源"的质疑。


Anthropic 连下数棋:Word 插件发布、Claude Mythos 引监管风暴

Anthropic 本周动作频繁。

Claude for Word 测试版: 继 Excel、PowerPoint 之后,Anthropic 推出 Word 插件,主打律师、金融从业者等文档密集型用户。核心功能包括:可点击段落引用(回答直接链接到原文位置)、智能修订模式(保留原有排版格式,逐条接受或拒绝修改)、评论线程理解与处理。例如律师可用其自动标记合同中偏离市场惯例的条款,并一键调整赔偿措辞。目前仅向 Team 和 Enterprise 套餐开放。

Claude Mythos 引发英美监管紧急评估: 英国央行、金融行为监管局、财政部正与国家网络安全中心磋商,评估 Claude Mythos Preview 模型的网络安全风险。消息称该模型已在操作系统、浏览器等常用软件中"发现数千个漏洞"。美国财政部长贝森特也已召集华尔街银行(摩根大通、高盛、花旗等)开会,讨论利用该模型加强防御。

争议: 据 Tomshardware 调查,所谓"数千漏洞"实为基于 198 份审计报告外推得出,实际测试中严重漏洞仅约 10 个,且多为旧版软件功能缺陷。Claude Mythos 已悄然在亚马逊和微软云平台上线,价格昂贵。社区质疑 Anthropic 采用"先造神、再限制"的营销策略。


马斯克三拳连发:Grok Computer 公测在即、XChat 定档 4 月 17

马斯克本周密集推进 AI 产品节奏:

Grok Computer 智能体: 马斯克确认私人测试版已向部分用户开放,三天后(4月16日前后)将发布更广泛的公测版。该智能体能够深度理解屏幕内容并操控鼠标键盘执行实时操作,马斯克将其比喻为:数字擎天柱(AI 执行)是"系统1(直觉)“,Grok(决策)是"系统2(思考)”。

XChat 应用: 将于 4 月 17 日正式登陆 App Store,中国大陆区已开启预约。采用 Rust 语言开发,安装包 175.8MB,深度集成 Grok AI,主打端到端加密、无广告、不追踪数据,被视为马斯克"微信级超级应用"战略的核心落地。

XChat 与 Grok 的协同: 两者构成"通讯+AI"闭环——XChat 提供社交关系链和隐私通讯,Grok 提供底层智能决策能力,X 平台提供内容生态,三者共同支撑马斯克对标微信的野心。


人形机器人商业化提速:奇瑞墨甲开卖、智元 A3 首批交付

机器人产业本周迎来商业化里程碑。

奇瑞墨甲机器人: 已在京东商城面向 C 端开卖,旗下两款产品上架:仿生人形机器人(28.58 万元)和机器狗(1.58 万元)。线下渠道招商同步启动,计划构建"专营店+汽车4S店+商超体验店"三位一体模式。墨甲已与超 300 家经销商签约,并支持租赁和分期购买。应用路线分三步:汽车销售场景→零售/政务场景→家庭场景。

智元机器人远征 A3 首批交付: 完成向启泓文旅和秀卡科技的正式交付,上半年产能已全部锁定、供不应求。A3 标称续航 10 小时(行业纪录),支持空翻、空中漫步,原生适配智元灵创平台。下半年将推出 A3 Ultra,主攻 24 小时待命部署态应用。

深圳乐聚中试产线投运: 乐聚机器人位于龙华的中试产线正式启用,解决从研发到量产之间"造不出、造不稳、造太贵"的验证环节。夸父机器人整机国产化率已超 95%,粤港澳大湾区基本实现人形机器人制造闭环。

魔法原子定档 4 月 28 日硅谷发布会: 将发布新一代灵巧手、全新人形机器人和具身智能模型,图灵奖得主马丁·赫尔曼将出席演讲。


苹果 AI 战略人事动荡:前负责人离职、智能眼镜四款并行

苹果 AI 业务迎来关键转折。

詹南德雷亚正式离职: 这位 2018 年从谷歌加入、负责苹果 AI 战略的负责人,在 Apple Intelligence 多次未达目标、Siri 升级反复延期后,职权已被逐步削减。其职责被分配给软件负责人费德里吉、服务负责人库伊和运营负责人汗。4 月 15 日股票归属期完成后,他将以"顾问"身份正式离开苹果。

苹果四款智能眼镜并行测试: 苹果正在测试四种镜框设计(大/小矩形、大/小椭圆或圆形),配色包括黑、海蓝和浅棕。产品定位为无显示屏的轻量级设备,聚焦拍摄、通话、音乐和语音交互,接近 Ray-Ban Meta Smart Glasses 路线。苹果在 Vision Pro 遇阻后转向更务实的可穿戴 AI 形态,最早有望 2027 年推出。


日本"国家队"入局 AI:软银、NEC、本田、索尼联手造大模型

软银、NEC、本田、索尼四大日企联合成立"日本 AI 基础模型开发公司",计划招聘约 100 名 AI 开发人员,目标打造不依赖美国和中国的日本国产 AI 基础模型。日本政府将在五年内提供最高 1 万亿日元资金支持,NEDO 已启动项目征集。

各企业分工明确:软银和 NEC 负责开发,本田用于自动驾驶,Preferred Networks 参与技术。AI 将向所有日企开放,并探索机器人控制领域。日本同时修订《个人信息保护法》,取消部分场景的"事先同意"要求,欲打造"全球最容易开发 AI 应用的国家"。


开源生态与技术治理

Linux 内核允许 AI 编程工具,但开发者须担责: 新规允许使用 GitHub Copilot 等工具,但所有代码 Bug 和安全隐患由提交者负责,开发者须标注代码是否由 AI 生成。Linus Torvalds 认为全面禁止 AI 毫无意义,重点是责任归属而非工具限制。

Hermes Agent 两日狂揽 1.4 万星: NousResearch 的开源智能体项目成为近期最受关注的开源 AI 项目,强调长期记忆与技能进化,支持自动化技能提炼和多代理并行。

Anthropic 短暂封禁 OpenClaw 创始人引发争议: Peter Steinberger 的 Claude 账号因"可疑活动"被暂停两小时,Anthropic 工程师介入后恢复。此事暴露了开源软件依赖模型厂商决策的现实困境。


AI 渗透实体产业

小鹏 GX 搭载图灵芯片和线控转向: 4 月 15 日发布,配备 4 颗自研图灵 AI 芯片,全球量产首发博世新一代线控转向系统,全系标配 800V 高压平台和双电机四驱。

广汽星河智舱接入通义千问: 基于 375 万辆车的实际运行数据开发,多模态感知引擎 1.6 秒响应、识别精确度超 95%,支持 15 个 AI 技能协同,规划路线、订餐、停车预约等可"一次指令全部搞定"。

紫荆智康发布虚拟诊室: 医生可构建 AI 分身与虚拟患者进行模拟诊疗,系统覆盖 26 个临床科室,已在北京、广西多家医院测试。

SiFive 获 4 亿美元融资,估值 36.5 亿美元: 英伟达参与跟投。基于 RISC-V 开源指令集的芯片设计公司正加速进入 AI 数据中心 CPU 市场,其 CPU 设计与英伟达 CUDA 生态的兼容性是核心战略。


AI 争议与社会影响

配音演员集体谴责 AI 仿声侵权: 《哪吒》太乙真人配音张珈铭透露,其声音单日被盗用超 700 例,三个商单因甲方选择免费 AI 仿声而取消。他投入资金维权,但因侵权者多为未成年人、法律追责困难,至今无一例起诉成功。吕艳婷、季冠霖等行业头部配音演员均遭遇类似情况。行业组织已发声,明确即便标注"非商用"也须承担侵权责任。

美国五分之一全职员工称 AI 已替代部分工作: 调查显示 AI 带来的替代效应正在加速,但经济学家也在质疑 AI 的实际生产力表现,金融科技公司 Klarna 重新雇用人类员工的案例被反复引用。

Claude 在英超预测中垫底: 测试显示 Claude Opus 4.6 表现最佳(平均亏损 11%),而 Grok 在一次测试中直接亏光全部资金。研究反映当前 AI 在动态、长期环境中的泛化能力仍有明显局限。


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码