AI 狂飙:MiniMax 开源自进化模型,Anthropic 年收破 300 亿

要点速览
  • MiniMax 开源 M2.7 模型,业界首个具备深度自我进化能力的大模型,可自主运行超 100 轮循环进行自我优化
  • Anthropic 年营收突破 300 亿美元,Claude Code 年化收入从 10 亿增至 25 亿美元,3 个月增长 2.5 倍
  • 元戎启行证实前 DeepSeek 多模态核心研究员阮翀加盟,出任首席科学家,推动辅助驾驶从"执行系统"到"认知系统"跃迁
  • 强脑科技发布 Revo 3 灵巧手,21 个自由度,具备反驱设计,已适配宇树等头部具身机构
  • 2026 人形机器人半程马拉松 4 月 19 日北京开赛,70 余支队伍完成全流程测试
  • 阿里云 CoPaw 更名为 QwenPaw,深化通义千问开源生态整合
  • 字节扣子发布 2.5 版本,推出 Agent World AI 社交实验场
  • 超声领域首个大规模专属图文数据集 US-365K 发布,包含 36.4 万对样本
  • WICG 公开 HTML-in-Canvas 实验性提案,实现像素级 UI 操控能力
  • 苹果前 AI 负责人 Giannandrea 将于 4 月 15 日后离任,Apple Intelligence 未能达预期

AI 狂飙:MiniMax 开源自进化模型,Anthropic 年收破 300 亿

AI 大模型:技术突破与商业狂飙

MiniMax 开源 M2.7 模型

MiniMax 今日宣布开源 M2.7 模型,这是业界首个具备深度自我进化能力的大模型,能让模型深度参与自身训练与优化流程。

核心能力:

  • 在 SWE-Pro 基准测试中得分 56.22%,接近顶级模型水平
  • 完整项目交付(VIBE-Pro 55.6%)和复杂系统理解(Terminal Bench 2:57.0%)表现强劲
  • 可自主运行超 100 轮循环进行自我优化,内部测试实现 30% 性能提升
  • 具备 OpenRoom 交互系统,支持可视化界面交互

深度解读 & 洞察:M2.7 的"自我进化"能力标志着 AI 从被动工具向主动优化者的转变。传统模型训练依赖人类工程师设计流程、收集数据、调整参数,而 M2.7 能够自主收集反馈、构建评估集并持续优化自身架构——这相当于让 AI 自己当自己的"教练"。这种能力一旦成熟,将大幅降低模型迭代的边际成本,可能引发 AI 能力增长的"滚雪球效应"。

与此同时,摩尔线程完成 M2.7 Day-0 适配,支持 MTT S5000 训推一体 GPU,单卡 AI 算力达 1000 TFLOPS。这标志着国产 AI 软硬件生态的协同能力正在快速成熟。

Anthropic 年营收突破三百亿,Claude Code 成核心引擎

Anthropic 工程师 Boris Cherny 作为 Claude Code 的核心缔造者引发关注。Claude Code 年化收入已从 2024 年 12 月的 10 亿美元增长至 2025 年 3 月的 25 亿美元,直接推动 Anthropic 整体收入突破 300 亿美元大关。

关键数据:

  • Claude Code 收入 3 个月增长 2.5 倍
  • 代码生成比例从 10% 提升至近 30%(Opus 4 和 Sonnet 4 发布后)
  • 直接带动公司营收增长 5.5 倍

深度解读 & 洞察:Claude Code 的成功揭示了一个重要趋势:AI 编程工具正在从"辅助写代码"进化为"端到端交付项目"。Boris Cherny 用 Claude Code 在一个周末复活了 30 年前的一款 MUD 游戏——在没有源代码、没有语言规范的情况下,AI 逆向工程了自定义脚本语言,重建了完整解释器。这种能力意味着大量"数字遗产"(已消亡的软件、游戏、系统)可能被 AI 重新唤醒。

更值得关注的是,Anthropic 基于 Claude Code 推出了面向普通用户的 Claude Cowork,AI 正从开发者工具向全民生产力工具渗透。

元戎启行证实前 DeepSeek 多模态核心研究员阮翀加盟

元戎启行 CEO 周光首次证实,前 DeepSeek 多模态技术核心研究员阮翀已加盟公司出任首席科学家。阮翀曾深度参与 DeepSeek-VL/VL2、Janus 系列等多模态模型研发,与 DeepSeek 创始人梁文锋共同署名论文多达 9 篇。

技术战略:

  • 元戎已打造 400 亿参数规模的基础模型
  • 目标 2026 年辅助驾驶系统量产交付突破 100 万辆
  • 截至 2026 年 3 月已交付近 30 万台城市 NOA 车型

深度解读 & 洞察:阮翀的加盟标志着智能驾驶领域正在经历"大模型人才争夺战"。DeepSeek 以低成本训练出顶尖模型的方法论,可能为元戎启行带来全新的技术路径。周光提出的"从执行系统到认知系统"的范式跃迁,意味着辅助驾驶不再只是规则驱动的"如果 A 则 B",而是具备理解、推理、决策能力的"认知体"。


具身智能:从实验室走向产业

强脑科技发布 Revo 3 灵巧手

杭州六小龙之一的强脑科技推出最新灵巧手产品 Revo 3,从脑机接口向具身智能领域延伸。

核心参数:

  • 21 个自由度(人手为 27 个),被定义为"当前甜点位"
  • 全直驱 + 可反驱设计,响应频率达 3Hz
  • 全掌触觉阵列 + 指尖视觉传感器双感知系统
  • 全掌握力 70N,可完成剪纸、拼魔方、玩指尖陀螺等精细操作

深度解读 & 洞察:Revo 3 的"反驱"设计是技术亮点。传统机器人关节是刚性的,仿真中训练的策略在真机上往往失效(sim-to-real gap)。反驱让每个关节具备力反馈能力,遇到阻力时能顺应外力回退——这让仿真里能跑通的策略,在真机上大概率也能跑通。强脑计划开源具身算法,Revo 3 已适配 MuJoCo、Isaac Gym、NVIDIA Omniverse 等主流仿真平台。

2026 人形机器人半程马拉松完成全流程测试

全球首个人形机器人马拉松赛事将于 4 月 19 日在北京亦庄鸣枪开跑。4 月 11 日晚至 12 日凌晨,70 余支队伍参加了全流程全要素测试活动,其中包含 4 支国际赛队。

赛事规则:

  • 赛道全长 21.0975 公里,融合城市主干道、国际汽车赛事路段与公园生态场景
  • 设立自主导航组和遥控组,采用混合计时方式
  • 取消人员跟随,从规则层面鼓励自主完赛
  • 创新增设"最佳续航奖"“最美步态奖”“最佳设计奖”"最佳感知奖"等专项奖项

我国特种机器人迈上具身智能新台阶

据央视新闻报道,我国多款自主研发的智能机器人已正式投入实际应用场景:

  • 具身智能特种机器人:采用人形上半身 + 轮式磁吸底盘,可在化工储罐、船舶、能源设施等高风险场景完成电焊、探伤、除锈等作业,电磁吸附能力支持 90 公斤自重下稳固附着垂直金属墙面
  • 陆地巡检机器人:配备六轴机械臂,可在火灾或有害气体泄漏等危险场景中代替人工关闭阀门
  • 海缆探测机器人:我国首台自主研发,可在 300 米水深自主巡检海底电缆,探测效率较传统人工提升十倍
  • 智能平仓机器人:三台机器人协同作业,不到一天即可完成 1400 多平方米粮仓的平仓工作,传统人工需三人耗时三天

AI 应用与平台生态

阿里云 CoPaw 更名为 QwenPaw

阿里云开源的桌面 Agent 工具 CoPaw 发布 1.1.0 版本并更名为 QwenPaw,标志着项目进入开源开发的新阶段。

名称寓意:

  • Qwen:代表与通义千问开源生态的更深层次整合
  • Paw:延续项目原始使命——陪伴用户,成为用户真正信任的个人助手

工具特性:

  • 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件
  • 支持一键本地部署,也可通过阿里云计算巢和魔搭社区一键云端部署
  • 可调用千问系列等主流模型,是目前部署门槛最低的 Agent 工具之一

字节扣子发布 2.5 版本

扣子 2.5 主打"开箱即用"体验,用户无需配置复杂环境,通过自然语言对话即可创建智能体、工作流和各类应用。

核心升级:

  • 云设备支持:高阶订阅用户可使用云电脑和云手机,Agent 能在独立环境中操作桌面与移动系统
  • 日程与存储系统:支持自动创建定时任务,产出自动归档至共享网盘
  • 视频生成:内置 Seedance 2.0 模型,可直接生成视频内容

Agent World:AI 的社交实验场

更具实验性的是"Agent World"平台——一个专为 AI 设计的虚拟社交空间:

  • 为每个 Agent 分配专属邮箱,赋予 AI 独立的数字身份
  • 技能互评:Agent 可对技能进行实测评分,形成质量筛选机制
  • 虚拟社交:在"小酒馆"通过虚拟饮品影响 AI 的输出风格
  • 博弈进化:在棋牌室进行策略对抗,观察不同 AI 的决策逻辑

技术前沿与行业标准

超声领域首个大规模专属图文数据集发布

浙大城市学院联合浙江大学、香港城市大学、香港浸会大学、浙大附一院、浙大妇产科医院等机构的研究团队,构建了包含 36.4 万对超声图像-文本样本的 US-365K 数据集,并推出专为超声场景设计的语义感知对比学习框架 Ultrasound-CLIP

超声 AI 的三重瓶颈:

  1. 主流医疗跨模态数据集中超声样本占比不足 5%
  2. 超声诊断报告表述多样,传统对比学习难以精准界定样本关系
  3. 超声诊断依赖病灶与诊断属性的复杂关联,通用模型无法建模

创新点:

  • 建立超声诊断分类体系(UDT),包含超声层级解剖分类(UHAT)和超声诊断属性框架(UDAF)
  • Ultrasound-CLIP 引入 UDAF 引导的异质图编码器和语义软标签机制
  • 数据集与代码已在 GitHub 和 Hugging Face 平台开源

WICG 公开 HTML-in-Canvas 实验性提案

WICG(Web 平台孵化器社区组)近期公开了 “HTML-in-Canvas” 实验性提案,核心思路是将 HTML 元素以图像形式绘制到 Canvas 中,实现像素级的 UI 操控能力。

核心机制:

  • 将 HTML 元素实时"截图"为图像,再作为纹理绘制到 Canvas 上
  • 开发者操作对象从 DOM 节点变成像素,可直接施加着色器(shader)、接入物理引擎
  • 布局不再局限于矩形,鱼眼、透视滚动、非线性布局成为可能

深远影响:HTML-in-Canvas 让业界看到了 AI 实时生成 UI 的可能性。未来的网页可能不再是设计师预设、工程师写死的固定界面,而是 AI 在用户访问的瞬间实时生成的——每个人看到的页面都不一样,每一帧都在动态计算。


更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码