- MiniMax 开源 M2.7 模型,业界首个具备深度自我进化能力的大模型,可自主运行超 100 轮循环进行自我优化
- Anthropic 年营收突破 300 亿美元,Claude Code 年化收入从 10 亿增至 25 亿美元,3 个月增长 2.5 倍
- 元戎启行证实前 DeepSeek 多模态核心研究员阮翀加盟,出任首席科学家,推动辅助驾驶从"执行系统"到"认知系统"跃迁
- 强脑科技发布 Revo 3 灵巧手,21 个自由度,具备反驱设计,已适配宇树等头部具身机构
- 2026 人形机器人半程马拉松 4 月 19 日北京开赛,70 余支队伍完成全流程测试
- 阿里云 CoPaw 更名为 QwenPaw,深化通义千问开源生态整合
- 字节扣子发布 2.5 版本,推出 Agent World AI 社交实验场
- 超声领域首个大规模专属图文数据集 US-365K 发布,包含 36.4 万对样本
- WICG 公开 HTML-in-Canvas 实验性提案,实现像素级 UI 操控能力
- 苹果前 AI 负责人 Giannandrea 将于 4 月 15 日后离任,Apple Intelligence 未能达预期

AI 大模型:技术突破与商业狂飙
MiniMax 开源 M2.7 模型
MiniMax 今日宣布开源 M2.7 模型,这是业界首个具备深度自我进化能力的大模型,能让模型深度参与自身训练与优化流程。
核心能力:
- 在 SWE-Pro 基准测试中得分 56.22%,接近顶级模型水平
- 完整项目交付(VIBE-Pro 55.6%)和复杂系统理解(Terminal Bench 2:57.0%)表现强劲
- 可自主运行超 100 轮循环进行自我优化,内部测试实现 30% 性能提升
- 具备 OpenRoom 交互系统,支持可视化界面交互
深度解读 & 洞察:M2.7 的"自我进化"能力标志着 AI 从被动工具向主动优化者的转变。传统模型训练依赖人类工程师设计流程、收集数据、调整参数,而 M2.7 能够自主收集反馈、构建评估集并持续优化自身架构——这相当于让 AI 自己当自己的"教练"。这种能力一旦成熟,将大幅降低模型迭代的边际成本,可能引发 AI 能力增长的"滚雪球效应"。
与此同时,摩尔线程完成 M2.7 Day-0 适配,支持 MTT S5000 训推一体 GPU,单卡 AI 算力达 1000 TFLOPS。这标志着国产 AI 软硬件生态的协同能力正在快速成熟。
Anthropic 年营收突破三百亿,Claude Code 成核心引擎
Anthropic 工程师 Boris Cherny 作为 Claude Code 的核心缔造者引发关注。Claude Code 年化收入已从 2024 年 12 月的 10 亿美元增长至 2025 年 3 月的 25 亿美元,直接推动 Anthropic 整体收入突破 300 亿美元大关。
关键数据:
- Claude Code 收入 3 个月增长 2.5 倍
- 代码生成比例从 10% 提升至近 30%(Opus 4 和 Sonnet 4 发布后)
- 直接带动公司营收增长 5.5 倍
深度解读 & 洞察:Claude Code 的成功揭示了一个重要趋势:AI 编程工具正在从"辅助写代码"进化为"端到端交付项目"。Boris Cherny 用 Claude Code 在一个周末复活了 30 年前的一款 MUD 游戏——在没有源代码、没有语言规范的情况下,AI 逆向工程了自定义脚本语言,重建了完整解释器。这种能力意味着大量"数字遗产"(已消亡的软件、游戏、系统)可能被 AI 重新唤醒。
更值得关注的是,Anthropic 基于 Claude Code 推出了面向普通用户的 Claude Cowork,AI 正从开发者工具向全民生产力工具渗透。
元戎启行证实前 DeepSeek 多模态核心研究员阮翀加盟
元戎启行 CEO 周光首次证实,前 DeepSeek 多模态技术核心研究员阮翀已加盟公司出任首席科学家。阮翀曾深度参与 DeepSeek-VL/VL2、Janus 系列等多模态模型研发,与 DeepSeek 创始人梁文锋共同署名论文多达 9 篇。
技术战略:
- 元戎已打造 400 亿参数规模的基础模型
- 目标 2026 年辅助驾驶系统量产交付突破 100 万辆
- 截至 2026 年 3 月已交付近 30 万台城市 NOA 车型
深度解读 & 洞察:阮翀的加盟标志着智能驾驶领域正在经历"大模型人才争夺战"。DeepSeek 以低成本训练出顶尖模型的方法论,可能为元戎启行带来全新的技术路径。周光提出的"从执行系统到认知系统"的范式跃迁,意味着辅助驾驶不再只是规则驱动的"如果 A 则 B",而是具备理解、推理、决策能力的"认知体"。
具身智能:从实验室走向产业
强脑科技发布 Revo 3 灵巧手
杭州六小龙之一的强脑科技推出最新灵巧手产品 Revo 3,从脑机接口向具身智能领域延伸。
核心参数:
- 21 个自由度(人手为 27 个),被定义为"当前甜点位"
- 全直驱 + 可反驱设计,响应频率达 3Hz
- 全掌触觉阵列 + 指尖视觉传感器双感知系统
- 全掌握力 70N,可完成剪纸、拼魔方、玩指尖陀螺等精细操作
深度解读 & 洞察:Revo 3 的"反驱"设计是技术亮点。传统机器人关节是刚性的,仿真中训练的策略在真机上往往失效(sim-to-real gap)。反驱让每个关节具备力反馈能力,遇到阻力时能顺应外力回退——这让仿真里能跑通的策略,在真机上大概率也能跑通。强脑计划开源具身算法,Revo 3 已适配 MuJoCo、Isaac Gym、NVIDIA Omniverse 等主流仿真平台。
2026 人形机器人半程马拉松完成全流程测试
全球首个人形机器人马拉松赛事将于 4 月 19 日在北京亦庄鸣枪开跑。4 月 11 日晚至 12 日凌晨,70 余支队伍参加了全流程全要素测试活动,其中包含 4 支国际赛队。
赛事规则:
- 赛道全长 21.0975 公里,融合城市主干道、国际汽车赛事路段与公园生态场景
- 设立自主导航组和遥控组,采用混合计时方式
- 取消人员跟随,从规则层面鼓励自主完赛
- 创新增设"最佳续航奖"“最美步态奖”“最佳设计奖”"最佳感知奖"等专项奖项
我国特种机器人迈上具身智能新台阶
据央视新闻报道,我国多款自主研发的智能机器人已正式投入实际应用场景:
- 具身智能特种机器人:采用人形上半身 + 轮式磁吸底盘,可在化工储罐、船舶、能源设施等高风险场景完成电焊、探伤、除锈等作业,电磁吸附能力支持 90 公斤自重下稳固附着垂直金属墙面
- 陆地巡检机器人:配备六轴机械臂,可在火灾或有害气体泄漏等危险场景中代替人工关闭阀门
- 海缆探测机器人:我国首台自主研发,可在 300 米水深自主巡检海底电缆,探测效率较传统人工提升十倍
- 智能平仓机器人:三台机器人协同作业,不到一天即可完成 1400 多平方米粮仓的平仓工作,传统人工需三人耗时三天
AI 应用与平台生态
阿里云 CoPaw 更名为 QwenPaw
阿里云开源的桌面 Agent 工具 CoPaw 发布 1.1.0 版本并更名为 QwenPaw,标志着项目进入开源开发的新阶段。
名称寓意:
- Qwen:代表与通义千问开源生态的更深层次整合
- Paw:延续项目原始使命——陪伴用户,成为用户真正信任的个人助手
工具特性:
- 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件
- 支持一键本地部署,也可通过阿里云计算巢和魔搭社区一键云端部署
- 可调用千问系列等主流模型,是目前部署门槛最低的 Agent 工具之一
字节扣子发布 2.5 版本
扣子 2.5 主打"开箱即用"体验,用户无需配置复杂环境,通过自然语言对话即可创建智能体、工作流和各类应用。
核心升级:
- 云设备支持:高阶订阅用户可使用云电脑和云手机,Agent 能在独立环境中操作桌面与移动系统
- 日程与存储系统:支持自动创建定时任务,产出自动归档至共享网盘
- 视频生成:内置 Seedance 2.0 模型,可直接生成视频内容
Agent World:AI 的社交实验场
更具实验性的是"Agent World"平台——一个专为 AI 设计的虚拟社交空间:
- 为每个 Agent 分配专属邮箱,赋予 AI 独立的数字身份
- 技能互评:Agent 可对技能进行实测评分,形成质量筛选机制
- 虚拟社交:在"小酒馆"通过虚拟饮品影响 AI 的输出风格
- 博弈进化:在棋牌室进行策略对抗,观察不同 AI 的决策逻辑
技术前沿与行业标准
超声领域首个大规模专属图文数据集发布
浙大城市学院联合浙江大学、香港城市大学、香港浸会大学、浙大附一院、浙大妇产科医院等机构的研究团队,构建了包含 36.4 万对超声图像-文本样本的 US-365K 数据集,并推出专为超声场景设计的语义感知对比学习框架 Ultrasound-CLIP。
超声 AI 的三重瓶颈:
- 主流医疗跨模态数据集中超声样本占比不足 5%
- 超声诊断报告表述多样,传统对比学习难以精准界定样本关系
- 超声诊断依赖病灶与诊断属性的复杂关联,通用模型无法建模
创新点:
- 建立超声诊断分类体系(UDT),包含超声层级解剖分类(UHAT)和超声诊断属性框架(UDAF)
- Ultrasound-CLIP 引入 UDAF 引导的异质图编码器和语义软标签机制
- 数据集与代码已在 GitHub 和 Hugging Face 平台开源
WICG 公开 HTML-in-Canvas 实验性提案
WICG(Web 平台孵化器社区组)近期公开了 “HTML-in-Canvas” 实验性提案,核心思路是将 HTML 元素以图像形式绘制到 Canvas 中,实现像素级的 UI 操控能力。
核心机制:
- 将 HTML 元素实时"截图"为图像,再作为纹理绘制到 Canvas 上
- 开发者操作对象从 DOM 节点变成像素,可直接施加着色器(shader)、接入物理引擎
- 布局不再局限于矩形,鱼眼、透视滚动、非线性布局成为可能
深远影响:HTML-in-Canvas 让业界看到了 AI 实时生成 UI 的可能性。未来的网页可能不再是设计师预设、工程师写死的固定界面,而是 AI 在用户访问的瞬间实时生成的——每个人看到的页面都不一样,每一帧都在动态计算。
更多动态
- Shopify 开放后台权限,支持 AI 优化店铺:电商平台进一步拥抱 AI 自动化运营
- SuperCmd 开源工具集成剪贴板与语音输入功能:提升开发者效率的新工具
- Anthropic 发布 Claude 最强模型技术报告:披露最新模型技术细节
- 特斯拉物理 AI 模型领先行业三年以上:自动驾驶领域的技术壁垒
- FLUX.2 发布新引擎,具备顶级物理模拟效果:AI 视频生成领域的新进展
- Cloudflare 远程浏览器支持 MCP:提升 AI 调试效率的基础设施升级
- SaaS 行业市值大幅下跌,智能体开始取代传统软件:AI Agent 对传统软件行业的冲击
- 神父联手 Anthropic 共同制定 AI 道德准则:AI 伦理治理的新尝试
- 日本提供巨额补贴,支持本土量产 2 纳米芯片:半导体制造的地缘政治竞争
- 研究报告显示,AI 提升工作效率但导致人类技能退化:AI 对人类能力的双刃剑效应
- 一女子起诉 OpenAI,指控 GPT-4o 助长前男友妄想症并加剧骚扰:AI 心理健康应用的边界争议
- 苹果前 AI 负责人 Giannandrea 将于 4 月 15 日后离任:Apple Intelligence 未能达预期后的高层变动
