- 谷歌发布 Gemma 4 开源大模型,31B 版本位列全球开源榜第三,改用 Apache 2.0 协议
- 阿里发布 Wan2.7-Video 视频生成模型,主打「能导擅演」,让视频像文档一样可编辑
- 微软加速自研 AI 模型,目标 2027 年在文本、图像、音频能力上达到行业最先进水平
- 小米 MiMo 大模型推出 Token Plan 订阅方案,月费 39 元起,累计调用量突破 1 万亿 Token
- OpenAI 关停 Sora 后收购播客 TBPN,布局内容传播渠道
- 优必选年薪最高 1.24 亿元招募具身智能首席科学家,2025 年人形机器人销量突破 1000 台
- 阿里 Qwen3.6-Plus 位列 Code Arena 编程榜全球第二,国产模型最高排名
- Claude Code 源码泄露引发钓鱼攻击,黑客传播 Vidar 恶意软件窃取敏感信息

谷歌开源 Gemma 4 系列模型,Apache 2.0 协议引发热议
北京时间 4 月 3 日凌晨,Google DeepMind 正式发布 Gemma 4 开源大模型系列,这是 Gemma 系列时隔一年的重大更新。本次发布包含四种规格:
| 型号 | 参数规模 | 定位 |
|---|---|---|
| E2B | 20 亿参数 | 端侧高效版,支持原生音频输入 |
| E4B | 40 亿参数 | 端侧高效版,支持原生音频输入 |
| 26B MoE | 260 亿总参数(激活 38 亿) | 低延迟推理,性价比之选 |
| 31B Dense | 310 亿参数 | 旗舰性能,开源榜排名第三 |
核心能力亮点:
- 多模态原生支持:全系支持图像、视频输入;E2B/E4B 额外支持语音输入
- 超长上下文:端侧模型 128K,大模型最高 256K
- 智能体原生:内置函数调用、结构化 JSON 输出,专为 Agent 工作流设计
- 部署友好:31B 可在单张 80GB H100 运行,量化版支持消费级显卡;E2B 可在树莓派和手机端离线运行
深度解读 & 洞察:
Gemma 4 最值得关注的变化不是技术参数,而是许可证从谷歌自定义协议改为 Apache 2.0。这意味着开发者可以更自由地进行商用和二次开发,无需担心法律顾虑。
过去一年,国内开源模型(如 Qwen、DeepSeek)快速迭代,谷歌在开源领域的影响力有所下降。这次改用 Apache 2.0,是谷歌重新争取开发者信任的关键举措。同时,31B 模型在 Arena AI 开源榜排名第三,证明了谷歌在「小参数、高性能」路线上的技术实力。
不过,协议中新增的伦理限制条款也引发争议——禁止军事用途、监控、武器开发等。支持者认为这是对社会负责,反对者则担忧单一企业定义「善恶」标准可能形成技术霸权。
阿里发布 Wan2.7-Video 视频生成模型,主打「能导擅演」
阿里通义实验室于 4 月 3 日发布 Wan2.7-Video 视频生成模型,聚焦「创作全链路」,号称让视频像文档一样可编辑。
核心功能:
- 全能编辑:支持增删元素、替换物体、修改属性、变换风格(如「把胶片替换成盘子」「夏季场景变秋冬」)
- 剧情重塑:不改变角色身份和场景,可修改行为、台词、拍摄视角,自动匹配口型和音色
- 创意复刻:一键复用动作序列、镜头运动、特效风格
- 剧情续写:通过首尾帧控制,实现无缝衔接,解决传统续写的「刹车感」
- 多主体锁定:最多支持 5 个主体参考,确保多镜头特征一致
深度解读 & 洞察:
Wan2.7 的发布标志着 AI 视频工具从「生成内容」向「专业创作」进化。传统视频生成的问题是「生成后无法修改」,Wan2.7 通过「像修图一样修视频」的能力,解决了这个痛点。
与 OpenAI 关停 Sora、收缩视频生成业务的策略相反,阿里选择继续深耕。这反映了国内外厂商的不同思路:海外聚焦 Agent 和底层推理,国内凭借短视频、电商等 C 端场景,加速 AI 内容生成的商业化。技术普惠而非技术领先,可能成为下一阶段的关键赛点。
微软加速自研 AI 模型,目标 2027 年比肩 OpenAI/Anthropic
据彭博社报道,微软正加速推进自研模型,目标在 2027 年前打造与 OpenAI、Anthropic 竞争的前沿 AI 系统。
关键进展:
- 4 月 2 日发布语音转录模型 MAI-Transcribe-1,在 25 种语言中的 11 种上登顶,平均字错误率仅 3.9%
- 开始部署英伟达 GB200 芯片集群,计划 12-18 个月内将算力提升至前沿规模
- 内部组织架构调整:穆斯塔法·苏莱曼专注模型研发,雅各布·安德鲁负责 Copilot 业务
深度解读 & 洞察:
微软的「自主化」战略是去年与 OpenAI 协议调整后的直接结果。此前合作协议限制了微软开发通用大模型,如今「松绑」后,微软明确将「3-5 年内实现 AI 能力自主化」列为核心目标。
这释放了一个重要信号:即使是 OpenAI 最大的合作伙伴,也在为「脱钩」做准备。AI 市场的竞争格局将从「两强对峙」演变为「多方混战」。对开发者而言,这意味着未来会有更多模型选择,但也需要面对更复杂的选型决策。
小米 MiMo 大模型商业化落地:Token Plan 订阅方案上线
小米于 4 月 3 日正式推出 MiMo Token Plan,这是小米大模型首个面向开发者的付费订阅方案。
套餐定价:
| 套餐 | 月费 | Credits | 预估任务量 |
|---|---|---|---|
| Lite | ¥39 | 6000 万 | ~120 个中等复杂任务 |
| Standard | ¥99 | 2 亿 | ~400 个任务 |
| Pro | ¥329 | 7 亿 | ~1400 个任务 |
| Max | ¥659 | 16 亿 | ~3200 个任务 |
核心特点:
- 统一 Credit 点数体系,按 Token 消耗量换算
- 取消 5 小时使用限额,支持集中高强度调用
- 适配 Claude Code、Cline、Kilo Code 等主流 AI 编程工具
- 首购享 88 折优惠
深度解读 & 洞察:
MiMo-V2-Pro 近期在 OpenRouter 平台表现亮眼:周 Token 消耗量连续突破 3 万亿和 4 万亿,登顶日榜、周榜、月榜第一。雷军宣布 MiMo 累计调用量已突破 1 万亿 Token。
小米的定价策略很有针对性:39 元入门价降低了尝鲜门槛,659 元 Max 版覆盖企业级需求。取消时间限制的设计,瞄准了编程、代码审查等需要连续高强度调用的场景。这标志着国产大模型从「技术叙事」转向「经营驱动」,商业化进入规模化交付阶段。
OpenAI 关停 Sora 后收购播客 TBPN,布局内容传播渠道
OpenAI 在关闭 Sora 视频应用仅一个月后,宣布收购科技商业播客 TBPN。
交易背景:
- TBPN 成立于 2024 年 10 月,主打三小时长播客对话,嘉宾包括扎克伯格、纳德拉、奥特曼等
- 收购时机微妙:发生在 TBPN 采访苹果高管 Eddy Cue 庆祝苹果 50 周年的第二天
- 财务条款未披露,TBPN 2024 年广告收入约 500 万美元,预计 2026 年突破 3000 万美元
OpenAI 的官方说法:
“随着推进 AGI 使命,我们有责任为技术变革构建真实的对话空间。TBPN 已经建立了这样的平台,收购比自建更有效率。”
OpenAI 承诺 TBPN 保持「编辑独立性」,继续独立运营节目、选择嘉宾。
深度解读 & 洞察:
Sora 的关停主因是日均百万美元亏损 + 用户数腰斩。在技术难以短期盈利的背景下,OpenAI 转向控制「内容传播渠道」而非「内容生成工具」。
这是一种更深层的「权力防御」:当 AI 技术红利进入平台期,谁能定义「科技的正确价值观」,谁就握住了下一个时代的入场券。不过,「企业内宣」的质疑始终存在——当掌握算法权力的巨头同时掌握话语权,如何确保讨论不流于「自说自话」,是监管层和公众需要关注的新挑战。
具身智能人才争夺战白热化:优必选年薪 1.24 亿招募首席科学家
优必选 4 月 2 日宣布 面向全球招募具身智能首席科学家,年薪 1500 万起步,最高可达 1.24 亿元,不看护照、不看年龄、不看性别。
岗位核心职责:
- 定义优必选在人形机器人和具身智能领域的技术路线图
- 主导视觉-语言-动作模型、机器人基础模型、操作与灵巧技能学习等核心领域
- 推动具身智能从实验室走向真实场景
优必选 2025 年业绩:
- 全年营收 20.01 亿元,同比增长 53.3%
- 人形机器人业务收入 8.21 亿元,同比暴增 2203.7%
- 销量 1079 台,同比增长超 358 倍
深度解读 & 洞察:
1.24 亿年薪是什么概念?相当于每天 34 万元,或每小时 1.4 万元。这反映出具身智能领域顶尖人才的极度稀缺。
优必选的业绩数据更具信号意义:人形机器人销量从「几十台」跃升到「千台级」,标志着行业从技术验证阶段正式进入规模化商业应用。智元机器人也宣布将于 4 月 7 日启动为期一周的「AI 发布周」,每天发布一项物理 AI 突破。
具身智能正在从「实验室炫技」走向「工厂 24 小时作业」,人才和产能的双重竞赛已经打响。
阿里 Qwen3.6-Plus 编程能力跃升:Code Arena 全球第二
据 LMArena 旗下 Code Arena 最新排名,阿里 Qwen3.6-Plus 在 React 专项榜单中以 1452 分位列全球第二,仅次于 Claude-Opus-4.6-Thinking(1540 分),领先 GPT-5.0-High(1448 分)。
关键数据:
- 阿里在全球 AI 实验室排名升至第四位(前三:Anthropic、OpenAI、Google)
- Qwen3.6-Plus 以较少参数量,超越了参数量为其 2-3 倍的国产竞品
- 这是该榜单上排名最高的中国大模型
Code Arena 是什么:
LMArena 是 AI 领域公认的权威盲测平台,采用「双盲测试」机制——用户不知道使用的是哪个模型,根据实际体验投票。Code Arena 专注于 AI 编程能力,React 专项榜单考察模型在真实复杂 Web 开发场景下的端到端开发能力。
深度解读 & 洞察:
Qwen3.6-Plus 的成绩证明,国产大模型在编程这个「硬核」领域已经具备国际竞争力。参数效率的突出表现,说明阿里在模型架构和训练方法上有独到之处。
更值得关注的是「后续弹药」:Qwen3.6 系列还将开源其他尺寸模型,旗舰版本 Qwen3.6-Max 也将在近期发布。这意味着阿里在编程和 Agent 能力上的投入仍在持续加码。
Claude Code 源码泄露引发钓鱼攻击,安全警示升级
Anthropic 的终端 AI 工具 Claude Code 前端源码因人为操作失误被意外打包进 npm 公开包,导致 51.3 万行代码外泄。事件持续发酵,黑客已在 GitHub 创建虚假仓库传播 Vidar 信息窃取恶意软件。
攻击手法:
- 黑客创建虚假仓库,声称提供「解锁企业功能」的泄露源码
- 针对性优化搜索引擎排名,用户搜索相关关键词时极易中招
- 下载运行可执行文件后,Vidar 恶意软件入驻系统,同时部署 GhostSocks 代理工具
Vidar 恶意软件:
- 暗网明码标价的成熟恶意软件
- 专攻浏览器数据、加密货币钱包等敏感信息
- 虚假仓库更新频繁,可能携带更多攻击载荷
深度解读 & 洞察:
从源码泄露到钓鱼攻击,这起事件展示了 AI 时代安全风险的「连锁反应」。Anthropic 的一次打包失误,被黑客精准利用,转化为针对开发者的社会工程攻击。
对普通开发者的警示:
- 只通过官方渠道获取工具,不要下载「破解版」「泄露版」
- 不要运行来自未知渠道的二进制文件
- 对任何「解锁企业功能」的宣传保持警惕
更多动态
模型与产品
- 腾讯云发布「龙虾」记忆服务 Agent Memory:为 OpenClaw 补齐长期记忆能力,接入后回答准确率从 48% 提升至 76.10%,支持免费一键开启
- 美团发布原生多模态大模型 LongCat-Next:将图像、语音、文本统一离散为 Token,用同一套自回归逻辑建模,已开源
- Cursor 3 正式发布:从「人机协作」推向「智能体自主工作」,支持多智能体协同、本地云端无缝切换
- ElevenLabs 推出 iOS 应用 ElevenMusic:正式进军 AI 音乐创作市场,与 Suno、Udio 直接竞争
- 谷歌 Vids 集成 Veo 3.1:支持 AI 虚拟形象互动、8 秒视频生成,新增 YouTube 导出和 Chrome 录屏扩展
- 小米超级小爱 V7.12 升级:三指上滑便捷记忆、新增小爱指南、支持后台生成深度研究报告
硬件与芯片
- 韩国 FuriosaAI 今年量产 2 万颗 RNGD 芯片:运行 Qwen3-32B 时效能比英伟达 RTX PRO 6000 高 2.2~7.4 倍,TCO 仅 40%
- 谷歌在德州建设 933 兆瓦天然气发电厂:专为 Goodnight 数据中心供电,预计年排放 450 万吨二氧化碳,引发零碳承诺质疑
行业与政策
- 广电行业组织发声:严禁 AI 演员换脸、声纹克隆复刻:未经授权使用演员影像声频数据构成侵权,平台需建立核验机制
- 商务部回应 Meta 收购 Manus:支持企业跨国经营与技术合作,但须严格遵守中国法律法规
- 北京市新增 15 款生成式 AI 服务完成登记
- Perplexity 遭集体起诉:隐身模式被指形同虚设,用户聊天记录被共享给谷歌和 Meta 用于广告投放
融资与商业
- 印度 AI 企业 Sarvam 启动新一轮融资:估值 15~15.5 亿美元,英伟达、亚马逊预计参与
- 月之暗面启动「穿越计划」:面向 2027 届毕业生提前授予期权,首批 16 人,估值已从 40 亿美元飙升至 180 亿美元
其他
- 瘫痪 53 年音乐家靠脑机接口创作音乐:加州理工学院植入 6 个脑芯片,将神经信号转化为实时音乐
- 微信下架 3800 条「AI 魔改」违规短视频:涉及经典文学恶意解构、历史名人低俗化改编、未成年人动画邪典化处理
- 红果短剧下架 AI 短剧《桃花簪》:因未经授权使用博主面部形象,出品方被暂停上传 15 天
