谷歌开源 Gemma 4 重夺开源话语权，AI 视频与编程赛道国产模型密集突破

要点速览

谷歌发布 Gemma 4 开源大模型，31B 版本位列全球开源榜第三，改用 Apache 2.0 协议
阿里发布 Wan2.7-Video 视频生成模型，主打「能导擅演」，让视频像文档一样可编辑
微软加速自研 AI 模型，目标 2027 年在文本、图像、音频能力上达到行业最先进水平
小米 MiMo 大模型推出 Token Plan 订阅方案，月费 39 元起，累计调用量突破 1 万亿 Token
OpenAI 关停 Sora 后收购播客 TBPN，布局内容传播渠道
优必选年薪最高 1.24 亿元招募具身智能首席科学家，2025 年人形机器人销量突破 1000 台
阿里 Qwen3.6-Plus 位列 Code Arena 编程榜全球第二，国产模型最高排名
Claude Code 源码泄露引发钓鱼攻击，黑客传播 Vidar 恶意软件窃取敏感信息

谷歌开源 Gemma 4 系列模型，Apache 2.0 协议引发热议

北京时间 4 月 3 日凌晨，Google DeepMind 正式发布 Gemma 4 开源大模型系列，这是 Gemma 系列时隔一年的重大更新。本次发布包含四种规格：

型号	参数规模	定位
E2B	20 亿参数	端侧高效版，支持原生音频输入
E4B	40 亿参数	端侧高效版，支持原生音频输入
26B MoE	260 亿总参数（激活 38 亿）	低延迟推理，性价比之选
31B Dense	310 亿参数	旗舰性能，开源榜排名第三

核心能力亮点：

多模态原生支持：全系支持图像、视频输入；E2B/E4B 额外支持语音输入
超长上下文：端侧模型 128K，大模型最高 256K
智能体原生：内置函数调用、结构化 JSON 输出，专为 Agent 工作流设计
部署友好：31B 可在单张 80GB H100 运行，量化版支持消费级显卡；E2B 可在树莓派和手机端离线运行

深度解读 & 洞察：

Gemma 4 最值得关注的变化不是技术参数，而是许可证从谷歌自定义协议改为 Apache 2.0。这意味着开发者可以更自由地进行商用和二次开发，无需担心法律顾虑。

过去一年，国内开源模型（如 Qwen、DeepSeek）快速迭代，谷歌在开源领域的影响力有所下降。这次改用 Apache 2.0，是谷歌重新争取开发者信任的关键举措。同时，31B 模型在 Arena AI 开源榜排名第三，证明了谷歌在「小参数、高性能」路线上的技术实力。

不过，协议中新增的伦理限制条款也引发争议——禁止军事用途、监控、武器开发等。支持者认为这是对社会负责，反对者则担忧单一企业定义「善恶」标准可能形成技术霸权。

阿里发布 Wan2.7-Video 视频生成模型，主打「能导擅演」

阿里通义实验室于 4 月 3 日发布 Wan2.7-Video 视频生成模型，聚焦「创作全链路」，号称让视频像文档一样可编辑。

核心功能：

全能编辑：支持增删元素、替换物体、修改属性、变换风格（如「把胶片替换成盘子」「夏季场景变秋冬」）
剧情重塑：不改变角色身份和场景，可修改行为、台词、拍摄视角，自动匹配口型和音色
创意复刻：一键复用动作序列、镜头运动、特效风格
剧情续写：通过首尾帧控制，实现无缝衔接，解决传统续写的「刹车感」
多主体锁定：最多支持 5 个主体参考，确保多镜头特征一致

深度解读 & 洞察：

Wan2.7 的发布标志着 AI 视频工具从「生成内容」向「专业创作」进化。传统视频生成的问题是「生成后无法修改」，Wan2.7 通过「像修图一样修视频」的能力，解决了这个痛点。

与 OpenAI 关停 Sora、收缩视频生成业务的策略相反，阿里选择继续深耕。这反映了国内外厂商的不同思路：海外聚焦 Agent 和底层推理，国内凭借短视频、电商等 C 端场景，加速 AI 内容生成的商业化。技术普惠而非技术领先，可能成为下一阶段的关键赛点。

微软加速自研 AI 模型，目标 2027 年比肩 OpenAI/Anthropic

据彭博社报道，微软正加速推进自研模型，目标在 2027 年前打造与 OpenAI、Anthropic 竞争的前沿 AI 系统。

关键进展：

4 月 2 日发布语音转录模型 MAI-Transcribe-1，在 25 种语言中的 11 种上登顶，平均字错误率仅 3.9%
开始部署英伟达 GB200 芯片集群，计划 12-18 个月内将算力提升至前沿规模
内部组织架构调整：穆斯塔法·苏莱曼专注模型研发，雅各布·安德鲁负责 Copilot 业务

深度解读 & 洞察：

微软的「自主化」战略是去年与 OpenAI 协议调整后的直接结果。此前合作协议限制了微软开发通用大模型，如今「松绑」后，微软明确将「3-5 年内实现 AI 能力自主化」列为核心目标。

这释放了一个重要信号：即使是 OpenAI 最大的合作伙伴，也在为「脱钩」做准备。AI 市场的竞争格局将从「两强对峙」演变为「多方混战」。对开发者而言，这意味着未来会有更多模型选择，但也需要面对更复杂的选型决策。

小米 MiMo 大模型商业化落地：Token Plan 订阅方案上线

小米于 4 月 3 日正式推出 MiMo Token Plan，这是小米大模型首个面向开发者的付费订阅方案。

套餐定价：

套餐	月费	Credits	预估任务量
Lite	¥39	6000 万	~120 个中等复杂任务
Standard	¥99	2 亿	~400 个任务
Pro	¥329	7 亿	~1400 个任务
Max	¥659	16 亿	~3200 个任务

核心特点：

统一 Credit 点数体系，按 Token 消耗量换算
取消 5 小时使用限额，支持集中高强度调用
适配 Claude Code、Cline、Kilo Code 等主流 AI 编程工具
首购享 88 折优惠

深度解读 & 洞察：

MiMo-V2-Pro 近期在 OpenRouter 平台表现亮眼：周 Token 消耗量连续突破 3 万亿和 4 万亿，登顶日榜、周榜、月榜第一。雷军宣布 MiMo 累计调用量已突破 1 万亿 Token。

小米的定价策略很有针对性：39 元入门价降低了尝鲜门槛，659 元 Max 版覆盖企业级需求。取消时间限制的设计，瞄准了编程、代码审查等需要连续高强度调用的场景。这标志着国产大模型从「技术叙事」转向「经营驱动」，商业化进入规模化交付阶段。

OpenAI 关停 Sora 后收购播客 TBPN，布局内容传播渠道

OpenAI 在关闭 Sora 视频应用仅一个月后，宣布收购科技商业播客 TBPN。

交易背景：

TBPN 成立于 2024 年 10 月，主打三小时长播客对话，嘉宾包括扎克伯格、纳德拉、奥特曼等
收购时机微妙：发生在 TBPN 采访苹果高管 Eddy Cue 庆祝苹果 50 周年的第二天
财务条款未披露，TBPN 2024 年广告收入约 500 万美元，预计 2026 年突破 3000 万美元

OpenAI 的官方说法：

“随着推进 AGI 使命，我们有责任为技术变革构建真实的对话空间。TBPN 已经建立了这样的平台，收购比自建更有效率。”

OpenAI 承诺 TBPN 保持「编辑独立性」，继续独立运营节目、选择嘉宾。

深度解读 & 洞察：

Sora 的关停主因是日均百万美元亏损 + 用户数腰斩。在技术难以短期盈利的背景下，OpenAI 转向控制「内容传播渠道」而非「内容生成工具」。

这是一种更深层的「权力防御」：当 AI 技术红利进入平台期，谁能定义「科技的正确价值观」，谁就握住了下一个时代的入场券。不过，「企业内宣」的质疑始终存在——当掌握算法权力的巨头同时掌握话语权，如何确保讨论不流于「自说自话」，是监管层和公众需要关注的新挑战。

具身智能人才争夺战白热化：优必选年薪 1.24 亿招募首席科学家

优必选 4 月 2 日宣布面向全球招募具身智能首席科学家，年薪 1500 万起步，最高可达 1.24 亿元，不看护照、不看年龄、不看性别。

岗位核心职责：

定义优必选在人形机器人和具身智能领域的技术路线图
主导视觉-语言-动作模型、机器人基础模型、操作与灵巧技能学习等核心领域
推动具身智能从实验室走向真实场景

优必选 2025 年业绩：

全年营收 20.01 亿元，同比增长 53.3%
人形机器人业务收入 8.21 亿元，同比暴增 2203.7%
销量 1079 台，同比增长超 358 倍

深度解读 & 洞察：

1.24 亿年薪是什么概念？相当于每天 34 万元，或每小时 1.4 万元。这反映出具身智能领域顶尖人才的极度稀缺。

优必选的业绩数据更具信号意义：人形机器人销量从「几十台」跃升到「千台级」，标志着行业从技术验证阶段正式进入规模化商业应用。智元机器人也宣布将于 4 月 7 日启动为期一周的「AI 发布周」，每天发布一项物理 AI 突破。

具身智能正在从「实验室炫技」走向「工厂 24 小时作业」，人才和产能的双重竞赛已经打响。

阿里 Qwen3.6-Plus 编程能力跃升：Code Arena 全球第二

据 LMArena 旗下 Code Arena 最新排名，阿里 Qwen3.6-Plus 在 React 专项榜单中以 1452 分位列全球第二，仅次于 Claude-Opus-4.6-Thinking（1540 分），领先 GPT-5.0-High（1448 分）。

关键数据：

阿里在全球 AI 实验室排名升至第四位（前三：Anthropic、OpenAI、Google）
Qwen3.6-Plus 以较少参数量，超越了参数量为其 2-3 倍的国产竞品
这是该榜单上排名最高的中国大模型

Code Arena 是什么：

LMArena 是 AI 领域公认的权威盲测平台，采用「双盲测试」机制——用户不知道使用的是哪个模型，根据实际体验投票。Code Arena 专注于 AI 编程能力，React 专项榜单考察模型在真实复杂 Web 开发场景下的端到端开发能力。

深度解读 & 洞察：

Qwen3.6-Plus 的成绩证明，国产大模型在编程这个「硬核」领域已经具备国际竞争力。参数效率的突出表现，说明阿里在模型架构和训练方法上有独到之处。

更值得关注的是「后续弹药」：Qwen3.6 系列还将开源其他尺寸模型，旗舰版本 Qwen3.6-Max 也将在近期发布。这意味着阿里在编程和 Agent 能力上的投入仍在持续加码。

Claude Code 源码泄露引发钓鱼攻击，安全警示升级

Anthropic 的终端 AI 工具 Claude Code 前端源码因人为操作失误被意外打包进 npm 公开包，导致 51.3 万行代码外泄。事件持续发酵，黑客已在 GitHub 创建虚假仓库传播 Vidar 信息窃取恶意软件。

攻击手法：

黑客创建虚假仓库，声称提供「解锁企业功能」的泄露源码
针对性优化搜索引擎排名，用户搜索相关关键词时极易中招
下载运行可执行文件后，Vidar 恶意软件入驻系统，同时部署 GhostSocks 代理工具

Vidar 恶意软件：

暗网明码标价的成熟恶意软件
专攻浏览器数据、加密货币钱包等敏感信息
虚假仓库更新频繁，可能携带更多攻击载荷

深度解读 & 洞察：

从源码泄露到钓鱼攻击，这起事件展示了 AI 时代安全风险的「连锁反应」。Anthropic 的一次打包失误，被黑客精准利用，转化为针对开发者的社会工程攻击。

对普通开发者的警示：

只通过官方渠道获取工具，不要下载「破解版」「泄露版」
不要运行来自未知渠道的二进制文件
对任何「解锁企业功能」的宣传保持警惕

谷歌开源 Gemma 4 重夺开源话语权，AI 视频与编程赛道国产模型密集突破

谷歌开源 Gemma 4 系列模型，Apache 2.0 协议引发热议

阿里发布 Wan2.7-Video 视频生成模型，主打「能导擅演」

微软加速自研 AI 模型，目标 2027 年比肩 OpenAI/Anthropic

小米 MiMo 大模型商业化落地：Token Plan 订阅方案上线

OpenAI 关停 Sora 后收购播客 TBPN，布局内容传播渠道

具身智能人才争夺战白热化：优必选年薪 1.24 亿招募首席科学家

阿里 Qwen3.6-Plus 编程能力跃升：Code Arena 全球第二

Claude Code 源码泄露引发钓鱼攻击，安全警示升级

更多动态