谷歌开源 Gemma 4 重夺开源话语权,AI 视频与编程赛道国产模型密集突破

要点速览
  • 谷歌发布 Gemma 4 开源大模型,31B 版本位列全球开源榜第三,改用 Apache 2.0 协议
  • 阿里发布 Wan2.7-Video 视频生成模型,主打「能导擅演」,让视频像文档一样可编辑
  • 微软加速自研 AI 模型,目标 2027 年在文本、图像、音频能力上达到行业最先进水平
  • 小米 MiMo 大模型推出 Token Plan 订阅方案,月费 39 元起,累计调用量突破 1 万亿 Token
  • OpenAI 关停 Sora 后收购播客 TBPN,布局内容传播渠道
  • 优必选年薪最高 1.24 亿元招募具身智能首席科学家,2025 年人形机器人销量突破 1000 台
  • 阿里 Qwen3.6-Plus 位列 Code Arena 编程榜全球第二,国产模型最高排名
  • Claude Code 源码泄露引发钓鱼攻击,黑客传播 Vidar 恶意软件窃取敏感信息

谷歌开源 Gemma 4 重夺开源话语权,AI 视频与编程赛道国产模型密集突破

谷歌开源 Gemma 4 系列模型,Apache 2.0 协议引发热议

北京时间 4 月 3 日凌晨,Google DeepMind 正式发布 Gemma 4 开源大模型系列,这是 Gemma 系列时隔一年的重大更新。本次发布包含四种规格:

型号参数规模定位
E2B20 亿参数端侧高效版,支持原生音频输入
E4B40 亿参数端侧高效版,支持原生音频输入
26B MoE260 亿总参数(激活 38 亿)低延迟推理,性价比之选
31B Dense310 亿参数旗舰性能,开源榜排名第三

核心能力亮点:

  • 多模态原生支持:全系支持图像、视频输入;E2B/E4B 额外支持语音输入
  • 超长上下文:端侧模型 128K,大模型最高 256K
  • 智能体原生:内置函数调用、结构化 JSON 输出,专为 Agent 工作流设计
  • 部署友好:31B 可在单张 80GB H100 运行,量化版支持消费级显卡;E2B 可在树莓派和手机端离线运行

深度解读 & 洞察:

Gemma 4 最值得关注的变化不是技术参数,而是许可证从谷歌自定义协议改为 Apache 2.0。这意味着开发者可以更自由地进行商用和二次开发,无需担心法律顾虑。

过去一年,国内开源模型(如 Qwen、DeepSeek)快速迭代,谷歌在开源领域的影响力有所下降。这次改用 Apache 2.0,是谷歌重新争取开发者信任的关键举措。同时,31B 模型在 Arena AI 开源榜排名第三,证明了谷歌在「小参数、高性能」路线上的技术实力。

不过,协议中新增的伦理限制条款也引发争议——禁止军事用途、监控、武器开发等。支持者认为这是对社会负责,反对者则担忧单一企业定义「善恶」标准可能形成技术霸权。


阿里发布 Wan2.7-Video 视频生成模型,主打「能导擅演」

阿里通义实验室于 4 月 3 日发布 Wan2.7-Video 视频生成模型,聚焦「创作全链路」,号称让视频像文档一样可编辑。

核心功能:

  • 全能编辑:支持增删元素、替换物体、修改属性、变换风格(如「把胶片替换成盘子」「夏季场景变秋冬」)
  • 剧情重塑:不改变角色身份和场景,可修改行为、台词、拍摄视角,自动匹配口型和音色
  • 创意复刻:一键复用动作序列、镜头运动、特效风格
  • 剧情续写:通过首尾帧控制,实现无缝衔接,解决传统续写的「刹车感」
  • 多主体锁定:最多支持 5 个主体参考,确保多镜头特征一致

深度解读 & 洞察:

Wan2.7 的发布标志着 AI 视频工具从「生成内容」向「专业创作」进化。传统视频生成的问题是「生成后无法修改」,Wan2.7 通过「像修图一样修视频」的能力,解决了这个痛点。

与 OpenAI 关停 Sora、收缩视频生成业务的策略相反,阿里选择继续深耕。这反映了国内外厂商的不同思路:海外聚焦 Agent 和底层推理,国内凭借短视频、电商等 C 端场景,加速 AI 内容生成的商业化。技术普惠而非技术领先,可能成为下一阶段的关键赛点。


微软加速自研 AI 模型,目标 2027 年比肩 OpenAI/Anthropic

据彭博社报道,微软正加速推进自研模型,目标在 2027 年前打造与 OpenAI、Anthropic 竞争的前沿 AI 系统

关键进展:

  • 4 月 2 日发布语音转录模型 MAI-Transcribe-1,在 25 种语言中的 11 种上登顶,平均字错误率仅 3.9%
  • 开始部署英伟达 GB200 芯片集群,计划 12-18 个月内将算力提升至前沿规模
  • 内部组织架构调整:穆斯塔法·苏莱曼专注模型研发,雅各布·安德鲁负责 Copilot 业务

深度解读 & 洞察:

微软的「自主化」战略是去年与 OpenAI 协议调整后的直接结果。此前合作协议限制了微软开发通用大模型,如今「松绑」后,微软明确将「3-5 年内实现 AI 能力自主化」列为核心目标。

这释放了一个重要信号:即使是 OpenAI 最大的合作伙伴,也在为「脱钩」做准备。AI 市场的竞争格局将从「两强对峙」演变为「多方混战」。对开发者而言,这意味着未来会有更多模型选择,但也需要面对更复杂的选型决策。


小米 MiMo 大模型商业化落地:Token Plan 订阅方案上线

小米于 4 月 3 日正式推出 MiMo Token Plan,这是小米大模型首个面向开发者的付费订阅方案。

套餐定价:

套餐月费Credits预估任务量
Lite¥396000 万~120 个中等复杂任务
Standard¥992 亿~400 个任务
Pro¥3297 亿~1400 个任务
Max¥65916 亿~3200 个任务

核心特点:

  • 统一 Credit 点数体系,按 Token 消耗量换算
  • 取消 5 小时使用限额,支持集中高强度调用
  • 适配 Claude Code、Cline、Kilo Code 等主流 AI 编程工具
  • 首购享 88 折优惠

深度解读 & 洞察:

MiMo-V2-Pro 近期在 OpenRouter 平台表现亮眼:周 Token 消耗量连续突破 3 万亿和 4 万亿,登顶日榜、周榜、月榜第一。雷军宣布 MiMo 累计调用量已突破 1 万亿 Token

小米的定价策略很有针对性:39 元入门价降低了尝鲜门槛,659 元 Max 版覆盖企业级需求。取消时间限制的设计,瞄准了编程、代码审查等需要连续高强度调用的场景。这标志着国产大模型从「技术叙事」转向「经营驱动」,商业化进入规模化交付阶段。


OpenAI 关停 Sora 后收购播客 TBPN,布局内容传播渠道

OpenAI 在关闭 Sora 视频应用仅一个月后,宣布收购科技商业播客 TBPN

交易背景:

  • TBPN 成立于 2024 年 10 月,主打三小时长播客对话,嘉宾包括扎克伯格、纳德拉、奥特曼等
  • 收购时机微妙:发生在 TBPN 采访苹果高管 Eddy Cue 庆祝苹果 50 周年的第二天
  • 财务条款未披露,TBPN 2024 年广告收入约 500 万美元,预计 2026 年突破 3000 万美元

OpenAI 的官方说法:

“随着推进 AGI 使命,我们有责任为技术变革构建真实的对话空间。TBPN 已经建立了这样的平台,收购比自建更有效率。”

OpenAI 承诺 TBPN 保持「编辑独立性」,继续独立运营节目、选择嘉宾。

深度解读 & 洞察:

Sora 的关停主因是日均百万美元亏损 + 用户数腰斩。在技术难以短期盈利的背景下,OpenAI 转向控制「内容传播渠道」而非「内容生成工具」。

这是一种更深层的「权力防御」:当 AI 技术红利进入平台期,谁能定义「科技的正确价值观」,谁就握住了下一个时代的入场券。不过,「企业内宣」的质疑始终存在——当掌握算法权力的巨头同时掌握话语权,如何确保讨论不流于「自说自话」,是监管层和公众需要关注的新挑战。


具身智能人才争夺战白热化:优必选年薪 1.24 亿招募首席科学家

优必选 4 月 2 日宣布 面向全球招募具身智能首席科学家,年薪 1500 万起步,最高可达 1.24 亿元,不看护照、不看年龄、不看性别。

岗位核心职责:

  • 定义优必选在人形机器人和具身智能领域的技术路线图
  • 主导视觉-语言-动作模型、机器人基础模型、操作与灵巧技能学习等核心领域
  • 推动具身智能从实验室走向真实场景

优必选 2025 年业绩:

  • 全年营收 20.01 亿元,同比增长 53.3%
  • 人形机器人业务收入 8.21 亿元,同比暴增 2203.7%
  • 销量 1079 台,同比增长超 358 倍

深度解读 & 洞察:

1.24 亿年薪是什么概念?相当于每天 34 万元,或每小时 1.4 万元。这反映出具身智能领域顶尖人才的极度稀缺。

优必选的业绩数据更具信号意义:人形机器人销量从「几十台」跃升到「千台级」,标志着行业从技术验证阶段正式进入规模化商业应用。智元机器人也宣布将于 4 月 7 日启动为期一周的「AI 发布周」,每天发布一项物理 AI 突破。

具身智能正在从「实验室炫技」走向「工厂 24 小时作业」,人才和产能的双重竞赛已经打响。


阿里 Qwen3.6-Plus 编程能力跃升:Code Arena 全球第二

据 LMArena 旗下 Code Arena 最新排名,阿里 Qwen3.6-Plus 在 React 专项榜单中以 1452 分位列全球第二,仅次于 Claude-Opus-4.6-Thinking(1540 分),领先 GPT-5.0-High(1448 分)。

关键数据:

  • 阿里在全球 AI 实验室排名升至第四位(前三:Anthropic、OpenAI、Google)
  • Qwen3.6-Plus 以较少参数量,超越了参数量为其 2-3 倍的国产竞品
  • 这是该榜单上排名最高的中国大模型

Code Arena 是什么:

LMArena 是 AI 领域公认的权威盲测平台,采用「双盲测试」机制——用户不知道使用的是哪个模型,根据实际体验投票。Code Arena 专注于 AI 编程能力,React 专项榜单考察模型在真实复杂 Web 开发场景下的端到端开发能力。

深度解读 & 洞察:

Qwen3.6-Plus 的成绩证明,国产大模型在编程这个「硬核」领域已经具备国际竞争力。参数效率的突出表现,说明阿里在模型架构和训练方法上有独到之处。

更值得关注的是「后续弹药」:Qwen3.6 系列还将开源其他尺寸模型,旗舰版本 Qwen3.6-Max 也将在近期发布。这意味着阿里在编程和 Agent 能力上的投入仍在持续加码。


Claude Code 源码泄露引发钓鱼攻击,安全警示升级

Anthropic 的终端 AI 工具 Claude Code 前端源码因人为操作失误被意外打包进 npm 公开包,导致 51.3 万行代码外泄。事件持续发酵,黑客已在 GitHub 创建虚假仓库传播 Vidar 信息窃取恶意软件。

攻击手法:

  • 黑客创建虚假仓库,声称提供「解锁企业功能」的泄露源码
  • 针对性优化搜索引擎排名,用户搜索相关关键词时极易中招
  • 下载运行可执行文件后,Vidar 恶意软件入驻系统,同时部署 GhostSocks 代理工具

Vidar 恶意软件:

  • 暗网明码标价的成熟恶意软件
  • 专攻浏览器数据、加密货币钱包等敏感信息
  • 虚假仓库更新频繁,可能携带更多攻击载荷

深度解读 & 洞察:

从源码泄露到钓鱼攻击,这起事件展示了 AI 时代安全风险的「连锁反应」。Anthropic 的一次打包失误,被黑客精准利用,转化为针对开发者的社会工程攻击。

对普通开发者的警示:

  1. 只通过官方渠道获取工具,不要下载「破解版」「泄露版」
  2. 不要运行来自未知渠道的二进制文件
  3. 对任何「解锁企业功能」的宣传保持警惕

更多动态

模型与产品

硬件与芯片

行业与政策

融资与商业

其他


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码