AI军备竞赛升级:大厂狂飙4K图像与千亿算力,国产模型批量井喷

要点速览
  • Google发布Nano Banana 2图像模型:4K分辨率、修复中文乱码、支持5个角色一致性
  • 英伟达Q4营收681亿美元,数据中心占比超90%,黄仁勋称Token经济已到来
  • DeepSeek V4 Lite内测:百万token上下文+原生多模态,优先适配华为芯片
  • 阿里千问3.5登顶HuggingFace开源榜单,全球下载量超10亿
  • Perplexity Computer上线:AI从对话工具变"数字工作者",可自动完成工作流
  • Anthropic收购Vercept强化计算机使用能力,发布RSP 3.0
  • 百度2025年AI业务收入400亿元,文心助手月活2.02亿
  • AI春招岗位需求激增14倍,大模型人才年薪最高超百万
  • 肯德基上线AI点餐"小K",可语音完成点餐到支付全流程

AI军备竞赛升级:大厂狂飙4K图像与千亿算力,国产模型批量井喷

大厂角力:图像模型、数据中心与AI安全

Nano Banana 2发布:Google图像生成进入4K时代

Google正式发布Nano Banana 2(Gemini 3.1 Flash Image)图像生成模型,这是继去年8月首版发布后的重大升级。该模型将Nano Banana Pro的高级世界知识、图像质量与Flash系列的极速处理能力融为一体。

核心升级包括:

  • 分辨率突破:从2K提升至最高4K输出,修复了此前版本中常见的中文字符乱码问题
  • 角色一致性:支持在多张图片中保持最多5个角色形象一致
  • 元素融合:单张画面可融合多达14个元素
  • 世界知识增强:利用Gemini实时网络搜索信息生成基于真实世界参考的图像
  • 原生应用集成:已接入Gemini应用、Google搜索(覆盖140+国家)、Flow创意平台和Google Ads

深度解读: Nano Banana 2的发布标志着Google在图像生成领域发起新一轮攻势。通过将高端能力下放到Flash系列,Google正在降低开发者使用高级AI图像工具的门槛。更值得关注的是4K分辨率支持和中文乱码修复——这意味着中国开发者将获得更顺畅的使用体验。


英伟达Q4财报:营收681亿美元,数据中心业务占比超九成

英伟达发布2026财年第四季度财报,各项指标再创历史新高:

  • 季度营收:681亿美元,同比增长73%,环比增长20%
  • 全年营收:2159亿美元,首次突破2000亿美元大关
  • 净利润:全年达到1200.67亿美元,日均盈利约22.6亿元
  • 数据中心业务:第四季度营收623亿美元,同比增长75%,占总营收的91.5%

黄仁勋的核心观点:

  • 全球对代币(Token)的需求已呈指数级增长,算力供给仍处于紧张状态
  • 宣布与OpenAI的投资合作已接近达成,拟投资约300亿美元
  • 反驳"AI冲击软件业"论调,称AI助手将提升软件效率而非取代

中国市场情况: 本季度未录得任何来自中国市场的收入。虽然美国政府批准少量H200出口至中国,但尚未产生收入。中国竞争对手如Moore Threads正在加速推进。

新品进展: 下一代Vera Rubin系统计划于今年晚些时候推出,每瓦性能是Blackwell的10倍,采用100%液冷散热,首批样品已交付客户。


Anthropic收购Vercept强化Claude计算机使用能力

Anthropic宣布收购初创公司Vercept,这是该公司继去年12月收购Bun之后的又一次重大并购。Vercept的Vy服务能远程操控MacBook完成复杂工作,其创始团队多数成员来自艾伦人工智能研究所。

收购意义: Vercept的技术将帮助Claude更准确地模拟人类在复杂操作系统中的交互方式,标志着Claude从对话机器人向能自主执行任务的"数字员工"转变。

深度解读: 这笔收购反映了AI行业的一个关键趋势——从"能说会道"到"能说会做"。计算机使用能力已成为AI模型竞争的核心战场,Anthropic正在通过并购快速补齐这一短板。


Anthropic发布 Responsible Scaling Policy 3.0

Anthropic发布第三代负责任扩展政策,对过去两年的实践进行反思和更新:

政策核心变化:

  • 将"公司计划做什么"与"建议行业做什么"分开处理
  • 引入"前沿安全路线图"机制,公开而非硬性承诺
  • 推出"风险报告"制度,每3-6个月发布一次
  • 设立外部审查机制,在特定情况下引入第三方评估

诚实评估: Anthropic坦承RSP的"能力阈值"在实际操作中存在模糊性,政府的AI安全监管推进速度低于预期。公司承认在更高能力水平上的安全措施可能需要多方协作才能实现。


中国动态:模型井喷与产业落地加速

DeepSeek V4技术细节曝光:百万token上下文+原生多模态

DeepSeek V4 Lite(代号"sealion-lite")正在内测,具备以下关键特性:

  • 上下文窗口:100万tokens(相比V3.2的128K提升近8倍)
  • 原生多模态:不是简单的插件叠加,而是深度融合
  • 性能表现:非思考模式下生成的SVG图像明显优于V3.2思考模式

值得关注的是: DeepSeek在发布V4前未向英伟达、AMD提供预览,反而提前数周向包括华为在内的中国芯片供应商开放访问权限,以完成国产算力平台的适配优化。

深度解读: 这标志着中国大模型公司在"芯片自主可控"方面迈出实质性步伐。优先适配华为昇腾等国产芯片,既是应对美国出口管制的被动选择,也是国产AI算力生态崛起的重要信号。


阿里千问3.5登顶Hugging Face开源榜单

阿里千问3.5系列模型包揽Hugging Face最新开源大模型榜单前四位置,成为全球AI社区最热门开源模型:

  • 三款中型模型刷新中等尺寸模型性能纪录
  • 部分模型可直接部署在消费级显卡上
  • 人类中级程序员需5小时完成的编程测试,Qwen3.5-35B-A3B仅用10分钟高分通过
  • 累计下载量超10亿,衍生模型超20万,成为全球第一开源大模型

配套动作: 阿里云同步推出AI编程订阅服务,首月价格仅7.9元,并开源三款中等规模Qwen3.5模型。


百度2025年财报:AI业务收入400亿元

百度发布2025年财务报告,AI战略转型成效显著:

  • 总营收:1291亿元
  • AI业务收入:400亿元,占总营收的31%
  • Q4 AI收入占比:已达一般性业务收入的43%
  • AI云收入同比增长:34%
  • 文心助手月活:2.02亿,春节期间同比增长4倍
  • 萝卜快跑:第四季度全球出行服务340万次,同比增长超200%

文心5.0:参数规模达2.4万亿,采用原生全模态统一建模技术。


MiniMax发布Expert 2.0与MaxClaw

MiniMax宣布升级Agent架构,推出两项重要更新:

Expert 2.0:

  • 用户只需用自然语言描述需求,系统自动完成知识注入、工作流编排与能力配置
  • 平台已积累超1.6万个专家Agent
  • 计划引入创作者分成机制和团队共享功能

MaxClaw:

  • 基于OpenClaw构建的云端AI助手,开箱即用
  • 无需自备服务器或API Key
  • 打通了飞书、钉钉、Telegram等办公工具
  • 提供50G专属云存储

深度解读: MiniMax的这两项更新标志着AI Agent正在从"工具"向"生产力平台"演进。通过降低创建门槛和提供云端部署,MiniMax正在构建一个AI Agent生态系统。


高盛首次覆盖MiniMax,估值389亿美元

高盛发布报告,首次覆盖中国全模态AI公司MiniMax,给出389亿美元估值:

  • 核心竞争力:成本控制,调用成本只有海外同类产品的十分之一
  • 商业表现:70%收入来自海外市场,成功实现技术全球化输出
  • 收入预测:从2025年的7500万美元增长至2027年的9.8亿美元

小鹏人形机器人全链条量产基地落户广州

小鹏与广州天河区签署战略合作框架协议,计划在广棠科创城具身智能产业园建设人形机器人全链条量产基地:

  • 一期工程:建设高标准机器人厂房、动力站房及相关配套设施
  • 目标:2026年年底实现全球第一个规模量产的高阶人形机器人
  • 技术基础:IRON机器人搭载3颗图灵AI芯片,总算力2250TOPS

AI应用落地:深入日常生活场景

Perplexity Computer上线:多模型协同自动完成工作流

Perplexity推出全新产品Perplexity Computer,将多款具备自主执行能力的AI模型整合为"通用数字工作者":

  • 核心定位:能行动的系统,而非仅回答问题
  • 运作方式:用户描述期望结果,系统自动拆解任务、生成执行步骤、分配给多个子代理
  • 技术架构:以Claude Opus 4.6为核心,可调用19个模型(包括Gemini、Grok、ChatGPT 5.2、Nano Banana、Veo 3.1)
  • 运行时间:可持续运行数小时甚至数月
  • 定价:Max订阅套餐,每月200美元

深度解读: 这是AI从"对话工具"向"数字工作者"转变的标志性事件。Perplexity Computer的推出预示着,下一阶段AI竞争的核心将围绕"谁能更好地替代复杂知识型劳动"展开。


肯德基上线AI点餐Agent“小K”

肯德基App正式上线AI智能点餐Agent“小K”,基于阿里通义千问大模型:

  • 核心能力:理解模糊需求(如"中午开会点个工作餐,一共10个人")、多轮修改保持高意图识别准确率
  • 场景延伸:已集成到智能车机系统,支持语音点单和导航
  • 记忆功能:可基于历史记录推荐用户喜欢的餐品

行业意义: 这标志着快餐巨头开始将AI能力作为核心竞争维度。继奈雪的茶、瑞幸之后,餐饮行业AI竞争持续升温。


Google翻译推出Gemini驱动的新功能

Google翻译上线由Gemini模型驱动的新功能:

  • 深层语境理解:能够把握不同对话场景中的语气与语境
  • 替代译法:提供多种翻译选择并解释适用场景
  • 交互功能:新增"理解"和"提问"按钮,帮助用户深入了解译文的文化背景
  • 当前覆盖:美国和印度移动端,网页版即将推出

汉堡王部署AI系统检测员工服务用语

汉堡王推出一款名为Patty的AI助手,部署在员工耳机中:

  • 功能定位:协助餐品制作、分析员工与顾客交流时的友好程度
  • 检测内容:识别"欢迎来到汉堡王"“请”"谢谢"等服务用语
  • 技术支撑:基于OpenAI技术
  • 推广计划:2026年底前推广至美国所有门店

更多动态

  • AI人才需求:2026年春招AI岗位需求激增14倍,字节跳动豆包业务为大模型应用架构专家开出128万元年薪
  • 阿里云编程服务:首月价格低至7.9元,打包四款国产大模型
  • 谷歌整合Intrinsic:将AI机器人技术公司Intrinsic并入核心业务,聚焦智能制造
  • 三星Galaxy S26系列:引入AI Agent功能,支持多AI引擎切换
  • 华为云码道发布:公测版开放免费体验,聚焦工程化AI编码
  • 演员王劲松AI侵权:发视频感叹AI生成视频已能以假乱真,引发肖像权担忧
  • 加拿大警告OpenAI:要求加强安全协议,否则将立法强制整改
  • 阶跃星辰计划上市:估值可能超过200亿元,最快今年内登陆港交所
  • 自变量机器人获投数亿元:1个月内吸金十几亿元,上汽金控、美团龙珠等领投
  • 可灵3.0登顶视频模型榜单:以1240分在全球视频大模型榜单中夺魁
  • Inception Labs Mercury 2:扩散推理模型实现每秒1009个tokens生成速度
  • 摩尔线程适配Qwen3.5:旗舰GPU MTT S5000完成三款新模型适配

想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码