- Google发布Nano Banana 2图像模型:4K分辨率、修复中文乱码、支持5个角色一致性
- 英伟达Q4营收681亿美元,数据中心占比超90%,黄仁勋称Token经济已到来
- DeepSeek V4 Lite内测:百万token上下文+原生多模态,优先适配华为芯片
- 阿里千问3.5登顶HuggingFace开源榜单,全球下载量超10亿
- Perplexity Computer上线:AI从对话工具变"数字工作者",可自动完成工作流
- Anthropic收购Vercept强化计算机使用能力,发布RSP 3.0
- 百度2025年AI业务收入400亿元,文心助手月活2.02亿
- AI春招岗位需求激增14倍,大模型人才年薪最高超百万
- 肯德基上线AI点餐"小K",可语音完成点餐到支付全流程

大厂角力:图像模型、数据中心与AI安全
Nano Banana 2发布:Google图像生成进入4K时代
Google正式发布Nano Banana 2(Gemini 3.1 Flash Image)图像生成模型,这是继去年8月首版发布后的重大升级。该模型将Nano Banana Pro的高级世界知识、图像质量与Flash系列的极速处理能力融为一体。
核心升级包括:
- 分辨率突破:从2K提升至最高4K输出,修复了此前版本中常见的中文字符乱码问题
- 角色一致性:支持在多张图片中保持最多5个角色形象一致
- 元素融合:单张画面可融合多达14个元素
- 世界知识增强:利用Gemini实时网络搜索信息生成基于真实世界参考的图像
- 原生应用集成:已接入Gemini应用、Google搜索(覆盖140+国家)、Flow创意平台和Google Ads
深度解读: Nano Banana 2的发布标志着Google在图像生成领域发起新一轮攻势。通过将高端能力下放到Flash系列,Google正在降低开发者使用高级AI图像工具的门槛。更值得关注的是4K分辨率支持和中文乱码修复——这意味着中国开发者将获得更顺畅的使用体验。
英伟达Q4财报:营收681亿美元,数据中心业务占比超九成
英伟达发布2026财年第四季度财报,各项指标再创历史新高:
- 季度营收:681亿美元,同比增长73%,环比增长20%
- 全年营收:2159亿美元,首次突破2000亿美元大关
- 净利润:全年达到1200.67亿美元,日均盈利约22.6亿元
- 数据中心业务:第四季度营收623亿美元,同比增长75%,占总营收的91.5%
黄仁勋的核心观点:
- 全球对代币(Token)的需求已呈指数级增长,算力供给仍处于紧张状态
- 宣布与OpenAI的投资合作已接近达成,拟投资约300亿美元
- 反驳"AI冲击软件业"论调,称AI助手将提升软件效率而非取代
中国市场情况: 本季度未录得任何来自中国市场的收入。虽然美国政府批准少量H200出口至中国,但尚未产生收入。中国竞争对手如Moore Threads正在加速推进。
新品进展: 下一代Vera Rubin系统计划于今年晚些时候推出,每瓦性能是Blackwell的10倍,采用100%液冷散热,首批样品已交付客户。
Anthropic收购Vercept强化Claude计算机使用能力
Anthropic宣布收购初创公司Vercept,这是该公司继去年12月收购Bun之后的又一次重大并购。Vercept的Vy服务能远程操控MacBook完成复杂工作,其创始团队多数成员来自艾伦人工智能研究所。
收购意义: Vercept的技术将帮助Claude更准确地模拟人类在复杂操作系统中的交互方式,标志着Claude从对话机器人向能自主执行任务的"数字员工"转变。
深度解读: 这笔收购反映了AI行业的一个关键趋势——从"能说会道"到"能说会做"。计算机使用能力已成为AI模型竞争的核心战场,Anthropic正在通过并购快速补齐这一短板。
Anthropic发布 Responsible Scaling Policy 3.0
Anthropic发布第三代负责任扩展政策,对过去两年的实践进行反思和更新:
政策核心变化:
- 将"公司计划做什么"与"建议行业做什么"分开处理
- 引入"前沿安全路线图"机制,公开而非硬性承诺
- 推出"风险报告"制度,每3-6个月发布一次
- 设立外部审查机制,在特定情况下引入第三方评估
诚实评估: Anthropic坦承RSP的"能力阈值"在实际操作中存在模糊性,政府的AI安全监管推进速度低于预期。公司承认在更高能力水平上的安全措施可能需要多方协作才能实现。
中国动态:模型井喷与产业落地加速
DeepSeek V4技术细节曝光:百万token上下文+原生多模态
DeepSeek V4 Lite(代号"sealion-lite")正在内测,具备以下关键特性:
- 上下文窗口:100万tokens(相比V3.2的128K提升近8倍)
- 原生多模态:不是简单的插件叠加,而是深度融合
- 性能表现:非思考模式下生成的SVG图像明显优于V3.2思考模式
值得关注的是: DeepSeek在发布V4前未向英伟达、AMD提供预览,反而提前数周向包括华为在内的中国芯片供应商开放访问权限,以完成国产算力平台的适配优化。
深度解读: 这标志着中国大模型公司在"芯片自主可控"方面迈出实质性步伐。优先适配华为昇腾等国产芯片,既是应对美国出口管制的被动选择,也是国产AI算力生态崛起的重要信号。
阿里千问3.5登顶Hugging Face开源榜单
阿里千问3.5系列模型包揽Hugging Face最新开源大模型榜单前四位置,成为全球AI社区最热门开源模型:
- 三款中型模型刷新中等尺寸模型性能纪录
- 部分模型可直接部署在消费级显卡上
- 人类中级程序员需5小时完成的编程测试,Qwen3.5-35B-A3B仅用10分钟高分通过
- 累计下载量超10亿,衍生模型超20万,成为全球第一开源大模型
配套动作: 阿里云同步推出AI编程订阅服务,首月价格仅7.9元,并开源三款中等规模Qwen3.5模型。
百度2025年财报:AI业务收入400亿元
百度发布2025年财务报告,AI战略转型成效显著:
- 总营收:1291亿元
- AI业务收入:400亿元,占总营收的31%
- Q4 AI收入占比:已达一般性业务收入的43%
- AI云收入同比增长:34%
- 文心助手月活:2.02亿,春节期间同比增长4倍
- 萝卜快跑:第四季度全球出行服务340万次,同比增长超200%
文心5.0:参数规模达2.4万亿,采用原生全模态统一建模技术。
MiniMax发布Expert 2.0与MaxClaw
MiniMax宣布升级Agent架构,推出两项重要更新:
Expert 2.0:
- 用户只需用自然语言描述需求,系统自动完成知识注入、工作流编排与能力配置
- 平台已积累超1.6万个专家Agent
- 计划引入创作者分成机制和团队共享功能
MaxClaw:
- 基于OpenClaw构建的云端AI助手,开箱即用
- 无需自备服务器或API Key
- 打通了飞书、钉钉、Telegram等办公工具
- 提供50G专属云存储
深度解读: MiniMax的这两项更新标志着AI Agent正在从"工具"向"生产力平台"演进。通过降低创建门槛和提供云端部署,MiniMax正在构建一个AI Agent生态系统。
高盛首次覆盖MiniMax,估值389亿美元
高盛发布报告,首次覆盖中国全模态AI公司MiniMax,给出389亿美元估值:
- 核心竞争力:成本控制,调用成本只有海外同类产品的十分之一
- 商业表现:70%收入来自海外市场,成功实现技术全球化输出
- 收入预测:从2025年的7500万美元增长至2027年的9.8亿美元
小鹏人形机器人全链条量产基地落户广州
小鹏与广州天河区签署战略合作框架协议,计划在广棠科创城具身智能产业园建设人形机器人全链条量产基地:
- 一期工程:建设高标准机器人厂房、动力站房及相关配套设施
- 目标:2026年年底实现全球第一个规模量产的高阶人形机器人
- 技术基础:IRON机器人搭载3颗图灵AI芯片,总算力2250TOPS
AI应用落地:深入日常生活场景
Perplexity Computer上线:多模型协同自动完成工作流
Perplexity推出全新产品Perplexity Computer,将多款具备自主执行能力的AI模型整合为"通用数字工作者":
- 核心定位:能行动的系统,而非仅回答问题
- 运作方式:用户描述期望结果,系统自动拆解任务、生成执行步骤、分配给多个子代理
- 技术架构:以Claude Opus 4.6为核心,可调用19个模型(包括Gemini、Grok、ChatGPT 5.2、Nano Banana、Veo 3.1)
- 运行时间:可持续运行数小时甚至数月
- 定价:Max订阅套餐,每月200美元
深度解读: 这是AI从"对话工具"向"数字工作者"转变的标志性事件。Perplexity Computer的推出预示着,下一阶段AI竞争的核心将围绕"谁能更好地替代复杂知识型劳动"展开。
肯德基上线AI点餐Agent“小K”
肯德基App正式上线AI智能点餐Agent“小K”,基于阿里通义千问大模型:
- 核心能力:理解模糊需求(如"中午开会点个工作餐,一共10个人")、多轮修改保持高意图识别准确率
- 场景延伸:已集成到智能车机系统,支持语音点单和导航
- 记忆功能:可基于历史记录推荐用户喜欢的餐品
行业意义: 这标志着快餐巨头开始将AI能力作为核心竞争维度。继奈雪的茶、瑞幸之后,餐饮行业AI竞争持续升温。
Google翻译推出Gemini驱动的新功能
Google翻译上线由Gemini模型驱动的新功能:
- 深层语境理解:能够把握不同对话场景中的语气与语境
- 替代译法:提供多种翻译选择并解释适用场景
- 交互功能:新增"理解"和"提问"按钮,帮助用户深入了解译文的文化背景
- 当前覆盖:美国和印度移动端,网页版即将推出
汉堡王部署AI系统检测员工服务用语
汉堡王推出一款名为Patty的AI助手,部署在员工耳机中:
- 功能定位:协助餐品制作、分析员工与顾客交流时的友好程度
- 检测内容:识别"欢迎来到汉堡王"“请”"谢谢"等服务用语
- 技术支撑:基于OpenAI技术
- 推广计划:2026年底前推广至美国所有门店
更多动态
- AI人才需求:2026年春招AI岗位需求激增14倍,字节跳动豆包业务为大模型应用架构专家开出128万元年薪
- 阿里云编程服务:首月价格低至7.9元,打包四款国产大模型
- 谷歌整合Intrinsic:将AI机器人技术公司Intrinsic并入核心业务,聚焦智能制造
- 三星Galaxy S26系列:引入AI Agent功能,支持多AI引擎切换
- 华为云码道发布:公测版开放免费体验,聚焦工程化AI编码
- 演员王劲松AI侵权:发视频感叹AI生成视频已能以假乱真,引发肖像权担忧
- 加拿大警告OpenAI:要求加强安全协议,否则将立法强制整改
- 阶跃星辰计划上市:估值可能超过200亿元,最快今年内登陆港交所
- 自变量机器人获投数亿元:1个月内吸金十几亿元,上汽金控、美团龙珠等领投
- 可灵3.0登顶视频模型榜单:以1240分在全球视频大模型榜单中夺魁
- Inception Labs Mercury 2:扩散推理模型实现每秒1009个tokens生成速度
- 摩尔线程适配Qwen3.5:旗舰GPU MTT S5000完成三款新模型适配
