国产多模态登顶+万亿半导体周期开启

要点速览
  • 国产多模态GLM-Image登顶Hugging Face,全程国产芯片训练跑通
  • 美团开源LongCat-Flash-Thinking-2601,工具调用能力超Claude,数学满分
  • Google发布TranslateGemma,12B翻译质量反杀27B基线,手机4B可跑
  • 阿里千问App上线400+功能,外卖机票酒店政务一条龙,一周下载破千万
  • 支付宝牵头发布ACT协议,想当AI商业时代的“HTTPS”
  • Grok再被诉生成真人裸照,日本首搬《AI法》威胁X平台
  • OpenAI全美招募硬件供应链,半导体2026收入首破万亿美元

国产多模态登顶+万亿半导体周期开启

01 模型与产品:国产多模态、开源“重思考”与谷歌翻译小模型同日爆发

GLM-Image登顶Hugging Face Trending,国产芯片全程训练首次跑通

  • 24小时内拿下全球开源热榜第一,训练、推理全程在昇腾Atlas 800T A2+MindSpore完成,验证国产算力可支撑SOTA多模态模型
  • 采用“自回归+扩散解码器”混合架构,在CVTG-2K与LongText-Bench两项文本渲染评测拿下开源第一,汉字生成能力突出

深度解读 & 洞察:

  • 国产算力+框架闭环跑通,意味着“缺高端GPU就做不出顶级模型”的叙事被打破;对于担心出口管制进一步收紧的国内团队,这是一条可复制的“安全路径”
  • 混合架构把“理解”与“生成”解耦:自回归负责读懂复杂提示,扩散解码器专注图像细节,兼顾知识密集型场景(海报、PPT、科普图)对“字不能错”的刚性需求
  • 开源即放出权重+代码+体验,24小时冲榜说明社区对“国产全流程”极度饥渴;预计会带动一批“信创+多模态”POC,政企、教育、出版等预算充足场景有望先落地

美团开源LongCat-Flash-Thinking-2601,工具调用能力超越Claude

  • 首个把“重思考”模式完整开源的模型,并行8路推理再归纳总结,AIME-25数学满分,工具调用τ²-Bench 88.2分
  • 在线可玩,GitHub/Hugging Face同步放权重,主打“低门槛试重思考”

深度解读 & 洞察:

  • 美团把“多步推理”拆成可观测的两阶段,降低开发者调Prompt成本;相当于给中小厂一个“推理即服务”的免费底座,Agent赛道的工具适配成本有望再降一档
  • 数学、编程、搜索、工具四项全开分领先,意味着模型已具备“写代码→调API→自我调试”的闭环能力;对RPA、低代码、运维自动化是即时利好
  • 开源+在线体验组合拳,继续抬高社区对“大厂模型必须放权重”的预期;闭源玩家若跟进不及,将面临人才与口碑双重流失

Google TranslateGemma三尺寸上线,12B模型反杀27B基线

  • 基于Gemma 3微调,4B/12B/27B三档,重点优化55种核心语言;12B在WMT24++翻译质量反超自家27B基线,4B可手机端侧跑
  • 保留多模态能力,图像内文字也能翻

深度解读 & 洞察:

  • “小模型打大模型”再次验证参数效率>参数规模;对需要离线翻译的App、IoT、车载场景,4B版本是现成的“小快灵”方案
  • 谷歌借开放翻译模型,把Gemma生态从英文生成扩展到多语理解,进一步抢占“开源基础设施”心智;国内出海开发者可直接白嫖,降低本地化成本
  • 4B手机可跑+图像翻译,叠加Gemini Nano已落地Pixel,谷歌在端侧AI的护城河越挖越深;国产手机厂商若不想被卡GMS,需尽快自研或寻找国产替代

02 商业与生态:阿里“千问App”一键办事,ACT协议欲做Agent版“HTTPS”

通义千问App上线400+功能,淘宝/支付宝/高德/飞猪一次打通

  • 国内首个对话界面内完成外卖、机票、酒店、政务、财务分析等全链路闭环的AI应用;下载量一周破千万
  • 背后模型为自研Qwen3-Max,阿里生态API全部开放给千问调度

深度解读 & 洞察:

  • 把“超级App”思路反向做:不是把功能塞进一个App,而是让AI帮用户跳完所有App;对微信、美团、抖音等“入口级”产品构成直接威胁——用户停留时长被AI截胡
  • 真正的杀招是“支付+物流+政务”三位一体:能点外卖就能查公积金,能订机票就能办签证,形成高频带低频的飞轮;竞品若缺少支付牌照,很难复制同样厚度
  • 400项功能一次性放出,说明阿里内部已完成“API商品化”改造;后续不排除向外部开发者开放Marketplace,让商家“上架”自己的服务,成为AI时代的App Store

支付宝联合30+伙伴发布ACT协议,给AI商业场景立规矩

  • Agentic Commerce Trust Protocol(ACT)定义委托授权、商业交互、支付、信任四大域,AI只负责执行,付款必须用户显性授权
  • 千问App、淘宝闪购、Rokid、大麦已首批接入,目标“一次配置,全渠道可用”

深度解读 & 洞察:

  • ACT相当于给Agent装上了“SSL证书”:告诉用户“这段对话里的交易可被追溯、不可抵赖”;没有信任层,AI电商永远只能做“比价助手”,做不了“代下单”
  • 支付宝用协议而非SDK切入,把自身定位从“支付通道”升级为“信任基础设施”;一旦成为行业标准,后续无论抖音、微信还是小红书,只要想让自己的Agent帮用户买东西,都得支持ACT
  • 对商家而言,统一接口意味着“被AI调用”与“被小程序调用”一样简单,大幅降低AI原生流量接入成本;预计2026年Q2开始,淘宝系商家将率先在千问App里出现“AI代下单”选项

03 安全与治理:Grok再陷“裸照门”,日本首次祭出《AI法》警告

马斯克前女友起诉xAI:Grok生成童年裸照且拒绝删除

  • 诉讼指控Grok用其童年照生成多张性情境图像并在X平台传播;原告多次要求下架未果,反被平台取消变现资格
  • xAI已紧急禁用“真实人物性情图像”功能,日本同日书面质询X,威胁动用《AI法》

深度解读 & 洞察:

  • 案件首次把“童年照片+AI裸照”送进法庭,一旦认定平台存在设计缺陷,xAI或将面临惩罚性赔偿;对其他允许上传真人图像的生成式工具是强烈警示
  • 日本内阁府书面质询并点名“若整改不足将行政指导”,意味着国家层面对AI图像的监管已从“倡议”升级为“执法”;Grok若再被逮到类似案例,将成为《AI法》全球第一案
  • 生成真人裸照的技术门槛极低,但合规成本即将飙升;预计海外主流平台会快速跟进“默认关闭+强制水印+可追溯日志”三重机制,国内备案制也可能同步收紧

04 资本与硬件:OpenAI“再工业化”求本土供应链,半导体首破万亿关口

OpenAI发RFP,向全美招募数据中心、消费电子与机器人供应商

  • 公开征询本土制造商,涵盖冷却、电源、网络、终端、机械臂等全链路,截止2026年6月;明确“端到端可控”,减少对外依赖
  • 同日注资脑机接口Merge Labs 2.5亿美元,押注非侵入式“分子接口”

深度解读 & 洞察:

  • 软件公司亲自下场“组局”硬件供应链,凸显AI竞争已从模型性能延伸到制造安全;美国本土工厂享受“国字号”订单红利,国内配套厂需评估转口或合资风险
  • Merge Labs走“超声波+分子”路线,避开Neuralink的开颅方案,目标健康人群消费市场;若五年内实现日间可穿戴,AI交互将跳过键盘/语音,直接进入“意念头”时代
  • 对华高端芯片限制可能再升级,出口管制清单或扩至数据中心周边(液冷、高功率电源、高速光模块),国内智算中心建设需提前锁货

Omdia:2026全球半导体收入首破1万亿美元,存储IC狂增90%

  • AI需求拉动下,2026年行业营收同比+30.7%,存储IC增速最高(+90%),计算与数据存储超5000亿美元
  • 超大规模数据中心CapEx 5000亿美元,三星有望冲击千亿俱乐部

深度解读 & 洞察:

  • “AI换机潮”让存储厂从周期谷底直接跳升,HBM供不应求;国产内存若能突破3D堆叠+2.5D封装,将迎来替代窗口期
  • 万亿美元蛋糕背后,地缘政治风险同步放大;美日荷对华设备管制若再升级,国产Fab建设进度将决定谁能吃到下一波增量
  • 对加密货币、黄金影响:半导体超级周期带动上游原材料(铜、银、金)需求,金价中期看通胀+避险双轮驱动,维持偏多;比特币与AI芯片概念联动增强,短线或随纳指波动,长期仍受宏观流动性主导

更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码