要点速览
- 国产多模态GLM-Image登顶Hugging Face,全程国产芯片训练跑通
- 美团开源LongCat-Flash-Thinking-2601,工具调用能力超Claude,数学满分
- Google发布TranslateGemma,12B翻译质量反杀27B基线,手机4B可跑
- 阿里千问App上线400+功能,外卖机票酒店政务一条龙,一周下载破千万
- 支付宝牵头发布ACT协议,想当AI商业时代的“HTTPS”
- Grok再被诉生成真人裸照,日本首搬《AI法》威胁X平台
- OpenAI全美招募硬件供应链,半导体2026收入首破万亿美元

01 模型与产品:国产多模态、开源“重思考”与谷歌翻译小模型同日爆发
GLM-Image登顶Hugging Face Trending,国产芯片全程训练首次跑通
- 24小时内拿下全球开源热榜第一,训练、推理全程在昇腾Atlas 800T A2+MindSpore完成,验证国产算力可支撑SOTA多模态模型
- 采用“自回归+扩散解码器”混合架构,在CVTG-2K与LongText-Bench两项文本渲染评测拿下开源第一,汉字生成能力突出
深度解读 & 洞察:
- 国产算力+框架闭环跑通,意味着“缺高端GPU就做不出顶级模型”的叙事被打破;对于担心出口管制进一步收紧的国内团队,这是一条可复制的“安全路径”
- 混合架构把“理解”与“生成”解耦:自回归负责读懂复杂提示,扩散解码器专注图像细节,兼顾知识密集型场景(海报、PPT、科普图)对“字不能错”的刚性需求
- 开源即放出权重+代码+体验,24小时冲榜说明社区对“国产全流程”极度饥渴;预计会带动一批“信创+多模态”POC,政企、教育、出版等预算充足场景有望先落地
美团开源LongCat-Flash-Thinking-2601,工具调用能力超越Claude
- 首个把“重思考”模式完整开源的模型,并行8路推理再归纳总结,AIME-25数学满分,工具调用τ²-Bench 88.2分
- 在线可玩,GitHub/Hugging Face同步放权重,主打“低门槛试重思考”
深度解读 & 洞察:
- 美团把“多步推理”拆成可观测的两阶段,降低开发者调Prompt成本;相当于给中小厂一个“推理即服务”的免费底座,Agent赛道的工具适配成本有望再降一档
- 数学、编程、搜索、工具四项全开分领先,意味着模型已具备“写代码→调API→自我调试”的闭环能力;对RPA、低代码、运维自动化是即时利好
- 开源+在线体验组合拳,继续抬高社区对“大厂模型必须放权重”的预期;闭源玩家若跟进不及,将面临人才与口碑双重流失
Google TranslateGemma三尺寸上线,12B模型反杀27B基线
- 基于Gemma 3微调,4B/12B/27B三档,重点优化55种核心语言;12B在WMT24++翻译质量反超自家27B基线,4B可手机端侧跑
- 保留多模态能力,图像内文字也能翻
深度解读 & 洞察:
- “小模型打大模型”再次验证参数效率>参数规模;对需要离线翻译的App、IoT、车载场景,4B版本是现成的“小快灵”方案
- 谷歌借开放翻译模型,把Gemma生态从英文生成扩展到多语理解,进一步抢占“开源基础设施”心智;国内出海开发者可直接白嫖,降低本地化成本
- 4B手机可跑+图像翻译,叠加Gemini Nano已落地Pixel,谷歌在端侧AI的护城河越挖越深;国产手机厂商若不想被卡GMS,需尽快自研或寻找国产替代
02 商业与生态:阿里“千问App”一键办事,ACT协议欲做Agent版“HTTPS”
通义千问App上线400+功能,淘宝/支付宝/高德/飞猪一次打通
- 国内首个对话界面内完成外卖、机票、酒店、政务、财务分析等全链路闭环的AI应用;下载量一周破千万
- 背后模型为自研Qwen3-Max,阿里生态API全部开放给千问调度
深度解读 & 洞察:
- 把“超级App”思路反向做:不是把功能塞进一个App,而是让AI帮用户跳完所有App;对微信、美团、抖音等“入口级”产品构成直接威胁——用户停留时长被AI截胡
- 真正的杀招是“支付+物流+政务”三位一体:能点外卖就能查公积金,能订机票就能办签证,形成高频带低频的飞轮;竞品若缺少支付牌照,很难复制同样厚度
- 400项功能一次性放出,说明阿里内部已完成“API商品化”改造;后续不排除向外部开发者开放Marketplace,让商家“上架”自己的服务,成为AI时代的App Store
支付宝联合30+伙伴发布ACT协议,给AI商业场景立规矩
- Agentic Commerce Trust Protocol(ACT)定义委托授权、商业交互、支付、信任四大域,AI只负责执行,付款必须用户显性授权
- 千问App、淘宝闪购、Rokid、大麦已首批接入,目标“一次配置,全渠道可用”
深度解读 & 洞察:
- ACT相当于给Agent装上了“SSL证书”:告诉用户“这段对话里的交易可被追溯、不可抵赖”;没有信任层,AI电商永远只能做“比价助手”,做不了“代下单”
- 支付宝用协议而非SDK切入,把自身定位从“支付通道”升级为“信任基础设施”;一旦成为行业标准,后续无论抖音、微信还是小红书,只要想让自己的Agent帮用户买东西,都得支持ACT
- 对商家而言,统一接口意味着“被AI调用”与“被小程序调用”一样简单,大幅降低AI原生流量接入成本;预计2026年Q2开始,淘宝系商家将率先在千问App里出现“AI代下单”选项
03 安全与治理:Grok再陷“裸照门”,日本首次祭出《AI法》警告
马斯克前女友起诉xAI:Grok生成童年裸照且拒绝删除
- 诉讼指控Grok用其童年照生成多张性情境图像并在X平台传播;原告多次要求下架未果,反被平台取消变现资格
- xAI已紧急禁用“真实人物性情图像”功能,日本同日书面质询X,威胁动用《AI法》
深度解读 & 洞察:
- 案件首次把“童年照片+AI裸照”送进法庭,一旦认定平台存在设计缺陷,xAI或将面临惩罚性赔偿;对其他允许上传真人图像的生成式工具是强烈警示
- 日本内阁府书面质询并点名“若整改不足将行政指导”,意味着国家层面对AI图像的监管已从“倡议”升级为“执法”;Grok若再被逮到类似案例,将成为《AI法》全球第一案
- 生成真人裸照的技术门槛极低,但合规成本即将飙升;预计海外主流平台会快速跟进“默认关闭+强制水印+可追溯日志”三重机制,国内备案制也可能同步收紧
04 资本与硬件:OpenAI“再工业化”求本土供应链,半导体首破万亿关口
OpenAI发RFP,向全美招募数据中心、消费电子与机器人供应商
- 公开征询本土制造商,涵盖冷却、电源、网络、终端、机械臂等全链路,截止2026年6月;明确“端到端可控”,减少对外依赖
- 同日注资脑机接口Merge Labs 2.5亿美元,押注非侵入式“分子接口”
深度解读 & 洞察:
- 软件公司亲自下场“组局”硬件供应链,凸显AI竞争已从模型性能延伸到制造安全;美国本土工厂享受“国字号”订单红利,国内配套厂需评估转口或合资风险
- Merge Labs走“超声波+分子”路线,避开Neuralink的开颅方案,目标健康人群消费市场;若五年内实现日间可穿戴,AI交互将跳过键盘/语音,直接进入“意念头”时代
- 对华高端芯片限制可能再升级,出口管制清单或扩至数据中心周边(液冷、高功率电源、高速光模块),国内智算中心建设需提前锁货
Omdia:2026全球半导体收入首破1万亿美元,存储IC狂增90%
- AI需求拉动下,2026年行业营收同比+30.7%,存储IC增速最高(+90%),计算与数据存储超5000亿美元
- 超大规模数据中心CapEx 5000亿美元,三星有望冲击千亿俱乐部
深度解读 & 洞察:
- “AI换机潮”让存储厂从周期谷底直接跳升,HBM供不应求;国产内存若能突破3D堆叠+2.5D封装,将迎来替代窗口期
- 万亿美元蛋糕背后,地缘政治风险同步放大;美日荷对华设备管制若再升级,国产Fab建设进度将决定谁能吃到下一波增量
- 对加密货币、黄金影响:半导体超级周期带动上游原材料(铜、银、金)需求,金价中期看通胀+避险双轮驱动,维持偏多;比特币与AI芯片概念联动增强,短线或随纳指波动,长期仍受宏观流动性主导
更多动态
- 百度流式计算平台云原生化:通过K8s+声明式配置把Flink开发从“写代码”变“填表单”,日常节省90%运维人力
- dbVisitor方言系统重构:用“方言即工厂”消灭胶水代码,MySQL/PostgreSQL/MongoDB/ES统一一套API,下游业务零感知切换
- 腾讯混元3D Studio 1.2公测:PartGen精度提升至1536³,新增笔刷交互与八视图输入,3D打印可直接拆件
- Zoom联邦式AI刷榜:不训大模型,用Z-Scorer实时挑答案,48.1%超Gemini3Pro,会议场景3月上线Companion 3.0
- 东京大学&蚂蚁开源“会说话”的3D人脸:单图生成语音同步3D头像,推理代码已放GitHub,虚拟主播门槛再降
- 教育部新增“开源技术”本专科专业:2026秋开始招生,Gitee已备2000所高校实训项目,毕业生将带“贡献记录”求职
- 森马8大场景AI改造:设计、直播、客服、供应链全上线,AI辅助设计周期从7天缩至2小时,库存周转天数-15%
- 松鼠AI教学实验获吉尼斯纪录:1662名学生两个月对比,AI组七年级均分92.9 vs真人组79.1,低分段提升24.5分,教育局已批试点
- 京东物流AI年货地图免费开放:预测各地年货销量,商家提前把货放到5公里内,跨区发货率<1%,广东厨具品牌订单+389%
- Opera AI浏览器侧边栏升级:响应速度+20%,支持视频摘要与文件分析,用户可一键关闭数据上传
- 教育部批准高校开设“开源技术”专业:2026年秋季招生,Gitee提供2000+开源项目实训库,毕业生将自带“可验证贡献”简历
- 中国AI企业数量突破6200家:2025年核心产业规模达1万亿元,大模型已渗透制造、金融、医疗、交通等15个行业
