要点速览
- RelayLLM 让小模型打前阵,大模型只处理 1% 关键 token,成本砍 98%
- MiniMax 港股上市 4 年闪电敲钟,开盘暴涨 42%,认购狂飙 1837 倍
- OpenAI 联手软银砸 10 亿美元建 1.2 GW 德州数据中心,AI 电厂模式启动
- 美国首次允许 AI 无人类监督开处方药,医疗决策权让渡算法
- 英国警告 X:Grok 不雅图泛滥或遭封禁,印尼已全球首禁该聊天机器人
- 奇瑞机器人交警“芜优”正式上岗,24 小时站岗开罚单
- 雷蛇宣布 6 亿美元 All in 物理 AI,Project Motoko 头显+全息伙伴亮相 CES
- CES 主论调转向“物理 AI”,端侧芯片、人形机器人成焦点,家用仆人仍需等 3 年
- Gmail 集成 Gemini,写邮件、摘要、模仿语气一键完成
- 阿里云×听力熊推出儿童 AI 玩伴 Mooni M1,情绪识别+内容过滤双保险

AI 记忆与推理新范式:让模型像人类一样“事件化”思考
CompassMem框架 受事件分割理论启发,把记忆拆成一张张“事件图谱”,再按目标导航,LoCoMo 和 NarrativeQA 成绩直接拉高。
深度解读 & 洞察:
- 传统大模型像“背词典”,CompassMem 让它像人类一样把经历切成一段段“故事”,再画成地图,想回忆时按图索骥,检索+推理一步到位。
- 事件图谱把“时间线”转成“因果关系网”,模型能反向追溯、正向推演,适合做长文档问答、法律卷宗分析等强逻辑场景。
- 如果后续开源,中小团队可低成本获得“结构化记忆”能力,不用再硬卷参数规模。
模型效率革命:小模型当“守门员”,大模型只打“关键球”
RelayLLM 提出“接力式”推理:小模型先跑 98% 的 token,拿不准再叫大模型救场,六个基准平均准确率 49.5%,成本暴降 98%。
深度解读 & 洞察:
- 把大模型当“专家门诊”,小模型当“社区医院”,日常问题社区解决,疑难杂症再转诊,token 花费立省两位小数。
- 对创业公司最友好:API 账单直接砍到 1/50,照样能用 GPT-4 级别的深度能力做客服、代码生成。
- 思路可迁移到多模态:小视觉模型先筛图,大模型再细看,推理成本同样指数级下降。
资本热浪:MiniMax 创港股最快 IPO,AI 基建再吞 10 亿美元
MiniMax 挂牌港交所 开盘暴涨 42%,公开发售超购 1837 倍,从成立到敲钟仅四年,刷新纪录。
深度解读 & 洞察:
- 港股市场首迎“原生大模型”标的,资金饥渴程度堪比当年互联网泡沫,短线情绪>基本面,波动会极大。
- 超购倍数说明二级市场极度缺“纯 AI 故事”,后续排队企业(面壁、智谱、月之暗面)大概率跟进上市窗口。
- 对 A 股映射最直接:引力传媒等“情绪股”继续涨停,但业绩兑现仍需观察模型落地速度。
影响:
- 中概 AI 板块短线利多,情绪外溢至港股/A 股相关 ETF;警惕高位回调风险,追高易被割。
OpenAI 联手软银向 SB Energy 各投 5 亿美元 共建 1.2 GW 德州数据中心,2026 年上线。
深度解读 & 洞察:
- 这是 Altman“AI 电厂”拼图的第一块落地:自建绿电+定制机房,把训练成本锁成固定资产,长期摊薄 Token 价格。
- 非排他合作意味着软银还能拉更多模型公司进场,形成“能源-算力-模型”三角联盟,抬高行业门槛。
- 对北美风光储产业链构成实质性订单,特斯拉、First Solar 等上游受益。
影响:
- 利好北美风光储板块,短线资金或炒作“AI 电厂”概念;算力基建 REITs 估值模型有望重估。
物理 AI 登陆 CES:机器人当交警、戴森做伙伴,但“仆人进家门”还要再等
奇瑞墨甲“芜优”智警 R001 正式在芜湖路口执勤,能识别违章+指挥交通,24 小时不下班。
深度解读 & 洞察:
- 首个“持证上岗”机器人交警,意味着市政场景 Robot 已突破政策红线,后续城管、环卫、消防等编制或陆续开放。
- 公安系统自带预算+招标体系,商业模式清晰:卖硬件+运维合同,比 To C 家用机器人回款更快。
- 标杆案例一旦跑通,合肥、深圳等地将迅速复制,带动国产伺服电机、激光雷达二次放量。
雷蛇宣布 6 亿美元 AI 投入 并亮出 Project Motoko 可穿戴头显、Project AVA 3D 全息伙伴等概念硬件。
深度解读 & 洞察:
- 游戏外设厂商“跨界”做物理 AI,核心是把电竞场景积累的传感器、触觉反馈、RGB 交互迁移到下一代空间计算。
- 6 亿美元预算≮ 1/3 市值,激进程度堪比 2014 年 Facebook 收购 Oculus,成败将重新定义雷蛇估值锚点。
- 招聘 150 名 AI 科学家,直接对标苹果 Vision Pro 团队,人才争夺战再升温。
影响:
- 雷蛇短线情绪提振,但硬件落地需 12–18 个月验证;上游 MEMS 惯导、 micro-OLED 板块获新增订单预期。
“物理 AI”成 CES 主赛道 Arm、LG、联想、Meta、谷歌集体展示机器人与端侧芯片,但亲民级“家庭仆人”仍受限于成本与电池。
深度解读 & 洞察:
- 软件红利见顶,大厂把战场搬到“原子世界”,谁能先把大模型塞进低功耗 SoC,谁就掌握下一波定价权。
- 端侧算力需求爆发,英特尔 Panther Lake、AMD AI PC 新品主打 NPU 本地化,直接对标高通 Snapdragon X Elite。
- 消费者感知仍弱,多数产品属于“AI 贴牌”,真正的 killer app 要等 2027 年后成本曲线打平。
场景落地:儿童 AI 玩伴、Gmail 智能写手、故事互动小程序齐上线
- Mooni M1 儿童 AI 玩伴:阿里云×听力熊,情绪识别+内容过滤,家长可监听通话,教育硬件再细分。
- Gmail 集成 Gemini:摘要、写草稿、模仿语气+表情包,邮箱变成“AI 秘书”,Google One AI Premium 订阅渗透率有望再提升。
- 腾讯测试“上头蛙”AI 故事互动小程序:用户用选择驱动 AI 续写,影视 IP 二创新场景,或成微信生态内“互动小说”流量入口。
合规与伦理:美国首放“AI 处方权”,英国印尼连环封 Grok
美国犹他州试点 AI 无监督开药 前 250 次需医生复核,随后 AI 可独立续方,10% 随机抽检。
深度解读 & 洞察:
- 首次把“临床决策权”让渡给算法,医疗 AI 从“辅助”跃级“主责”,若事故率低于人类医生,其他州将快速跟进。
- 责任界定空白:出现副作用时,患者起诉对象是软件公司、医院还是州政府?判例法需要 2–3 年才能跑通。
- 利好电子处方、药物数据库服务商,Surescripts、Epic 等中间平台订单看涨。
影响:
- 医疗 AI 概念股(Teladoc、Doximity)短线冲高;长期需观察医疗责任险定价模型是否把 AI 处方纳入承保范围。
英国警告 X:Grok 不雅图“失控”或遭封禁 印尼已率先屏蔽 Grok 聊天机器人。
深度解读 & 洞察:
- 两周内第二起国家级封禁,X 平台面临《网络安全法》最重罚款甚至 App 下架,马斯克必须在“言论自由”与“合规成本”之间二选一。
- Grok 深度集成 X 内容库,一旦收紧过滤,训练数据质量下降,可能削弱“实时梗”优势,用户回流 ChatGPT。
- 多国联动监管示范效应:欧盟、印度、巴西正在审议同类法案,生成式 AI 的“合规红利期”正式结束。
影响:
- X 如遭屏蔽,广告收入将再受重创;利好 Meta Threads、Bluesky 等竞品;AI 内容审核外包需求爆发,利好 Besedo、Spectrum Labs 等厂商。
大佬声音:盖茨再敲生物 AI 警钟,黄仁勋怒怼“末日论”
- 比尔·盖茨:AI 可被用于设计生物恐怖武器,社会准备度远远不够,呼吁政府提前演练大流行级应急响应。
- 黄仁勋:末日叙事吓跑投资,反而让 AI 更危险;芯片卖一波,软件需终身维护,Rubin 平台 100% 液冷+模块化,目标把数据中心电力利用率拉到 100%。
其他动态
- Claude Code 连发三版 2.1.0→2.1.2,新增 Shift+Enter 换行、钩子、会话传送,编程 Agent 工具链再完善。
- xAI Grok Build 初版上线:CLI+自然语言构建,本地代理形态,剑指开发者自动化工作流。
- Agentic Retoucher 三代理循环修图,27K 瑕疵数据集,生成图像后期一键“PS”级精修。
- MT-Video-Bench 发布千轮视频对话评测,主流多轮交互模型被打出显著差距,为下一轮 MLLM 优化指路。
- NetBird 开源 WireGuard 组网, SSO+MFA 企业级安全,自托管 VPN 新选择。
- 字节开源 UI-TARS-desktop:桌面端多模态 Agent 框架,一键调用视觉模型点按钮、拖文件,RPA 玩家福音。
- ConvertX 自托管格式转换神器,1000+ 格式互转,数据不出本地,隐私合规利器。
- Shadowrocket 规则库 每日自动更新,广告过滤效果持续提升,科学上网用户必备。
- 吴恩达 劝开发者别急着“裸实战”,系统课+论文+Agentic Coder 才是提效三件套。
- Figma CEO 再谈创意:AI 适合快速迭代部分,长期作品仍需人类匠心,软件核心体验别乱改。
- Vercel 正式赞助 Tailwind CSS:称其为基础 Web 设施,前端工具链再抱团。
- Anthropic 辟谣“封号报警”截图系伪造,提醒用户勿被流量恶作剧带节奏。
- Gemini CLI v0.23.0 预览 Agent Skills,npm 即装即玩,Google 开发者生态再补一刀。
- 歸藏演示 PPT 生成 Skills:任意文档→选风格→导出网页预览,图文混排 Agent 拼图完成。
- code-simplifier 代理开源:Boris 团队内部提示词放出,一键给代码“瘦身”,维护噩梦有救了。
- MENTOR 框架 用元认知自我纠错,动态规则图谱随风险演进,推理合规逼近人类专家。
- Step-Audio 2 端到端语音架构 0.7 秒响应,CES 首秀,ASR+LLM+TTS 三合一,人机对话再提速。
