- 火山引擎推AgentKit,谭待称未来计算单元将转向智能体
- MiniMax和智谱双双通过港交所聆讯,冲刺“大模型第一股”
- OpenAI算力利润率飙升至70%,商业化效率显著提升
- 谷歌推出A2UI开放标准,让AI能自动生成图形界面
- Anthropic发布Claude“技能”开放标准,推动AI向任务型智能体演进
- 英伟达开源通用游戏智能体NitroGen,可玩1000+款游戏
- 旧金山大停电致Waymo数百辆无人车瘫痪,暴露自动驾驶脆弱性
- AI导致美国大企业裁员近5.5万人,创2020年以来新高

智能体成为AI新范式:巨头加速布局
火山引擎推AgentKit,谭待:未来计算单元将从App转向智能体
火山引擎在2025年末提出AI演进新范式:智能Agent(智能体)将成为AI落地的核心载体。公司推出AgentKit开发套件,强调多模态能力与高效开发体系是关键。大模型正从简单的问答交互,转向深入汽车、制造等复杂场景,实现从“聊天”到“干活”的跨越。
深度解读 & 洞察:
- 这标志着AI行业竞争焦点从“模型参数规模”转向“任务执行能力”。
- “智能体”不是单次问答,而是能理解目标、规划步骤、调用工具、持续迭代的自主程序。
- 谭待的观点代表了行业共识:未来的操作系统或应用,可能不再以App为中心,而是由一个个能主动完成任务的智能体构成。
Anthropic发布Claude“技能”开放标准
Anthropic正式将Claude模型的“技能”功能作为开放标准发布。开发者和企业可以基于此标准,训练AI执行订机票、查邮件、写代码等特定工作,无需从头构建。
深度解读 & 洞察:
- 这是AI从“大模型”向“任务代办智能体”演进的关键一步。
- 开放标准意味着生态共建,不同厂商的智能体未来可能互相协作,形成类似“App Store”的智能体市场。
- 结合谷歌的A2UI标准(见下文),未来的AI不仅能思考,还能自己“画界面”、“写代码”、“执行任务”,真正成为数字世界的劳动力。
谷歌推出A2UI开放标准:让AI代理秒变"界面设计师"
谷歌推出A2UI(AI-to-UI)开放标准,允许AI代理根据任务需求,即时生成按钮、表单等图形界面元素,并无缝嵌入到现有应用中。该标准采用Apache 2.0许可证开源。
深度解读 & 洞察:
- 传统AI交互依赖纯文本,处理复杂任务(如填表、筛选)非常繁琐。
- A2UI弥合了生成式AI与图形用户界面(GUI)之间的鸿沟,让AI的输出不再是“建议”,而是可直接操作的“界面”。
- 这将极大提升客服、办公软件等场景的效率,用户只需描述需求,AI就能生成一个定制化的操作面板。
商业化加速:盈利模式与资本市场的双重验证
OpenAI算力利润率飙升至70%!内部指标翻倍,商业化效率显著提升
据知情人士透露,OpenAI内部关键指标“计算利润率”已从2024年初水平翻倍,至2025年10月攀升至70%。这表明其通过优化运营、提升收入和控制成本,正从“烧钱”模式转向高效盈利。
深度解读 & 洞察:
- “计算利润率”衡量的是每投入一美元算力成本,能产生多少美元的收入。
- 70%的高利润率证明,以ChatGPT Plus、API调用、企业合作为代表的付费产品模式已非常成熟。
- 这为整个AI行业注入强心针,证明大规模AI投入是可以获得丰厚商业回报的。
AI独角兽MiniMax通过港交所上市聆讯:阿里腾讯联手押注
中国AI初创公司MiniMax(稀宇科技)通过港交所上市聆讯。公司成立于2022年初,若成功上市,将成为全球从创立到IPO耗时最短的AI公司。2024年收入同比增长782%至3050万美元,现金结余达10.46亿美元。
智谱冲刺港股“大模型第一股”,估值244亿
另一家中国大模型公司智谱也通过港交所聆讯,冲刺“大模型第一股”。其MaaS(模型即服务)平台日均token消耗量已达4.2万亿,为约8000万台设备提供支持。
深度解读 & 洞察:
- MiniMax和智谱的IPO进程,标志着资本市场对国产大模型商业前景的认可。
- 两者都采用了多元化的变现模式,包括订阅、API、营销服务等,证明了中国AI公司的商业化路径正在跑通。
- 港股成为AI公司上市首选,也反映了全球资本对中国AI生态的关注。
技术前沿:具身智能与多模态能力突破
英伟达发布通用AI智能体NitroGen:从4万小时游戏视频中进化出的“全能玩家”
英伟达推出通用游戏智能体NitroGen,基于GR00T架构,通过学习YouTube和Twitch上4万小时带有手柄操作叠加层的游戏视频,学会了跨1000余款不同类型游戏的玩法。它不依赖深度思考,而是模仿玩家的直觉式操作。
深度解读 & 洞察:
- NitroGen是具身智能(Embodied AI)的重要里程碑,证明了AI可以通过观察人类行为来学习复杂的物理交互。
- 其价值不仅在于玩游戏,更在于为机器人学习真实世界操作(如抓取、行走)提供了可扩展的训练范式。
- 开源此举将极大加速整个具身智能领域的研究和应用。
北京人形机器人推出国内首个符合国标的 VLA 大模型 XR-1
北京人形机器人创新中心开源了国内首个符合具身智能国家标准的VLA(视觉-语言-动作)大模型XR-1,并配套发布了数据底座和高保真数字资产数据集。
深度解读 & 洞察:
- VLA模型是连接感知(看)、认知(想)和执行(做)的桥梁,是人形机器人的“大脑”。
- 国家标准的出台,意味着中国在具身智能领域开始建立自己的技术规范和生态体系。
- 开源策略旨在吸引全球开发者,共同构建机器人应用生态。
阿里通义千问 Qwen 发布分层图像编辑模型Qwen-Image-Layered
阿里巴巴推出的Qwen-Image-Layered模型,能将一张静态照片自动分解为多个透明背景的RGBA图层,实现类似Photoshop的结构化编辑,突破了传统AI只能对整张图进行重绘的限制。
深度解读 & 洞察:
- 这解决了AI图像编辑的核心痛点:局部修改会破坏全局一致性,且难以处理遮挡和模糊边界。
- “指哪改哪”的能力,将极大降低专业图像编辑的门槛,赋能设计师和普通用户。
- 该技术是多模态AI向精细化、可控化方向发展的体现。
社会影响与风险:就业冲击与技术脆弱性暴露
AI 冲击下,美国大型企业亚马逊、微软等裁员人数突破 5 万
根据CNBC报道,2025年因应用人工智能技术,美国大型企业宣布的裁员总数接近5.5万人,占全年总裁员人数(117万)的近5%,创下2020年以来的新高。
深度解读 & 洞察:
- AI的生产力提升正以“创造性破坏”的方式重塑劳动力市场。
- 被替代的岗位主要集中在重复性高、规则明确的白领工作,如基础客服、数据录入、初级编程等。
- 这既是效率提升的必然结果,也对社会提出了再培训和就业转型的紧迫挑战。
旧金山大停电变“智驾大考”,Waymo 数百辆无人车瘫痪街头
2025年12月20日,旧金山大范围停电导致交通信号灯失效,Waymo的数百辆自动驾驶出租车因无法识别失效的交通设施而全面停摆,造成严重交通拥堵。
深度解读 & 洞察:
- 此事件暴露了当前L4级自动驾驶系统对基础设施的高度依赖和脆弱性。
- 在“长尾场景”(如极端天气、基础设施故障)面前,AI的鲁棒性(robustness)仍是巨大挑战。
- 完全无人驾驶的商业化落地,仍需解决大量边缘情况和系统冗余问题。
更多动态
- 三星联手谷歌推出全球首款Gemini AI冰箱,具备食材识别、食谱推荐和红酒管理功能。
- 快手Kling 2.6更新,支持语音与动作控制,可完美复刻复杂舞蹈动作。
- Resolve AI完成A轮融资,投前估值10亿美元,专注于AI自动运维(SRE)。
- Cursor豪掷重金收购AI代码审查公司Graphite,打造“写+审”闭环的AI编程平台。
- 夸克AI眼镜G1新品开启预售,重量仅40g且支持换电,将大模型硬件门槛拉入“千元时代”。
- 全国首个开放式机器人租赁平台“擎天租”在上海发布,提供类似共享充电宝的便捷租赁体验。
- OpenAI为ChatGPT上线“热情度”调节滑块,用户可自定义AI的情绪浓度。
- Claude Chrome插件正式向所有付费用户全量开放,提供强大的浏览器内AI助手功能。
- 苹果与普渡大学合作研发DarkDiff技术,显著提升手机在极暗环境下的拍照效果。
- 首部院线AIGC动画电影《团圆令》在京点映,展现AI在内容创作领域的突破。