- 阿里发布万亿参数推理模型Qwen3-Max-Thinking,HLE测试创模型最高分纪录
- 月之暗面开源Kimi K2.5,首创Agent集群模式可调度100个分身并行处理
- 微软发布自研AI芯片Maia 200,性能超越谷歌TPU
- 蚂蚁灵波开源LingBot-Depth,攻克机器人透明反光物体感知难题
- OpenAI启动ChatGPT广告业务,定价60美元/千次展示为Meta三倍
- DeepSeek-OCR 2发布,用"因果流"机制重新定义视觉编码
- 马化腾年会定调腾讯全面投入AI,元宝团队承压
- 阶跃星辰完成超50亿元融资,旷视印奇加入任董事长
- 英伟达20亿美元加码CoreWeave,目标2030年建成5GW算力
- 我国将出台应对AI影响促就业文件
- 全国首例AI"幻觉"侵权案宣判,平台被判无责
- 职场AI热度冷却,Q4员工使用率增长仅1个百分点

国产大模型密集迭代,推理与多模态能力全面突破
通义千问发布Qwen3-Max-Thinking,万亿参数对标国际顶尖
阿里云1月26日正式发布旗舰推理模型Qwen3-Max-Thinking,总参数量突破万亿(1T),预训练数据达36T Tokens。该模型在19项权威基准测试中刷新多项SOTA纪录,性能媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro。
深度解读 & 洞察:
- 测试时扩展机制:不同于简单的并行推理,该机制能对推理结果进行"经验提取"和多轮自我迭代。在启用工具的"人类最后的测试"HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking(45.5)和Gemini 3 Pro(45.8),创下当前模型最高分纪录。
- 原生Agent能力:模型可自主调用搜索、个性化记忆和代码解释器三大核心工具,通过基于规则奖励与模型奖励的联合强化学习训练,解决真实复杂任务。
- 市场信号:千问月活已突破1亿,此次升级标志着国产大模型在推理能力上正式跻身全球第一梯队,与OpenAI、Google的差距正在快速缩小。
月之暗面开源Kimi K2.5,首创Agent集群模式
月之暗面发布并开源Kimi K2.5模型,采用原生多模态架构,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务。核心亮点包括:
- Agent集群能力:首次引入"Agent集群"概念,可自主创建并调度多达100个"分身",并行处理高达1500个步骤,实际运行时间最高可缩短4.5倍。
- 视觉驱动编程:支持通过录屏自动拆解交互逻辑,并用专业代码从头复现,显著降低编程门槛。
- Kimi Code同步发布:支持VSCode、Cursor、JetBrains和Zed等主流编辑器,SDK开源允许开发者自定义Agent行为。
深度解读 & 洞察:
- 从单兵到团队协作:K2.5的Agent集群模式代表了AI从单一工具向协作系统的演进。在处理40篇学术论文时,Kimi能衍生多个子Agent分工撰写章节,最终由主Agent汇总生成专业综述——这种工作流模拟了人类团队的协作模式。
- 开源策略意图:同步开源Agent SDK,显示出月之暗面希望构建开发者生态、与Cursor等成熟产品形成差异化竞争的意图。
DeepSeek-OCR 2发布:用"因果流"重新定义视觉编码
DeepSeek发布新一代文档识别模型DeepSeek-OCR 2,核心创新在于引入DeepEncoder V2编码器,采用"视觉因果流"机制——让模型根据图像语义动态调整视觉信息的处理顺序,而非传统的固定栅格扫描。
深度解读 & 洞察:
- 模拟人类阅读逻辑:人类阅读时目光会依据内容逻辑自由跳跃,而非机械逐行扫描。DeepEncoder V2通过因果注意力机制,让模型先理解"这里在说什么",再决定接下来该看哪里。
- 性能提升:在OmniDocBench v1.5基准中整体得分达91.09%,较前代提升3.73%;阅读顺序准确度编辑距离从0.085降至0.057。
- 架构前瞻性:DeepSeek团队指出,这套架构可能实现图像、音频和文本的统一特征提取,为真正的多模态基础模型提供新思路。
具身智能加速落地,空间感知与机器人大脑成焦点
蚂蚁灵波开源LingBot-Depth,攻克机器人"透明盲区"
蚂蚁集团旗下灵波科技开源高精度空间感知模型LingBot-Depth,专门解决机器人对透明玻璃、镜面、不锈钢等物体的深度感知难题。
深度解读 & 洞察:
- 掩码深度建模(MDM)技术:当深度数据缺失时,模型结合RGB图像中的纹理、轮廓信息推断补全。这一设计迫使模型建立"外观—几何"的对应关系,从视觉特征推断空间距离。
- 软硬协同新范式:作为即插即用的算法模块,LingBot-Depth可无缝集成到现有机器人、自动驾驶设备中,无需更换硬件即可提升感知能力。
- 商业化进展:已与奥比中光达成战略合作,计划推出新一代深度相机。核心数据资产(200万组高质量深度数据)将于近期开源。
智源研究院发布RoboBrain 2.5,直击机器人"抓不准、控不稳"痛点
智源研究院发布具身智能大脑基础模型RoboBrain 2.5,实现两项关键升级:
- 精确3D空间推理:将2D视觉理解提升至真实尺度下的空间认知,生成准确的3D抓取与放置轨迹。
- 稠密时序价值预测:实时评估任务进度与潜在风险,赋予机器人在长时任务中自适应调整与闭环恢复的决策能力。
宇树科技三度牵手春晚,人形机器人出货量超5500台
宇树科技宣布成为2026年春晚机器人合作伙伴,这是其第三次与春晚合作。2025年其人形机器人出货量超过5500台,稳居全球人形机器人第一梯队。
科技巨头AI战略:自研芯片、商业化与监管博弈
微软发布自研AI芯片Maia 200,性能超越谷歌TPU
微软正式发布第二代自研AI加速器芯片Maia 200,采用台积电3nm制程,集成超1000亿晶体管。
深度解读 & 洞察:
- 性能数据:FP4性能达亚马逊Trainium3的3倍,FP8性能超越谷歌第七代TPU;每美元性能较微软现有硬件提升约30%。
- 战略意图:降低对英伟达GPU的依赖,应对持续增长的AI推理成本。Maia 200已在爱荷华州数据中心部署,支撑Copilot 365、GPT-5.2及微软内部研究项目。
- 行业信号:谷歌、亚马逊、微软三大云厂商均已推出自研AI芯片,英伟达的垄断地位面临系统性挑战。
OpenAI启动ChatGPT广告业务,定价高达60美元/千次展示
OpenAI开始在ChatGPT免费版和Go版本中投放广告,千次展示费用(CPM)约60美元,是传统社交媒体的三倍,接近超级碗黄金时段广告价格。
深度解读 & 洞察:
- 高价逻辑:ChatGPT用户带有明确意图(如"适合旅行的行李箱推荐"),转化率远高于社交媒体的随机浏览。OpenAI放弃按点击付费,改为按展示付费——因为AI聊天用户很少点击外部链接。
- 数据局限:广告主仅能查看曝光量和总点击量,无法追踪购买转化,与Google、Meta的精细化追踪差距明显。
- 战略转向:奥特曼曾称广告是"最后手段",但高估值压力和增长需求迫使OpenAI调整策略。目标是在明年年底前让非付费用户板块实现110亿美元营收。
马化腾年会定调:腾讯全面投入AI,元宝团队承压
腾讯2025年度员工大会上,马化腾明确AI为战略核心,各业务板块全面AI化:
- 云业务:CSIG实现整体规模化盈利,元宝推出10亿红包活动探索"AI助手+群聊"社交玩法。
- 微信:坚持去中心化思路,在兼顾用户需求和隐私安全前提下规划智能生态。
- 输入法:搜狗输入法20.0版本全面AI化,语音识别准确率达98%,支持一键关闭键盘广告。
Meta暂停青少年AI角色功能,强化内容过滤
Meta宣布关闭全球青少年用户访问AI角色功能的权限,因去年夏季内部文件显示部分规则曾允许AI与未成年人进行不当对话。新版本将参照PG-13标准过滤内容,并开发家长监控工具。
AI应用与商业化:从工具到基础设施
Claude推出跨应用交互功能,深度集成办公生态
Anthropic推出Claude跨应用交互功能,用户可直接在对话界面调用Asana、Slack、Figma、Canva等工具。技术基础为MCP(Model Context Protocol)协议的新扩展MCP Apps,允许任何MCP服务器在任何支持的AI产品中提供交互式界面。
深度解读 & 洞察:
- 从黑箱到透明:传统AI工具调用发生在后台,用户缺乏感知。新功能将工具调用过程可视化,用户可实时查看进度并干预——这可能是未来AI Agent设计的重要方向。
- 生态开放策略:MCP协议已开源,Anthropic试图建立AI与工具连接的通用标准,让Claude成为AI时代的"操作系统"。
谷歌Gemini 3全球上线,搜索体验对话化
谷歌将Gemini 3作为AI概览的默认模型全球上线,并优化从获取信息到深度对话的过渡体验。用户可直接在AI概览下方提出后续问题,无缝切换到"AI模式"进行多轮对话。
OpenAI发布Prism:科学家的AI原生工作区
OpenAI推出专为科学家设计的免费AI工作区Prism,搭载GPT-5.2模型,整合论文草拟、修订、协作及出版准备功能,原生支持LaTeX。核心理念是扩大科研工具可访问性,完全免费且不设项目数量和协作人数限制。
更多动态
- 阶跃星辰完成超50亿元B+轮融资:旷视科技创始人印奇加入担任董事长,形成"AI+终端"战略团队。
- 英伟达20亿美元加码CoreWeave:目标2030年建成超5GW AI算力,英伟达将首次以独立形式供应VERA CPU芯片。
- DeepWay深向完成11.77亿元Pre-IPO轮融资:自动驾驶卡车赛道2026年首笔重磅融资,估值突破10亿美元。
- 我国将出台应对人工智能影响促就业文件:人社部确认将推出重点行业就业支持举措。
- 全国首例AI"幻觉"侵权案宣判:杭州互联网法院驳回原告诉请,明确AI生成内容不构成平台意思表示。
- 阿里开源Assistant Agent企业级智能助手框架:基于Spring AI Alibaba构建,采用代码即行动范式。
- 阿里健康医学AI"氢离子"升级:新增"动态证据定位"功能,将静态引用升级为可验证的活证据。
- 百度智能云上调2026年AI收入增速目标至200%:2025年已蝉联国内大模型中标项目数和金额双第一。
- 百度文心APP推出行业首个多人多Agent群聊功能:打破传统一对一交互模式,AI从工具变为社交参与者。
- 职场AI热度冷却:盖洛普调查显示,2025年Q4员工AI使用率仅从45%微增至46%,增长停滞主因是缺乏清晰应用场景。
- RMS批判AI与智能手机:自由软件之父理查德·斯托曼称大语言模型为"伪智能"(Pretend Intelligence),将智能手机称为"奥威尔式的追踪和监视设备"。
- 我国计算机与AI领域奠基人李未院士逝世:享年82岁,是新中国首位在英国获计算机博士学位的留学生。
