国产大模型密集迭代，Agent集群与自研芯片成焦点

要点速览

阿里发布万亿参数推理模型Qwen3-Max-Thinking，HLE测试创模型最高分纪录
月之暗面开源Kimi K2.5，首创Agent集群模式可调度100个分身并行处理
微软发布自研AI芯片Maia 200，性能超越谷歌TPU
蚂蚁灵波开源LingBot-Depth，攻克机器人透明反光物体感知难题
OpenAI启动ChatGPT广告业务，定价60美元/千次展示为Meta三倍
DeepSeek-OCR 2发布，用"因果流"机制重新定义视觉编码
马化腾年会定调腾讯全面投入AI，元宝团队承压
阶跃星辰完成超50亿元融资，旷视印奇加入任董事长
英伟达20亿美元加码CoreWeave，目标2030年建成5GW算力
我国将出台应对AI影响促就业文件
全国首例AI"幻觉"侵权案宣判，平台被判无责
职场AI热度冷却，Q4员工使用率增长仅1个百分点

国产大模型密集迭代，推理与多模态能力全面突破

通义千问发布Qwen3-Max-Thinking，万亿参数对标国际顶尖

阿里云1月26日正式发布旗舰推理模型Qwen3-Max-Thinking，总参数量突破万亿（1T），预训练数据达36T Tokens。该模型在19项权威基准测试中刷新多项SOTA纪录，性能媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro。

深度解读 & 洞察：

测试时扩展机制：不同于简单的并行推理，该机制能对推理结果进行"经验提取"和多轮自我迭代。在启用工具的"人类最后的测试"HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking（45.5）和Gemini 3 Pro（45.8），创下当前模型最高分纪录。
原生Agent能力：模型可自主调用搜索、个性化记忆和代码解释器三大核心工具，通过基于规则奖励与模型奖励的联合强化学习训练，解决真实复杂任务。
市场信号：千问月活已突破1亿，此次升级标志着国产大模型在推理能力上正式跻身全球第一梯队，与OpenAI、Google的差距正在快速缩小。

月之暗面开源Kimi K2.5，首创Agent集群模式

月之暗面发布并开源Kimi K2.5模型，采用原生多模态架构，同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务。核心亮点包括：

Agent集群能力：首次引入"Agent集群"概念，可自主创建并调度多达100个"分身"，并行处理高达1500个步骤，实际运行时间最高可缩短4.5倍。
视觉驱动编程：支持通过录屏自动拆解交互逻辑，并用专业代码从头复现，显著降低编程门槛。
Kimi Code同步发布：支持VSCode、Cursor、JetBrains和Zed等主流编辑器，SDK开源允许开发者自定义Agent行为。

深度解读 & 洞察：

从单兵到团队协作：K2.5的Agent集群模式代表了AI从单一工具向协作系统的演进。在处理40篇学术论文时，Kimi能衍生多个子Agent分工撰写章节，最终由主Agent汇总生成专业综述——这种工作流模拟了人类团队的协作模式。
开源策略意图：同步开源Agent SDK，显示出月之暗面希望构建开发者生态、与Cursor等成熟产品形成差异化竞争的意图。

DeepSeek-OCR 2发布：用"因果流"重新定义视觉编码

DeepSeek发布新一代文档识别模型DeepSeek-OCR 2，核心创新在于引入DeepEncoder V2编码器，采用"视觉因果流"机制——让模型根据图像语义动态调整视觉信息的处理顺序，而非传统的固定栅格扫描。

深度解读 & 洞察：

模拟人类阅读逻辑：人类阅读时目光会依据内容逻辑自由跳跃，而非机械逐行扫描。DeepEncoder V2通过因果注意力机制，让模型先理解"这里在说什么"，再决定接下来该看哪里。
性能提升：在OmniDocBench v1.5基准中整体得分达91.09%，较前代提升3.73%；阅读顺序准确度编辑距离从0.085降至0.057。
架构前瞻性：DeepSeek团队指出，这套架构可能实现图像、音频和文本的统一特征提取，为真正的多模态基础模型提供新思路。

具身智能加速落地，空间感知与机器人大脑成焦点

蚂蚁灵波开源LingBot-Depth，攻克机器人"透明盲区"

蚂蚁集团旗下灵波科技开源高精度空间感知模型LingBot-Depth，专门解决机器人对透明玻璃、镜面、不锈钢等物体的深度感知难题。

深度解读 & 洞察：

掩码深度建模（MDM）技术：当深度数据缺失时，模型结合RGB图像中的纹理、轮廓信息推断补全。这一设计迫使模型建立"外观—几何"的对应关系，从视觉特征推断空间距离。
软硬协同新范式：作为即插即用的算法模块，LingBot-Depth可无缝集成到现有机器人、自动驾驶设备中，无需更换硬件即可提升感知能力。
商业化进展：已与奥比中光达成战略合作，计划推出新一代深度相机。核心数据资产（200万组高质量深度数据）将于近期开源。

智源研究院发布RoboBrain 2.5，直击机器人"抓不准、控不稳"痛点

智源研究院发布具身智能大脑基础模型RoboBrain 2.5，实现两项关键升级：

精确3D空间推理：将2D视觉理解提升至真实尺度下的空间认知，生成准确的3D抓取与放置轨迹。
稠密时序价值预测：实时评估任务进度与潜在风险，赋予机器人在长时任务中自适应调整与闭环恢复的决策能力。

宇树科技三度牵手春晚，人形机器人出货量超5500台

宇树科技宣布成为2026年春晚机器人合作伙伴，这是其第三次与春晚合作。2025年其人形机器人出货量超过5500台，稳居全球人形机器人第一梯队。

科技巨头AI战略：自研芯片、商业化与监管博弈

微软发布自研AI芯片Maia 200，性能超越谷歌TPU

微软正式发布第二代自研AI加速器芯片Maia 200，采用台积电3nm制程，集成超1000亿晶体管。

深度解读 & 洞察：

性能数据：FP4性能达亚马逊Trainium3的3倍，FP8性能超越谷歌第七代TPU；每美元性能较微软现有硬件提升约30%。
战略意图：降低对英伟达GPU的依赖，应对持续增长的AI推理成本。Maia 200已在爱荷华州数据中心部署，支撑Copilot 365、GPT-5.2及微软内部研究项目。
行业信号：谷歌、亚马逊、微软三大云厂商均已推出自研AI芯片，英伟达的垄断地位面临系统性挑战。

OpenAI启动ChatGPT广告业务，定价高达60美元/千次展示

OpenAI开始在ChatGPT免费版和Go版本中投放广告，千次展示费用（CPM）约60美元，是传统社交媒体的三倍，接近超级碗黄金时段广告价格。

深度解读 & 洞察：

高价逻辑：ChatGPT用户带有明确意图（如"适合旅行的行李箱推荐"），转化率远高于社交媒体的随机浏览。OpenAI放弃按点击付费，改为按展示付费——因为AI聊天用户很少点击外部链接。
数据局限：广告主仅能查看曝光量和总点击量，无法追踪购买转化，与Google、Meta的精细化追踪差距明显。
战略转向：奥特曼曾称广告是"最后手段"，但高估值压力和增长需求迫使OpenAI调整策略。目标是在明年年底前让非付费用户板块实现110亿美元营收。

马化腾年会定调：腾讯全面投入AI，元宝团队承压

腾讯2025年度员工大会上，马化腾明确AI为战略核心，各业务板块全面AI化：

云业务：CSIG实现整体规模化盈利，元宝推出10亿红包活动探索"AI助手+群聊"社交玩法。
微信：坚持去中心化思路，在兼顾用户需求和隐私安全前提下规划智能生态。
输入法：搜狗输入法20.0版本全面AI化，语音识别准确率达98%，支持一键关闭键盘广告。

Meta暂停青少年AI角色功能，强化内容过滤

Meta宣布关闭全球青少年用户访问AI角色功能的权限，因去年夏季内部文件显示部分规则曾允许AI与未成年人进行不当对话。新版本将参照PG-13标准过滤内容，并开发家长监控工具。

AI应用与商业化：从工具到基础设施

Claude推出跨应用交互功能，深度集成办公生态

Anthropic推出Claude跨应用交互功能，用户可直接在对话界面调用Asana、Slack、Figma、Canva等工具。技术基础为MCP（Model Context Protocol）协议的新扩展MCP Apps，允许任何MCP服务器在任何支持的AI产品中提供交互式界面。

深度解读 & 洞察：

从黑箱到透明：传统AI工具调用发生在后台，用户缺乏感知。新功能将工具调用过程可视化，用户可实时查看进度并干预——这可能是未来AI Agent设计的重要方向。
生态开放策略：MCP协议已开源，Anthropic试图建立AI与工具连接的通用标准，让Claude成为AI时代的"操作系统"。

谷歌Gemini 3全球上线，搜索体验对话化

谷歌将Gemini 3作为AI概览的默认模型全球上线，并优化从获取信息到深度对话的过渡体验。用户可直接在AI概览下方提出后续问题，无缝切换到"AI模式"进行多轮对话。

OpenAI发布Prism：科学家的AI原生工作区

OpenAI推出专为科学家设计的免费AI工作区Prism，搭载GPT-5.2模型，整合论文草拟、修订、协作及出版准备功能，原生支持LaTeX。核心理念是扩大科研工具可访问性，完全免费且不设项目数量和协作人数限制。

国产大模型密集迭代，Agent集群与自研芯片成焦点

国产大模型密集迭代，推理与多模态能力全面突破

具身智能加速落地，空间感知与机器人大脑成焦点

科技巨头AI战略：自研芯片、商业化与监管博弈

AI应用与商业化：从工具到基础设施

更多动态