- 阿里发布 Qwen3.5 系列大模型,3970 亿参数只需激活 170 亿,性能超越万亿参数模型,API 价格仅为同级别的 1/18
- 蚂蚁开源万亿参数模型 Ling-2.5-1T,支持 100 万 Token 超长上下文
- 2026 春晚四家机器人公司集中亮相,创历史纪录:宇树展示全球首秀的高动态集群控制,银河通用演示叠衣服等实用技能
- OpenAI 招募 OpenClaw 创始人,推动个人智能体开发,承诺保持开源
- 智谱 GLM-5 需求激增突破规划上限,启动算力合伙人招募计划
- OpenAI 披露印度 ChatGPT 周活破亿,成全球第二大市场
- 谷歌 AI 概览被诈骗分子利用,虚假客服电话暗藏陷阱
- NPR 主播起诉谷歌 NotebookLM 模仿其声音,AI 声音权益争议升温
- 贾樟柯 AI 短片引发版权争议,派拉蒙、迪士尼指控豆包视频模型侵权
- 微信推出 AI 制作拜年歌功能,录入声音即可生成翻唱歌曲

国产大模型密集开源,技术迭代按下加速键
阿里发布 Qwen3.5 系列:3970 亿参数、激活仅 170 亿,性能超越万亿参数模型
阿里今日正式开源 Qwen3.5 系列大模型,包括 Qwen3.5-Plus 和开源旗舰 Qwen3.5-397B-A17B 两款模型。
核心突破:
- 极致效率:总参数 3970 亿,但单次推理仅激活 170 亿参数(激活比例不到 5%),部署显存占用降低 60%,推理吞吐量最高提升 19 倍
- 架构革新:采用线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合的混合架构,根据信息重要程度动态分配计算资源
- 原生多模态:从预训练阶段就让文本和视觉数据在同一参数空间处理,支持长达 2 小时视频输入,可将手绘草图转化为前端代码
- 多语言覆盖:支持 201 种语言,词表规模 25 万,小语种编码效率最高提升 60%
- 定价策略:API 定价百万 Tokens 仅 0.8 元,相当于同级别模型的 1/18
深度解读 & 洞察:
这次发布的核心亮点是"以小激活撬动大能力"。MoE 架构(Mixture of Experts,混合专家模型)就像一个大公司里有很多专业团队,每次任务只调用最相关的几个团队,既保留了大规模参数的知识储备,又大幅降低了实际运行成本。这解决了大模型"贵"和"慢"两大痛点。
原生多模态是另一个关键突破。传统方案通常是先训练语言模型,再"外挂"视觉模块,好比一个人学会说话后再学看图,两个能力是分离的。而 Qwen3.5 让文本和视觉从训练之初就融合在一起,处理图片和处理文字走的是同一条神经通路,这种"天生融合"在复杂任务中表现更自然。
性能超越万亿参数模型却只需激活 170 亿,意味着中小企业和开发者用更低的成本就能获得顶级模型能力。这会加速 AI 从"实验室技术"走向"普惠工具"。
蚂蚁开源 Ling-2.5-1T:万亿参数即时模型,支持 100 万 Token 上下文
蚂蚁开源今日发布万亿参数即时模型 Ling-2.5-1T,总参数 1T(即万亿),激活参数 63B,预训练语料从 20T 扩展至 29T。
核心能力:
- 百万上下文:采用混合线性注意力架构,能以高吞吐处理长达 1M Token 的上下文(约相当于 150 万汉字)
- token 效率提升:引入"正确性 + 过程冗余"复合奖励机制,在相同 token 消耗下,推理能力接近需消耗约 4 倍 token 的前沿思考模型
- 原生智能体交互:基于大规模高保真交互环境训练,可适配 Claude Code、OpenCode、OpenClaw 等主流智能体产品
深度解读 & 洞察:
“即时模型”(Instant Model)是指响应速度快、适合实时交互场景的模型。蚂蚁这款模型的核心卖点是用更少的计算资源达到更强的推理效果——这通过精细的奖励机制设计实现,好比教会模型"不仅要答案对,解题过程也要高效"。
百万 Token 上下文能力意味着模型可以一次性处理超长文档,比如整本小说或完整代码库,而不需要把内容切成小块分批处理。这对企业级应用(法律文书分析、代码审查等)有重要价值。
智谱 GLM-5 需求激增突破规划上限,启动算力合伙人招募
智谱今日宣布,由于全球范围内对 GLM-5 的需求激增,并发访问量突破了既有规划上限,导致服务出现排队、响应延迟及卡顿现象。为此启动"算力合伙人"招募计划,包括:
- 与芯片厂商开放核心技术接口,联合优化
- 寻找大规模、高稳定性算力池的伙伴
- 共建高并发、低延迟的推理网络
GLM-5 于 2 月 12 日上线并开源,在 Artificial Analysis 榜单中位居全球第四、开源第一,已与华为昇腾、寒武纪、摩尔线程等国产芯片深度适配。
深度解读 & 洞察:
这个事件揭示了一个行业痛点:好模型做出来了,但算力跟不上。大模型的推理(即实际使用)需要大量 GPU 资源,当用户请求量激增时,就像春运买票——服务器扛不住就会排队。
智谱的应对策略是"借力":与其自己砸钱建数据中心,不如联合芯片厂商和算力服务商共建基础设施。这种模式在国内很实用——国产芯片正在崛起,需要好的软件来发挥性能;模型公司需要算力;双方互补,形成国产 AI 生态闭环。
京东开源 JoyAI-LLM-Flash:48 亿参数 MoE 模型
京东在 Hugging Face 平台开源 48 亿参数模型 JoyAI-LLM-Flash,其中激活参数仅 3 亿,经过 20T Token 预训练。该模型在前沿知识理解、推理和编程方面表现良好,吞吐量比无多 Token 预测版本提升 1.3-1.7 倍。
MiniMax 推出 M2.5-highspeed 模型,推理速度达 100TPS
MiniMax 最新推出 M2.5-highspeed 模型,支持高达 100TPS 的推理速度(每秒生成 100 个 token),比同类产品快 3 倍。发布 48 小时内已被 50 多个产品接入,专为 Agent 场景优化。
春晚成机器人秀场,四家公司集中亮相
2026 春晚创纪录:四家机器人公司集中登场
2026 年央视春晚迎来机器人企业的"集体首秀",宇树科技、银河通用、松延动力、魔法原子四家公司登上舞台,创下春晚历史上机器人品牌集中亮相的新纪录。其中三家为首次登陆春晚。
深度解读 & 洞察:
春晚选择机器人大规模亮相,释放了明确信号:人形机器人已从"实验室概念"走向"可展示产品"。能上春晚意味着这些机器人的稳定性、安全性已达到可公开展示的水平——要知道,春晚直播不能出任何差错。
四家公司展示了不同技术路线:宇树聚焦运动控制、银河通用主打"能干活"、松延动力深耕仿生表情、魔法原子展示机器狗。这说明行业已进入差异化竞争阶段,不再是"大家都做一样的东西"。
宇树科技《武 BOT》:全球首秀高动态集群控制技术
在春晚《武 BOT》节目中,宇树机器人展示了翻跟头、舞棍、跑跳空翻和舞剑等特技。创始人王兴兴表示,机器人在快速奔跑中完成穿插变阵和武术动作的技术属于全球首次亮相。
核心突破:
- 高动态、高协同集群控制:多台机器人在高速运动中协同配合,避免碰撞,精准完成编排动作
- 稳定性验证:运动能力是智能机器人的先决条件,“先站稳、跑稳,才能在未来复杂场景协助人类”
深度解读 & 洞察:
集群控制是机器人领域的硬骨头。单台机器人做好动作已经很难,多台机器人还要在高速运动中协同、不碰撞、保持队形,技术难度呈指数级上升。这次全球首秀意味着中国在动态集群控制领域达到世界领先水平。
这技术的应用场景远不止表演。未来在仓储物流、应急救援等场景,多机器人协同作业都会用到这套底层能力。
银河通用机器人亮相春晚:展示叠衣服、抓东西等实用技能
银河通用具身智能机器人 Galbot 在沈腾、马丽主演的微电影《我最难忘的今宵》中亮相,展示了语音互动、叠衣服、捡拾垃圾、抓取商品等技能。
技术亮点:
- 解决"干活数据匮乏"难题:首创合成仿真数据为主、真机采集为辅的训练管线,构建百亿级机器人干活数据集
- 硬件设计:双臂配合折叠腿与全向轮底盘,支撑零售、工业、医疗等多场景部署
- 商业进展:近期完成 3 亿美元融资,估值突破 30 亿美元
深度解读 & 洞察:
“具身智能”(Embodied AI)是当前 AI 最热方向之一,核心思想是:智能不能只存在于云端,必须有"身体"才能真正理解世界、完成任务。银河通用的切入点很务实——不追求炫酷的动作,而是让机器人"真正能干活"。
通过仿真数据训练机器人,好比让机器人在虚拟世界里"预习"了无数遍任务,再到现实中实操。这大幅降低了数据采集成本,是规模化落地的关键。
松延动力:1:1 复刻蔡明,表情眼神都精准调试
松延动力机器人登上春晚小品《奶奶的最爱》,其中一台 1:1 复刻艺术家蔡明的仿生人形机器人与蔡明同台表演。
技术细节:
- 高自由度:头部内置 32 个电机,仅嘴部就有 12 个,支持细腻表情变化
- 头部体积压缩:比第二代产品整体尺寸减少 30%,容纳所有结构件、机械件和电子件
- 三自由度颈部:使动作更自然流畅
这也是蔡明时隔 30 年与机器人"再续前缘"——1996 年她曾主演科幻喜剧小品《机器人趣话》。
魔法原子机器人亮相春晚分会场:机器狗与熊猫对阵
魔法原子机器人亮相四川宜宾分会场《立上游》,现场展示 MagicDog 机器狗和 MagicBot Z1 机器人。
AI 智能体成新战场,巨头密集布局
OpenAI 招募 OpenClaw 之父,推动下一代个人智能体开发
OpenAI CEO 奥尔特曼宣布,Peter Steinberger 正式加入 OpenAI,推动下一代个人智能体(Personal AI Agents)开发。
OpenClaw 能力:
- 自主性:无需用户指令,可自主清理收件箱、预订服务、管理日历
- 记忆功能:保存所有对话历史,精准回调用户个性化偏好
- 远程控制:通过聊天软件远程操控电脑
奥尔特曼承诺,OpenClaw 将作为开源项目继续运营。他表示:“未来将是高度多智能体化的时代,支持开源是实现这一目标的重要组成部分。”
深度解读 & 洞察:
"个人智能体"是 AI 的下一个形态演进:从"问什么答什么"的工具,变成"主动帮你做事"的助手。想象一下,AI 不再只是回答问题,而是自动帮你筛选邮件、预订餐厅、协调日程——这才是真正的生产力革命。
OpenAI 收购这个项目并保持开源,说明他们意识到:智能体生态需要开放协作。单一公司的智能体无法覆盖所有场景,开放让更多开发者参与构建,才能形成真正的"智能体网络"。
Qwen3.5 定位通用数字智能体,具备自主运行能力
Qwen3.5 在设计时已将智能体能力作为核心目标。官方披露的应用案例包括:
- 代码智能体:支持网页开发、OpenClaw 集成,将自然语言转化为可运行代码
- 视觉智能体:可自主操作手机与电脑,处理跨应用任务;将手绘草图转化为前端代码
- 未来规划:构建具备持久记忆、自我改进机制的长期自主运行系统
AI 市场与基础设施:印度成增长焦点
OpenAI:印度 ChatGPT 周活破亿,成全球第二大市场
OpenAI CEO 奥尔特曼透露,印度目前拥有 1 亿 ChatGPT 每周活跃用户,成为仅次于美国的第二大市场。全球范围内,ChatGPT 周活已达 8 亿,正逼近 9 亿。
市场策略:
- 推出低于 5 美元的 ChatGPT Go 版本
- 为印度用户提供一年免费使用
- 学生群体是增长主力,印度拥有全球最多的 ChatGPT 学生用户
挑战: 广泛使用不等于经济回报。如何在价格敏感环境与基础设施限制下实现商业化,仍是难题。奥尔特曼警告,AI 经济红利可能集中于少数群体。
深度解读 & 洞察:
印度市场对 AI 公司的战略意义在于:庞大人口、年轻用户、快速增长。但付费能力弱是现实障碍。OpenAI 的策略是"先用起来"——免费培养习惯,期待未来转化。
学生群体尤其关键。他们是最容易接受新技术的群体,也是未来的付费主力。谁能赢得印度学生,谁就赢得了下一代用户。
AMD 与塔塔合作,在印度部署最新 “Helios” AI 系统
AMD 与塔塔咨询服务宣布扩大合作,将在印度部署 AMD 最新的机架级 AI 系统 “Helios”。双方将提供支持高达 200MW 容量的 AI 就绪数据中心蓝图,加速印度数据中心建设。
这将是 AMD 在印度部署的首个由 Helios 驱动的 AI 基础设施。
AI 安全与版权:技术进步伴随新风险
谷歌 AI 概览被诈骗分子利用,虚假客服电话暗藏陷阱
谷歌搜索的 “AI 概览” 功能正被诈骗分子盯上。不法分子在多个低曝光网站上发布虚假客服号码,与知名企业名称绑定,谷歌 AI 抓取后可能将其整合进摘要。
风险本质:
- AI 概览直接给出"整合后的答案",更具"权威感",容易让用户放松警惕
- 不像传统搜索提供多个来源供比较
建议: 涉及电话号码、支付信息时,仍应访问官方网站核实。在 AI 搜索时代,"多来源核实"仍然必要。
NPR 主播起诉谷歌:指控 NotebookLM 模仿其声音
美国国家公共广播电台主持人戴维·格林起诉谷歌,声称 NotebookLM 生成的播客男声非法模仿了他的声音——包括语调、语气,甚至"呃"等习惯填充词。
谷歌否认,表示声音来自付费专业演员。这不是 AI 公司第一次遇到类似纠纷——OpenAI 曾因 ChatGPT 语音助手与斯嘉丽·约翰逊声音相似而被迫下架。
深度解读 & 洞察:
这起诉讼触及 AI 时代的核心法律问题:声音是否属于个人财产?当 AI 能精准捕捉真人的说话方式和习惯时,这是技术进步还是身份侵犯?目前法律界尚无明确答案,但这类纠纷会越来越多。
贾樟柯 AI 短片引发版权争议:派拉蒙、迪士尼发函指控侵权
导演贾樟柯发布春节贺岁短片《贾科长 Dance》,与豆包视频生成模型 Seedance 2.0 合作完成。但该模型引发版权争议:派拉蒙天舞已向字节跳动发出停止侵权通知函;迪士尼指控训练时未经许可使用其作品。
更多动态
- 微信推出 AI 制作拜年歌功能,五音不全也能翻唱——点击「发现」-「听一听」-制作拜年歌,录入声音即可生成翻唱歌曲
- OpenAI 宣布永久下线 GPT-4o 模型——新一代模型已取代旧版本
- 谷歌 Gemini 3 支持直接生成 3D 打印文件——多模态能力再扩展
- 可灵 AI 宣布模型对部分用户限时免费——视频生成赛道竞争加剧
- 小红书开源支持中文编辑的修图模型——AI 图像编辑工具再添一员
- Cloudflare 推出网页转 Markdown 工具——节省流量的实用工具
- 马斯克预言:2026 年底人类不需要编程——AI 将跳过源代码直接生成二进制,但行业判断更温和:程序员角色会改变而非消失
