- 英伟达GTC大会发布DLSS 5超分技术、Nemotron 3系列模型及NemoClaw智能体平台
- 智谱发布首个龙虾模型GLM-5-Turbo,专门针对复杂Agent场景优化
- 央视315曝光AI大模型"投毒"黑色产业链,GEO技术操控推荐结果
- 中国AI大模型周调用量达4.69万亿Token,首次超越美国
- OpenClaw生态爆发:腾讯、百度、阿里等大厂密集布局
- 通义开源影视级配音模型Fun-CineForge,解决音画同步难题

英伟达GTC大会发布多项重磅技术
DLSS 5超分技术亮相:图形领域的"GPT时刻"
英伟达CEO黄仁勋在GTC 2026大会上展示了全新的DLSS 5超分技术,称其为自2018年实时光线追踪技术问世以来,计算机图形领域最具颠覆性的突破。
核心技术突破:
- 引入实时神经渲染模型,结合传统手工渲染与生成式AI
- 在4K分辨率下实时运行,完美还原发丝光泽、布料纹理及皮肤次表面散射效果
- 解决了生成式视频模型常见的连贯性问题,不同帧之间保持高度一致性
- 为开发者提供强度、色彩分级和遮罩的精细控制
行业支持: 已获Bethesda、CAPCOM、育碧、腾讯、网易等顶级游戏开发商支持,将于今年秋季上线《星空》《刺客信条:影》《生化危机:安魂曲》等大作。
深度解读 & 洞察:DLSS 5的核心创新在于将生成式AI引入实时渲染管线。传统渲染依赖程序员手动编写光照、材质计算逻辑,而DLSS 5让AI学习真实世界的光影规律,自动为游戏画面注入逼真的视觉细节。这类似于"让AI学会了画画",但关键是——它必须实时运行,且在玩家不同操作下保持视觉一致性。黄仁勋称其为"GPT时刻",正是因为这标志着图形渲染从"程序化"向"AI生成化"的范式转移。对游戏行业而言,这意味着更低的开发成本和更逼真的画面表现;对玩家而言,则是沉浸式体验的质的飞跃。
Nemotron 3系列开源模型发布:吞吐量效率提升5倍
英伟达宣布全面扩展其开源模型家族,推出Nemotron 3系列全理解多模态模型:
- Nemotron 3 Ultra:基于Blackwell架构,吞吐量效率提升5倍,专注代码辅助与复杂工作流
- Nemotron 3 Omni:整合音、视、语多模态能力
- Nemotron 3 VoiceChat:集语音识别、大模型与语音合成于一体,支持实时对话
CrowdStrike、ServiceNow等企业已将其部署于企业级应用。同时在物理AI领域发布Cosmos 3世界基础模型、GR00T N1.7机器人模型等,在医疗领域BioNeMo平台新增蛋白质药物发现模型。
深度解读 & 洞察:英伟达此番密集发布,本质上是在构建"AI时代的基础设施矩阵"。Nemotron 3系列针对不同场景(代码、多模态、语音对话)提供专用模型,就像汽车发动机有不同的排量选择。关键在于"吞吐量效率提升5倍"——这意味着同样算力下能处理5倍的工作量,对企业用户而言是实打实的成本降低。在物理AI和医疗领域的布局,则显示英伟达正从纯软件向"软件+垂直行业"延伸,试图在机器人、制药等万亿级市场建立技术壁垒。开源策略更是一步妙棋,让开发者用英伟达的模型,自然会倾向于购买英伟达的芯片。
NemoClaw发布:英伟达版"小龙虾"主打一键安装
英伟达推出针对OpenClaw智能体平台的NemoClaw软件栈,用户只需一条指令即可快速部署Nemotron模型与OpenShell运行环境。黄仁勋将OpenClaw比作AI时代的Windows或Mac,称其为"个人AI的操作系统"。
通过内置的OpenShell隔离沙箱环境和"隐私路由器",智能体可以在确保数据安全的前提下灵活切换本地开源模型与云端大模型。支持GeForce RTX的PC、笔记本、工作站,以及DGX Station和DGX Spark AI超级计算机。
深度解读 & 洞察:NemoClaw的发布标志着英伟达正式杀入AI智能体赛道。"一键安装"听起来简单,但对于OpenClaw这类需要复杂环境配置的开源项目,降低部署门槛就是降低用户流失率。更重要的是,英伟达通过NemoClaw将自家模型(Nemotron)、芯片(RTX/DGX)和智能体框架(OpenClaw)打包成一体化解决方案,形成"买芯片送软件"的生态闭环。OpenShell沙箱和隐私路由器则解决了用户对AI智能体安全性的担忧——你可以在本地处理敏感数据,只在必要时调用云端大模型。这种"本地+云端混合"的架构,很可能成为未来个人AI助手的标配。
OpenClaw生态爆发式发展
GLM-5-Turbo发布:首个龙虾原生模型
智谱发布GLM-5-Turbo,这是首个针对OpenClaw场景深度优化的基础模型,从训练阶段就针对工具调用、复杂指令执行、长链路任务等核心能力进行了专项优化。
四大核心能力增强:
- 工具调用能力:强化对外部工具和Skills的调用稳定性,解决Agent在调用过程中容易"掉链子"的问题
- 指令遵循能力:提升对复杂多层、长链路指令的理解能力,支持多智能体协同工作
- 定时与持续性任务处理:针对定时触发、长时间运行等场景进行优化,保证长任务不中断
- 高吞吐长链路执行:针对数据吞吐量大、执行链条长的任务提升效率和稳定性
模型最大输出Token达128K、上下文长度200K。在智谱自研基准测试ZClawBench中,GLM-5-Turbo在国产模型里排名第一,开发者盲测优胜认可率达90%。
深度解读 & 洞察:GLM-5-Turbo的核心价值在于"专而精"。通用大模型在处理复杂Agent任务时经常出现"失速"——执行到一半忘记目标、工具调用出错、长任务中途崩溃。GLM-5-Turbo从训练数据构造到优化目标设计的全流程,都围绕"让Agent稳定执行复杂任务"这一目标展开。就像一个普通人和一个项目经理的区别:前者可能知道怎么做,后者知道如何规划、如何拆解、如何协调资源、如何应对意外。GLM-5-Turbo在智谱ZClawBench测试中领先国产模型,说明"专项优化"路线在特定场景确实比"通用大而全"更有效。对企业和开发者而言,这意味着可以用更少的Token消耗、更少的调试时间,完成更复杂的自动化任务。
腾讯发布"龙虾管家":行业首个AI安全沙箱
腾讯电脑管家18.0核心版本推出"龙虾管家·AI安全沙箱",解决AI Agent在本地部署时的权限滥用、恶意注入和隐私泄露问题。
核心功能:
- 安全隔离虾房:通过沙箱隔离技术严格管控AI对底层资源的访问权限,拦截异常的支付行为和系统级文件修改指令
- 实时保护:对提示词和技能包进行深度监测,识别并阻止注入式攻击
- 可视化管理:用户可查看AI对剪贴板、摄像头、麦克风等敏感权限的调用记录,识别是用户触发还是软件自动运行
目前支持OpenClaw、QClaw等多种主流本地AI框架。
深度解读 & 洞察:OpenClaw火爆的同时,安全问题也频频曝光——有用户的信用卡被刷、隐私信息泄露、电脑被远程控制。腾讯"龙虾管家"的价值在于,它为AI智能体划了一条"安全红线"。就像电脑上的杀毒软件,龙虾管家监控AI的每一个敏感操作,并在发现异常时及时拦截。“可视化管理"尤其重要——用户可以清晰看到AI什么时候访问了摄像头、为什么读取了剪贴板,这种透明化设计让"黑盒AI"变成了"玻璃盒子”。随着AI智能体越来越普及,类似的安全沙箱很可能会成为PC端的标配功能,腾讯此举也是在抢占"AI时代的安全入口"。
更多OpenClaw生态动态
- 百度秒哒发布全球首个OpenClaw应用开发Skill:实现"对话即应用",用户可通过自然语言直接创建、修改并发布网页、小程序及游戏,5-8分钟完成应用生成
- 阿里拟推企业级AI智能体产品:基于千问模型开发,能操作电脑、浏览器和云服务器,有望接入淘宝和支付宝,最快本周发布
- QQ机器人接入OpenClaw:支持富媒体收发,包括图片、语音、视频和文件
- 阶跃龙虾首批5万个名额售罄:公司追加2万个免费名额,赠送5000万Token及一个月云服务器
- 企业微信接入OpenClaw:推出扫码一键部署和文档自动化操作功能
- 阅文推出网文创作AI智能体Claw:支持热梗素材收集、三江推荐鉴赏、情节评论分析等功能
AI安全与监管焦点
央视315曝光AI大模型"投毒"黑色产业链
央视3·15晚会曝光了一条针对AI大模型的"投毒"黑色产业链。不法服务商利用"生成式引擎优化"(GEO)技术,通过在互联网上批量投放虚假信息,成功操控主流AI大模型的输出结果。
案例实测:央视记者虚构了一款不存在的智能手环"Apollo9",编造"量子纠缠传感""黑洞级续航"等毫无科学根据的营销话术。使用GEO系统在短时间内向网上散布几十篇相关文章后,在主流AI大模型上询问这款手环,AI竟然将其作为"行业第一"推荐给用户。
三种"投毒"技术路径:
- 训练数据污染:篡改百科、论坛、媒体报道等知识源,将错误信息写入模型的"记忆",最难修复
- 检索上下文劫持:利用RAG技术的工作原理,让自己的内容在检索结果中排名更靠前
- 提示注入诱导攻击:埋入伪造差评、虚假对比、诱导式问答等,影响AI生成结果
淘宝和闲鱼已紧急下架"力擎GEO优化系统"等产品。关联公司北京力思文化传媒有限公司被点名,2025年该公司只有1人交社保。
深度解读 & 洞察:GEO本质上是SEO(搜索引擎优化)在AI时代的升级。SEO让网站在搜索结果中排名靠前,GEO让品牌在AI回答中被优先推荐。问题在于,当这套技术被用于"虚假信息批量投放",AI就变成了"谣言放大器"。核心症结在于:大模型依赖互联网公开数据训练和检索,缺乏有效的真伪辨别机制。当大量虚假信息被系统性地注入信息源,模型很容易将其当作"事实"输出。这不仅是技术问题,更是"信息生态治理"问题。对于普通用户而言,这意味着AI推荐的"标准答案"可能已被商业利益操控——你以为在问AI,实际是在问一个被"喂料"过的AI。未来可能需要建立"信息溯源认证"机制,就像食品有溯源标签一样。
中国互联网金融协会发布OpenClaw安全风险提示
针对OpenClaw智能体,协会警示四大核心风险:
- 资金安全:已披露多个中高危漏洞,攻击者可窃取网银密码、支付密钥等敏感信息
- 自动化交易风险:智能体可能误操作资金转账或投资产品购买,责任主体难以认定
- 数据合规风险:智能体具备持久记忆功能,金融敏感数据可能超出原有业务目的范围
- 新型诈骗:不法分子利用"AI代炒股""稳赚不赔"等话术实施投资诈骗
对金融消费者和从业机构提出明确防范建议。
AI竞争格局变化
中国AI大模型周调用量首次超越美国
根据OpenRouter最新数据,中国AI大模型周调用量达到4.69万亿Token,环比增长11.83%,首次超越美国的3.294万亿Token(环比下滑9.33%)。
全球调用量排行榜前三:
- MiniMax M2.5:连续五周排名第一,周调用量1.75万亿Token
- 阶跃星辰Step3.5Flash:首次进入前三,周调用量环比增长79%
- DeepSeek V3.2:周调用量1.04万亿Token
值得关注的Hunter Alpha模型仅上线几天就冲进全球第七,周调用量0.666万亿Token。这是一款专为智能体应用设计的万亿参数模型,拥有100万Token超长上下文能力。
深度解读 & 洞察:Token调用量是衡量AI模型实际应用活跃度的关键指标,就像电商看GMV、社交应用看DAU。中国模型调用量超越美国,说明在"实际使用量"这个维度上,国产模型已经占据优势。但这背后有几个关键因素:一是国产模型的"免费策略"和"低价策略"大幅降低了用户使用门槛;二是中国庞大的用户基数和企业数字化转型需求,创造了巨大的应用场景;三是国产模型在特定场景(如代码生成、中文内容创作)的优化更符合本土用户需求。当然,“调用量高"不等于"技术领先”——美国顶级模型(如GPT-5、Claude)在推理能力、多模态理解等核心指标上可能仍占优势。但这个数据至少证明,在"应用普及"这条赛道上,中国跑得很快。
算力基础设施竞赛
Meta豪掷270亿美元采购AI算力
Meta将在未来五年内向云服务提供商Nebius Group NV支付最高270亿美元,获取尖端人工智能基础设施使用权。这是Meta签署的规模最大的单笔合同之一。
合作详情:
- 2027年初起,Nebius为Meta提供价值120亿美元的专属算力
- Meta承诺额外采购最高150亿美元的算力资源
市场预计,Meta等科技巨头将在2026年投入约6500亿美元建设数据中心与采购基础设施。扎克伯格表示,到2028年Meta将在美国基础设施项目上投入6000亿美元。
影响:(利多AI算力产业链)Meta此举是典型的"军备竞赛"式投资——在AI赛道,算力就是弹药。270亿美元订单直接利好英伟达等芯片厂商、数据中心运营商和电力供应商。对投资者而言,这释放了明确信号:头部科技公司仍在加速扩张AI基础设施,短期内看不到"算力过剩"的风险。但需要注意,巨额资本支出也会影响Meta的短期利润率。
英伟达投资Groq推动LPU芯片出货量级成长
天风国际证券分析师郭明錤表示,英伟达对Groq的投资将推动LPU AI芯片出货规模实现10倍以上数量级成长,2026-2027年有望合计出货400-500万颗。
新一代LPX机柜/机架预计2026Q4-2027Q1量产,将单一机柜中的LPU数量从当前的64颗提升至256颗,两年总出货量15000-20000套。
地瓜机器人完成1.2亿美元B1轮融资
地平线旗下地瓜机器人完成1.2亿美元B1轮融资,累计融资额达2.2亿美元。本轮由Synstellation Capital、滴滴、美团龙珠等领投,北汽产投、芯联资本等跟投,高瓴创投、淡马锡旗下Vertex Growth等老股东超额跟投。
公司提供覆盖5~560 TOPS各算力段的完整产品布局,覆盖人形机器人、轮足机器人、四足机器狗、服务陪伴机器人、物流AMR等全场景的端侧计算需求。
多模态AI技术突破
通义开源影视级配音模型Fun-CineForge
阿里通义实验室发布并开源首个支持影视级多场景配音的多模态大模型Fun-CineForge,解决了AI配音长期面临的口型同步、情绪表达、音色一致、时间对齐四大难题。
核心技术创新:
- 引入"时间模态":首次将起始/结束时间作为强监督目标,确保语音在视觉缺失时仍能准时出现
- 四模态融合:协同利用视觉(唇动)、文本(内容与情感)、音频(目标)和时间(节奏控制)四类信息
- 配套开源CineDub数据集构建方法:中文字错率从4.53%降至0.94%,说话人分离错误率从8.38%降至1.20%
Fun-CineForge首次支持双人及多人对话场景,在独白场景中文字错率仅1.49%。项目已在GitHub、HuggingFace和ModelScope同步开源。
深度解读 & 洞察:传统AI配音像"播音员读稿"——声音流畅但缺乏情感,更谈不上与画面同步。影视配音的核心难点在于"时机":角色什么时候张嘴、什么时候停顿、情绪如何起伏、与背景音乐如何配合。Fun-CineForge引入"时间模态",相当于给AI一个"节拍器"——不仅知道说什么,还知道什么时候说、说多久。四模态融合则让AI同时理解画面、文本、声音和时间四类信息,就像配音演员同时看剧本、看画面、听导演指导、把握节奏。开源的意义在于,让小团队和个人创作者也能用上"工业级"配音工具,大幅降低短剧、动画、多语言版本的制作成本。
Claude推出100万Token上下文窗口
Anthropic推出Claude Opus4.6和Sonnet4.6,上下文窗口扩展至100万Token,相当于一次性读完750万个英文单词,或把整套《哈利·波特》系列翻7倍。
在定价上实行全窗口统一价格,长上下文不再需要额外付费。细节检索测试中,Opus4.6准确度达78.3%,是同类模型中最好表现。
深度解读 & 洞察:上下文窗口就像AI的"短期记忆容量"。窗口越大,AI一次性能处理的信息越多——程序员可以把整个代码库丢进去让它重构,律师可以把几百页合同一起提交让它审核,研究员可以把一整年的论文都喂给它做综述。100万Token意味着Claude可以"记住"的信息量,比之前主流模型(如GPT-4的128K)高出近8倍。更重要的是"统一定价"——以往使用长上下文要额外付费,现在不涨价,相当于给开发者和企业用户"降价"。这很可能引发新一轮"上下文军备竞赛":OpenAI、Google等玩家大概率会跟进,最终受益的是需要处理大量数据的用户。
AI应用落地加速
OpenAI:未来AI将如水电般按使用量计费
OpenAI CEO奥尔特曼在贝莱德基础设施峰会上表示,人工智能最终将像电和水一样,作为一种基础公用事业进行买卖,并按使用量计费。
“从根本上说,我们的业务最终都会看起来像是在销售Token。我们看到这样一个未来:智能就像电或水一样成为公用事业,人们通过计量表向我们购买,并用于任何他们想使用的场景。”
奥尔特曼强调,算力决定了谁能使用人工智能。如果无法构建足够的算力满足需求,结果要么是无法提供服务,要么是价格变得极其昂贵。
谷歌向香港用户开放Gemini
谷歌将逐步把Gemini网页应用程序开放给香港用户,日后涵盖App移动应用程序。香港个人用户此前一直未能直接登录,此次开放后可使用Gemini处理日常事务,并使用生成图像、音乐、多媒体内容等功能。
藏语AI时代开启:全球首个藏语大模型DeepZang发布
全球首个藏语大语言模型DeepZang在拉萨发布,支持藏、中、英三语智能交互,集成AI对话、实时翻译和语音转写功能。模型已积累国家标准藏语平行语料近7000万条,藏语三大方言语音语料超过30500个小时,获得"世界首个藏语大语言模型"认证证书。
Google地图接入Gemini:十年来最大升级
Google地图接入Gemini模型,推出Ask Maps和沉浸式导航两大功能。Ask Maps把地图从地址搜索工具变成生活助理,可以问"找一家离我办公室近、环境温馨、晚上七点有四人位且提供素食的餐厅",Gemini会分析评论、照片和实时数据给出建议。沉浸式导航利用Gemini对数亿张街景和航拍照片实时渲染,清晰显示建筑物、绿植、交通信号灯等细节。
清华开源AI虚拟课堂OpenMAIC
清华大学开源OpenMAIC多智能体互动课堂平台,能把任意主题或文档转变成完整的沉浸式学习体验。包含AI老师(负责讲解、白板画图)、AI助教(个性化辅导)、多个AI同学(参与讨论和辩论)。用户输入主题后约30分钟生成完整课程,成本不到2美元。已在清华校内完成500多名学生的实证试点,产生超过10万条真实互动记录。
苹果计划2026年WWDC发布新版Siri
苹果计划在2026年全球开发者大会上发布代号为"Campo"的新版Siri,覆盖iOS、iPadOS及macOS系统。最大改变是对话能力,苹果想让Siri的交互体验接近ChatGPT或Claude。为此苹果与谷歌达成协议,将谷歌Gemini模型整合进苹果的基础模型架构,年投入约10亿美元研发和运营成本。
更多动态
产品与技术
- 抖音处置1.4万个违规账号,打击AI生成色情低俗内容
- OpenAI计划将Sora视频生成工具集成到ChatGPT
- OpenAI澄清ChatGPT广告暂不全球推广,目前仅在美国提供
- VS Code改为每周发布稳定版本,此前为每月发布
- OpenAI发布Codex Security安全工具,从代码库本身开始验证漏洞
行业事件
- 大英百科全书起诉OpenAI,指控非法复制近10万篇文章训练ChatGPT
- 马斯克与OpenAI诉讼案定于2026年4月28日开庭,涉及1340亿美元索赔
- 字节跳动因法律合规压力暂停Seedance2.0全球发布
- 广州出台AI"一人公司"政策,三年构建"十百千万"格局
- 上海生成式AI服务备案规模达150款
- 教育部批复全国唯一独立设置的网络安全类本科高校,选址武汉
开源项目
