- 林俊旸离职后断言:AI从推理思考转向智能体思考,训练模型变成训练系统
- OpenClaw框架走红引发智能体热潮,中美企业态度两极分化
- Anthropic计划10月IPO募资600亿美元,新模型Claude Mythos泄露
- 谷歌Gemini支持一键导入ChatGPT对话记忆,降低用户切换门槛
- 美团发布开源多模态模型LongCat-Next,统一图像语音为同源Token
- 苹果计划在iOS 27开放Siri接口,允许第三方AI助手深度整合
- OpenAI战略收缩:暂停情色模式、关停Sora,聚焦编程和企业服务
- Meta强制员工使用AI:80%中高级工程师需在工作中使用AI工具
- 小米宣布三年投入600亿发力AI,发布MiMo-V2系列模型
- OpenAI硬件团队被控窃取iyO原型,指控称研发加速近十年

智能体成为AI新焦点:从推理式思考到行动式思考
林俊旸:AI演进全面转向智能体思考
前阿里千问技术负责人林俊旸在离职后发表长文,系统复盘了千问的技术探索历程,并提出了对AI下一阶段发展方向的核心判断。
核心观点:
- 行业正从"推理式思考"转向"智能体式思考"
- 过去关注的是如何让模型"多想一会儿",未来重点是模型能否为了采取行动而思考
- 第一波推理模型(OpenAI o1、DeepSeek-R1)验证了强化学习在后训练阶段的价值
- 真正的智能体思考必须在真实约束下通过持续交互取得进展
千问的实践困境:
- 团队曾试图将thinking(思考)和instruct(指令)两种模式合并到同一个模型中
- 但两种模式的数据分布和行为目标存在本质差异,强行合并导致两边都表现平庸
- 这促使千问在后续版本中选择发布独立的Instruct和Thinking变体
未来挑战:
- 智能体RL的基础设施需要训练与推理彻底解耦
- 奖励作弊成为核心难题:能搜索的模型可能学会直接搜索答案
- 竞争优势来源正在改变:从更好的RL算法转向更好的环境设计、更强的编排工程
深度解读 & 洞察:林俊旸的分析揭示了AI发展的一个关键拐点。过去两年,OpenAI o1和DeepSeek-R1证明了推理能力可以被训练和复现,但这只是第一步。真正的智能不是在真空中思考,而是在与真实世界的交互中持续迭代、修正计划。这种转变意味着:训练目标从"解决基准测试"变成了"解决交互式任务";技术栈从静态验证器扩展到了包含工具服务器、浏览器、终端等的完整生态系统;研发重点从数据多样性转向环境质量。简单说,AI正在从"会思考的模型"进化为"会干活的系统"。
OpenClaw框架走红,智能体热潮形成
AI产业的一个新热潮正在形成。最近OpenClaw框架(中文因谐音被叫"龙虾")走红,引发了一波智能体的热潮。百度、字节跳动、腾讯等大厂都在积极推出各自的智能体产品。
产业影响:
- 大模型企业的盈利前景越来越清晰
- 随着智能体在金融、管理等专业领域的应用落地,大模型企业有望在2026年实现业绩增长
- 企业需要改变管理方式,用AI提升组织效能、加强数据管理
深度解读 & 洞察:OpenClaw的走红不是偶然。它代表了AI从"对话工具"向"任务执行器"的范式转移。过去用户用AI聊天、问答,现在用户让AI写代码、处理文档、管理项目。这种转变意味着AI正在从玩具变成工具,从单次交互变成持续工作流。对企业来说,智能体时代的关键不是追逐单个AI产品,而是如何将AI能力嵌入到业务流程中,形成真正的生产力提升。
OpenClaw创始人谈AI温差:中美企业态度两极分化
OpenClaw创始人彼得·斯坦伯格接受采访时指出,中美两国在使用AI智能体的态度上形成了鲜明对比。
核心差异:
- 在美国,某些公司会因为员工使用OpenClaw而裁掉他们
- 在中国,很多公司会因为员工不使用OpenClaw而裁掉他们
- 中国成为庞大的AI系统测试场,学生、工人、老年人纷纷涌入测试
- 美国企业更多出于安全和失控的担忧,选择限制甚至禁止员工使用
斯坦伯格的观点:
- 美国企业应该从中国学到经验
- 人类只有频繁地与AI互动和测试,才能真正理解AI的能力,同时发现和规避安全漏洞
深度解读 & 洞察:这种"温差"反映了两国在AI治理上的不同理念。美国更强调安全、隐私和可控性,担心AI智能体失控带来的风险;中国更强调效率、创新和实用主义,愿意通过大规模测试来快速迭代。两种态度各有优劣:过于谨慎可能错失技术红利,过于激进可能埋下安全隐患。斯坦伯格的观点提醒我们,平衡的关键在于"亲自下场"——只有在真实场景中不断测试,才能既挖掘AI的潜力,又发现和修复潜在问题。
AI巨头竞争升级:上市竞赛与战略收缩
Anthropic计划10月IPO,募资超600亿美元
Anthropic计划最快在今年10月IPO上市,试图抢在OpenAI之前。公司已与高盛、摩根大通和摩根士丹利等华尔街大投行展开初步讨论。
关键信息:
- 上市募资规模预计超过600亿美元
- 今年2月完成30亿美元融资,融后估值达3800亿美元
- 股东包括谷歌、亚马逊、微软和英伟达
- 法院支持了Anthropic的立场,暂时解除了美国政府对其技术使用的限制
深度解读 & 洞察:这是AI领域迄今规模最大的IPO计划之一。Anthropic选择在此时推动上市,有几个关键信号:第一,公司认为自己的技术护城河已经足够深,Claude系列模型在企业市场取得了实质性进展;第二,OpenAI的战略收缩(关停Sora等产品)给了Anthropic追赶的机会;第三,资本市场对AI公司的估值逻辑正在从"烧钱换增长"转向"盈利能力验证"。对整个行业来说,Anthropic的上市将是一个风向标——如果市场反应热烈,将证明AI公司的商业化路径可行,可能引发新一轮AI公司上市潮。
Claude新模型Mythos泄露,性能超越Opus
Anthropic的泄露文件显示,一个名叫Claude Mythos的新模型目前正在秘密测试中,性能已经超越了之前的旗舰产品Claude Opus。泄露信息提到了一个全新的模型层级叫Capybara。
关键信息:
- 新模型会带来前所未有的网络安全风险
- Anthropic在追求最强智能和保护人类安全之间寻找平衡
- 正式发布日期尚未确定
深度解读 & 洞察:泄露文件揭示了AI发展的一个核心矛盾:能力越强,风险越大。Anthropic一直以安全著称,但这也意味着他们在发布新模型时更加谨慎。Mythos的出现表明,大模型的能力边界正在被再次突破,从简单的对话能力发展到更深层的逻辑推理和复杂任务处理。但关键问题是:当AI的智能水平开始超越人类的认知边界时,如何确保这种力量被安全地驾驭?这是Anthropic和所有AI公司都需要面对的问题。
OpenAI战略收缩:关停Sora,聚焦编程和企业服务
OpenAI宣布无限期暂停ChatGPT情色模式的开发,并突然关闭备受关注的视频生成模型Sora。这一系列动作反映了公司正在进行重大战略转变。
战略调整:
- 放弃消费级支线任务,核心资源集中向商业用户和程序员群体倾斜
- 编程领域被认为是大模型能最直接提高生产力的场景
- 企业级市场是稳定的收入来源
- 竞争对手Anthropic在企业市场的强力进攻是重要因素
深度解读 & 洞察:这是OpenAI成立以来最明显的战略调整信号。过去几年,OpenAI试图在所有AI细分领域都保持领先——从对话到图像、从视频到搜索。但这种"全面开花"的策略在商业上难以为继。现在,OpenAI选择收缩战线,把资源集中在最能赚钱的领域。这个转变背后有几个逻辑:第一,资本市场的压力在增大,投资者需要看到清晰的盈利路径;第二,编程和企业服务是AI能力最成熟、商业化最清晰的场景;第三,与其在所有战场都作战,不如在关键战场建立绝对优势。这对整个AI行业也有启示:AI的竞争正在从"谁的能力更全面"转向"谁的商业化更成功"。
OpenAI硬件团队被控窃取原型,研发加速近十年
AI音频初创公司iyO与OpenAI之间的法律纠纷骤然升级,从最初的商标侵权演变为严重的技术剽窃纠纷。
核心指控:
- iyO指控前工程师违规访问公司内部服务器,下载大量机密CAD文件与专有设计数据
- 这些资料最终落入前苹果设计师、io联合创始人Tang Tan手中
- Tang Tan随后与前苹果设计师Jony Ive旗下工作室的工程师共同审查这些内部材料
- iyO预估,这次机密窃取让io公司的产品开发进度"加速了近十年"
深度解读 & 洞察:这个案件揭示了AI硬件竞争的激烈程度。OpenAI正在与Jony Ive合作开发AI硬件设备,而苹果的设计团队是人才争夺的焦点。如果指控属实,这意味着OpenAI可能通过不正当手段获得了竞争对手的核心技术,这将严重损害其声誉,也可能引发更广泛的法律和道德问题。更重要的是,这个案件反映了AI硬件领域的"人才战争"正在升级——当AI从软件走向硬件,工业设计和硬件集成能力成为新的稀缺资源,巨头们正在不择手段地获取这些能力。
产品与技术突破:多模态、语音与Agent
谷歌Gemini支持一键导入ChatGPT对话记忆
谷歌为Gemini增加了一项新的"记忆导入"功能,让用户更便捷地从其他AI服务切换至Gemini AI。
功能亮点:
- 偏好导入:用户可将喜好、人际关系、背景信息直接导入Gemini
- 操作便捷:复制粘贴原AI应用生成的摘要即可
- 聊天历史迁移:支持上传从其他AI导出的聊天历史ZIP文件
- 更名"记忆":将原有的"过往聊天"功能更名为"记忆"
深度解读 & 洞察:这个功能看似简单,但战略意义重大。换AI平台最大的痛点是什么?是要重新教AI了解你的工作方式、沟通习惯和偏好。谷歌的这个功能直接降低了用户切换平台的成本。从竞争角度看,这是谷歌在AI助手战争中的一次精准打击——如果用户可以轻松把在ChatGPT或Claude上积累的"记忆"迁移到Gemini,那用户选择平台的标准就不再是"我用习惯了哪个",而是"哪个平台更好用"。这也有望推动整个AI行业走向更开放的数据流动。
美团发布开源多模态模型LongCat-Next
美团今日发布原生多模态大模型LongCat-Next,将图像、语音与文本统一映射为同源的离散Token。
架构创新:
- 构建DiNA(Discrete Native Autoregressive)离散原生自回归架构
- 所有模态统一为离散Token,用同一个自回归模型建模
- 无论读文字、看图片还是听声音,对AI来说都是同一件事:预测下一个Token
性能表现:
- 视觉与文档理解:超越Qwen3-Omni及专用视觉模型Qwen3-VL
- 纯文本能力:MMLU-Pro(77.02)和C-Eval(86.80)表现领先
- 音频领域:支持低延迟的并行文本语音生成与可定制语音克隆
- 工具与代码:SWE-Bench代码能力达到43.0
深度解读 & 洞察:美团的开源动作体现了中国科技公司在AI领域的一个新策略:与其和OpenAI、Google在通用大模型上硬碰硬,不如在垂直领域和特定架构上建立优势。LongCat-Next的DiNA架构是一个有趣的技术路线——把所有模态都转化成离散Token,然后用统一的方式建模。这种设计让模型在训练时更稳定,部署时更轻量。更重要的是,美团选择开源,这意味着他们希望构建生态,而不是单纯卖模型。对开发者来说,这是一个可以自由使用、修改和商业化的多模态基础模型。
苹果计划在iOS 27开放Siri接口
苹果计划在iOS 27中向第三方AI助手开放Siri的底层接口,允许用户通过App Store安装的AI聊天机器人与Siri深度整合。
战略转变:
- Siri从一个独立的工具转变为一个开放的AI分发平台
- 用户只需一个指令,就能直接在Siri界面调用不同厂商的AI能力
- 苹果无法在所有AI细分领域都保持领先,开放接口能确保Siri依然是用户进入AI世界的第一入口
深度解读 & 洞察:这是苹果闭环生态中的一个重大转变。长期以来苹果以封闭著称,但面对AI这个快速演进的领域,苹果意识到单打独斗有局限。向外部助手开放Siri,既是为了守住硬件流量入口做出的让步,也是一次精准的进攻。当Siri能够随时变换"灵魂"时,智能手机的交互方式可能真正迎来新的阶段。这个策略的聪明之处在于:苹果不需要在每个AI细分领域都做到最好,只需要成为用户接入AI的入口。这也是平台思维的典型体现——我不做所有应用,但我做应用的分发平台。
Claude高峰时段调整会话额度机制
Anthropic调整了Claude的用量限制机制,引入类似电力系统峰谷价的逻辑。
调整内容:
- 在高峰时段(太平洋时间早上5点-11点,北京时间晚8点-凌晨2点),5小时会话限额会缩减
- 约7%的用户会比之前更早触发限制提示
- 每周总用量限制保持不变
- 建议开发者将大量消耗Token的后台任务转移到非高峰时段
深度解读 & 洞察:这次调整反映了AI算力资源的紧张状况。当数百万用户同时在高峰期调用Claude,服务器的压力是巨大的。Anthropic选择用经济杠杆(而不是直接涨价)来管理流量,是一种聪明的做法。它既保证了服务的稳定性,又不会完全阻止用户使用。对开发者来说,这提醒我们:AI服务不是无限的资源,合理的调用策略和时段规划正在成为必备技能。这也预示着,未来AI服务的计费模式可能更加精细化——不仅按Token计费,还可能按时段、按优先级计费。
中国力量:AI投入与落地加速
小米三年投入600亿发力AI
小米宣布未来三年投入600亿元发力AI领域。2026年的AI研发与资本开支已达到160亿元。
核心布局:
- 推出MiMo-V2大模型系列,面向智能体时代
- 首款AI原生手机Xiaomi Miclaw已进入封测阶段
- 新一代小米SU7电车全系搭载XLA认知大模型和澎湃智能座舱
- 从手机厂商转型为AI科技公司
深度解读 & 洞察:小米的600亿投入是一个明确的战略信号。在手机和电动车市场竞争日益激烈的背景下,雷军希望通过AI建立新的竞争优势。这个投入规模在国内科技公司中名列前茅,说明小米不再满足于做硬件组装商,而是要成为AI技术公司。从产品布局看,小米的策略是"全场景AI"——手机、汽车、智能家居都要AI化。这种做法的优势是能形成生态协同,劣势是资源分散。关键问题是:600亿能否换来真正领先的技术,还是只是在跟随别人?
Meta强制员工使用AI:80%中高级工程师需达标
Meta为员工设立了"硬指标",要求中高级工程师在工作中使用AI工具。
关键指标:
- 55%的代码变更需由智能体辅助完成
- 80%的中高级工程师需使用AI工具(DevMate、Metamate、Gemini等)
- Scalable ML团队目标:50%-80%的代码为AI辅助
- Creation组织预计:65%的工程师在提交代码中超过75%由AI完成
深度解读 & 洞察:这是科技巨头将AI强制化的典型案例。Meta不再只是"鼓励"员工使用AI,而是把它变成了绩效指标。这种做法的信号很明确:AI不再是锦上添花的工具,而是工作的基本技能。不学AI,可能意味着职业发展的天花板。对员工来说,这既是压力也是机会——学会用AI的人将获得更大的生产力优势。对行业来说,这可能是一个趋势:未来会有更多公司把AI使用能力作为招聘和晋升的标准。
腾讯发布Agent产品全景图
腾讯云发布Agent产品全景图,构建从基础设施到应用层的完整体系。
五层架构:
- 基础设施层:为企业应用Agent提供操作系统级别的技术底座
- 模型服务层:将MaaS平台升级为TokenHub大模型服务平台
- 技能生态层:开放自研技能、开源SkillsHub以及微信、小程序等生态资源
- AI应用层:围绕个人提效、企业营销、知识管理等场景打造产品矩阵
- 安全层:针对Agent自主执行能力提供系统性的安全保障方案
深度解读 & 洞察:腾讯的全景图展示了Agent时代的完整技术栈。从底层基础设施到上层应用场景,从模型供给到安全保障,形成了一条完整的链路。这种"全栈"策略意味着腾讯不仅要做模型,还要做模型的使用环境、工具生态和安全框架。对企业来说,这意味着可以像使用云服务一样使用Agent能力,不需要自己搭建整个技术栈。腾讯的优势在于其庞大的产品生态(微信、QQ、小程序等),这些都可以成为Agent的技能来源。
智元机器人第1万台人形机器人量产下线
智元机器人即将官宣第1万台人形机器人量产下线,距离上次官宣5000台下线仅过去一个季度。
关键数据:
- 2025年全球人形机器人市场迈入快速增长阶段,全年总出货量预计达1.3万台
- 智元以超过5100台的年度出货量,占全球39%市场份额
- 在出货量与市场份额两项指标上均位居全球第一
深度解读 & 洞察:这是人形机器人产业化的一个重要里程碑。从5000台到10000台只用了一个季度,说明量产能力正在快速提升。更重要的是,智元占据了全球近40%的市场份额,这意味着中国在人形机器人领域已经建立了实质性的领先优势。人形机器人被视为具身智能的终极形态,这个领域的突破将对制造业、服务业产生深远影响。
更多动态
- 苹果向iPhone设计团队发放20-40万美元奖金防止被挖角
- 美团2025年财报:营收3649亿元,净亏损234亿元,研发投入260亿元
- 首个AI失业补助计划启动,每月发放1000美元
- 维基百科正式禁止使用AI生成或重写文章内容
- OpenAI推出Codex插件服务,开发者可打包工作流配置
- 字节跳动Seedance 2.0正式出海,支持最长15秒视频生成
- 具身智能领域迎来首个行业标准,6月1日起实施
- ChatGPT广告业务上线六周,年化收入突破1亿美元
- 阿里QoderWork打通钉钉、微信和飞书,支持移动端远程调度桌面AI助手
- 钉钉开源CLI工具,成为国内首个面向AI Agent开源全产品能力的国民级应用
- 斯坦福研究:AI存在过度谄媚问题,47%的几率会认可有害行为
- 天工AI发布三款核心模型:游戏世界模型、视频模型、音乐模型
- 腾讯混元3.0版本将在4月发布,内部超900个业务接入
- NeurIPS征稿争议:从禁令到认错
- 《纽约时报》已刊登大量AI生成的文章,评论文章概率是新闻稿件的六倍
- 谷歌发布Gemini 3.1 Flash Live,提升语音视觉智能体实时响应能力
- Suno v5.5发布,新增声音定制、自定义模型等深度编辑功能
- Neuralink脑机接口100天:瘫痪老兵用意念畅玩《魔兽世界》
- Cohere发布开源语音识别模型Transcribe,20亿参数支持14种语言
