要点速览
- 京东开源 JoyAI-Echo 长视频生成框架,解决角色一致性和音色稳定性难题,支持 5 分钟级音画同步长片
- 美股半导体板块暴跌两万亿美元,巴菲特囤现金引发 AI 泡沫争论
- OpenAI 自研芯片核心工程师 Clive Chan 跳槽 Anthropic,后者芯片自研计划提速
- AI 培训师成华尔街新职业,一节课收费 2.5 万美元,金融机构争相购买
- 地平线创始人余凯投资 14 位离职员工创业,布局具身智能生态
- 谷歌 Gemini 市场份额突破 20%,推出 Colab 命令行工具
- 亚美尼亚大选遭深度伪造攻击,AI 造假威胁选举安全
- 特朗普政府探讨入股 OpenAI

AI 长视频生成:京东开源 JoyAI-Echo,瞄准分钟级一致性
京东开源 JoyAI-Echo 长音视频生成框架
京东开源团队发布 JoyAI-Echo,试图解决 AI 视频领域三大瓶颈:角色漂移、音色断裂、推理延迟高。
核心解法包括:
- 跨模态音视频记忆库:角色首次登场时提取视觉与声音特征并绑定存储,后续镜头主动调用,采用"开头关键帧 + 最近生成帧"双锚点设计,支持 5 分钟级长视频一致性
- 记忆驱动后训练 + DMD 加速:通过 Distribution Matching Distillation(分布匹配蒸馏,一种将大模型能力压缩到小模型的技术)实现约 7.5 倍推理速度提升
- 轻量化实时超分:将超分能力嵌入生成链路,720P 生成后直接输出 1K/2K,音画同步增强
- Director Agent:对话式 AI 导演,将创作拆分为策划、生成、点评修改三阶段,支持局部重生成
用户盲测显示,长视频画面偏好 63.6%,音频质量偏好 81.7%,提示词遵循偏好 80.6%。
深度解读 & 洞察:
- 当前 AI 视频模型在短片段上效果惊艳,但长视频面临"早期内容被后续信息稀释"的根本问题——本质上是大模型缺乏长期记忆
- JoyAI-Echo 的独立记忆机制(而非简单扩大上下文窗口)是一条更务实的技术路线,将"记住角色长什么样"与"生成下一帧"解耦
- 开源策略意义重大:长视频生成正从头部公司的技术 Demo 转变为可共同迭代的生产工具,虚拟叙事、数字人、品牌营销等场景落地条件逐渐成熟
芯片与算力:美股暴跌、人才流动与自研竞赛
美股半导体板块市值暴跌两万亿美元
半导体板块遭遇大规模抛售,市值蒸发约两万亿美元,引发市场对芯片行业前景的广泛关注。
深度解读 & 洞察:
- 暴跌背后可能反映三重担忧:AI 资本开支是否见顶、地缘政治对供应链的冲击、以及估值泡沫的修正
- 巴菲特近期大举囤积现金,进一步加剧了"AI 是否存在泡沫"的市场争论
- 对投资者而言,半导体行业正从"普涨阶段"进入"分化阶段"——有真实订单和产能壁垒的公司与纯概念公司的差距将拉大
影响:
- 对股市:半导体板块短期利空,可能拖累纳斯达克指数;中长期看,若 AI 需求持续,暴跌反而提供布局窗口
- 对加密货币:算力相关币种(如与 AI 算力结合的代币)可能承压,但去中心化算力叙事或间接受益于中心化算力成本上升
OpenAI 芯片核心工程师 Clive Chan 转投 Anthropic
帮助 OpenAI 从零打造第一颗自研芯片的核心工程师 Clive Chan 宣布加入 Anthropic。Chan 是 OpenAI 硬件团队二号员工,此前在 Tesla Dojo 团队直接向马斯克汇报。
关键时间线:
- OpenAI 自研芯片与博通合作,采用台积电 3nm 工艺,2025 年 10 月官宣,预计 2026 年量产
- Chan 在 OpenAI 约 30 个月,恰好覆盖芯片从设计到量产的全周期
- 今年 4 月路透社报道 Anthropic 有意自研芯片,Chan 的加入将实质性推进该计划
深度解读 & 洞察:
- Chan 离职的三个关键词——talent、values、ambition——暗示 OpenAI 自研芯片项目第一阶段完成后,核心人才开始寻求"新山峰"
- 这已是多位 OpenAI 员工跳槽 Anthropic 的最新案例,网友戏称"OpenAI 成了 Anthropic 的入职培训"
- 在两家均筹备 IPO 的背景下,核心人才流动反映的不仅是薪酬竞争,更是技术路线和公司文化的选择
- Anthropic 自研芯片一旦落地,将减少对英伟达的依赖,形成"模型 + 芯片"的垂直整合能力
谷歌推出 Colab 命令行工具
谷歌推出 Colab 命令行工具,使用户能够更便捷地获取云端算力资源。
谷歌 Gemini 市场份额突破 20%
谷歌 Gemini 大模型市场份额突破 20%,显示出强劲增长势头。
AI 商业化:华尔街的"AI 焦虑"与新职业
AI 培训师成华尔街新造富职业
两位 30 岁出头的创业者以每节课 2.5 万美元(约 17 万元人民币)的价格向华尔街金融机构提供 AI 培训,客户包括花旗、美国银行、T. Rowe Price 等。
背景与逻辑:
- 2022 年 ChatGPT 问世时,华尔街第一反应是封禁;如今各机构大规模投入 AI 工具,但员工不会用
- 2026 年 Q1,花旗、富国银行、美国银行合计裁员超 5000 人,同期业绩均创历史新高——“会 AI 的留下,不会的走人”
- 学习 AI 对金融从业者已从"锦上添花"变为"生存必需"
竞争格局:
- 伦敦 Multiverse 已将花旗、微软、毕马威纳入客户名单
- 纽约 Rogo Technologies 专做金融分析师自动化工具,估值达 20 亿美元
- Wall Street Prompt 的差异化策略:构建专为主流金融机构设计的 AI Agent 库,目标让 AI 承担 90% 事务性工作
深度解读 & 洞察:
- 这个故事的本质是"工具普及与能力缺失之间的断层"——银行买了锤子,员工不知道往哪钉钉子
- 2.5 万美元一节课的定价说明,当前 AI 培训处于"卖方市场",企业愿意为"即学即用"付费
- 更深层的信号:金融行业正在经历一场"人机协作"的重构,未来的核心竞争力不是"懂金融"或"懂 AI",而是"懂如何用 AI 做金融"
具身智能:地平线"离职员工军团"与生态博弈
地平线创始人余凯投资 14 位离职员工创业
地平线创始人余凯以投资方式持续支持离职员工创业,至少 14 位核心技术和管理人才获得投资,创业方向几乎全部指向具身智能。
主要案例:
- 维他动力(余轶南,地平线 005 号员工):四足机器狗,搭载地瓜机器人 S100P 芯片
- 无界动力(张玉峰):余凯天使轮投入 3 亿元
- 鉴智机器人(单羿、都大龙):被四维图新并购后,都大龙创办章鱼动力,余凯继续出资
- 叮当动力(牛建伟):专注空间大模型与通用具身智能,余凯领投
余凯还通过基金间接布局至简动力、智元机器人、本末科技等。
深度解读 & 洞察:
- 余凯的愿景是让地平线成为"机器人时代的 Wintel"——只做芯片和平台,不做整机。支持前员工创业本质上是在培育生态,这些公司未来都是地平线的下游客户
- 自动驾驶行业为中国 AI 产业完成了一次系统性工程化训练:懂传感器融合、实时控制、嵌入式系统、软硬协同的人才,正是具身智能最稀缺的
- 但隐忧仍在:地平线 2025 年净利润由盈转亏,股价承压;芯片研发负责人陈鹏 3 月离职,J7 芯片研发正处于关键时点
- 英特尔用 10 年筑牢 Wintel,高通用近 15 年锁定安卓生态——余凯的"大方"本质上是在为地平线争取建立生态壁垒的时间
更多动态
- 谷歌发布 Gemini 代理系统:旨在帮助用户提升日常工作效率
- 普林斯顿开发系统刷新数学证明纪录:展示 AI 在数学推理领域的新突破
- MAOAM 框架发布:支持用户通过交互方式操控蒙版,提升图像编辑灵活性
- 特朗普政府探讨入股 OpenAI:以期共享 AI 技术发展红利
- Anthropic 高薪招募工程师:致力于提升 AI 系统代码安全性
- 亚美尼亚大选遭遇深度伪造攻击:AI 造假技术对选举安全的威胁凸显
- 美国加速国防领域 AI 部署:推动军事领域智能技术应用落地
- "中国词元"概念提出:开源中国董事长马越团队借高考作文形式,提出中国模型、中国芯片、中国绿色算力融合的自主可控智能底座概念
