GPT-5.5 泄露、SpaceX 600 亿吞 Cursor,AI 行业一日变天

要点速览
  • GPT-5.5 模型在 OpenAI 开发环境中意外泄露,下一代智能体编程模型浮出水面
  • SpaceX 宣布拟以 600 亿美元收购 AI 编程工具 Cursor,马斯克 AI 版图再下一城
  • OpenAI 发布 ChatGPT Images 2.0,AI 生图进入「会思考」时代
  • 谷歌发布第八代 TPU 芯片 8t/8i,专为智能体时代设计
  • OpenAI 成立 15 亿美元合资公司 DeployCo,猛攻企业级市场
  • 月之暗面发布 Kimi K2.6,最多支持 300 个 Agent 并行协作
  • 阿里开源 Qwen3.6-27B,270 亿参数编程能力超越 15 倍规模模型
  • Anthropic 最强模型 Mythos 遭未授权访问,安全性受质疑
  • 佛罗里达州对 OpenAI 展开刑事调查,涉大学枪击案
  • 蚂蚁百灵发布 Ling-2.6-flash,Token 消耗仅为同类模型十分之一
  • DeepSeek API 升级至百万 Token 上下文

GPT-5.5 泄露、SpaceX 600 亿吞 Cursor,AI 行业一日变天

模型竞赛白热化:六家厂商同日亮牌

OpenAI 发布 ChatGPT Images 2.0:AI 生图进入「会思考」时代

OpenAI 正式推出基于 GPT Image 2 模型的图像生成工具 ChatGPT Images 2.0,核心升级包括:

  • 引入「思考能力」:AI 在生成前会先联网检索信息、推理图像结构并规划布局,而非直接生成
  • 多图一致性:单次提示最多生成 8 张图像,角色、物体和风格保持一致
  • 画质提升:最高支持 2K 分辨率,宽高比扩展至 3:1 至 1:3
  • 多语言优化:中文、日语、韩语等文本生成能力大幅改善

该模型已在大模型竞技场文生图任务中登顶第一,领先第二名 240 分。目前向 ChatGPT Plus、Pro、Business 及 Enterprise 用户开放。

深度解读 & 洞察:

  • 「思考能力」是这次升级的最大亮点。传统 AI 生图是「看到提示词就直接画」,而 Images 2.0 会先「想一想」——理解用户真实意图、规划构图、检查逻辑,再动手。这意味着 AI 图像生成从「听指令画画」进化到「理解需求后创作」,设计、漫画、广告等场景的工作流将被重塑。
  • 单次生成 8 张连贯图像并保持一致性,直接击中了此前 AI 绘图最大的痛点——无法在多张图中维持同一角色的外观。这对漫画创作者、品牌设计师来说是质的飞跃。
  • 结合同日曝光的 GPT-5.5,OpenAI 正在从单一模型能力转向「智能体+多模态」的综合平台战略。

GPT-5.5 意外泄露:OpenAI 下一个前沿模型曝光

多位开发者在 Codex CLI 终端界面意外发现 GPT-5.5 模型。Reddit 用户 DavidAGMM 证实,内部测试环境被误部署到生产环境,导致一批未公开模型集体曝光:

  • GPT-5.5:被标注为「最前沿的智能体编程模型」
  • oai-2.1:同定位的智能体编程模型
  • Heisenberg:生命科学研究模型
  • Glacier-alpha 系列:大规模推理模型

泄露入口现已消失,OpenAI 尚未正式回应。

深度解读 & 洞察:

  • GPT-5.5 的定位明确指向「智能体编程」,说明 OpenAI 的研发重心已从对话式 AI 转向能自主规划、执行复杂编程任务的智能体。这呼应了整个行业的趋势——AI 不再只是「回答问题」,而是「替你做事」。
  • 多个实验性模型的同时曝光,暗示 OpenAI 内部在多条技术路线并行推进,包括生物医药、大规模推理等方向。
  • 结合同日发布的 Workspace Agents(工作空间智能体),OpenAI 正在构建一个从模型到产品到企业部署的完整智能体生态。

月之暗面发布 Kimi K2.6:300 个 Agent 并行协作

月之暗面发布并开源 Kimi K2.6,在 Artificial Analysis 榜单上取得全球开源第一。核心升级方向:

  • Agent 集群落地:最多支持 300 个子 Agent 并行完成 4000 个协作步骤
  • 全栈开发能力:自主选定技术栈,完成从前后端到数据库的全流程开发
  • 从「更强单兵」到「更好协作」:模型角色从执行者转向协调者,动态分配任务、修复错误、管理交付链

影响: K2.6 的发布标志着 AI 从单模型竞争转向多 Agent 协作竞争。当 AI 能像团队一样分工协作时,复杂任务的自动化程度将大幅提升。


阿里开源 Qwen3.6-27B:小体量大能力

通义千问团队开源 Qwen3.6-27B,270 亿参数稠密模型,编程能力全面超越前代 397 亿参数的 MoE 模型。关键指标:

  • SWE-bench Verified: 77.2 | Terminal-Bench 2.0: 59.3 | GPQA Diamond: 87.8
  • 原生支持多模态(图像、视频、文本)
  • 无需 MoE 路由,部署门槛更低

蚂蚁百灵发布 Ling-2.6-flash:极致 Token 效率

总参数 104B、激活参数 7.4B,在 Artificial Analysis 评测中仅消耗 15M tokens 完成同等任务,约为同类模型的 1/10。4 卡 H20 推理速度达 340 tokens/s。此前以匿名代号「Elephant Alpha」上线 OpenRouter,日均调用量达 100B 级。BF16/FP8/INT4 版本将开源。


DeepSeek API 升级至百万 Token 上下文

DeepSeek API 从 128k 升级至 1M tokens 上下文,与客户端和网页版对齐。知识库更新至 2025 年 5 月。创始人梁文锋透露,旗舰模型 DeepSeek V4 将于 4 月下旬发布。


谷歌发布 Deep Research 与 Deep Research Max 智能体

基于 Gemini 3.1 Pro 推出两款自主研究智能体。标准版追求速度,Max 版专注深度推理。首次支持 MCP 协议,可连接企业私有数据库,并原生生成专业图表与信息图。

资本并购重塑格局

SpaceX 拟 600 亿美元收购 Cursor

SpaceX 官宣已获得在今年晚些时候以 600 亿美元收购 AI 编程独角兽 Cursor 的权利,若未触发收购则支付 100 亿美元用于双方合作。Cursor 由 4 位 00 后于 MIT 创立,近期估值已达 500 亿美元。

深度解读 & 洞察:

  • 这笔交易的本质是「算力+用户入口」的垂直整合。SpaceX(实为 SpaceX+xAI 合并体,估值 1.25 万亿美元)拥有超级计算机,Cursor 拥有顶级编程工具和海量开发者用户。两者结合,可以形成「模型训练→产品验证→用户反馈→模型迭代」的闭环。
  • 马斯克自知 xAI 在编程领域无法追赶 Anthropic 和 OpenAI,收购 Cursor 是最快捷的补课方式。此前 Cursor 两位工程主管已跳槽 xAI,人才和基础设施的提前流动说明这不是临时起意。
  • 600 亿美元的价格标签反映出 AI 编程工具赛道的急剧升温——工具的价值不再局限于产品本身,而是被视为模型落地和获取高质量反馈数据的关键入口。

影响:

  • 对 AI 编程工具市场(Cursor、Claude Code、GitHub Copilot 等)格局将产生重大冲击
  • SpaceX 正筹备 IPO(目标估值 1.75 万亿美元),Cursor 的加入为其增添了高增长叙事
  • 但交易仍存风险:合并体仍在亏损,600 亿美元支出将加重财务压力

OpenAI 成立 DeployCo,15 亿美元猛攻企业市场

OpenAI 拟与 TPG、贝恩资本等多家私募股权公司成立合资企业 DeployCo,注资最多 15 亿美元(首期 5 亿)。DeployCo 估值预计达 100 亿美元,OpenAI 承诺为投资方提供 17.5% 年化回报率,并持有超级投票权。

深度解读 & 洞察:

  • 这是一种全新的 AI 分销模式:私募公司掌控着大量被投企业的 IT 采购决策权,OpenAI 通过与他们绑定,可以将 ChatGPT 直接植入企业运营流程,绕过传统的企业销售周期。
  • 核心动机是应对 Anthropic 在企业级市场的先发优势。Anthropic 近期因服务中断、静默调价等争议陷入舆论漩涡,这是 OpenAI 趁势抢夺企业客户的关键窗口。
  • 17.5% 的年化回报承诺相当激进,说明 OpenAI 对企业市场的增长潜力有极高信心,同时也承受着不小的财务压力。

OpenAI 推出 Workspace Agents

OpenAI 在 ChatGPT 中引入工作空间智能体,团队可创建共享智能体处理代码编写、报告生成、消息响应等任务。智能体在云端运行,即使离线也能持续执行。支持人工审批、合规 API 和角色访问控制。目前面向 Business、Enterprise、Edu 用户开放预览。

芯片与基础设施

谷歌发布第八代 TPU 芯片 8t/8i

谷歌在 Cloud Next 大会上推出两款定制 AI 芯片:

  • TPU 8t(训练专用):Pod 规模从 9216 颗增至 9600 颗,FP4 算力接近翻倍,横向扩展带宽从 100Gbps 跃升至 400Gbps
  • TPU 8i(推理专用):配备 384MB 片上 SRAM 和 288GB HBM,Pod 规模从 256 颗增至 1152 颗,FP8 算力提升 8.67 倍
  • 两款芯片能效均为上代 Ironwood 的两倍

深度解读 & 洞察:

  • 谷歌将训练和推理分为两款独立芯片,说明 AI 工作负载的分化已经到了需要专用硬件的阶段。训练追求极致算力吞吐,推理(尤其是智能体推理)追求低延迟和高内存带宽——两者最优解不同。
  • TPU 8i 的推出直接瞄准了「智能体推理」这一新兴场景。智能体需要多步规划、持续交互,对推理延迟极其敏感,这正是 8i 的设计目标。
  • 这也是谷歌对英伟达的一次正面回应——通过自研芯片降低对 GPU 的依赖,同时为自家 Gemini 生态提供底层算力保障。

黄仁勋:英伟达生产全球成本最低 Token

黄仁勋在 Cadence Live 2026 演讲中提出,衡量 AI 系统价值的核心指标应是「单位 Token 成本」,而非最大吞吐量。虽然 Blackwell/Rubin 平台造价数百万美元,但通过海量产出分摊,英伟达实现了最低的单位 Token 成本和能效比。

安全与监管风暴

Anthropic Mythos 遭未授权访问

少数未经授权用户通过第三方供应商环境访问了 Anthropic 最新的 Mythos AI 模型。该组织属于一个 Discord 频道,根据过往模型格式规律猜测了 Mythos 的在线位置从而绕过防线,已持续使用数周。Anthropic 已确认正在调查,称未影响自身系统。

深度解读 & 洞察:

  • 讽刺的是,Anthropic 刚刚以「安全风险过高」为由限制 Mythos 的开放范围,转头就被绕过了防线。这直接打了 Anthropic 「安全叙事」的脸——再严密的限制措施,在技术层面都可能存在漏洞。
  • 这也印证了奥尔特曼的批评:以「模型太危险」为借口限制访问,实际上并不能阻止真正有心的攻击者,反而可能阻碍合法研究。真正的安全应该来自技术层面的防护,而非营销层面的恐吓。

佛罗里达州对 OpenAI 展开刑事调查

佛罗里达州总检察长宣布对 OpenAI 及 ChatGPT 展开刑事调查,涉及去年佛罗里达州立大学枪击案(2 死 6 伤)。调查聚焦于 ChatGPT 是否向嫌疑人提供了枪支和弹药建议。州检察官称「如果屏幕另一端是个人,我们会以谋杀罪起诉」。OpenAI 回应称 ChatGPT 提供的是互联网公开信息,没有鼓励非法活动。

深度解读 & 洞察:

  • 这可能是全球首例针对 AI 公司的与暴力犯罪相关的刑事调查,具有里程碑意义。案件的核心问题是:AI 对用户行为负有多大程度的责任?如果 ChatGPT 只提供了公开可查的信息,它是否应该为用户的行为承担后果?
  • 这个案件的判决结果将深刻影响 AI 行业的法律边界。如果 OpenAI 被认定有责任,将迫使所有 AI 公司加强内容审核,甚至可能影响模型的基本能力。

影响: 此案如果走向不利于 OpenAI 的方向,将对 AI 行业的监管环境产生深远影响,可能增加 AI 公司的合规成本和法律风险。


奥尔特曼再谈家中遇袭事件

OpenAI CEO 奥尔特曼透露其旧金山住所此前遭燃烧瓶袭击(嫌疑人面临谋杀未遂指控),并点名 Anthropic 「谈论 OpenAI 的方式没有帮助」。FBI 在嫌疑人身上发现了一份「反 AI」文件,列有其他 AI 公司 CEO 名单。


Anthropic 争议持续发酵

  • Belo 公司遭突袭断网:Anthropic 无预警切断 Belo 公司 Claude 访问权限,60 名员工停摆 15 小时,仅提供谷歌表单申诉。15 小时后恢复服务,称系「误判」
  • Claude Code 悄然从 Pro 套餐移除:约 2% 新用户发现权益变更,Anthropic 称系 A/B 测试。算力成本压力下,公司可能引导开发者升级至 100 美元的 Max 套餐

AI 应用落地加速

千问发布数字人「小酒窝」

阿里巴巴发布生态级 AI 助手数字人「小酒窝」,已接入淘宝、飞猪、高德、支付宝、大麦等阿里全系应用。用户可通过对话完成外卖点单、行程规划、打车、机票酒店预订等跨服务串联操作。

深度解读 & 洞察: 千问小酒窝代表了阿里大模型战略的清晰方向——不再是比拼单一模型能力,而是依托商业生态底座,让 AI 从「聊天机器人」变成「能办事的助手」。这是大模型竞争重心从算法基座转向端到端生态服务能力的标志性事件。


支付宝 AI 付支持 OpenClaw 智能体

支付宝正式发布 AI 付能力,新增对 OpenClaw 类 AI 智能体的支付支持。用户在「龙虾」类智能体中直接说「开启支付宝支付功能」即可授权,三步完成支付。官方承诺「你敢付我敢赔」。


特斯拉车机语音大模型完成备案

特斯拉车机语音大模型在上海完成生成式 AI 服务备案,AI 能力从客服端延伸至座舱核心交互。这是继去年 xBot 客服模型后,特斯拉在华 AI 本土化的又一里程碑。


商汤绝影发布端侧智能体基座模型 Sage

Sage 采用 MoE 架构(32B 总参数/3B 激活参数),在 PinchBench 上任务完成率达 94%,超越 Claude Opus 4.6、GPT-5.4 等云端旗舰模型。已部署在英伟达 Orin X 端侧平台,首字响应约 0.5 秒。


爱奇艺推出首部全 AI 生成电影

《灵魂摆渡·浮生梦》定档 2026 年暑期,由爱奇艺与长信传媒联合出品。AI 成功复制经典角色年轻时期数字形象,实现超现实视觉效果。


OpenAI 推出临床医生版 ChatGPT

面向美国执业医生、护士、药剂师免费开放,使用 GPT-5.4 模型处理临床文档和医学研究。支持 HIPAA 合规,对话数据不用于训练。


Meta 采集员工键鼠数据训练 AI

Meta 计划通过内部工具采集员工鼠标移动和键盘输入数据,用于训练能模拟人类操作电脑的 AI 模型。Meta 强调数据仅用于模型训练,但隐私边界引发争议,欧洲可能违反 GDPR。


YouTube 开放深伪检测技术

YouTube 向娱乐行业开放人脸声纹检测技术,类似 Content ID 但专门识别 AI 伪造内容。演艺明星即使没有 YouTube 频道也可使用该保护。

更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码