- OpenAI发布GPT-5.5:史上最智能模型,Token成本降至1/35,AI首次在纯数学核心领域做出原创贡献
- DeepSeek-V4预览版发布并开源:百万上下文成标配,开源模型性能逼近顶级闭源模型
- 北京车展车载AI大爆发:阿里千问接入十余家车企,豆包大模型搭载超700万辆车,宝马、特斯拉纷纷入局
- DeepSeek启动首轮融资,目标估值超200亿美元,核心目的是给员工期权定价留人
- 腾讯开源混元Hy3最强版本,蚂蚁百灵发布万亿旗舰模型Ling-2.6-1T
- Cursor寻求500亿美元估值融资遭多家顶级基金拒绝,AI编程工具竞争白热化
- Meta裁员8000人、微软推自愿退休计划,AI高成本开始挤压科技巨头利润
- 国产算力集体Day-0适配DeepSeek-V4:华为昇腾、寒武纪、摩尔线程全线上阵

模型双雄:GPT-5.5 与 DeepSeek-V4 同日亮剑
OpenAI 发布 GPT-5.5:史上最智能模型,推理成本暴降 35 倍
OpenAI 于 4 月 24 日正式发布 GPT-5.5,定位为"面向智能体时代的新型智能"。核心变化:
- 自主性飞跃:用户可直接下达模糊、多目标指令,模型自动完成拆解、工具调用、脚本编写、结果验证和迭代优化,不再需要逐步引导
- 性能数据:Terminal-Bench 2.0 准确率 82.7%,SWE-Bench Pro(GitHub 真实问题解决)58.6%,均远超竞品
- 成本暴降:在英伟达 GB200 NVL72 上运行,百万 Token 成本降至前代 1/35,每兆瓦 Token 输出量提升 50 倍
- 科学突破:协助发现拉姆齐数(Ramsey Numbers)新证明,已通过 Lean 形式化验证——AI 首次在纯数学核心领域做出原创性贡献
- 自我优化:Codex 系统自主编写负载均衡算法,将自身 Token 生成速度提升超 20%
- 定价:标准版 $5/百万 Token,Pro 版 $30/百万 Token
深度解读 & 洞察:
GPT-5.5 最核心的突破不是"更聪明",而是"更自主"。之前的 AI 模型更像一个"高级打字员"——你让它写一段它写一段;GPT-5.5 则像一个"初级项目经理"——你给一个模糊目标,它自己拆任务、找工具、写代码、检查结果、修 bug,全流程闭环。这意味着 AI 从"辅助工具"正式进入"自主执行"阶段。
与英伟达的深度绑定值得关注:模型和硬件联合设计,百万 Token 成本暴降 35 倍背后,不仅是算法优化,更是软硬件协同的结果。这种合作模式将 AI 竞争从纯算法层面拉到了"算法定义+硬件定制"的新维度。
AI 自主优化自身基础设施(Codex 自己写负载均衡算法),预示着一个正反馈飞轮的启动:模型越强→基础设施越高效→模型更强。这对整个行业的竞争格局有深远影响。
DeepSeek-V4 预览版发布并开源:百万上下文成标配,开源追上闭源
DeepSeek 同日发布 V4 预览版并同步开源,分两个版本:
| DeepSeek-V4-Pro | DeepSeek-V4-Flash | |
|---|---|---|
| 总参数 | 1.6 万亿 | 2840 亿 |
| 激活参数 | 490 亿 | 130 亿 |
| 定位 | 旗舰,对标顶级闭源模型 | 轻量,性价比之选 |
| 输入价格 | 12 元/百万 Token | 1 元/百万 Token |
核心亮点:
- 百万上下文标配:引入全新注意力压缩机制 + DSA 稀疏注意力,1M 场景下 Pro 版推理 FLOPs 仅为前代 27%,KV 缓存降至 10%
- 性能对标:Pro 版 Agentic Coding 达开源最佳,体验优于 Claude Sonnet 4.5,接近 Opus 4.6 非思考模式
- 生态适配:针对 Claude Code、OpenClaw、OpenCode 等主流 Agent 产品专项优化
- API 价格:Flash 版 1 元/百万 Token 输入,将顶级模型能力拉到"白菜价"
深度解读 & 洞察:
DeepSeek-V4 最具战略意义的不是"性能追上了闭源模型",而是"百万上下文的成本被砍到了前代的十分之一"。当处理一百万 Token(约等于一本长篇小说)的成本从高不可攀变得"用得起",大量基于长文档的实际应用场景(法律合同审查、大型代码库维护、多轮 Agent 协作)将被解锁。
开源策略的选择也值得细品:DeepSeek 把最强版本直接开源,本质是在争夺开发者生态——谁能成为 Agent 时代的"Android",谁就掌握了下一代 AI 应用的分发权。1 元/百万 Token 的定价更是把门槛踩到地面,对国内中小企业和独立开发者来说几乎是"零成本"上手。
影响:
- 港股大模型股在 V4 发布后跳水(智谱跌 6.3%、Minimax 跌 3.9%),市场担忧开源模型冲击商业化空间。短期利空同赛道上市公司,但长期利好整个 AI 应用生态
- 对开发者和创业者是重大利好:顶级模型能力以极低成本开放,AI 应用的创业窗口进一步打开
国产算力生态:Day-0 适配 DeepSeek-V4,自主算力全面就位
DeepSeek-V4 发布当天,国产 AI 芯片厂商集体完成适配,展现出罕见的协同效率:
- 华为昇腾:超节点全系列支持 DeepSeek-V4,昇腾 950 实现 TPOT 约 20ms 下单卡 Decode 吞吐 4700TPS;华为云 MaaS 平台同步上线免部署 API 服务
- 寒武纪:基于 vLLM 完成 V4-Flash(285B)和 V4-Pro(1.6T)Day-0 适配,通过自研 Torch-MLU-Ops 算子库专项加速稀疏 Attention 等模块
- 摩尔线程:携手智源 FlagOS,MTT S5000 完成 V4-Flash 适配,利用原生 FP8 支持承载 V4 的"FP4+FP8"混合精度策略
深度解读 & 洞察:
三家国产芯片厂商在同一天完成适配,传递了一个关键信号:国产算力生态对前沿大模型的支撑能力已经从"勉强能跑"进化到"发布即适配"。特别是 DeepSeek-V4 采用了全新的压缩稀疏注意力架构和混合精度策略,技术复杂度远超前代——能 Day-0 适配说明软硬件协同能力已相当成熟。
英特尔 CEO 陈立武同日指出,AI 推理趋势正推动 CPU/GPU 配比从 1:8 趋向 1:1,英特尔 Q1 数据中心营收同比增长 22%。Meta 也宣布与 AWS 合作,部署数千万 Graviton 核心。这两条消息共同指向一个趋势:AI 推理(而非训练)正成为算力需求的主战场,CPU 的角色正在重新被重视。
北京车展引爆车载 AI:从"语音助手"到"智能体"的集体跃迁
2026 北京车展首日,车载 AI 成为最大看点,国内外车企和科技公司集体亮剑:
- 阿里千问接入十余家车企:长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等宣布接入,用户可一句话在车内完成订餐、购物、导航、支付
- 宝马基于千问推出三款 AI 智能体:“用车专家”“出行伙伴”“百科达人”,新世代 BMW iX3 长轴距版首搭,整合 20 万条宝马专业知识库
- 火山引擎发布新一代汽车 AI 方案:豆包大模型已搭载超 700 万辆车、覆盖 50+ 品牌,日均完成超 3000 万次座舱交互
- 特斯拉车载语音接入豆包:首次全面采用中国本土 AI 技术,采用双模型方案(豆包 + DeepSeekChat)
- 华为鸿蒙座舱 HarmonySpace 6:小艺智能体采用千亿级参数多模态模型,一句话同时处理导航、控车、聊天和生活服务
- 地平线发布舱驾融合芯片"星空":5nm 制程、650 TOPS 算力,一颗芯片同时支持智驾与座舱,单车综合降本 1500-4000 元
- 斑马智能与支付宝推出车载 AI 支付:语音指令直接完成车内支付,全球首个支付笔数超 1 亿的 AI 原生支付产品
深度解读 & 洞察:
车载 AI 正经历一次质变:从"能听懂你说什么"进化到"能替你把事情办完"。以前的语音助手只能说"好的,为您导航到最近的餐厅";现在的智能体可以直接说"找到了 3 公里内有充电桩的商场,旁边有评分 4.8 的川菜馆,吃完后走机场第二高速 40 分钟到机场,需要我帮你订位吗?"
这背后是两条技术路线的融合:端侧(车机本地)处理隐私敏感和实时性任务,云端调用大模型处理复杂推理和服务整合。阿里千问和火山引擎豆包分别代表"平台化输出"和"产品化交付"两种打法。
地平线的舱驾融合芯片"星空"尤其值得关注——它把智驾和座舱从两套系统合二为一,直接省掉一套芯片和内存,单车省 1500-4000 元。在 DRAM 价格翻倍的背景下,这种方案的商业说服力很强,已获得大众、比亚迪等 10 余家车企意向合作。
特斯拉接入豆包是一个标志性事件:全球最激进的科技车企选择中国本土 AI 模型,说明国产 AI 在车载场景的成熟度已达到国际认可水平。
资本与人才:AI 行业的钱去哪了、人去哪了
DeepSeek 启动首轮融资:目标估值超 200 亿美元,核心目的是留人
《金融时报》披露 DeepSeek 正与少数战略投资者接触,融资规模仅"几亿美元低位",核心目的并非缺钱,而是通过融资给员工手里的股票期权定出更清晰的价值。
背景:过去几个月,R1 论文主要作者郭达雅加入字节跳动,资深研究员王秉轩转投腾讯。DeepSeek 现金薪酬有竞争力,但缺少清晰估值导致在人才争夺中处于劣势。
深度解读 & 洞察:
DeepSeek 的融资故事折射出 AI 行业一个残酷的现实:技术理想主义也得面对市场价格。梁文锋用量化交易公司的自有资金养 DeepSeek,这种模式在做研究时没问题,但当竞争对手开始用几十亿美元的估值给员工画饼时,"没有估值"就变成了人才流失的根源。
融资规模刻意控制得小(几亿美元),更像是一次"估值锚定"而非资金需求。最有意思的是,知情人士指出最合适的投资者可能是"提供算力和云基础设施的战略合作伙伴"或"没有业绩压力的国资背景基金"——这暗示 DeepSeek 的商业模式仍然模糊,纯商业资本可能不太买账。
Cursor 500 亿美元估值融资遭多家顶级基金拒绝
AI 编程公司 Cursor 寻求数十亿美元新融资时,包括 Iconiq 在内的多家大型基金明确拒绝其 500 亿美元估值。SpaceX 曾传出有意以 600 亿美元收购,但最终融资碰壁。
核心原因:全球顶级资本已在 OpenAI 和 Anthropic 身上押注数十亿,而 Claude Code 增长势头强劲,独立编程工具的生存空间被持续挤压。
深度解读 & 洞察:
Cursor 的遭遇说明 AI 行业融资逻辑正在根本性转变:资本不再追逐"单点工具",而是向拥有底层模型能力的平台型公司集中。当 Claude Code、Codex 等大模型原生编程工具崛起,独立做一层封装的 Cursor 模式面临天花板——没有底层模型能力的护城河,随时可能被上游厂商"降维打击"。
AI 裁员潮持续
- Meta 裁员 8000 人(约 10%),资金集中投入 AI 基础设施
- 微软推出自愿退休计划,约 8750 名美国员工符合条件,薪酬等级从 9 个压缩至 5 个
- Anthropic 估值突破万亿美元,二级市场热度超过 OpenAI
影响:
- AI 高成本正在挤压科技巨头利润,"用自动化工具替代基础岗位、把资金集中到 AI 研发"成为行业共识
- 对 AI 和科技股短期中性偏多(裁员增效改善利润预期),但需警惕 AI 投入产出比不及预期的风险
- 投资者应关注:有清晰 AI 商业化路径和稳定现金流的公司(如火山引擎、昆仑万维)更具防御性
更多动态
国产模型持续上新
- 腾讯开源混元 Hy3 preview:295B 参数 / 21B 激活参数,256K 上下文,代码与 Agent 能力大幅提升,已在腾讯云、QQ、微信等产品线落地
- 蚂蚁百灵发布 Ling-2.6-1T:万亿级参数旗舰模型,主打"快思考",对标 GPT-5.4 非推理版,即将开源
- 美团秘密测试万亿参数大模型:完全基于国产算力训练,目前仅受邀用户可用
- 昆仑万维发布 4+3 战略:2025 年营收 81.98 亿元(+44.78%),AI 短剧平台月流水近 3600 万美元
- 谷歌发布 Gemini 3.1 Flash,语音生成更自然流畅
- 阿里发布 Wan-Image 4K 图像生成系统
- 腾讯开源混元 Hy3 预览版,推理和代码生成显著提升
语音与多模态
- 小米发布 MiMo-V2.5 语音模型系列:TTS 支持"一句话生成新音色",ASR 开源支持方言和中英混说
- 阶跃发布 StepAudio 2.5 ASR:推理速度提升 400%,30 分钟音频端到端转写,定价仅 0.15 元/小时
- Soul AI Lab 开源实时数字人模型 SoulXFlashTalk:14 亿参数,亚秒级延迟
- 快手可灵上线原生 4K 视频生成
AI 应用与工具
- 阿里云发布企业级 Agent 构建平台 JVS Crew:三道安全墙设计,让企业 Agent 自主执行但始终可控
- OpenAgents 展示 AI 分身办公:4 名团队成员的 AI 分身自动协作完成任务,全程真人未参与
- 有道龙虾接入 DeepSeek-V4 与 Kimi K2.6,100% 开源 MIT 协议
- 万兴脑图 AI 上线:国内首款支持 AI Agent 的思维导图软件
- 淘宝天猫推出 AI 假图识别技术,打击恶意退款
- 豆神教育与微软 Azure 推出 AI 短剧平台
行业观察
- Perplexity CEO:AI 越强 iPhone 越重要,个人数据构筑核心壁垒,Apple Silicon 是被低估的资产
- Claude Code 负责人:AI 高速发展引发用户焦虑,"错失恐惧症"蔓延,Anthropic 今年前三个月推出 45+ 项新功能
- Anthropic Mythos AI 模型被黑客入侵,安全漏洞引发行业警觉
- Meta 计划收集员工工作行为数据训练大模型,引发隐私担忧
- 小马智行 CTO 楼天城专访:世界模型 2.0 实现 AI 自我纠错,L4 与 L2 本质是不同技术路线
- 原力灵机(旷视团队)具身智能路线:不做人形、不进汽车产线,专注物流场景的务实落地
- 优必选发布 Thinker cosmos 开发者平台,推动人形机器人从实验室走向规模应用
- Cohere 与 Aleph Alpha 达成 200 亿美元合作,共建不依赖中美的人工智能架构
- 平安医疗 AI 大模型全球评测夺冠,超越 Meta 和 OpenAI
- 影禾医脉 × 天坛医院发布小君医生 2.0:全球首个全疾病覆盖的颅脑 CT 辅助报告生成模型
- 上海量子黑客松大赛官宣:50 万奖金、五大赛道,5 月 16-17 日举行
- 工信部数据:5G 用户突破 12.5 亿,3 月户均流量 23.4GB 创新高
- 腾讯云、PPIO 等云平台首批上线 DeepSeek-V4 API 服务
- 福客 AI 获阿里巴巴战略投资,聚焦电商 AI Agent
