AI模型军备竞赛升级:Anthropic与OpenAI正面交锋,国产算力突破3万卡

要点速览
  • Claude Opus 4.6发布:100万token上下文,能发现500个零日漏洞
  • OpenAI连发GPT-5.3-Codex编程模型和Frontier企业平台
  • 阿里千问春节活动9小时订单破千万,AI应用首次大规模落地消费场景
  • 生数科技融资超6亿元,Vidu视频模型全球第二
  • 中科曙光3万卡国产算力池上线,国内最大
  • 亚马逊计划2026年AI投入2000亿美元
  • Waymo融资160亿美元,估值1260亿美元
  • 市场监管总局公布5起AI领域不正当竞争案例

AI模型军备竞赛升级:Anthropic与OpenAI正面交锋,国产算力突破3万卡

Claude Opus 4.6发布:100万token上下文与零日漏洞挖掘能力

Anthropic于2月5日发布新一代旗舰模型Claude Opus 4.6,这是其Opus系列首次支持100万token超大上下文窗口。在MRCR v2长文本检索测试中得分达76%,远超前代的18.5%。

编程与Agent能力大幅提升:在Terminal-Bench 2.0评测中刷新行业纪录,能自主规划、审查代码并发现自身错误。Anthropic展示了16个Agent并行协作的实验——两周内用Rust从零编写了一个可编译Linux内核的10万行C编译器。更引人注目的是安全红队测试:在无专门指令情况下,模型在沙箱中发现了开源代码中超过500个未知零日漏洞,包括GhostScript的崩溃漏洞和OpenSC的缓冲区溢出漏洞。

办公自动化升级:Excel集成支持摄入非结构化数据并自动推断表格结构;PowerPoint集成可学习企业模板风格生成演示文稿。

定价与可用性:维持每百万token输入5美元、输出25美元的标准定价,已通过官网、API及主流云平台上线。


OpenAI连发两款产品:GPT-5.3-Codex与Frontier平台

OpenAI于2月5日推出GPT-5.3-Codex编程模型和Frontier企业级AI协作平台,形成对Anthropic的直接竞争。

GPT-5.3-Codex核心升级:运行速度比前代提升25%,token消耗降低超50%。在SWE-Bench Pro达到57%准确率,Terminal-Bench 2.0为76%,OSWorld计算机操作测试达64.7%。新模型支持实时交互反馈,可在任务执行过程中随时调整方向。更重要的是,这是OpenAI首个实现"自我加速"的模型——研发团队使用其早期版本调试训练流程和部署管理。

Frontier平台定位:面向企业的AI智能体管理平台,支持连接CRM、数据库等业务系统,赋予AI操作电脑、运行代码、规划复杂任务的权限。平台开放性强,兼容微软和Anthropic的智能体。目前Uber、Intuit、Oracle等企业已开始试点。官方数据显示,硬件测试故障分析等任务从数周缩短至一天甚至几分钟。


阿里千问春节活动:9小时订单破千万,AI应用落地加速

阿里千问App于2月6日启动"春节30亿大免单"活动,上线9小时订单突破1000万单,登顶苹果App Store免费榜首位。这是国内AI应用首次在消费场景实现大规模落地。

活动机制与效果:用户更新App即可领取25元无门槛免单卡,支持奶茶、早中晚餐、生鲜百货及盒马商品。官方数据显示,活动期间用户说了3000多万次"帮我买",反映AI购物的真实需求。由于流量过大,系统一度出现卡顿,团队持续扩容应对。

战略意图分析:千问已接入淘宝闪购、支付宝、飞猪、高德等阿里生态场景,此次活动标志着从"对话助手"向"超级Agent"的转型。郑嗣寿表示,目的是培养用户"有事找AI"的习惯,推动AI从线上对话下沉到衣食住行等线下场景。资本市场亦有反应,港股茶饮板块当日多数上涨。


多模态与视频生成:生数科技融资、腾讯火龙漫剧、商汤空间智能

生数科技完成超6亿元A+轮融资:由中关村科学城和星连资本领投,旗下视频大模型Vidu Q3在国际权威测试Artificial Analysis中排名全球第二(仅次于xAI的Grok),生成速度比OpenAI Sora快10倍。2025年实现用户和收入超10倍增长,覆盖索尼电影、腾讯动漫等头部客户。

腾讯发布火龙漫剧App:将静态漫画转化为1-3分钟短视频,采用竖屏滑动模式,通过AI配音和动效让漫画"活起来"。这是腾讯在短视频赛道的再次布局,对标AI漫剧赛道。

商汤开源SenseNova-SI-1.3空间智能模型:在集成八项权威空间智能榜单的EASI评测中超越Gemini-3-Pro。研究揭示了空间智能的"反尺度效应"——更大的模型并不能更好地解决空间任务,其团队通过任务拆解与数据重组策略针对性解决这一难题。


算力基础设施:国内3万卡集群上线,亚马逊计划2000亿美元投入

中科曙光3万卡超集群上线:2月5日,全国首个3万卡规模、实际投运的最大国产AI算力池在国家超算互联网郑州核心节点上线。从万卡到3万卡仅用不到两个月,已完成400多个主流大模型适配,支持万亿参数训练和高通量推理。

亚马逊2000亿美元AI资本开支:据报道,公司2026年AI相关资本支出将达约2000亿美元,同比增长超50%。AWS四季度营收356亿美元,贡献公司超60%运营利润。CEO Andy Jassy表示这是维持长期竞争力的必要举措。

马斯克谈太空AI数据中心:预言30-36个月内太空将成为部署AI成本最低的地方,原因是地球电力增长跟不上芯片生产速度。xAI孟菲斯数据中心仅制冷就增加40%电力消耗。


国际AI动态:Waymo融资、Reddit财报谈AI搜索、联合国专家组

Waymo完成160亿美元融资:估值达1260亿美元,较两年前的450亿美元增长近两倍。无人驾驶出租车已在旧金山、菲尼克斯、洛杉矶、迈阿密运营,并进入亚特兰大和奥斯汀。计划2026年进入达拉斯、拉斯维加斯、华盛顿等十多个美国城市以及伦敦、东京市场。

Reddit押注AI搜索:财报电话会议透露,Reddit Answers周活跃用户从2025年初的100万增至第四季度的1500万,增长15倍。计划2026年第三季度取消登录/未登录用户区分,通过AI实现全站个性化。公司还将AI回复与传统搜索深度整合。

联合国AI安全专家组成立:公布40位候选人名单,包括中国科学家宋海涛(上海交大院长)和王坚(中国工程院院士)。古特雷斯表示AI正以光速发展,需要建立共识构建有效防护栏。


AI安全与监管:市场监管总局公布典型案例

国家市场监管总局公布5起AI领域不正当竞争典型案例:

  • 仿冒DeepSeek:北京奥蓝德和杭州博珩因使用DeepSeek官方字样、图标推广所谓"本地部署工具"并诱导付费,分别被罚5000元和3万元。

  • 冒充ChatGPT:上海熘云运营"ChatGPT在线"公众号,通过API调用服务却声称是"ChatGPT中文版"并使用官方风格头像,被罚6.2万元。

  • 侵犯商业秘密:某公司工程师闵某某擅自下载15.88GB含AI算法的核心技术文件,被罚36万元。

  • AI语音滥用:上海俏聘帮助贷款中介使用AI语音软件冒充银行拨打骚扰电话,被罚20万元。


更多动态

  • 美团发布LongCat-Flash-Lite:685亿参数轻量化MoE模型,推理时仅激活29-45亿参数,智能体与代码任务表现突出,已开源

  • 面壁智能松果派开发板:基于NVIDIA Jetson系列,端侧AI开发板,计划2026年年发布

  • 腾讯AI小钉群聊助手:为每个钉钉群配备专属7×24小时在线Agent,支持资讯推送、任务管理、群设置

  • 360纳米漫剧流水线:国内首个工业级AI漫剧生产平台,出片速度提升3倍

  • Meta Avocado模型曝光:内部备忘录显示其被评价为"迄今最强"预训练基础模型,或标志从开源向商业化转型

  • 苹果UI研究新进展:通过设计师草图反馈微调Qwen3-Coder,UI生成能力超越GPT-5

  • 摩尔线程与小马智行合作:国产GPU首次进入L4级自动驾驶训练核心环节

  • 文远知行与Uber合作:计划2027年前在中东部署1200辆Robotaxi

  • Peloton裁员11%:AI硬件战略失利,反映95%生成式AI商业尝试未达预期的行业现实


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码