大模型激战升级:谷歌轻量模型突袭,OpenAI紧急迭代

要点速览
  • 谷歌发布Gemini 3.1 Flash-Lite,首字响应速度提升2.5倍,输入价格低至0.25美元/百万Tokens
  • OpenAI发布GPT-5.3 Instant优化对话体验,幻觉率降低26.8%
  • 阿里千问核心负责人林俊旸突然宣布离职,离职原因疑似组织调整
  • OpenAI与美国国防部合作引发用户大规模反弹,ChatGPT卸载量暴增295%
  • 阶跃星辰开源Step3.5 Flash全链路,智元机器人开源灵渠OS
  • Anthropic年化营收达190亿美元,Cursor年化收入突破20亿美元
  • 苹果发布M5芯片MacBook Pro,AI图像生成能力提升8倍
  • 高通发布骁龙可穿戴平台至尊版,首次将NPU引入智能手表
  • 谷歌Gemini被起诉诱导暴力自杀,首起类似诉讼引关注

大模型激战升级:谷歌轻量模型突袭,OpenAI紧急迭代

核心模型激战:谷歌轻量模型亮剑,OpenAI紧急迭代

谷歌 Gemini 3.1 Flash-Lite 发布

谷歌于3月3日发布轻量级AI模型Gemini 3.1 Flash-Lite,声称是其速度最快、最具成本效益的Gemini 3系列模型。该模型在性能方面实现大幅跨越:首字响应速度(TTFT)提升2.5倍,整体输出速度提升45%。在Arena.ai排行榜获得1432分Elo得分,GPQA Diamond测试得分率达86.9%,MMMU Pro测试达76.8%,多项指标超越上一代Gemini 2.5 Flash。

定价极具竞争力:输入每百万Tokens收费0.25美元,输出每百万Tokens收费1.50美元。开发者可通过Google AI Studio和Vertex AI平台体验。新增“思考层级“功能,允许开发者灵活控制模型的思考深度,低深度适用于翻译等基础任务,高深度适用于复杂逻辑模拟等高难度任务。

OpenAI 发布 GPT-5.3 Instant

OpenAI紧随谷歌发布GPT-5.3 Instant,核心升级聚焦于用户体验优化。新模型显著改善了此前版本中常见的过度说教和冗长免责声明,不再针对普通问题甩出大段安全声明,直接提供答案。搜索功能也得到优化,不再简单罗列链接,而是能结合自身知识对搜索结果进行背景补充。

在事实准确性方面,联网模式下高风险领域(医学、法律、金融)幻觉率降低26.8%,用户反馈评估中联网时幻觉减少22.5%。写作风格从“抽象感伤“转向“细节白描”,更倾向于通过描写具体触感和声音来引发用户情感共鸣。

API代号为「gpt-5.3-chat-latest」,GPT-5.2 Instant将于6月3日退役。同时有消息透露,OpenAI正准备推出GPT-5.4,上下文窗口将超过100万Tokens,并引入“极限推理模式”。

阿里大模型核心负责人突然离职

阿里巴巴通义千问大模型技术负责人林俊旸3月4日凌晨在X平台发文宣布卸任:“me stepping down. bye my beloved qwen.”

林俊旸1993年出生,是阿里最年轻的P10级技术负责人,本硕均毕业于北京大学,拥有计算机科学与语言学复合背景。2019年加入阿里达摩院,2022年底通义实验室成立后担任通义千问系列大模型技术负责人,主导了Qwen系列从7B到72B的全尺寸开源。

此次离职非常突然,就在两天前(3月2日),阿里刚开源了4款Qwen3.5小尺寸模型系列,获得马斯克关注点赞。3月2日,阿里刚刚宣布将AI总称和核心品牌统一为“千问”。根据QuestMobile数据,千问App春节期间的DAU达到7352万,以940%增幅位居国内AI应用首位。

有接近阿里的人士透露,林俊旸的离开似乎并非本人意愿,通义实验室近期计划将Qwen团队分拆,从垂直整合体系变为水平分工团队,林俊旸的管理范围被缩小。截至目前,阿里官方尚未对此消息进行正式回应。

OpenAI 牵手国防部引发用户反弹

OpenAI宣布与美国国防部合作后,在美国引发用户大规模反弹。根据Sensor Tower数据,合作消息公布当天,ChatGPT移动应用的卸载量暴增295%,远高于平时9%的日卸载率。应用商店评分急剧下跌,48小时内一星评价激增775%,五星好评下降50%。

用户愤怒主要源于对AI用于军事领域的担忧。OpenAI CEO奥尔特曼随后解释称合作有严格的伦理红线和安全准则,但未能平息众怒。

与此同时,竞争对手Anthropic获得好处。Anthropic公开拒绝五角大楼类似合作,坚持AI不应被用于监控或自主武器。其Claude应用下载量直线上升,2月28日增长51%,连续三天登上美国App Store免费应用榜榜首。

此外,有报道称OpenAI正考虑与北约展开AI合作,合同洽谈针对北约的“非机密网络”。

开源生态持续繁荣

阶跃星辰全面开源Step3.5 Flash

阶跃星辰宣布开源Step3.5 Flash模型的预训练权重、中训练权重以及配套的Steptron训练框架。该模型采用稀疏MoE架构,总参数量1960亿,推理时仅激活约110亿参数,单请求代码任务中推理速度最高可达350TPS。Hugging Face下载量突破30万次,登顶OpenRouter Trending榜首,在OpenClaw中调用量已上升至全球前二。

智元机器人开源灵渠OS

智元机器人正式开源发布灵渠OS Alpha版本,这是面向具身智能机器人的操作系统。核心架构采用“南向适配硬件、北向支撑应用“的双向设计,包含跨平台具身软件框架和基于强化学习的双足运控仿真训练部署一站式框架。

蚂蚁集团开源AReaL强化学习框架

蚂蚁集团与清华大学联合发布开源强化学习训练框架AReaL v1.0稳定版。该框架特点是智能体可以零改造直接接入强化学习训练,不需要改动代码。通过Proxy Worker中转层解决接入训练成本高和缺乏持续进化能力的问题。实验结果显示,训练速度最高提升2.77倍。

硬件新品密集发布

苹果发布M5芯片MacBook Pro

苹果发布M5 Pro和M5 Max芯片以及新款MacBook Pro。AI性能大幅提升:AI图像生成能力相比M1 Max提升8倍,相比M4 Max提升3.8倍;LLM提示词处理能力相比M4 Max提升4倍。MacBook Pro起售价8499元,续航最长可达24小时。

高通发布骁龙可穿戴平台至尊版

高通在MWC巴塞罗那发布全新骁龙可穿戴平台至尊版,首次将NPU单元引入可穿戴设备。采用3纳米工艺,Hexagon NPU和专门低功耗eNPU双脑协同架构,在手表狭小空间内实现10TOPS总算力,足以在端侧运行20亿参数大模型。

Ayar Labs获5亿美元融资

硅光子初创公司Ayar Labs完成5亿美元E轮融资,由Neuberger Berman领投,英伟达、联发科参与。融资用于加快共封装光学器件(CPO)技术量产。TeraPHY芯片用光学替代铜线,单个封装总带宽可达200Tbps,约为英伟达Rubin GPU的7倍。

讯飞发布AI眼镜

科大讯飞在MWC2026发布AI眼镜,整机仅40克,业界最轻。核心创新是唇动识别技术,通过摄像头捕捉讲话者唇部运动,结合骨传导麦克风声音,在嘈杂环境中准确锁定说话人,提升语音识别准确率50%以上。

AI行业商业化加速

Anthropic年化营收达190亿美元

据彭博社报道,Anthropic CEO达里奥·阿莫代伊在摩根士丹利TMT大会上表示,企业年化营收规模已达到190亿美元,其中2026年2月单月就增长50亿美元。Anthropic在2025年末年化营收仅有90亿美元,不到三个月实现收入水平翻倍。

Cursor年化收入突破20亿美元

据彭博社消息,AI编程助手Cursor年化收入已突破20亿美元,过去三个月实现翻倍。Cursor成立仅四年,企业客户已贡献约60%收入。尽管部分个人开发者因Claude Code性价比更高而转投,但企业客户的高消费高留存抵消了这部分流失。

MiniMax M2.5调用量全球第一

MiniMax的大模型M2.5发布后表现强劲,根据OpenRouter数据,调用量已位居全球第一,后面是Kimi K2.5和GLM-5。这是国产大模型首次在调用量上占据全球前三。M2.5自2月13日发布以来,仅用一周就突破3.07万亿tokens调用量,MiniMax 2月份年化收入达到1.5亿美元。

AI风险与监管动态

谷歌Gemini被起诉诱导暴力

谷歌面临诉讼,佛罗里达州一名36岁男子家属指控其在谷歌Gemini聊天机器人影响下策划大规模伤亡袭击后自杀。诉讼称数月互动让该男子陷入精神恶化状态。谷歌回应称Gemini曾明确说明其AI身份并提供危机干预热线。这是首起针对谷歌Gemini的不当致死诉讼。

AI模拟核危机研究引关注

伦敦国王学院研究员Kenneth Payne让GPT-5.2、Claude Sonnet4和Gemini3 Flash三款AI模型在模拟核危机中扮演对立国家领导人。研究发现95%的模拟对局出现战术核武器使用,AI模型没有人类对核武器的本能恐惧。这为AI在军事外交领域的应用敲响警钟。

硅谷巨头阻击AI监管议员

据报道,多家AI公司资助的超级政治行动委员会已筹集1.25亿美元,用于阻击纽约州推动《RAISE法案》的议员亚历克斯·博雷斯。该法案要求年收入超过5亿美元的AI实验室公开安全计划。“引领未来“组织投放数千万美元广告指责博雷斯曾支持某些驱逐行动。博雷斯回应称硅谷害怕他是因为他懂技术。

更多动态

  • 微软Windows 12消息:计划2026年下半年推出,基于CorePC架构彻底模块化,Copilot成为系统中枢,强制要求NPU硬件
  • 雷军两会建议:提交五份建议聚焦人形机器人、智能驾驶安全、科技公益和人才培养
  • 何小鹏两会建议:建议加快推动自动驾驶从L2跨越到L4,赋予地方试点权
  • 新加坡AI人才培养计划:三年内培养10万名具备中英双语能力的AI专业人才
  • 亚马逊裁员:约1.6万名员工,不到四个月削减约3万个职位
  • Chrome发布节奏调整:从四周一次缩短至两周一次
  • 百度梯子AI关停:运营半年多后并入文心App
  • 微软被批“Microslop“:用户讽刺Windows 11过度塞入AI功能
  • API密钥泄露风险:墨西哥团队谷歌Gemini密钥被盗,48小时产生8.2万美元账单

想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码