谷歌I/O百项轰炸,Qwen3.7-Max迎战,AI进入智能体纪元

要点速览
  • 谷歌I/O 2026一口气发布100项更新:Gemini 3.5 Flash免费开放,搜索25年来最大变革,AI眼镜今秋上市
  • 阿里发布智能体旗舰模型Qwen3.7-Max,35小时1000+次工具调用零中断
  • OpenAI联创Karpathy官宣加入Anthropic,将探索用Claude加速模型开发
  • 软银对OpenAI投资超600亿美元,内部质疑孙正义"追星式"押注
  • DeepSeek组建Harness团队,正面对标Anthropic Claude Code
  • GitHub遭入侵3800个内部仓库被窃,npm供应链20分钟投毒630个恶意版本
  • OpenAI联合谷歌推出C2PA+SynthID双重AI图像水印
  • 全球首部95分钟AI长片《HELLGRIND》戛纳首映,由Seedance 2.0生成
  • 全球首个家庭通用机器人"拾光S1"在武汉发布

谷歌I/O百项轰炸,Qwen3.7-Max迎战,AI进入智能体纪元

谷歌I/O 2026:百项发布宣告智能体时代全面到来

Gemini 3.5 Flash:最强旗舰模型免费开放

谷歌在I/O 2026大会上发布了Gemini 3.5 Flash,核心参数:

  • 在多项智能体和编码基准测试中超越上一代旗舰Gemini 3.1 Pro
  • 输出速度每秒280+ Token,是GPT-5.5和Claude Opus 4.7的4倍
  • 使用成本仅为其他前沿模型的一半
  • 面向全球用户完全免费,同时通过API向开发者开放

深度解读 & 洞察:谷歌将最强的Flash模型免费开放,本质上是一次"降维打击"。当免费模型的能力已经逼近甚至超越竞品的付费旗舰,用户的迁移成本就变得极低。这一策略的核心目的不是靠模型本身赚钱,而是将用户牢牢锁定在谷歌生态中——搜索、Gmail、Docs、YouTube都是AI能力的出口。对OpenAI和Anthropic来说,这相当于在价格战的底线上又砍了一刀。

谷歌搜索25年来最大变革

谷歌宣布搜索从"十个蓝色链接"正式转向AI驱动的交互式体验:

  • 新搜索框支持文字、图片、文件、视频、Chrome标签页等多模态输入
  • 信息智能体(Information Agents):用户可创建AI智能体24/7后台监控网络动态
  • 迷你应用:用自然语言生成个性化追踪器、仪表盘等工具
  • AI概览月活超25亿,对话式搜索月活破10亿

深度解读 & 洞察:这是搜索引擎诞生以来最大的一次范式转移。从"人找信息"变成"AI帮你看信息",搜索结果不再是静态链接列表,而是动态生成的交互界面。对出版商和依赖搜索流量的媒体网站来说,这意味着流量将进一步被蚕食。当AI直接给出答案,谁还会点击原始链接?

AI智能眼镜今秋上市

谷歌联合三星推出两款AI智能眼镜,分别与Gentle Monster和Warby Parker合作:

  • 内置Gemini AI,支持语音导航、实时翻译、拍照修图
  • 搭载摄像头、扬声器、麦克风,镜片不带显示屏
  • 预计售价379-499美元,今年秋季上市
  • 同时支持Android手机和iPhone

影响:

  • 利多AI硬件产业链(AR/VR光学组件、语音芯片等),谷歌正式入局智能眼镜赛道
  • 对苹果形成压力——苹果AI眼镜预计2027年才上市

谷歌I/O更多重要发布

  • Gemini Omni:全模态模型,支持从任意输入生成任意输出,首批支持视频生成,具备物理世界理解能力
  • Gemini Spark:24/7个人AI智能体,设备关闭也能后台运行,处理邮件、账单、文档等任务
  • Antigravity 2.0:智能体开发平台,支持多智能体协同,已发布开源Python SDK
  • Wear OS 7:集成Gemini Intelligence,续航提升10%,支持手表端自动化任务
  • Google Pics:AI设计工具,支持局部编辑,面向Workspace用户
  • Daily Brief / Universal Cart:个性化每日简报 + 跨平台AI购物车
  • SynthID水印扩展:AI生成内容水印技术覆盖搜索和Chrome

大模型军备竞赛:Qwen3.7-Max与Gemini Omni齐发

阿里Qwen3.7-Max:面向智能体时代的旗舰模型

通义实验室发布新一代旗舰模型Qwen3.7-Max,核心定位是"全能智能体基座":

  • 编程智能体:SWE-Pro 60.6、SWE-Multilingual 78.3,Terminal Bench超越DS-V4-Pro Max
  • 长周期自主执行:35小时连续运行、1158次工具调用零中断,在SGLang算子优化中实现10倍加速
  • 办公自动化:SpreadSheetBench-v1得分87.0
  • 跨框架泛化:兼容Claude Code、OpenClaw、Qwen Code等主流框架
  • 即将通过阿里云百炼平台上线API

深度解读 & 洞察:Qwen3.7-Max的核心卖点不是"跑分更高",而是"干活更稳"。35小时连续运行1000+次工具调用不崩溃,这解决的是Agent落地中最实际的痛点——长链路任务容易"断片"。当模型从对话玩具变成工作流引擎,稳定性比绝对能力更重要。这也标志着大模型竞争从"谁的参数更大"转向"谁能更可靠地完成任务"。

Qwen3.5-LiveTranslate:2.8秒实时同传

阿里同步发布实时语音翻译模型:

  • 支持60种语言音频输入、29种语言音频输出
  • 端到端字均延迟低至2.8秒,支持实时跨语言音色克隆
  • 内置1000个自定义热词,专业术语翻译更精准

阿里云发布千问云:为Agent而生的模型服务平台

阿里云在2026峰会上发布全新AI产品官网"千问云"(qianwenai.com):

  • 聚合150+款主流模型API(Qwen、GLM、Kimi、DeepSeek等)
  • 核心能力封装为Skills和CLI工具,Agent用一句话即可调用
  • 百炼平台同步接入智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型

阿里云新一代超节点服务器

搭载平头哥自研真武M890芯片,128张卡,互联延迟百纳秒级,面向Agent时代的高并发推理需求。

智能体生态全面爆发

DeepSeek组建Harness团队,正面对决Claude Code

DeepSeek内部组建全新Harness团队,主攻代码智能体产品,对标Anthropic Claude Code:

  • 提出"Model + Harness = Agent"公式,聚焦模型之外的所有工作
  • 前Jane Street明星工程师崔天一已于3月加入
  • 招聘要求候选人熟练使用Claude Code、Cursor等AI编程工具
  • 同步加快模型发布节奏:V4系列已发,6月将推V4.1

深度解读 & 洞察:DeepSeek从"模型实验室"向"完整AI公司"转型的信号非常明确。光有模型不够,能真正嵌入开发者的工作流才是关键。Claude Code之所以成功,靠的不仅是Claude模型强,而是整个编码智能体的使用体验。DeepSeek能否复刻甚至超越这条路,取决于产品打磨的速度——毕竟社区已经自己做出了开源的DeepSeek-TUI。

xAI发布Grok Skills:跨对话持久记忆

xAI为Grok引入持久化记忆能力,用户自定义的偏好和技能配置在所有对话中自动生效,解决AI助手"每次都要重新教"的痛点。

Android CLI 1.0正式发布

谷歌发布Android CLI稳定版,定位为AI Agent驱动开发流程的标准化基础设施,支持Claude Code、OpenAI Codex、Gemini等多平台统一调用。

AgentScope Java 1.1.0发布

阿里巴巴通义实验室开源的Agent框架Java版发布1.1.0,正式交付Harness工程框架,支持从个人工具到企业级分布式系统的分层扩展。

人才争夺与资本格局

Karpathy官宣加入Anthropic

OpenAI联合创始人、前特斯拉AI总监Andrej Karpathy正式宣布加入Anthropic:

  • 将在预训练团队工作,重点组建新团队探索用Claude加速模型开发(“模型自举”)
  • 在X上相关推文获得超1.5万转推、近1600万浏览
  • 同日,Anthropic正与五角大楼在联邦上诉法院对簿公堂——因拒绝军方监控和自主武器要求被列为"供应链风险"

深度解读 & 洞察:Karpathy的"用脚投票"值得细品。他没回OpenAI、没去谷歌、没继续创业,而是选择了以"安全优先"为品牌定位的Anthropic。更关键的是,他将探索"模型自举"——用现有模型辅助开发下一代模型,本质上是寻找一条突破算力瓶颈的替代路径。在同一天Anthropic与五角大楼交锋的背景下,Karpathy的加入也为Anthropic的"AI安全"品牌标签加了一层名人背书。

软银600亿美元豪赌OpenAI,内部质疑声渐起

彭博社报道:

  • 软银对OpenAI总投资承诺已超600亿美元
  • 多名高管担忧孙正义对奥尔特曼"追星式"信任,将其与WeWork灾难类比
  • 软银在OpenAI无董事会席位,甚至连观察员席位都没有
  • 标普已下调软银展望,认为大规模押注可能消耗流动性

影响:

  • 若OpenAI IPO估值超1万亿美元,软银将迎来"第二次阿里时刻"
  • 但Anthropic估值已逼近9000亿美元,谷歌Gemini持续追赶,竞争格局远未尘埃落定

OpenAI与Anthropic合占AI创业公司89%营收

The Information报告显示生成式AI双寡头格局加速形成:

  • OpenAI ARR达250亿美元(2026年2月),Anthropic逼近440亿美元(半年内增长3.3倍)
  • 两家合计占据AI创业公司年化营收的89%
  • 下游企业议价空间极小,被迫采用"多模型策略"分散风险

月之暗面完成约20亿美元融资,估值突破200亿美元

公司正在拆除红筹架构,为赴港上市做准备。计划采用合资企业结构让现有美元基金投资者继续参与。

算力与基础设施

AMD上海首办AI开发者大会

AMD首次将AI开发者大会搬到上海,CEO苏姿丰现场给出判断:AI正在重新定义计算的每一个层次。

  • 核心策略:以ROCm开源软件平台为核心,提供云端到端侧的全栈算力
  • 苏姿丰直言"中国正在领跑开放生态",DeepSeek、Qwen等最活跃项目从未缺少中国开发者
  • AMD AI开发者计划-中国正式上线

英特尔新款AI推理GPU曝光

Crescent Island电路板照片曝光:160GB LPDDR5X显存,PCIe Gen 5+规格,采用Xe3P微架构,预计2026年下半年提供样品。

趋境科技完成数亿元Pre-A轮融资

清华系推理基础设施公司,核心产品ATaaS平台日均处理Token近万亿,开源项目KTransformers GitHub Star突破17k。

OpenAI推出"保证容量"服务

客户可锁定1至3年长期算力,年消费越高折扣越大。本质上是将云服务的预留实例模式引入AI算力市场。

AI应用百花齐放

全球首部95分钟AI长片《HELLGRIND》戛纳首映

字节跳动Seedance 2.0参与制作的全球首部95分钟AI长片在戛纳电影节首映,15人团队14天完成,成本不到50万美元(传统同级影片的1%)。吕克·贝松也将依托Seedance 2.0执导AI动画电影。与此同时,Seedance 2.1即将发布,质量比2.0提升约20%,系列已占据AI视频生成80%以上算力消耗。

Stability Audio 3.0:可生成6分钟专业级歌曲

四款不同规格的音频生成模型,大型版27亿参数可生成6分20秒完整乐曲。小型和中型模型已开源,基于合法授权数据集训练,与华纳、环球音乐达成合作。

微信AI团队首获ICASSP最佳工业论文奖

WalkVLM-LR模型专为视障人士行走辅助设计,核心创新是"减少冗余提醒",延迟控制在百毫秒量级。这是该奖2016年设立以来首次颁给中国企业团队。

网易有道开源"子曰4"大模型

27B多模态模型,视觉数理任务达同规模SOTA;同步开源14种语言的语音合成引擎,3秒完成零样本语音克隆。

YouTube推出对话式搜索"Ask YouTube"

整合Gemini大模型,用户可直接提问,AI精准定位视频中的关键片段给出答案。所有AI生成内容添加数字水印和"合成或篡改"标签。

更多AI应用动态

  • Google CodeMender:谷歌推出AI代码安全工具,直接找出并修复安全漏洞,被视为对Anthropic安全模型的直接回应
  • 出门问问CodeBanana:获36氪「2026AI最佳场景渗透案例」大奖,研发环节实现100%AI编码
  • 微信读书Skill:AI可调用个人阅读数据,完成查书、统计、笔记整理等任务
  • 袋袋Profy:面向专业人士的AI数字分身平台,在HLE评测中超越基座模型近20个百分点
  • Netflix与爱奇艺加大AI影视投入:Netflix成立INKubator工作室用AI制作动画
  • Take-Two CEO:AI加速游戏开发有用,但做不了爆款——“数据属于过去”

具身智能:机器人从实验室走向现实

全球首个家庭通用机器人"拾光S1"发布

武汉光谷发布全国首个面向家庭场景的通用机器人,能叠衣服、做饭、收拾餐桌、陪老人聊天。搭载自研具身智能模型,不依赖预设程序,碰到人或宠物会立刻停止。

京东建设全国首个具身智能数据采集社区

在宿迁正式运行,居民头戴220克采集终端做家务即可采集训练数据。计划两年内积累超1000万小时数据,训练通用泛化能力的模型至少需数千万小时数据,而全球目前仅有数十万小时。

Figure AI机器人连续运行超120小时

三台人形机器人轮流工作,24小时完成超3万个包裹分拣,已稳定运行超6天。但实习生仍以192个包裹的优势赢得了10小时对决。

更多具身智能动态

安全警报:GitHub遭入侵,供应链攻击升级

GitHub内部仓库遭入侵:3800个仓库被窃

威胁组织TeamPCP通过员工安装的恶意VS Code扩展入侵GitHub内部系统:

  • 约3800个内部仓库私有代码被窃取,标价5万美元出售
  • 攻击者明确表示"这不是勒索",只要有一个买家就销毁数据
  • TeamPCP此前已入侵Aqua Security、LiteLLM、TanStack等多个开源项目
  • 恶意代码可横向传播至AWS其他实例和Kubernetes环境

深度解读 & 洞察:这不是孤例,而是一个趋势。开发者工具链(VS Code扩展、npm包、PyPI包)正成为供应链攻击的首选入口。一个看似无害的扩展安装,可以直接通向企业内部代码库。问题的本质是:项目的安全性不取决于自身代码质量,而是取决于所有上游依赖中安全最薄弱的那一环。

npm供应链攻击:20分钟投毒630个恶意版本

安全公司警告"Mini Shai-Hulud"攻击正在进行,攻击者入侵开发者账户后在20分钟内发布630个恶意版本,波及317个npm包,目标窃取AWS/GCP/Azure凭证和密码管理器密钥。以TanStack为跳板,攻击者还渗透了多名OpenAI员工设备。

CISA承包商在GitHub泄露高权限AWS密钥

CISA承包商主动禁用密钥泄露检测功能,明文存储密码,仓库公开数月后才被发现。泄露密钥在仓库下线后仍有效约48小时。

OpenAI推出C2PA+SynthID双重AI图像水印

  • 正式采用C2PA开放标准,在图片元数据中标注AI生成标识
  • 与谷歌合作部署SynthID隐形水印,可抵抗截图、压缩、裁剪等操作
  • 推出公开验证工具供用户检测AI生成图像

AI垃圾正在吞噬开源社区

AI原生创业公司Archestra在GitHub悬赏900美元后,AI机器人蜂拥提交253条无效评论和27个未测试的PR,团队被迫采用白名单机制自救。

更多动态


想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码