- GPT-5.6发布三款模型(Sol/Terra/Luna),编程和网络安全领域表现突出,但普通用户暂不可用
- DeepSeek融资74亿美元,梁文锋自掏30亿,看到Anthropic Mythos后下定决心储备弹药
- DeepSeek V4正式版7月中旬上线,引入高峰时段翻倍定价机制
- 北大与DeepSeek联合开源DSpark推理加速框架,单用户速度提升最高85%
- 昆仑芯瞄准500亿美元估值赴港IPO,投资者被要求额外认购芯片产品
- 惠普与OpenAI达成战略合作,全面部署Frontier AI智能体平台
- Grok 4.5在SpaceX和特斯拉启动内部测试,接近Claude Opus水平
- 自变量连融四轮估值破200亿,美团阿里字节小米集体押注具身大脑
- 智平方融资近50亿估值超200亿,成大湾区具身智能独角兽
- Coinbase改用中国AI模型GLM和Kimi,AI支出减半
- 美国部分放宽Anthropic Mythos 5访问限制,Fable 5仍受限
- 谷歌限制Gemini API调用,Meta研发受阻,算力争夺白热化
- 普林斯顿CEO-Bench:14个AI当CEO,只有3个赚到钱,纯规则算法排第四
- Momenta启动港股IPO,奔驰比亚迪参投
- 芬兰计划2031年用AI全面改造公共部门,目标生产力提升20%
- 英国消费者不信任AI购物助手,60%的人遇到一次错误就放弃

大模型竞赛白热化:GPT-5.6、Grok 4.5、DSpark同台登场
GPT-5.6 突然上线:三款模型矩阵覆盖旗舰到性价比
2026年6月27日,OpenAI发布 GPT-5.6 系列限量预览版,包含三款定位各异的模型:
| 模型 | 定位 | 要点 |
|---|---|---|
| Sol | 旗舰级,深度推理 | 新增 max 和 ultra 增强模式 |
| Terra | 高频日常工作 | 性能≈GPT-5.5,价格降一半 |
| Luna | 轻量高速 | 成本进一步压缩 |
GPT-5.6 Sol 在 Terminal-Bench 2.1 上超过 Anthropic Mythos 5,在 GeneBench v1 上超越 GPT-5.5,网络安全识别效率极高。由于监管因素,初期仅向少数受信任的合作伙伴和机构开放 API,普通用户暂不可用。
深度解读 & 洞察:
- GPT-5.6 的三档产品矩阵明显在模仿消费电子的定价策略:高端秀肌肉、中端走量、低端抢市场。Terra 降价50%是关键信号——OpenAI 开始用价格战主动争夺中间层用户。
- 在编程和网络安全领域的突出表现,说明 OpenAI 正在押注 Agent(智能体)场景。长链式 Agent 任务的稳定性提升,意味着 AI 正从「对话工具」向「可信赖的执行者」过渡。
- 受限发布本身值得关注:说明前沿模型的安全审查已成为常态,商业化节奏不得不为监管让路。
影响:
- 对AI行业:利空Anthropic、Google等竞品,GPT-5.6在基准测试中的领先地位可能影响竞品市场份额和估值预期。
- 对加密货币/科技股:OpenAI仍为非上市公司,但其竞争态势间接影响英伟达等算力供应链标的的情绪。
马斯克 Grok 4.5 在 SpaceX 与特斯拉启动内部私测
Grok 4.5 基于拥有 1.5 万亿参数的 V9 基础模型训练,训练过程中引入了 AI 编程工具 Cursor 的数据。早期评测显示,其综合能力已接近 Anthropic 旗舰产品 Claude Opus,部分领域有望超越。
更引人注目的是,马斯克宣布 SpaceX 将在今年剩余时间里每月发布一款全新基础模型,全部从头训练(而非微调)。同时,SpaceX 计划以 600 亿美元收购 Cursor 开发商 Anysphere,预计明年第三季度完成。
深度解读 & 洞察:
- 「每月一款新基础模型」的节奏远超行业常态(通常 3-6 个月迭代一次),即便最终打折扣,也反映出 xAI 在算力和数据方面的激进投入。
- 将 Cursor 数据融入训练,意味着 Grok 4.5 在代码生成方面可能会有质的飞跃。Cursor 作为目前最火的 AI 编程工具之一,积累了大量真实的开发者交互数据,这是传统训练数据集无法替代的。
- 600 亿美元收购 Anysphere 是一笔天文数字级的交易,如果完成,xAI 将同时拥有大模型能力和开发工具入口,形成对 OpenAI 的直接竞争。
北大×DeepSeek 联合开源 DSpark 推理加速框架,提速最高 85%
DeepSeek 与北京大学联合发布论文,提出大模型推理加速框架 DSpark,已部署至 DeepSeek-V4-Flash 和 V4-Pro 的生产系统。
核心创新:
- 半自回归架构:保留并行草稿模型的速度优势,同时用轻量顺序模块(仅 2 层 Transformer)补充 token 间依赖,有效生成长度反而超过 5 层传统并行模型
- 置信度调度验证:根据系统负载和候选置信度动态调整验证长度,负载高时缩短验证、负载低时拉长验证,减少无效计算
性能数据:
| 指标 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
|---|---|---|
| 单用户速度提升 | 60%-85% | 57%-78% |
| 总吞吐提升 | 51%(80 token/s) | 52%(35 token/s) |
| 高压场景吞吐提升 | 661%(120 token/s) | 406%(50 token/s) |
一个关键规律:压力越大,优化效果越显著。DSpark 已开源全部训练代码和模型权重(MIT 协议)。
深度解读 & 洞察:
- 推测解码(Speculative Decoding)的核心思想是「小模型写草稿,大模型做审稿」,类似于报社的记者+主编工作流。但之前的方案要么草稿写得慢(自回归模型),要么草稿质量差(并行模型到后段准确率骤降)。
- DSpark 的突破在于两处:让草稿写得「更像样」(半自回归),同时让审稿「会挑重点」(置信度调度)。这种设计在高并发场景下效果尤为突出,对降低 API 服务成本意义巨大。
- 开源这一动作的战略意图明确:DeepSeek 正在将竞争从「模型性能」层面推向「推理基础设施」层面,让整个行业都受益于其优化方案,同时强化自身在开源生态中的话语权。
DeepSeek V4 正式版 7 月中旬上线,引入高峰时段翻倍定价
DeepSeek 宣布 V4 正式版计划 7 月中旬上线,同步引入峰谷定价机制:高峰时段(每天 9-12 点、14-18 点)API 价格为平时 2 倍,平时价格与目前定价相同。
深度解读: 峰谷定价是典型的资源调度策略,类似于电价的峰谷定价——高峰贵、低谷便宜,引导用户错峰使用。这反映出 DeepSeek 用户量增长带来的算力压力已经不可忽视。
DeepSeek 融资 74 亿美元内幕:梁文锋看到 Claude Mythos 后决定出手
据 The Information 报道,DeepSeek 融资细节如下:
- 融资总额:74 亿美元
- 梁文锋个人出资:约 30 亿美元(占总额五分之二),此前三年均由其个人出资维持实验室运营
- 融资导火索:Anthropic 发布 Claude Mythos 后,梁文锋判断不储备足够资金将无法维持竞争力
- 团队扩张:全公司约 300 人,所有部门招聘规模至少翻倍,核心 Harness 团队已进入每天面试状态
- 国产芯片适配:梁文锋正推动 DeepSeek 适配华为芯片,判断华为几年内有望追上英伟达;适配工作导致 DeepSeek 长达 15 个月未发布新一代模型
- 市场表现:V4 在 Vercel AI Gateway 上的 token 用量份额从不到 1% 飙升至 17%,成为仅次于 Anthropic 和 Google 的第三大模型
深度解读 & 洞察:
- 梁文锋自掏 30 亿美元是一个极端信号——这不仅说明他对 AGI 的信念,也说明他在融资谈判中保持了对公司的绝对控制权。设了员工持股计划但仍坚持开源和低价路线,这是罕见的「使命驱动型」创业姿态。
- 15 个月未发布新模型来适配华为芯片,代价极为昂贵。在 AI 竞赛中,半年不发新模型可能就意味着掉队。但梁文锋判断这是「战略押注」——如果华为芯片几年内追上英伟达,率先完成适配的 DeepSeek 将拥有巨大的先发优势。
- V4 在开发者平台上的份额飙升(1% → 17%)说明开源+低价策略正在奏效。DeepSeek 正在用「极致性价比」抢占开发者的心智,这对西方 AI 公司的高估值模型构成了直接挑战。
普林斯顿 CEO-Bench:让 AI 当 CEO 500 天,仅三成保住本金
普林斯顿大学发布 CEO-Bench 基准测试:让 AI 模型扮演虚拟 SaaS 初创公司 CEO,用 100 万美元本金在 500 天内尽可能多赚钱。
关键结果:
| 排名 | 选手 | 收益 |
|---|---|---|
| 1 | Claude Fable 5 | 4715 万美元(本金翻 47 倍) |
| 2 | Claude Opus 4.8 | 2780 万美元 |
| 3 | GPT-5.5 | 2130 万美元 |
| 4 | 纯规则算法(无 LLM) | 1576 万美元 |
14 位参赛者中 5 位破产,仅 4 位保住本金。
两个核心洞察:
- 探索 > 谨慎:获胜 AI 不断尝试新策略,保守削减成本的模型虽然「苟活」但无法盈利
- 编程 Agent 并非万金油:用 Claude Code 等编程框架跑 CEO 角色,表现反而大幅下降——不同行业需要特定的 Agent 框架
深度解读: 这项研究最有意思的发现不是「AI 能不能当 CEO」,而是一个没有任何语言能力的纯规则算法竟然排第四。这说明在商业决策中,遵循纪律性的规则(固定定价、固定配额)可能比「聪明但不确定」的 AI 判断更有效。这也呼应了现实世界中量化交易(规则驱动)长期战胜主观判断的现象。
GLM 5.2 在漏洞检测任务中胜过 Claude Code
安全工具公司 Semgrep 基准测试结果:在 IDOR(不安全的直接对象引用)漏洞检测中,智谱 AI 的 GLM 5.2 以 39% F1 分数超越 Claude Code(37% / 28%)。GLM 5.2 每发现一个真实漏洞成本约 0.17 美元,约为同类前沿模型的六分之一。
深度解读: IDOR 这类漏洞的检测难点在于「没写什么」而非「写了什么」——代码本身没有危险函数,危险在于缺少权限校验。GLM 5.2 在此任务上的突破,说明开源权重模型在特定安全场景已具备与闭源模型竞争的能力,且成本结构对敏感代码库场景(不能发送至第三方 API)极具吸引力。
AI 资本与产业:昆仑芯冲 500 亿、具身智能双 200 亿
昆仑芯瞄准 500 亿美元估值,计划赴港 IPO
百度旗下 AI 芯片子公司昆仑芯计划在香港上市,目标估值约 500 亿美元(约 3405 亿元人民币)。
要点:
- 部分投资者被要求认购价值相当于其计划申购金额 3-7 倍的芯片产品
- 腾讯已成为昆仑芯客户,字节跳动也在考虑采用
- 昆仑芯成立于 2012 年,最初是百度内部 AI 芯片研发部门,已开发多代自研 AI 芯片
深度解读 & 洞察:
- 500 亿美元(约 3400 亿人民币)的估值对标全球 AI 芯片公司来看相当高——作为参考,英伟达市值已达数万亿美元。昆仑芯作为国产 AI 芯片的代表之一,其估值更多反映的是中国市场对 AI 算力自主可控的预期溢价。
- 要求投资者「额外认购芯片产品」是一种创新的绑定方式,本质上是把 IPO 变成了「融资+获客」的双重操作。这既保证了订单量,也筛选了真正有产业协同的投资者。
- 腾讯成为客户这一信息非常关键。如果字节跳动也跟进,昆仑芯将拥有百度之外的两大互联网巨头客户,这对国产 AI 芯片的商业化验证意义重大。
影响:
- 对半导体板块:昆仑芯 IPO 可能带动国产芯片概念股的情绪,但 500 亿美元估值能否被市场接受仍存在不确定性。
- 对AI行业:国产芯片的进一步成熟和资本化,有利于降低中国 AI 企业对英伟达的依赖,但短期内英伟达生态仍不可替代。
自变量连融四轮估值破 200 亿,大湾区首个 200 亿具身大脑诞生
自变量在两个多月内连续完成 B、B+、B++ 和 C 轮融资,投后估值突破 200 亿元,融资款全部到账。
资本阵容: 四大互联网巨头分别领投——美团(A 轮)、阿里(A+轮)、字节跳动(A++轮)、小米战投(B 轮起连续参与)。产业资本包括 58 集团、奇瑞、荣耀等;国家队包括中保投资、中国移动等。
技术路线: 创始人王潜认为具身智能的核心在于世界模型(World Model)。4 月发布了基于 WUM 架构的具身大模型 WALL-B,将视觉、语言、动作和物理预测统一在同一个网络中。最近发布了全球首个具备事件级预测能力的世界模型 WALL-WM。
智平方融资近 50 亿估值超 200 亿,类脑 VLA 模型首次引入皮层-小脑-脊髓协同
智平方完成新一轮系列融资,融资总额近 50 亿元,估值超 200 亿元,成为粤港澳大湾区首个估值突破 200 亿的具身智能企业。
技术亮点: 推出自研类脑 VLA 模型 NeuroVLA,首次将「皮层—小脑—脊髓」协同机制引入机器人控制:皮层负责语义理解,小脑负责运动协调,脊髓负责毫秒级执行与安全反射。运动抖动降低 75%+,碰撞后 20 毫秒内完成反射响应。
量产进展: 已建成行业首批半自动化产线,年产能超 2000 台;已在半导体显示、生物制药、新零售等领域规模化落地。
深度解读: 自变量和智平方同期达到 200 亿估值,标志着具身智能赛道正式进入「独角兽」阶段。两家公司分别押注「世界模型」和「类脑架构」两条截然不同的技术路线,这种分化本身说明具身智能仍处于技术路线尚未收敛的早期阶段。四大互联网巨头集体下注自变量,反映出平台公司对「具身大脑」入口的战略焦虑。
Coinbase 改用中国 AI 模型 GLM 和 Kimi,AI 支出减半
加密货币交易所 Coinbase 改用中国的 GLM 和 Kimi 模型,AI 支出减少一半,同时代币使用量增加。CEO 布莱恩·阿姆斯特朗表示,新建的自动路由系统可根据任务类型、价格和缓存潜力分配请求,缓存命中率从 5% 提升至 60%。
这一转变引发连锁反应:初创公司 Lindy 开始使用 DeepSeek V4,云计算公司 Snowflake 也在测试中国模型作为 OpenAI 和 Anthropic 的替代方案。
深度解读 & 洞察:
- 这是一个标志性事件:一家美国知名科技公司主动选择中国 AI 模型来降低成本,说明大模型的「性能差距」已经不足以支撑「价格差距」。
- 全球大模型市场正在从「技术竞争」转向「工程效率和商业定价」的竞争。OpenAI 和 Anthropic 之间的价格战已经打响,中国模型凭借低价策略正在蚕食市场份额。
- 这对准备上市的西方 AI 公司构成压力——如果估值模型依赖高价格维持增长,中国竞品的低价冲击将直接威胁其增长叙事。
影响:
- 对加密行业:Coinbase 降低 AI 成本有利于提升利润率,短期利好。
- 对AI行业:中国模型加速出海可能重塑全球 AI 定价体系,西方公司面临「降价或被替代」的两难选择。
Momenta 启动港股上市
自动驾驶公司 Momenta 启动港股 IPO,股票代码 6880,计划募资 58.9 亿港元。14 家机构投资者承诺认购 30 亿港元,新加坡政府投资公司、富达国际各投 1 亿美元,奔驰追加 2500 万美元、比亚迪追加 1500 万美元。2023-2025 年营收从 7.43 亿元增长到 24.13 亿元,毛利率从 17.5% 升至 71.6%,已接近盈亏平衡。
亚马逊放弃奥尔特曼传记电影发行,此前刚投 OpenAI 150 亿美元
亚马逊影业宣布放弃发行关于 OpenAI 创始人奥尔特曼的传记电影《人工智能》,理由是「换另一家公司发行可能效果更好」。该片已拍完,导演为《请以你的名字呼唤我》的卢卡·瓜达尼诺。值得注意的是,亚马逊近期刚与 OpenAI 达成 150 亿美元投资协议(后续可能追加 350 亿美元)。
深度解读: 放弃一部已经拍完的电影发行权,在好莱坞并不常见。考虑到亚马逊刚成为 OpenAI 的重大投资方,放弃一部可能对奥尔特曼形象产生争议性影响的传记电影,在商业逻辑上是合理的「投资保护」行为。
AI 基础设施与算力:全球进入「电力为王」时代
算力告急:谷歌限制 Gemini API 调用,Meta 研发受阻
自 2025 年春季以来 Gemini API 调用需求翻倍增长,谷歌于 2026 年 5 月实施使用限制,超出配额的请求被限流。Meta 因对 Gemini 需求远超其他客户,无法获得足够的算力配额,多个 AI 项目推进计划被打乱,被迫要求员工优化调用流程。
深度解读: 这一事件揭示了一个结构性矛盾:大模型能力在不断提升,但算力基础设施建设速度跟不上应用需求增长。即便是 Meta 这样的巨头,在依赖外部算力时也会被「卡脖子」。这进一步说明了拥有自有算力基础设施(如谷歌 TPU、Meta 自研芯片)的战略价值。
澳企 Firmus 在印尼建设 360MW AI 工厂,部署 17 万颗英伟达 GPU
澳大利亚 AI 云服务商 Firmus 与 DayOne 合作,在印度尼西亚峇淡建设 NVIDIA DSX 液冷 AI 工厂:
- 电力容量:360MW
- 硬件规模:17 万颗 GPU(覆盖 Grace Blackwell、Vera Rubin 多代算力)
- 合作期限:持续至 2034 年
- 营收预期:前六年通过承购协议获 250-300 亿美元收入
韩国推出 AI 数据中心专属电价,2029 年前供应超 800 万千瓦电力
韩国宣布推出分地区差异化电价制度和 AI 数据中心专属电价方案。韩国气候环境部长官金成焕将当下定义为「电力为王的 AI 时代」,具体规划包括:
- 龙仁半导体产业集群:保障约 1500 万千瓦电力、日供 150 万吨水
- 西南圈集群:配套 630 万千瓦供电
- AI 数据中心:至 2029 年前供应超 800 万千瓦电力
深度解读: AI 竞争的本质正在从「算法」延伸到「电力」。AI 数据中心的能耗已成为各国基础设施战略的核心议题。韩国将芯片和电力列为国家竞争力两大支柱,这一认知正在成为全球共识。
三星电机有望斩获 5000 亿韩元 AI 服务器 MLCC 大单,加码玻璃基板
三星电机正与美国大型云服务商洽谈约 5000 亿韩元(约 22 亿元人民币)的 AI 服务器 MLCC(多层瓷介电容器)供应协议。同时计划与日本住友化学成立玻璃基板合资公司,投资 5000 亿韩元,2028 年初投产。
行业预计 AI 服务器用高规格 MLCC 同比涨价 50-60%。村田和三星电机在该领域合计占据约 85% 市场份额。
吉姆·凯勒回应 Tenstorrent 收购传闻:已与英特尔、高通 CEO 会面
「硅仙人」吉姆·凯勒确认已与英特尔和高通两家公司 CEO 会面,希望与其中一家达成重大合作。已有超大规模云服务商在评估 Tenstorrent 的 AI IP。凯勒曾先后在苹果、特斯拉负责核心芯片开发。
三星将在光州新建先进半导体封装工厂
因 AI 芯片需求暴涨面临产能不足,三星宣布在光州建设全新先进封装工厂。三星已率先向客户提供 12 层 HBM4E 内存样品,推动下一代 AI 内存商业化。
太空算力:从概念走向工程化
光本位科技联合东方天算启动全球首颗天基光计算载荷研制
光本位科技宣布与东方天算联合启动全球首颗天基光计算载荷的研制,探索将光计算技术应用于太空场景。
光计算解决太空芯片三道坎:
- 辐射:光子不带电荷,天然免受高能粒子干扰
- 散热:太空是真空,无空气对流;光计算在波导中完成传播与计算,几乎不产生热量
- 功耗:光计算芯片静态功耗趋近于零,与卫星能源受限高度契合
光本位科技是目前全球唯一同时实现光子存内计算和玻璃基光计算的企业。联合研制的光电融合计算卡单卡算力已达 300 TOPS,支持 INT8、FP8 多精度推理。
深度解读: 太空计算的核心约束不是芯片性能,而是载荷重量和体积。光计算的低功耗、低发热特性意味着同等载荷下能容纳更多算力单元。这条技术路线不走先进制程(45nm 即可),而是通过光子多重复用维度提升算力,绕开了电计算面临的制程极限。
北京太空算力创新中心正式揭牌
北京太空算力创新中心在中关村正式揭牌,采用「公司+联盟」双轮驱动模式,核心职能包括:星载 AI 芯片、太空大模型等共性技术攻关;建设地面综合验证基础设施;主导行业标准制定;推动城市治理、天数天算、社会化 Token 化 AI 服务三类商业落地。工信部明确表示将支持太空算力技术前瞻性研究。
企业 AI 转型与产品落地
惠普与 OpenAI 达成战略合作,全面部署 AI 智能体平台 Frontier
惠普宣布在其全球业务中全面部署 OpenAI Frontier 平台,推动转型与增长计划。
Frontier 平台核心能力:
- 企业无需重新部署即可连接现有数据和应用程序
- AI 智能体不被束缚在单一界面,可通过 ChatGPT、工作流或业务应用协同工作
- 提供共享上下文、入职培训、反馈式学习和明确的安全权限边界
试点成效: 软件工程师利用 AI 在几周内处理了上百个合并请求;安全团队一天内修复了原本需要一个月的多个系统漏洞。将推广至定价、门店运营和客户支持等关键业务。
深度解读: Frontier 的设计哲学是「让 AI 融入现有工作流」而非「让工作流适应 AI」。这与许多企业 AI 项目的失败教训形成对比——大多数企业的问题不是缺少 AI,而是 AI 与现有系统割裂。Frontier 的跨界面协同能力如果真的可靠,将成为企业 AI 落地的关键基础设施。
OceanBase 发布湖库一体 AI 数据库
OceanBase 发布面向 AI 时代的湖库一体 AI 数据库,核心产品体系包括:
- Lakebase(底层引擎):统一管理结构化、非结构化和向量数据
- DataStudio(数据治理层):覆盖数据接入、加工、编排到 Agent 协作
- DataPilot(业务入口):让业务人员通过自然语言查询和生成报告
相比传统多系统方案,总体成本降低 30%-50%。已在蚂蚁阿福、灵光等场景完成验证。
深度解读: OceanBase 的核心判断是「AI 竞争的焦点已从模型转向数据」。当 Agent 进入企业执行层,它需要一次性获取完整的业务上下文。传统的数据湖+数据库+搜索引擎分离架构,让 AI 无法获得统一的数据视角。湖库一体的本质是消除多系统割裂,让 AI 真正「理解」企业。
支付宝跨代更新至 v12:蚂蚁阿宝 AI 助手正式上线
iOS 版支付宝跨版本更新至 12.12.1(此前为 10.8.76),蚂蚁阿宝 AI 助手正式上线。Logo 添加「AI」字样,应用名称改为「支付宝-你的 AI 生活伙伴」。用户可在 AI 版和经典版间切换,通过右滑以对话方式让「阿宝」处理事务。目前仍需邀请码才能体验。
豆包灰度测试社交功能,打通飞书账号体系
豆包新增独立对话页面,支持添加「豆包好友」或「飞书好友」。豆包账号可登录飞书网页版,信息同步至飞书但核心办公功能暂未开放。豆包拥有超 3 亿月活用户,打通飞书意在切入职场社交场景。
阿里推出千问输入法:AI 语音输入 + 口语润色
阿里巴巴通义千问团队推出独立 AI 语音输入法,底层接入 CosyVoice 语音能力。支持最快 300 字/分钟语音输入、9 种方言免切换识别、中英混说。核心特色是将随意口述自动转化为结构化书面文本,还能语音唤起 AI 指令模式执行查资料、写邮件等任务。
高德内测 Vibe Coding 产品「袋马」:自然语言一键生成 App
高德内测「袋马」,用户通过自然语言描述需求即可生成微信小程序或 iOS 原生应用,支持对话式修改和一键复刻。主要面向无研发团队的中小企业和独立创作者,目前处于内测阶段。
其他产品动态
- Agnes AI 推出 Pavo 免费视频创作平台:一句话自动生成需求→大纲→角色设计→分镜→关键帧→视频,全流程免费
- 星卡科技发布 AI 汽车诊断工具 Tyler:基于自研 ThinkLLM,学习超 2.4 亿次真实诊断案例
- 农帮手推出 AI 农技助手 2.0:支持自定义 AI 农技智能体,由陕西省农业农村厅指导
- 生数科技推出 AI 陪伴应用 Vidy:支持文字、语音互动,具备关系成长记忆系统
- 蚂蚁阿福「科学减重 1 亿斤」项目:全国 18.47 万网友参与,累计减重 10.26 万斤
AI 监管、安全与产业观察
美国部分放宽 Anthropic 模型访问限制,Mythos 5 恢复、Fable 5 仍受限
6 月 12 日美国政府以国家安全为由暂停了 Anthropic 的 Mythos 5 和 Fable 5 对外籍人士的访问。仅两周后,商务部长致函确认已采取适当保障措施,允许部分「值得信赖的合作伙伴」恢复 Mythos 5 访问,涉及超 100 家美国政府机构和企业。Fable 5 尚无明确解禁时间表。
深度解读: 禁令发布两周就部分松口,反映出 AI 技术管控与商业化之间的深层矛盾。彻底封锁前沿模型会损害本国企业的国际竞争力,过度放开又面临技术外溢风险。这种「收紧-放松」的反复,将成为 AI 监管的常态。
奥地利提议欧盟引入 Anthropic,应对美国 AI 限制
奥地利数字化国务秘书致函欧盟技术事务专员,建议在境内战略性引入 Anthropic,提供法律保障、市场准入和资金支持,建立符合双方价值观的技术生态。反映欧洲争取技术自主的决心。
OpenAI 与韩国人工智能安全研究所达成合作
双方签署合作备忘录,重点在安全评估方法、基准测试和技术信息交流。特别之处是针对韩语环境和韩国社会背景制定专门测试数据,找出英文测试中难以发现的本地化风险。这是 OpenAI 第四次与国家级机构建立安全合作。
芬兰计划 2031 年用 AI 全面改造公共部门,目标生产力提升 20%
芬兰财政部表示,计划到 2031 年将全国公共部门改造为以 AI 为基础的模式,导入市面上最强大的 AI 模型。部分员工将被 AI 智能体取代,裁员部分通过自然退休实现。工会代表对此表示担忧。
「词元盗用」成为 AI 商业化新风险
Stripe 数据显示:AI 服务中滥用免费试用的情况在六个月内增长一倍多,每 6 次注册尝试中就有 1 次来自恶意行为。提供自助注册并开放 API 的 AI 初创企业面临的滥用情况比企业级方案高出 10 倍。
攻击方式从盗取资金转向盗窃 Token 额度——恶意脚本几小时内可能消耗掉过去数周才会产生的推理成本。Stripe 升级了 Radar 反欺诈系统,一个月内为 8 家 AI 公司拦截超 330 万次高风险注册。
深度解读: 当 AI 智能体开始自主消耗资源和参与交易,风险的性质发生了根本转变。传统风控针对「盗钱」,新型风控需要针对「盗算力」。这对 AI 企业的商业化设计提出了新要求:免费试用和按量计费模式必须从产品设计阶段就嵌入风控逻辑。
福特因 AI 质控表现不达预期,重新聘请 350 名资深硬件工程师
福特发现仅靠引入 AI 并采用既有设计需求,无法确保产品质量。重新聘请的 350 名资深工程师负责在零部件进入生产线前捕捉潜在问题,同时培训年轻员工并重新编程 AI 工具。此举已节省数亿美元保修和召回成本,福特在 J.D. Power 新车质量调查中排名第一。
深度解读: 福特的经历是一个重要警示——AI 并非万能替代品,特别是在需要丰富隐性知识和经验判断的制造场景。正确的做法是让 AI 辅助人类专家,而非试图取代他们。
Anthropic 调查:近半数用户认为 AI 可处理其 30%-90% 的工作
对约 9700 名 Claude 用户的调查显示:33% 的人认为 AI 能处理其 30%-60% 的工作,14% 认为达到 60%-90%,4% 认为几乎可接管全部工作。超八成受访者经常用 Claude 查询数据库、写文章或营销文案。有趣的是,AI 重度使用者对职业前景反而更乐观。
OpenAI 成立「应急小组」调查 Codex 额度消耗异常
大量用户反馈 Codex 编程工具额度消耗速度远超往常,问题根源是平台防滥用风控系统错误地对部分账户实施限流。OpenAI 已重置所有用户额度上限,Codex 团队周日全员进驻应急攻坚室排查。
英国消费者不信任 AI 购物助手
ACI Worldwide 调查 2000 名英国成年人:仅 19% 信任 AI 助手做出购买决策,60% 表示 AI 犯一次错就会停止使用,70% 反对 AI 在未询问的情况下自主完成购买。
开源与开发者生态
百度开源 Unlimited OCR:3B 参数长文档解析模型,5 天 GitHub Star 破万
百度开源 3B 参数端到端 OCR 模型,推理时仅需激活约 570M 参数。创新引入 Reference Sliding Window Attention 机制,可一次性连续解析数十页文档,KV Cache 控制在固定大小。在 OmniDocBench v1.6 得分 93.92%,推理速度比 DeepSeek OCR 快约 12.7%。
新浪开源 VibeThinker-3B:30 亿参数比肩百倍规模大模型
仅 30 亿参数,在数学、编程等高难度测试中表现接近主流大模型,部分竞赛题超过 GPT-5.2。研究提出「参数压缩-覆盖假说」:逻辑推理等结构清晰任务可高密度压缩进小模型,但储存广泛世界知识仍需更多参数。LeetCode 编程题完成 123/128 道。
Google 详解 AI「全栈」战略
Google Cloud 开发者体验主管阐述了 Google 的全栈 AI 方法:从自研 TPU 硬件、Gemini 前沿模型、Agent 编排平台到用户交互界面的端到端集成。强调「开放性与全栈不冲突」,开发者仍可接入其他公司的模型。
更多动态
- JumpServer 与 MaxKB 联合推出 AI 智能运维审计方案:构建两个分工明确的 AI 智能体,将大模型能力限制在堡垒机合规边界内
- 阿里云发布 Kafka 原生零 ETL 入湖方案:流数据跳过 Flink/Spark 直达 Iceberg 表存储
- Godot 4.7 正式发布(代号「导演剪辑版」):新增 HDR 输出、AreaLight3D、内建 Asset Store
- WPS 回应 C 盘占用问题:7 月上线磁盘存储管理功能,安装界面增加路径选择
- OpenAI 从苹果挖走 Vision Pro 硬件负责人保罗·米德:参与 OpenAI 新 AI 设备研发
- 曹操出行聘请图灵奖得主希发基思为 AI 创新中心首席科学顾问
- 月之暗面发布声明警告融资诈骗:从未委托第三方机构担任融资顾问
- OpenAI Codex 负责人表示 AI 仍无法做好创意设计,设计比代码更难量化评判
- 开发者越来越放心让 AI 生成代码直接上线生产环境(Cursor 数据)
- 科技巨头疯狂抢购核聚变设备,解决 AI 算力带来的能耗痛点
