- 上海AI Lab开源1万亿参数科学多模态大模型Intern-S1-Pro,奥赛金牌级数理推理能力
- Claude插件引发软件股暴跌,市值蒸发近万亿美元,AI从技术提供者变为应用层直接参与者
- Alphabet营收首破4000亿美元,2026年资本支出预计翻倍至1750-1850亿美元
- OpenAI发布Frontier平台,推动AI代理进入生产环境
- 阿里千问大模型成为奥运史上首个官方大模型
- EverMind发布EverMemOS记忆操作系统,刷新多项基准测试纪录
- 面壁智能开源MiniCPM-o 4.5全双工全模态模型,交互从“对讲机”升级为“即时自由对话”
- ElevenLabs完成5亿美元D轮融资,估值达110亿美元
- 何恺明团队提出“漂移模型”,将分布演化从推理阶段转移到训练阶段,实现单步生成
- 全国首个3万卡国家超算互联网核心节点上线试运行
- 天津严禁使用AI开处方,明确AI在医疗领域的边界

AI架构与记忆技术突破
上海AI Lab开源Intern-S1-Pro科学多模态大模型
上海人工智能实验室开源了参数规模达1万亿的科学多模态大模型Intern-S1-Pro,采用MoE架构(1T总参数,22B激活),基于SAGE“通专融合”技术打造。
- 核心能力:奥赛金牌级别的数理推理、跨五大核心学科(化学、材料、生命、地球、物理)的100+专业子任务、时序信号分析(从数个到百万级采样)、多模态理解(分子结构图、实验图表、遥感图像)
- 技术特色:傅里叶位置编码赋予“物理直觉”、国产算力深度适配(昇腾生态)、全栈开源(GitHub、HuggingFace、ModelScope)
深度解读 & 洞察:这是开源AI社区在科学计算领域的里程碑事件。传统大模型擅长语言和通用知识,但对科学领域的专业推理、物理规律理解一直存在短板。Intern-S1-Pro通过“通专融合”架构——共享基础表征层 + 分化专家层——同时解决了通用认知和专业深度两个难题。
更值得关注的是其“物理直觉”能力。通过傅里叶位置编码和重构时序编码器,模型能够理解从微观生命信号到宏观宇宙波动的规律,这让它不只是“背诵”科学知识,而是真正“理解”科学原理。对于药物研发、材料设计、蛋白质预测等需要深度科学推理的场景,这种能力将极大加速发现过程。
从战略角度看,这款模型验证了中国在AI基础研究上的自主创新路径——从原创模型架构到国产算力基座的全链条自主可控。
EverMind发布EverMemOS记忆操作系统,刷新多项基准测试纪录
由陈天桥和邓亚峰联合创立的EverMind发布了AI记忆基础设施系统EverMemOS,在LoCoMo基准测试中以93.05%准确率位列全球第一,并同步启动8万美元“记忆起源大赛”。
- 三阶段记忆架构:情景轨迹构建(拆解对话为独立记忆单元)→ 语义整合(归类为主题化记忆场景,更新用户画像)→ 重构式回忆(智能筛选提取必要信息)
- 技术突破:支持突破百兆上下文、多智能体场景信息传递、云服务与开源双轨并行
深度解读 & 洞察:大模型的“遗忘”问题正在成为下一阶段竞争的关键。当模型能力日益同质化,谁能让AI“记多远”,谁就能建立真正的用户粘性和长期壁垒。
EverMemOS的创新在于跳出传统RAG(外部存储)、参数内化(固化到权重)、隐状态(短期记忆)三条路线,从人脑记忆机制中寻找灵感。人脑的记忆不是简单存储,而是一个涉及多个脑区协同的复杂过程——海马体负责情景编码,新皮层负责语义整合,前额叶负责选择性回忆。EverMemOS正是模拟了这个过程,将记忆从静态数据存储升级为动态的认知整合。
这种架构的价值在长程对话、个人数字孪生、CRM协作等场景中将尤为突出。当AI能够积累、整合和利用历史经验,它才可能真正实现能力的持续进化,而非每次部署都是重新开始。
面壁智能开源MiniCPM-o 4.5:全双工全模态模型,交互从“对讲机”升级为“即时自由对话”
面壁智能开源了9B参数的全模态旗舰模型MiniCPM-o 4.5,支持“边看、边听、主动说”的全双工交互,模型输出时也能持续感知外界信息。
- 核心突破:全双工多模态实时流机制(文本与语音token交错建模)、主动交互机制(1Hz频率决策是否发言)、可配置语音建模
- 端侧定位:与芯片厂商深度协同,从训练阶段就适配终端硬件条件,配套“松果派”AI原生端侧智能开发板年中推出
深度解读 & 洞察:传统多模态模型的“回合制”交互——用户说话→AI停止感知→AI生成回答→恢复感知——本质上是一种I/O阻塞,限制了自然对话的可能性。MiniCPM-o 4.5通过全双工机制彻底打破了这个限制,让AI能够像人类一样,在说话的同时也能听到对方插入的内容,并根据环境变化即时调整回应时机。
这种能力对于语音助手、智能车载、智能家居等实时交互场景将带来质的提升。当AI正在播报信息时,用户可以随时打断提问,而AI能够即时理解和回应,这种体验将极大提升人机交互的自然度。
从技术路径看,面壁智能坚持“端原生”路线——不是把云端模型压缩后跑在终端上,而是在训练阶段就以端侧芯片为目标环境。这种思路与当前AI从云端向边缘下沉的趋势高度契合,能够有效解决隐私风险和延迟稳定性问题。
何恺明团队提出“漂移模型”,将分布演化从推理阶段转移到训练阶段
MIT博士生邓明扬(师从何恺明)提出全新生成模型范式“漂移模型”,在ImageNet 256×256基准测试中,单步推理(1-NFE)下取得1.54 FID的成绩,刷新单步生成纪录。
- 核心思想:神经网络的训练过程本身就是迭代优化,每轮参数更新的微小变化等价于样本在空间中的位移,因此可将分布演化从推理阶段转移到训练阶段
- 关键技术:漂移场机制(引导训练过程)、特征空间引导(MAE/MoE预训练模型构建高维语义映射)、吸引与排斥机制(确保细节精准的同时防止模式坍缩)、CFG机制内化(无需额外推理开销)
深度解读 & 洰察:扩散模型和流匹配等主流方法将分布演化放在推理阶段,生成一张图像需要多次调用神经网络,导致计算开销大、生成速度慢。漂移模型提出了一种完全不同的思路:既然训练过程已经在不断调整模型参数,为什么不把这一演化过程赋予明确的物理意义,让训练本身就完成分布的演化?
这个想法的可行性植根于深度学习的本质——训练就是迭代优化。漂移模型通过漂移场机制,在训练阶段就驱使模型输出分布与真实数据分布对齐,当两者完全匹配时,漂移场归零,达到平衡状态。推理时就不再需要多步迭代,仅需单次前向传播即可生成高质量样本。
这种范式的转换具有重要意义。它不仅大幅提升了生成速度,还在具身智能控制任务中展现出泛化能力——单步推理的决策质量可匹配甚至超越需要100步推理的Diffusion Policy。对于实时性要求极高的机器人控制、自动驾驶等场景,这种低延迟的生成能力将具有实际应用价值。
英伟达Jim Fan:“世界建模”将成为新一代预训练范式
英伟达机器人主管Jim Fan发布系统性论述,认为继“下一个词预测”之后,世界建模将成为新的预训练范式,2026年将成为大世界模型真正为机器人领域奠定基础的第一年。
- 核心定义:在给定动作的条件下,预测下一个合理的世界状态,视频生成模型是其中一种实现形式(“下一个状态”是一系列RGB帧,“动作”是文本描述)
- 范式转换:从语言中心到视觉中心——VLM本质以语言为中心,视觉只是二等公民;对于物理AI,LVA路线(语言>视觉>动作)更像是“LVA”,知识检索强但物理能力不足
- 2026年趋势:更广义的预训练目标(覆盖3D空间运动、本体感觉、触觉感知)、新的推理形式(视觉空间中的思维链,而非语言空间)
深度解读 & 洞察:Jim Fan的判断揭示了AI发展的一个深层矛盾:当前主流的VLM(视觉语言模型)本质上是为语言和知识服务的,而不是为物理世界本身服务的。VLM中大多数参数用于知识,而非物理能力。这导致了一个问题:高灵巧物理智能(如猿类)的语言理解能力不超过BERT或GPT-1,但物理技能远远超过当前最先进的机器人。
世界建模试图解决这个矛盾。它的核心是在给定动作的条件下,预测下一个合理的世界状态——这本质上是在构建一个可学习的物理模拟器和渲染引擎。YouTube的海量视频和智能眼镜的兴起,将以远超文本训练规模的原始视觉流捕捉世界。
这个范式的转换将带来深远影响。从交互方式看,AI将不再通过语言作为“脚手架”来理解世界,而是直接在视觉空间中进行推理和规划。从应用场景看,这将为机器人、自动驾驶、虚拟现实等领域提供更贴近物理现实的基础模型。
企业战略与商业化
Claude插件引发软件股暴跌:Anthropic从技术提供者变为应用层直接参与者
Anthropic近期发布的Claude插件功能在华尔街引发剧烈震荡,导致软件板块单日市值蒸发约2850亿美元。其中法律检索系统服务商汤森路透暴跌16%,法律科技公司CS Disco下挫12%,标准化法律服务商LegalZoom大跌20%。
- 插件能力:Legal插件可自动完成合同审查、NDA分流、合规检查和法律简报等工作,覆盖销售、财务、市场营销等多个领域
- 成本对比:企业此前可能每年需要花费5万美元购买一整套法律软件系统,而使用Claude可能只需每月支付100多美元
深度解读 & 洞察:这轮市场反应反映了AI厂商战略的重要转变。过去,软件公司普遍将AI视为互补工具,通过API接入模型增强产品能力。而Anthropic的做法是绕过API层和SaaS厂商,直接下场做应用,提供开箱即用的专业能力。这本质上改变了竞争格局:AI模型厂商从技术提供者变成了应用层的直接参与者。
市场焦虑的核心在于“中间层价值”。许多SaaS公司本质上扮演着中介角色——它们占据某个入口,利用信息差和流程复杂度向客户收取“过路费”。当智能能力变成触手可及的基础设施,用户只需要直接与模型对话就能获得所需功能时,中间层的存在价值自然受到质疑。
但SaaS的护城河并非完全没有。成熟软件公司通常掌握着专有数据集,往往是这些数据的唯一或垄断提供者。更重要的是,真实商业场景中对安全性和鲁棒性的要求极高,这正是现有SaaS公司的核心优势。Linux、MySQL等技术早已成熟,但客户依然信赖微软、甲骨文这样具备工程能力和行业know-how的大公司。
影响:
- 对软件行业:短期内引发估值重估,长期将推动SaaS公司重新定位产品价值,与AI形成新的分工关系
- 对AI公司:从API模式向应用层延伸可能带来更高收入,但也增加了与垂直领域SaaS公司的直接竞争
Alphabet 2025年营收首破4000亿美元,2026年资本支出预计翻倍至1750-1850亿美元
谷歌母公司Alphabet发布2025年财报,全年营收达4028.36亿美元,同比增长15%;净利润1321.70亿美元,同比增长32%。谷歌云Q4收入176.64亿美元,同比增长48%,成为最大亮点。公司宣布2026年资本支出预计在1750亿至1850亿美元之间,较2025年的914.5亿美元增长近一倍。
- 核心业务:谷歌广告Q4收入822.84亿美元,同比增长14%;谷歌服务Q4收入958.62亿美元,增长14%;YouTube全年广告和订阅总收入超600亿美元
- AI投入:资本支出主要用于AI基础设施建设,包括服务器、数据中心和网络设备;Gemini月活用户达7.5亿,Q4新增1亿用户
深度解读 & 洞察:Alphabet的财报展现了“双轮驱动”格局:广告业务稳健增长提供现金流,云业务加速爆发成为新的增长引擎。更重要的是,AI已经从“未来方向”变为实实在在的业绩驱动力——Gemini用户数突破7.5亿,谷歌云增长48%,这些都与AI直接相关。
但更引人注目的是资本支出的激进预测。1750-1850亿美元意味着什么?这接近2025年支出的两倍,也超过了绝大多数科技公司的年度营收。这笔投入主要用于AI基础设施,显示出Alphabet在AI竞赛中的投入决心。
从行业角度看,这反映了AI基础设施建设进入“军备竞赛”阶段。OpenAI、Meta、微软等公司都在大规模投入算力,而Alphabet的加入意味着这场竞争将进一步升级。对于芯片厂商、数据中心运营商、云服务商来说,这是巨大的市场机会;但对于投资者来说,这种巨额投入的回报周期和可持续性需要密切关注。
影响:
- 对AI基础设施行业:资本开支大幅提升将直接利好芯片制造商、数据中心设备供应商、云服务商
- 对Alphabet股价:短期可能引发投资者对盈利能力和回报周期的担忧,长期取决于AI能否带来可持续增长
OpenAI发布Frontier平台,推动AI代理进入生产环境
OpenAI宣布推出名为Frontier的全新平台,旨在帮助企业构建、部署和管理能够处理实际业务的AI代理。首批采用企业包括HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber。
- 核心功能:业务上下文理解(连接企业数据仓库、CRM系统和办公应用)、任务规划与执行(推理数据、处理文件、运行代码、操作工具)、持续评估与优化(从经验中学习,根据人类反馈改进)、身份与安全治理(独立身份、明确权限、安全防护栏)
- 技术支持:派出前沿部署工程师(FDEs)与企业团队并肩工作,分享最佳实践;基于开放标准构建,允许第三方软件团队接入
深度解读 & 洞察:OpenAI Frontier的推出标志着AI应用从单纯的对话工具向能够深入业务流程的“AI同事”转型。根据OpenAI的数据,约75%的企业员工表示AI协助他们完成了以往无法胜任的任务,但企业在将AI代理转化为生产力时仍面临挑战——主要瓶颈不在于模型的智力,而在于如何让这些代理在复杂的企业组织中高效运行。
Frontier试图解决这个问题。它充当企业的“语义层”,连接零散的数据仓库、CRM系统和办公应用,让AI代理理解业务运作方式和决策逻辑。更重要的是,它为AI代理提供了人们在工作中所需的“职场技能”:共享上下文、入职引导、基于反馈的实践学习,以及清晰的权限边界。
从竞争格局看,这标志着OpenAI从API供应商向企业AI平台运营商的延伸。以前,企业通过API调用模型;现在,OpenAI直接提供从模型到部署到管理的全栈解决方案。这将进一步加深OpenAI与企业客户的绑定关系,但也增加了与现有企业软件厂商的竞争。
ElevenLabs完成5亿美元D轮融资,估值达110亿美元
AI语音公司ElevenLabs完成5亿美元D轮融资,估值达到110亿美元,成为全球估值最高的AI语音服务商。本轮融资由红杉资本领投,Andreessen Horowitz追加了4倍投资,ICONIQ Capital跟投了3倍。
- 财务表现:2025年年度经常性收入超3.3亿美元,主要来自企业客户;从2025年初估值33亿美元到现在,一年内增长超三倍
- 客户阵容:德国电信、Square、乌克兰政府、Revolut等大型企业和机构,用于客户支持、对话式电商、公民互动、内部培训和销售等工作
深度解读 & 洽察:ElevenLabs的成功证明了语音AI在商业应用上的变现能力。许多企业已经把ElevenLabs的对话式代理作为核心基础设施来用,这说明语音AI正在从娱乐工具转变成企业级的生产力工具,帮助企业提供更自然、更有人情味的交互体验。
从竞争格局看,虽然OpenAI和Google等大公司也在布局语音技术,但ElevenLabs凭借技术专注度和在企业中的渗透率脱颖而出。110亿美元的估值创造了AI语音赛道的新纪录,也预示着这个领域会吸引更多资本和创新竞争。
从行业趋势看,语音正在成为AI时代的重要交互界面。随着智能音箱、车载语音、智能客服等场景的普及,高质量的语音合成和语音识别能力将成为AI产品的核心竞争力。ElevenLabs的估值反映了市场对这一趋势的认可。
行业应用与落地
阿里千问大模型成为奥运史上首个官方大模型
2026年米兰冬奥会开幕前夕,国际奥委会宣布基于阿里千问大模型打造了奥运史上首个官方大模型,国际奥委会主席柯丝蒂·考文垂称其为变革性的一步。
- 双端落地:“国家奥委会AI助手”(面向各国奥委会工作人员,支持母语查询赛务问题)+ “奥运AI助手”(面向全球观众,解答赛事规则与奥运历史)
- 技术突破:基于千问-VL的自动媒体描述系统(实时识别进球、犯规等关键事件)、针对雪地场景的高精度重建(克服“背景纹理单一、缺乏特征点”难题)、“子弹时间”和“时间切片”视觉特效
深度解读 & 洞察:这标志着AI首次大规模进入奥运核心业务流。奥运会是全球最具复杂性的综合赛事之一,涉及数百万字的规则文档和错综复杂的后勤调度工作。传统模式下,语言障碍和信息系统碎片化一直是困扰奥运运营的长期难题。
千问大模型的应用系统性解决了这些困境。“国家奥委会AI助手”消化吸收了所有官方手册内容,支持全球119个代表团的母语交互,消除了语言和地域带来的信息不对称。“奥运AI助手”面向全球观众开放,让普通大众也能以互动方式深入了解赛事规则和奥运历史。
更值得关注的是AI在转播和内容生产环节的深度渗透。基于千问-VL的自动媒体描述系统能够实时识别关键事件并生成描述,这标志着AI首次大规模介入奥运内容的实时生产流程。针对雪地场景的高精度重建技术攻克了长期困扰机器视觉的“雪地盲区”问题,让全球观众得以摆脱单一镜头视角的局限。
考文垂总结得好:“每一届奥运会都会留下独特的遗产。而米兰冬奥会的遗产将是——智能化,具体来说,是人工智能驱动的智能化。”
谷歌推出Gemini全新广告,展示AI在日常生活中的无限可能
Google在橄榄球年度盛事“大周末”前夕推出了一系列以Gemini为核心的新广告,旨在向全球观众展示这款AI助手如何能够即时协助完成各种规模的任务。
- “新家”广告:母子利用Gemini为新居注入活力,通过由Nano Banana驱动的图像编辑功能,上传空房间照片并输入文本指令,实时预览不同装修方案效果
- 核心能力:与Google相册深度关联(回顾昔日回忆捕捉装修灵感)、视觉识别(快速找到汽车引擎盖下的保险丝盒)、风格探索(AI试戴或尝试全新发型)、跨应用协作(与Gmail、谷歌地图等核心应用无缝衔接)
深度解读 & 洞察:这组广告传递了一个明确信号:Gemini正从简单的问答机器向“创意合伙人”转变。通过Nano Banana技术(过去一年处理了超过50亿张图片的编辑),用户只需上传照片并输入简单的文本指令,即可实时预览不同装修方案的效果。更重要的是,Gemini能与Google相册深度关联,通过回顾昔日回忆来捕捉装修灵感,这种将个人数据与创意生成相结合的能力标志着AI助手从信息检索工具向创意伙伴的演进。
广告还展示了Gemini在日常细节中的应用:通过视觉识别快速找到汽车引擎盖下的保险丝盒;利用AI试戴或尝试全新的发型设计;与Gmail、谷歌地图等核心应用无缝衔接。这些场景虽然看似简单,但它们共同描绘了一个愿景:AI不再是需要主动调用的工具,而是无缝融入生活各个角落的智能伙伴。
从竞争格局看,Gemini的月活用户已突破7.5亿,与ChatGPT的8亿月活非常接近。这组广告旨在进一步扩大Gemini的用户基础,并向市场展示Gemini在多模态交互、创意生成、跨应用协作等方面的能力。
Google Cloud AI Research发布PaperBanana:多智能体协作的自动化图表生成框架
Google Cloud AI Research与北京大学的研究团队联合发布了“PaperBanana”,提出了一种基于多智能体协作(Multi-Agent)的自动化图表生成框架,旨在解决学术论文配图耗时久、设计门槛高以及生成式AI容易产生“幻觉”导致数据不准确的痛点。
- 五阶段工作流:检索智能体(找灵感)→ 规划智能体(定逻辑)→ 风格智能体(定规范)→ 可视化智能体(执行绘制)→ 批判智能体(审核迭代)
- 双模式生成:代码生成模式(默认/高精度,利用Gemini-3-Pro等大模型生成Python可视化代码,沙盒环境运行,保证数值100%精确)+ 图像生成模式(概念/高美观,直接利用图像生成模型渲染)
深度解读 & 洞察:这是一个多智能体协作在专业领域落地的典型案例。传统的自动化图表生成往往使用单一模型进行端到端生成,但这种方式在专业场景中存在明显短板:容易产生“幻觉”(数据不准确)、缺乏领域专业知识、难以达到出版级质量。
PaperBanana通过五个专业分工智能体的协作,模拟了人类研究员绘制高质量论文插图的完整思维链条。检索智能体负责“找灵感”,利用RAG技术从顶会论文数据库中检索高质量参考图;规划智能体负责“定逻辑”,将文本描述转化为详细的绘图说明书;风格智能体负责“定规范”,基于学术审美标准添加配色方案和排版布局;可视化智能体负责“执行绘制”,通过代码生成或直接图像生成的方式产出初稿;批判智能体负责“审核迭代”,对初稿进行正确性与美观度评估并提出修改意见。
这种分工协作的价值在于将复杂任务拆解为多个专业化模块,每个模块专注于自己擅长的领域。更重要的是,它提供了双模式生成路径:对于需要数据精确性的统计图表,采用代码生成模式,从根本上保证数值的100%精确;对于注重视觉效果的概念图或架构图,采用图像生成模式,获得更丰富的设计感。
从评估结果看,PaperBanana的综合性能相比传统单模型基线提升了17.0%,在简洁性维度上提升高达37.2%,在匿名盲测中72.7%的情况下研究人员认为其生成的图表优于基线模型。这些数据证明了多智能体协作在专业场景中的有效性。
质变科技发布MemoryLake记忆湖产品,定位业内首个具备超大规模实践的AI记忆平台
质变科技发布了MemoryLake,定位为“业内首个具备超大规模实践的记忆湖产品”,在LoCoMo基准测试中以94.0%的综合得分位列全球第一。目前已服务全球150多万专业用户和15000家企业。
- AI落地三阶段:1.0连接阶段(AI充当智能连接器,替代传统关键词搜索)→ 2.0交互阶段(大模型突破让AI可以用自然语言对话调用数据)→ 3.0生产力时代(焦点转向直接提升生产效率,关键是将员工的决策逻辑、经验权衡等隐性知识数字化、轨迹化)
- 核心组件:MemoryLake-D1大模型(负责多模态内容深度理解)+ MemoryLake记忆引擎(负责记忆计算与管理)+ Relyt Multi-modal Data Cloud(负责记忆存储)
深度解读 & 洞察:这篇文章对AI企业落地的演进做了清晰梳理,指出了当前竞争的核心已从“存与找”转向“隐性知识”萃取。
1.0连接阶段(2023年前):AI充当智能连接器,将企业数据导入向量数据库实现语义检索,本质是替代传统关键词搜索。这个阶段的AI更像个“更聪明的文档管理员”,离核心业务很远。
2.0交互阶段(2023-2024年):大模型突破让AI可以用自然语言对话调用数据,门槛骤降。然而瓶颈也随之显现:AI能处理显性数据,却难以表征专家头脑中的“隐性知识”——比如风投一眼看穿财报问题的直觉。输出流于表面,难以交付可靠决策。
3.0生产力时代(2025年至今):行业焦点转向直接提升生产效率。关键一跃在于能否将员工的决策逻辑、经验权衡等隐性知识数字化、轨迹化。通过记录分析员工的日常审批、批注、沟通,构建组织“决策轨迹记忆中枢”,实现核心能力的沉淀与复用。
MemoryLake的核心判断是:未来系统核心将从“管理数据记录”转向“管理多模态的决策轨迹,构建多模态认知状态记忆”。所谓认知状态记忆,是系统在某一时刻对“我在做什么、我知道什么、我假设什么、我不确定什么”的结构化内部表征。
从市场竞争看,分析师预计到2030年,AI智能体编排和记忆系统市场将达到284.5亿美元,其中128.8亿美元归因于独立的AI记忆市场。这是一条足够宽、足够深的赛道。头部大模型厂商和传统数据平台、云厂商已纷纷入局,但各自面临短板:传统云厂商与数据平台深耕存储与计算多年,缺乏针对多模态记忆的深度理解引擎与动态管理能力;头部大模型厂商虽拥有强大的生成能力,却受困于数据碎片化,难以在复杂业务场景中给出准确、持续且可解释的决策。这恰恰为具备全栈能力的创新企业提供了弯道超车的机会。
市场与投资
软件股遭抛售:市值蒸发近万亿美元,AI成“幕后推手”
投资者正在评估本周全球软件股的抛售是否已过度。周二标普500软件与服务指数暴跌近4%,周三再度下挫0.73%,自1月28日以来已蒸发约8300亿美元(约合5.77万亿元人民币)市值。
- 直接导火索:Anthropic推出Claude Cowork Agent插件,覆盖法律、销售、营销与数据分析等多领域任务,凸显大语言模型向应用层渗透的趋势
- 受冲击最严重板块:法律软件——汤森路透暴跌16%、CS Disco下挫12%、LegalZoom大跌20%;数据服务——MSCI前一交易日大跌约7%、励讯集团重挫14%
深度解读 & 洞察:近几个月来,软件股持续承压,人工智能对众多软件企业而言,已从发展助推器转变为潜在的颠覆性力量。本轮最新抛售潮由AI公司Anthropic旗下大语言模型Claude推出的一款全新法律工具触发。这款工具是Claude智能体的插件,可覆盖法律、销售、营销与数据分析等多领域任务,凸显了大语言模型向应用层渗透的趋势。
大模型厂商正大举切入利润丰厚的企业级业务领域,以此获取营收,支撑其巨额研发投入。投资者担忧,若该模式取得成功,或将对金融、法律、编程等多个行业造成毁灭性冲击。
不过部分分析师指出,这类人工智能大语言模型远非胜券在握,原因是其缺乏各行业企业赖以运转的核心专业数据。他们表示,此次抛售反映出投资者急于调整投资组合避险——人工智能技术的飞速迭代,已让企业估值与业务前景超出了常规3至5年预测的范畴,变得扑朔迷离。
英伟达首席执行官黄仁勋对此回应称,有关人工智能将取代软件及相关工具的担忧“不合逻辑”。他说软件本质上是工具,AI的作用是使用这些工具,而不是重新发明它们。“当拥有了人工智能的时候,你是选择用它来操作现有的螺丝刀,还是非要发明一把新的螺丝刀?”
影响:
- 对软件行业:短期内引发估值重估,长期将推动软件公司重新定位产品价值,与AI形成新的分工关系
- 对AI公司:从API模式向应用层延伸可能带来更高收入,但也增加了与垂直领域SaaS公司的直接竞争
- 对投资者:需要在技术创新与商业模式可持续性之间找到平衡
甲骨文计划融资450-500亿美元扩建云基础设施
甲骨文宣布了一项大规模融资计划,计划在2026年通过债务与股权融资筹集450亿至500亿美元,用于扩建云基础设施,以应对AI浪潮下激增的算力需求。
- 融资背景:已与AMD、Meta、英伟达、OpenAI、TikTok和xAI等企业签署算力供应协议;OpenAI已承诺在甲骨文云上投入约3000亿美元租用服务器
- 财务挑战:自由现金流已转为负值,分析师预计这一状态将持续至2030年;自2025年9月创下历史高点以来,股价已下跌约50%,市值蒸发约4600亿美元
深度解读 & 洞察:甲骨文的融资计划揭示了云计算行业在AI时代面临的普遍挑战:基础设施建设的资金需求远超传统模式,而回报周期的不确定性又让投资者更加谨慎。
这次融资的核心驱动力来自于大型科技公司的算力需求。这些客户对云基础设施的规模和性能要求远超以往,在AI训练和推理场景中尤为明显。然而,巨额投资带来的财务压力已经开始显现——甲骨文的自由现金流已转为负值,分析师预计这一状态将持续至2030年。
市场对甲骨文的财务状况也表达了担忧。自2025年9月创下历史高点以来,其股价已下跌约50%,市值蒸发约4600亿美元。信用违约掉期价格在2025年12月升至2008年金融危机以来的高位,表明投资者对信用风险的关注。
OpenAI已承诺在甲骨文云上投入约3000亿美元租用服务器,这为甲骨文提供了可观的收入预期。但OpenAI尚未盈利,这一背景使得市场对甲骨文资本开支回报周期的评估更加谨慎。AI领域的投资热潮虽然带来机会,但也引发了关于长期回报可持续性的讨论。
甲骨文选择在周日宣布这一消息,时点颇为罕见。分析人士认为,这可能是为了在本周开盘前向投资者传递稳定信号,试图遏制股价持续下滑的势头。在科技行业,通过重大融资或投资计划来提振市场信心是一种常见做法,但实际效果仍需时间检验。
影响:
- 对甲骨文股价:巨额融资可能加剧投资者对财务可持续性的担忧
- 对云基础设施行业:反映出AI时代算力需求的爆发式增长,以及随之而来的资金压力
- 对OpenAI等AI公司:显示其对算力需求的长期承诺,但也引发对盈利能力的关注
a16z募150亿美元新基金,其中17亿美元专门投向AI基础设施
a16z刚募了150亿美元的新基金,其中17亿美元要专门用来投AI基础设施。这说明他们的投资策略在转变,从单纯看应用层的公司,转向去支持更底层的技术。
- 投资组合:已投过OpenAI、ElevenLabs、Cursor等企业;重点关注算力分配、搜索基础设施和底层模型架构
- 战略意图:通过控制AI时代的基础设施,在未来十年的竞争中争取更多话语权;关注AI初创公司面临的人才短缺问题,通过投提升开发体验、优化搜索效率的工具类公司来打造完整AI生态
深度解读 & 洽察:这轮融资反映了风投机构在AI时代投资策略的深层转变。过去,VC们更倾向于投资应用层的AI公司——那些直接面向用户提供AI产品或服务的企业。但现在,他们开始意识到,真正控制AI时代话语权的可能不是应用层,而是基础设施层。
a16z的合伙人Jennifer Li解释了他们的想法:在当下这个AI发展的关键时期,算力分配、搜索基础设施和底层模型架构变得特别重要。这些基础设施就像是AI时代的“水电煤”,谁掌握了它们,谁就拥有了未来竞争的主动权。
从投资组合看,a16z的基础设施团队已经投过不少牛企业,像OpenAI、ElevenLabs、Cursor这些都在他们的投资组合里。这次大额注资意味着他们打算加重在基础设施上的赌注。
更重要的是,a16z还在关注AI初创公司面临的人才短缺问题。他们想通过投那些能提升开发体验、优化搜索效率的工具类公司,来打造一个完整的AI生态。这种从基础设施到开发者工具到应用层的全链条布局,展现了a16z在AI领域的长期战略眼光。
基础设施与算力
全国首个3万卡国家超算互联网核心节点上线试运行
中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池,全面覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。
- 平台规模:截至1月4日,国家超算互联网用户规模突破100万;已接入14个省市、超过30家国家级超算中心与智算中心
- 算力资源:整合形成总算力规模达15万+加速卡与200万核心的全国最大异构算力资源池,提供近70种规格的算力服务
深度解读 & 洞察:这是中国算力基础设施建设的里程碑事件。3万卡的超集群部署不仅是规模的突破,更重要的是实现了“实际投入运营”,这意味着这些算力不是摆设,而是真正能够支撑大规模AI计算需求的实用资源。
从国家战略角度看,算力已经成为数字经济时代的核心生产力。中国建成万卡智算集群42个,智能算力规模超过1590 EFLOPS,位居全球前列,这些算力资源的规模化部署为人工智能产业发展提供了底层支撑。
从行业应用看,3万卡算力池能够覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。这意味着从基础研究到产业应用,从模型训练到推理部署,都有了强大的算力保障。
从技术角度看,这3套万卡超集群系统采用的是中科曙光的国产技术。这表明中国在AI算力基础设施方面不仅实现了规模突破,也在技术上具备了自主可控的能力。
Positron公布AI推理芯片Asimov,宣称Token能效与性价比可达英伟达Rubin五倍
AI推理芯片初创企业Positron公布了其第二代ASIC设计Asimov,宣称该产品的Token能效与性价比都可以达到英伟达Rubin GPU的五倍。Asimov芯片目标在2026年底完成芯片流片,并在2027年初投入生产。
- 核心设计:以内存优先,拥有90%的内存带宽利用率,从结构上消除不必要的远程数据移动;芯片整体TDP为400W,内存总容量2304GB、总带宽2.76 TB/s
- 系统规模:Titan推理服务器系统采用19英寸4U机架规格,聚合了4颗Asimov芯片,支持16T参数模型推理和10M上下文窗口,单系统最多4096套Titan
深度解读 & 洞察:Positron的野心很明确:要在AI推理芯片领域挑战英伟达的霸主地位。其宣称的“Token能效与性价比可达英伟达Rubin五倍”虽然需要实际验证,但确实揭示了AI芯片领域的一个重要趋势——从通用计算向专用推理的演进。
Asimov的核心设计理念是“内存优先”。Transformer推理的限制在内存而非算力,因此Asimov在设计上以内存优先,拥有90%的内存带宽利用率,并从结构上消除不必要的远程数据移动。每个计算模块连接到432GB的LPDDR5x内存,并通过PCIe 6.0 / CXL 3.0连接到至多720GB的KV Cache缓存用内存。这种设计思路抓住了Transformer推理的核心瓶颈。
从系统规模看,Titan推理服务器系统支持16T参数模型推理和10M上下文窗口,单系统最多4096套。这意味着Asimov不仅关注单卡性能,也关注集群化部署能力。
当然,Positron要挑战英伟达并不容易。英伟达不仅硬件强大,更重要的是拥有CUDA等成熟的软件生态。Asimov能否在实际应用中兑现性能承诺,能否建立起自己的软件生态,这些都还有待观察。但无论如何,Asimov的出现反映了AI芯片领域竞争的加剧,这对于推动技术创新、降低AI计算成本都是有利的。
Comma.ai投资约500万美元自建数据中心,加速自动驾驶AI研发
以开源自动驾驶技术openpilot闻名的美国AI创业公司comma.ai披露了自建数据中心的关键基础设施布局:在位于圣地亚哥的办公室内部署并运营了一座自建数据中心,专门用于支撑其AI模型的训练、指标分析与数据存储工作。
- 成本对比:将同等规模的计算工作放在公有云上执行,估算成本将超过2500万美元;而自建数据中心的总投资仅约500万美元
- 核心配置:75台自制TinyBox Pro机器(总计约600张GPU)、Dell服务器阵列构成约4PB SSD存储(带宽可达20 Gbps)、3个100 Gbps核心交换机配合Infiniband互联
- 自然冷却:利用圣地亚哥的外部环境冷空气进行自然冷却,取代了大量耗电的传统空调系统
深度解读 & 洞察:在AI训练成本持续攀升的行业背景下,comma.ai给出了一个值得深思的反问:如果算力已经成为公司的核心生产资料,为什么要把它完全交给别人?
comma.ai的自建数据中心揭示了一个重要的趋势:对于依赖海量数据与高频模型迭代的AI公司,特别是那些算力需求相对稳定的公司,自建数据中心可能比依赖公有云更经济、更可控。
从成本角度看,自建数据中心的投资是500万美元,而同等规模的公有云服务估算成本超过2500万美元——5倍的差距反映了云服务溢价与自有基础设施之间的经济鸿沟。
从控制力角度看,自有数据中心能够促使工程团队直接面对电力消耗、计算效率和硬件性能等根本性问题,而不是简单地通过“增加预算”来解决。当计算资源就部署在触手可及的地方,团队对资源的掌控感和优化能力都会显著提升。
当然,自建这条路显然不适合所有公司——它需要前期的资本投入、持续的运维投入以及专业的工程团队。但对于像comma.ai这样依赖海量数据与高频模型迭代的自动驾驶公司而言,这确实是一项具有战略意义的投资。当行业普遍依赖云服务巨头提供的算力时,comma.ai选择了一条更为自主的道路。
具身智能与机器人
全球首次,魔法原子人形机器人展示360度转体和单手倒立
在“敢梦敢为·追觅之夜”演唱会上,魔法原子高动态双足人形机器人Magicbot Z1与四足机器人MagicDog组成的“硅基伴舞天团”作为表演嘉宾,与歌手萧敬腾共同演绎曲目《海芋恋》。Z1展示了全球首个人形机器人360度转体和单手倒立高难度技术展示。
- 技术基础:高动态平衡控制系统与全身协同运动算法,完成复杂的舞蹈动作编排
- 智能交互:即兴互动环节中,Z1展示智能语音交互能力,与萧敬腾对话互动
- 应用场景:具身智能技术应用于文娱表演场景;魔法原子已正式宣布将亮相2026年央视春晚
深度解读 & 洞察:这个事件虽然发生在娱乐场景,但其意义远不止于“机器人跳舞”。它展示了人形机器人在高动态平衡、全身协同运动、实时环境感知等方面的技术突破。
360度转体和单手倒立是人类舞蹈中的高难度动作,需要强大的平衡能力和核心力量控制。机器人能够完成这些动作,说明其在运动学建模、平衡控制、实时感知反馈等方面已经达到了相当高的水平。更重要的是,这些动作是在与人类歌手的即兴互动中完成的,这说明机器人不仅能够执行预设的动作序列,还能根据环境变化实时调整。
从技术路径看,这反映了具身智能领域的一个重要趋势:从工业场景向服务场景的延伸。过去,机器人主要应用在工业制造等结构化环境,现在开始进入演唱会、春晚等娱乐场景,甚至在餐厅当服务员、在家庭做陪伴。这些场景对机器人的动态平衡、实时交互、环境适应能力提出了更高的要求。
从商业角度看,春晚是一个巨大的展示平台。魔法原子宣布将亮相2026年央视春晚,这将极大地提升公众对人形机器人的认知和接受度。就像2025年12月宇树机器人为王力宏演唱会进行伴舞的视频爆火,甚至引来马斯克的点赞一样,这种高曝光度的应用场景将加速具身智能技术的商业化进程。
优必选无人物流车赤兔α在富士康郑州工厂下线,Walker S2参与生产
优必选旗下智慧物流子公司UQI优奇无人物流车Chitu赤兔α在位于郑州的富士康新能源汽车研发中心完成首批PVT车辆的正式下线。在Chitu赤兔α的生产制造过程中,引入优必选工业人形机器人Walker S2与Wali瓦力顶升移动机器人U1500协作实现SPS上料无人化。
- 协作流程:Wali瓦力U1500自主执行从仓储区到内饰线的物料转运;Walker S2基于现场工况自主识别与决策,将料箱搬运至装配工位
- 生产验证:PVT阶段是车辆量产交付能力的关键验证环节,用于验证量产条件下的制造一致性、过程稳定性与质量可追溯能力
深度解读 & 洞察:这是人形机器人在工业制造场景落地的一个重要案例。优必选将具身智能引入作业体系,在机器人操作系统UPilot的集群调度下,让Walker S2与Wali瓦力U1500协作实现Chitu赤兔α的SPS上料无人化,使装配所需物料的流转从人工搬运转化为无人物流链路。
从技术角度看,这个案例展示了多机器人协同工作的能力。不同类型的机器人(人形机器人、四足机器人、顶升移动机器人)在统一的调度系统下协同作业,各自发挥自己的优势。Wali瓦力U1500负责长距离转运,Walker S2负责精细操作,这种分工协作模式是工业智能化的一个重要方向。
从商业角度看,PVT阶段是车辆量产交付能力的关键验证环节。Chitu赤兔α在富士康车规级体系下完成PVT,意味着它已经具备了量产爬坡与批量交付的条件。这将加速无人物流车在制造业的推广应用。
更重要的是,这个案例展示了“人形机器人制造无人物流车”的闭环应用——人形机器人参与生产另一款智能产品,这为具身智能的商业化提供了一个可行的路径。
贾跃亭旗下FF发布三款具身智能机器人
法拉第未来(FF)在美国拉斯维加斯举行的美国国家汽车经销商大会上,发布了首批具身智能(Embodied AI)机器人产品,定价从2499美元到34990美元不等。FF还宣布轮臂系列机器人计划于2026年第二季度发布。
- 三款产品:Futurist系列(全尺寸职业型,34990美元起)、Master系列(运动型,19990美元起)、Aegis系列(安防和陪伴型四足,2499美元起)
- 战略定位:从智能电动汽车向具身智能领域延伸;机器人业务与其汽车业务形成协同,构建更完整的人机交互生态
深度解读 & 洞察:贾跃亭选择在汽车经销商大会上发布机器人产品,这个时点和场景的选择很有意思。汽车经销商网络是销售汽车的高净值用户渠道,将机器人放在这个渠道销售,可以直接触达那些可能对机器人感兴趣的富裕用户。这是一种跨界渠道的创新。
从产品定位看,FF的三款机器人覆盖了不同的应用场景和价格区间:Futurist系列面向高端专业市场,Master系列面向运动爱好者,Aegis系列面向大众消费市场。这种产品矩阵的布局显示了FF在具身智能领域的野心——不是只做一款产品,而是要构建一个完整的产品线。
从战略角度看,FF表示这些机器人产品将与其汽车业务形成协同,构建更完整的人机交互生态。这意味着FF在尝试将智能汽车、AI技术平台和机器人进行深度融合,构建软硬件一体化的闭环生态。这种思路与当前许多科技公司“车-家-机器人”一体化的战略方向是一致的。
政策与监管
天津:严禁使用AI开处方
天津市卫生健康委员会印发《天津市互联网诊疗监管实施办法(试行)》,明确规定处方应由接诊医师本人开具,在线开具的处方必须有医师电子签名,处方经药师审核合格后方可生效,严禁使用AI等自动生成处方。
- 病历管理:医疗机构开展互联网诊疗的病历记录需按照门诊电子病历的有关规定进行管理,保存时间不得少于15年;诊疗中的图文对话、音视频资料等过程记录保存时间不得少于3年
- 低龄儿童用药:为6岁以下低龄儿童开具互联网用药处方时,需确认患儿有监护人和相关专业医师陪伴
深度解读 & 洽察:这项政策明确划定了AI在医疗领域的边界:AI可以辅助诊断、提供治疗建议,但最终的开处方权必须在医生手中。这反映了监管部门对AI医疗应用审慎态度的核心原则:AI可以提供建议,但不能替代专业判断和责任承担。
从患者安全角度看,这是必要的保护措施。处方涉及用药种类、剂量、频次等关键决策,直接影响患者的生命健康。AI虽然可以基于大量医学数据提供参考建议,但医学决策往往需要综合考虑患者的个体差异、病史、过敏史、用药史等多方面因素,这些是当前AI难以全面把握的。更重要的是,医学决策需要有人负责——如果AI开错了处方导致患者受伤,责任谁来承担?让医生最终把关,就是明确了责任主体。
从AI发展角度看,这并非对AI医疗应用的否定,而是为其设定了健康发展的边界。AI可以发挥数据处理、知识检索、辅助诊断等方面的优势,提升医生的诊疗效率和准确性。但在涉及生命健康的关键决策上,必须由专业的人类医生做最终判断和承担相应责任。
这种“AI辅助 + 人工把关”的模式,可能是未来医疗AI发展的主流方向。它既能发挥AI的技术优势,又能确保患者安全和医疗责任清晰明确。
八部门:运用AI等新一代信息技术构建经典名方知识图谱
工业和信息化部等八部门印发《中药工业高质量发展实施方案》,提出深度赋能中药新药研发,运用人工智能、大数据等新一代信息技术,构建经典名方、名老中医经验方等特色方剂知识图谱和图神经网络。
- 研发赋能:加强中药领域基础研究,构建多组学联合分析平台,完善体内外评价技术体系;突破中药功效组分辨识、组方优化、成药性评价、剂型及工艺设计等技术瓶颈
- 产业发展:鼓励对已上市中成药创新改良,促进疗效提升;开展中药材“传统非药用部位”开发利用研究,提升中药材资源综合利用水平
深度解读 & 洞察:这项政策标志着AI技术在传统中医药领域的应用获得了官方认可和支持。中医的核心是“辨证论治”,而“证”的识别和判断往往依赖于名老中医的经验和直觉,这些经验往往难以被系统地传承和规模化应用。
AI技术的引入为解决这个问题提供了新的路径。通过构建经典名方、名老中医经验方的知识图谱和图神经网络,可以将中医的经验知识结构化、数字化,使其能够被系统地存储、检索和应用。这不仅有助于保护珍贵的中医文化遗产,更能让这些经验知识在更大范围内发挥作用,惠及更多患者。
从新药研发角度看,中药新药研发一直面临周期长、成本高、成功率低的挑战。AI技术可以通过多组学联合分析、体内外评价等技术手段,加速中药功效组分辨识、组方优化等关键环节,提升研发效率,降低研发成本。
从产业发展角度看,这项政策将推动中药产业的现代化转型。通过AI技术的赋能,传统中药产业可以从“经验驱动”转向“数据驱动”,从“小规模手工制作”转向“规模化智能生产”,提升整个产业的科技含量和竞争力。
更多动态
- Mistral AI推出Voxtral Transcribe 2语音转文字模型,包含两款模型:Voxtral Realtime(实时转录,延迟可压缩至200ms以下)和Voxtral Mini Transcribe V2(批量处理,支持3小时长音频),均支持包括中文在内的13种语言
- 可灵AI 3.0上线,多模态输入输出一体化,实现智能分镜、主体参考、全能音画、15秒超长生成等功能
- OpenScholar开源AI模型专为整合前沿学术研究打造,引用准确率与人类专家持平,在51%的盲评中更受科学家偏爱
- 何恺明团队提出“漂移模型”将分布演化从推理阶段转移到训练阶段,实现单步生成,在ImageNet 256×256基准测试中取得1.54 FID
- GitHub集成Claude和Codex AI编程智能体,支持多模型协同开发,开发者可在不同开发环节选用不同智能体
- 亚马逊新版AI智能助手Alexa+面向美国所有用户开放,全量级单独订阅19.99美元/月,非Prime会员可免费体验新聊天功能
- ElevenLabs完成5亿美元D轮融资,估值达110亿美元,2025年年度经常性收入超3.3亿美元
- 我国生成式人工智能用户规模达6.02亿人,普及率达42.8%,较2024年底增长141.7%
- 谷歌发布Gemini全新广告展示AI在日常生活中的无限可能,Nano Banana技术已处理超过50亿张图片
- 阿里巴巴统一大模型品牌为“千问”,中文官方名称统一为“千问大模型”,英文统一使用Qwen
- Anthropic宣布Claude将不再包含广告,承诺永久保持无广告模式,将“无广告的思考空间”明确为核心产品哲学
- 重庆推出新政策扶持人工智能与制造业融合,通过技术研发、数据建设、案例推广等方面给予企业资金支持,单项奖补最高可达500万元
- 西门子收购Canopus AI,加强半导体测量能力,交易金额估计在1.5亿至3亿欧元之间
- 微软推出内容市场,为AI公司提供合法的数据来源,建立透明、规范的授权体系
- FF发布三款具身智能机器人,定价从2499美元到34990美元,计划于2026年第二季度发布轮臂系列机器人
- 上海AI Lab发布Intern-S1-Pro科学多模态大模型,参数达1万亿,采用MoE架构,在数理推理上达到奥赛金牌水平
- 谷歌Gemini用户数破7.5亿,Alphabet营收首超4000亿美元,2026年资本支出预计1750-1850亿美元
- 奥尔特曼公开炮轰Anthropic的超级碗广告,指责其存在虚假宣传,强调OpenAI不会以“愚蠢的方式”投放广告
- 百度春节期间启动5亿元红包活动,将AI战略从技术研发转向全民应用,文心助手月活跃用户已突破2亿
- 黄仁勋驳斥“软件消亡论”,认为AI是好用的螺丝刀,而非替代者,软件是AI运行和落地的工具
- 西北工业大学发布WenetSpeech-Chuan语料库,首个针对川渝方言的大规模多维标注语音语料库,规模达10000小时
- deepin社区发布OpenClaw AI Agent框架安装教程,详细介绍在deepin 25系统上安装并对接飞书的完整流程
- Elastic发布9.3版本,重点围绕与数据直接对话、构建自定义AI agents以及实现全自动化能力
- 酷哇科技发布第二代世界模型架构COOWA WAM 2.0,定位为“可学习的神经模拟器”,预计2026年全系机器人交付量将突破10,000台
- OceanBase团队开源seekdb-js SDK,面向AI应用开发的向量检索与混合查询工具包
- 谷歌将ZetaSQL更名为GoogleSQL,统一该SQL方言、分析和解析库的对外命名
- RentAHuman“AI雇佣人类”工作平台走红,AI智能体可通过MCP或API预约真人执行取件跑腿、参加会议、签署文件等任务
- 英飞凌前移AI领域业务投资,本财年在AI数据中心电源解决方案产能扩充上的支出达到27亿美元,预计AI领域营收3年内增长10倍
- OpenScholar开源AI模型发布,专为整合前沿学术研究打造,引用准确率与人类专家持平
- Gitee入选首批「供应链安全号」成员,携手国家工信中心共建工业软件安全生态
- OpenAI发布关于访问相关页面出现客户端异常的情况说明,提示用户尝试刷新页面、清理缓存、检查扩展程序
- 亚马逊将使用AI工具制作影视作品,简化创作流程、降本增效,计划3月启动闭门测试
- 微软Visual Studio 2026二月开发路线图重点放在AI功能的稳定性上,从激进的功能堆叠转向提升现有工具的可靠性
- 百度文心助手春节红包分享链接被微信封禁,微信认为此类行为严重干扰正常的社交秩序,具有明显的骚扰性质
- Anthropic估值大幅攀升,公司推进员工股权套现计划,让员工能够实现持股收益
- 工信部发布政策发力AI与制造业融合,推动构建智能工业体系,加快产业数字化转型
- 阿里发布开源代码模型,该模型专门为Agent场景设计优化,提升代码生成和理解能力
- ChatDev 2.0版本发布,采用多代理协作方式实现软件全流程自动化开发,提升开发效率
- 面壁智能宣布开源全双工交互模型MiniCPM-o,支持实时语音交互,实现更加自然流畅的人机对话体验
- 智谱AI推出新模型,专门解决图片中文字渲染的技术难题,提升OCR准确性和视觉效果
- 苹果在Xcode中引入Agent编码功能引发隐私争议,该功能可能涉及代码和用户数据的处理方式引发关注
- 新型视觉模型采用螺旋编码方式,有效突破了传统方法在方向处理上的限制
- 微信严厉打击诱导分享行为,封禁涉及腾讯元宝的违规分享链接,维护平台生态
- 钉钉发布全新智能体系统,通过AI技术重塑企业工作方式,提升协作效率和智能化水平
- 美团提出全新全能模型,在理解和生成任务上取得突破性进展,打破了传统模型的局限性
- 研究发现生成式模型能够自动进化出最优的增强策略,无需人工干预即可提升性能
- 研究人员提出新方法,能够在无参考图像的情况下实现稳定可控的风格生成
- 君逸数码推出AI智能体平台,面向政府和企业客户,支持多模态数据分析、智能知识库管理、智能问答和自主执行任务
- 阿里千问APP在酒店客房推出NFC唤醒功能,住客用手机轻碰NFC感应贴纸即可唤醒千问APP,实现旅行规划、景点讲解、照片处理等功能
- 米哈游总裁刘伟:上海游戏产业已具备世界一流工业化能力,要攻克AI模型等新技术
- 谷歌发布原生自适应界面框架,利用AI重塑无障碍技术
- 马斯克四个月财富暴增1000多亿美元,从5000亿到8520亿,跨越四个千亿级台阶
- 美图CEO吴欣鸿回应“大模型吞噬应用”担忧,认为通用大模型和垂直应用之间主要是协同关系,而不是简单的竞争
- 特斯拉人形机器人Optimus即将具备自主学习能力,只需要看人类怎么做就能学会新技能,年产量计划提高到百万台级别
- Moltbook AI社交网络爆火,上线仅一周吸引超过100万个AI智能体入驻,日均发帖量突破万条
- 谷歌与苹果强强联手,下一代AI模型即将面世,谷歌已成为苹果的首选云服务提供商,苹果正在基于Gemini技术开发下一代AI模型Apple Foundation
- 腾讯游戏启动2026寒假未成年人保护行动,引入AI技术推出AI游戏周报、AI一键管控、家长AI助手三项新功能
- 超半数Chrome AI插件在暗中搜集用户隐私,对442款标有AI标签的Chrome插件分析发现,超过50%在收集用户数据,近三分之一会获取个人身份信息
- 面壁智能首款AI硬件“松果派”官宣今年上市,AI原生端侧智能开发板,支持离线多模态个人知识助理、具身智能、编程教具等场景
- Anthropic在超级碗投放广告嘲讽OpenAI,内容直指竞争对手在ChatGPT中插入广告的做法
