- 智谱AI发布GLM-4.7开源编码大模型,性能超越GPT-5.2
- Alphabet斥资47.5亿美元收购清洁能源公司Intersect
- 字节跳动计划投入230亿美元建设AI基础设施
- 钉钉发布全球首个AI工作操作系统Agent OS
- MiniMax发布M2.1开源编码模型,性能超越Gemini3Pro
- 百度文心5.0 Preview登顶LMArena中国榜首
- OpenAI承认AI浏览器存在难以根除的安全漏洞
- 软银急需225亿美元资金支持OpenAI

大模型技术突破与开源竞争
智谱AI发布 GLM-4.7,新一代开源编码大模型性能跃升
12月22日,智谱华章正式上线并开源新一代大模型GLM-4.7。该模型在多项国际基准测试中表现突出:
- 在权威编码评估平台Code Arena中位列开源与国产模型双榜首
- 在SWE-bench Verified中获得73.8%的SOTA分数
- 工具调用任务τ²-Bench得分87.4分,超越Claude Sonnet 4.5
深度解读 & 洞察:
- GLM-4.7的发布标志着国产大模型在专业编程领域已具备全球竞争力,尤其针对开发者场景进行了深度优化
- 开源策略有助于构建开发者生态,加速模型在真实工业场景中的迭代和应用
- 编码能力已成为大模型竞争的核心战场,直接关系到AI在软件开发、自动化等关键领域的落地效果
MiniMax发布 M2.1 开源编码和代理模型
MiniMax M2.1正式发布,这是一款专为真实编码和AI组织设计的先进开源模型:
- 在SWE-multilingual测试中得分72.5%
- 在VIBE-bench测试中高达88.6%
- 性能超越Gemini3Pro和Claude4.5Sonnet等闭源模型
深度解读 & 洞察:
- MiniMax M2.1不仅关注基础编码能力,更强调在真实世界复杂任务中的全栈应用构建能力
- VIBE-bench等新评测标准的出现,反映了行业对AI代理(Agent)实际工作能力的重视
- 开源高性能编码模型的涌现,正在改变软件开发的工作范式,让AI从辅助工具向协作伙伴演进
百度文心5.0 Preview登顶LMArena中国榜首
百度文心5.0Preview在LMArena最新排名中以1451分登顶国内大模型榜首,展现其在创意写作和高难度任务上的强劲实力。
深度解读 & 洞察:
- LMArena采用人类偏好评估,更能反映模型在实际使用中的体验质量
- 文心5.0的突破说明国产大模型在通用能力上也在快速追赶,不再局限于特定垂直领域
- 大模型竞争已进入"全能选手"阶段,既要有专业深度,也要有通用广度
AI基础设施与资本布局
Alphabet斥资47.5亿美元收购Intersect,加码AI算力的绿色能源引擎
谷歌母公司Alphabet以47.5亿美元收购清洁能源开发商Intersect,以应对AI算力激增带来的电力需求。
深度解读 & 洞察:
- AI数据中心的能耗问题已成为制约行业发展的关键瓶颈,据估计训练一个大型AI模型的碳排放相当于数百次跨洋航班
- 科技巨头开始向上游能源领域延伸,确保AI竞赛中的电力供应稳定性和成本可控性
- 绿色能源与AI的结合不仅是环保需求,更是商业战略必需,未来可能成为AI公司的核心竞争力之一
字节跳动拟豪掷230亿美元布局AI基础设施
字节跳动计划在2026年投入约1600亿元人民币用于AI基础设施建设,其中约850亿元将用于采购先进AI处理器。
深度解读 & 洞察:
- 这一投资规模显示了字节跳动缩小与美国科技巨头差距的决心,硬件投入是AI竞争的基础
- AI处理器采购占总投资一半以上,说明算力仍是当前AI发展的最大瓶颈
- 巨额基础设施投入也反映了AI竞赛已进入"军备竞赛"阶段,只有具备雄厚资本实力的公司才能参与顶级竞争
软银急需225亿美元资金支持OpenAI
软银为履行对OpenAI的承诺,正紧急筹集225亿美元资金,可能动用Arm股权相关贷款。作为OpenAI主要支持者,软银参与了5000亿美元"星际网"数据中心计划。
深度解读 & 洞察:
- OpenAI背后的资金需求远超想象,5000亿美元的数据中心计划需要多方资本支持
- 软银通过Arm等资产为AI投资提供资金,显示了其将AI视为未来十年最重要的投资方向
- 资本密集度已成为AI行业的显著特征,初创公司如果没有巨头支持很难独立生存
企业级AI应用与产品创新
钉钉发布全球首个AI工作智能操作系统Agent OS
钉钉发布全球首个AI工作智能操作系统Agent OS,开启"人与AI协同"新工作方式。该系统在AI钉钉1.1新品发布暨生态大会上亮相,命名为"木兰"。
深度解读 & 洞察:
- Agent OS代表了企业AI应用的新范式:不再是单点工具,而是完整的操作系统级解决方案
- 通过统一调度和管理各类AI智能体,企业可以实现更高效的自动化工作流
- 钉钉选择在企业办公场景率先落地Agent OS,是因为办公场景标准化程度高、ROI(投资回报率)明确
钉钉发布企业级AI硬件DingTalk Real
钉钉发布企业级AI硬件DingTalk Real,集成实体、数据与实时三大核心能力,通过软硬一体重塑办公体验。该硬件采用内网部署,具备强大数据处理能力,可深度读取企业内部私有数据。
深度解读 & 洞察:
- 企业级AI硬件的推出解决了数据安全和隐私保护的核心痛点,内网部署模式更适合敏感业务场景
- "紧急时刻可拔电"的设计理念体现了对企业数据主权的尊重,这可能是打动传统企业客户的关键
- 软硬一体化正在成为企业AI解决方案的趋势,单纯的软件服务难以满足复杂的企业需求
优必选子公司优奇联手火山引擎,豆包大模型赋能具身智能新赛道
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作。
深度解读 & 洞察:
- 具身智能(Embodied AI)是AI与物理世界交互的重要方向,机器人+大模型的组合有望解决工业场景中的复杂任务
- VLA(Vision-Language-Action)模型能让机器人理解指令、观察环境并执行动作,这是实现真正智能机器人的关键技术
- 工业物流是具身智能的理想落地场景,因为环境相对结构化,任务目标明确,ROI容易量化
AI安全、监管与社会影响
OpenAI坦言AI浏览器难逃"提示注入"威胁
OpenAI承认其AI浏览器存在难以根除的"提示注入"安全漏洞,这将是长期技术挑战,而非可短期修复的Bug。
深度解读 & 洞察:
- "提示注入"类似于传统软件中的代码注入攻击,恶意网站可以通过特殊构造的内容劫持AI的行为
- 这一安全问题的根本原因在于AI的黑盒特性,无法像传统程序那样进行精确的输入验证和边界检查
- OpenAI承认这是长期挑战,说明AI安全需要全新的防护思路,不能简单套用传统网络安全方法
Instacart宣布停止AI动态定价测试
配送平台Instacart宣布终止AI定价测试,承诺同一商品对同时购买的用户显示相同价格。此前其算法曾导致"同货不同价"争议,引发监管关注。
深度解读 & 洞察:
- AI动态定价虽然在技术上可行,但在消费者公平性方面存在重大伦理问题
- 监管压力和舆论风险迫使企业重新考虑AI应用的边界,技术可行性不等于商业可行性
- 这一案例说明AI应用需要建立透明度和可解释性机制,让用户理解为什么会出现不同的价格或结果
上海市新增12款已完成备案的生成式人工智能服务
上海市网信办公布新增12款生成式AI服务备案,全市备案总数已达一定规模,旨在促进AI创新与规范发展。
深度解读 & 洞察:
- 中国的AI监管采用"备案制"而非"审批制",在控制风险的同时保持创新活力
- 上海作为AI高地,其备案制度可能成为全国其他地区的参考模板
- 合规将成为AI产品商业化的重要门槛,企业需要在产品设计初期就考虑监管要求
更多动态
- ChatGPT推出年终回顾功能:OpenAI推出类似Spotify Wrapped的年度回顾功能,为用户提供个性化使用报告
- 照片秒变涂色书:Retro团队发布Splat:AI应用Splat可将普通照片转化为儿童涂色书页面
- 日本女子听取ChatGPT建议,与AI游戏角色结婚:引发人机关系讨论
- 估值暴涨至66亿美元:AI编程黑马Lovable完成B轮融资:Google与英伟达联合入局
- Perplexity推出2025年回顾小工具:用户可轻松总结个人年度活动
- 重金挖角半年即传不和:扎克伯格与Meta新AI主管陷入关系僵局
- 亚马逊SageMaker已部署Mistral AI的Voxtral模型:整合文本与音频处理能力
- Quest Mobile发布AI应用周活排行榜:字节系上榜3个,蚂蚁上榜2个
- GPT-5首次独立攻克数学难题:透明化归因实验引发学界争论
- 美国战争部联手xAI:Grok模型将进驻AI平台GenAI.mil
- 国家知识产权局推出18项"人工智能+"场景
- 吸金6.6亿美元!Steam近八成游戏染指AI
- 苹果初代智能眼镜细节曝光:将成iPhone最强AI配件
- MiniMax Agent平台上线开源编码和代理模型MiniMax M2.1
- 从红包大战到AI对决:火山引擎或成为2025春晚独家合作伙伴
- 加速端侧大模型进化:面壁智能获数亿元新融资
- 印度数据中心快速发展面临人才短缺挑战
- 宇树科技获交互控制专利授权:机器人响应速度大幅提升
- 谷歌DeepMind发布Gemma Scope 2:为Gemma 3模型提供全栈可解释性工具
- 英伟达云业务战略调整:重心转向内部AI开发
- 微软纳德拉重返一线督战,Copilot付费增长为何陷入瓶颈?
- 生数科技与清华大学联合推出TurboDiffusion视频生成加速框架
- 蚂蚁集团发布千亿参数医疗模型安诊儿
- 谷歌开源A2UI项目支持智能体生成原生UI
- 盛大AI推出具备长期记忆与情感的数字人系统Mio
- 旧金山停电导致Waymo无人车瘫痪:暴露高精地图短板
- 蚂蚁集团牵头的多智能体可信国际标准正式立项
- 可灵2.6发布运动控制功能让静态图动感热舞
- AI体育教练SportsGPT精准诊断运动动作
- VLMIR框架利用视觉语言模型修复模糊图像
- 结构化思维链让小模型也能写好SQL代码
- 生成式AI席卷Steam游戏热销榜
- 尤洋教授分析企业是否需要私有模型
- exo开源项目支持在家运行AI集群
- Fabric开源框架利用AI增强人类能力
- LocalAI提供OpenAI的免费替代方案
- Home Assistant Core智能家居系统
- cocoindex面向AI的高性能数据转换框架
- Armin大神分享2025年氛围编程经验
- 全自动编程智能体Auto-Claude发布
- 阿里千问发布2025年十大高频提示词
- NotebookLM推出记忆卡片生成功能
- AI一键生成质感PPT功能发布
- 阿里发布新一代端到端语音交互模型:Fun-Audio-Chat
- 面壁智能完成数亿元融资,加码投入领跑端侧AI