要点速览
- OpenAI开放ChatGPT应用目录,Spotify等首批入驻
- 谷歌发布免费Gemini 3 Flash,性能反超Pro版
- 千问App接入高德地图,AI可执行现实世界任务
- MiniMax、智谱等国产大模型公司通过港交所聆讯
- 火山引擎豆包大模型日均调用量破50万亿
- 人形机器人“小墨”规模化入驻宁德时代产线
- 豆包AI眼镜明年上市,定价2000元以内

大模型平台生态全面升级
OpenAI正式开放ChatGPT应用目录,Spotify、Apple Music等首批入驻
OpenAI正式向全球开发者开放ChatGPT应用提交权限,审核通过后将出现在ChatGPT内置的应用目录中。首批入驻的第三方服务包括Spotify、Apple Music、DoorDash等,用户可在聊天界面直接调用这些服务完成订餐、听歌、做PPT等操作。
深度解读 & 洞察:
- 这标志着ChatGPT从“聊天机器人”正式转型为“AI原生超级应用平台”,具备了连接现实世界服务的能力
- 开发者提交的不是独立App,而是为ChatGPT注入新情境与操作能力的“技能插件”,形成以ChatGPT为核心的AI服务生态
- 此举将极大扩展ChatGPT的实用边界,使其从信息问答工具升级为可执行任务的操作系统
谷歌发布Gemini 3 Flash:免费、极速、性能反超Pro
谷歌正式发布轻量化旗舰模型Gemini 3 Flash,响应速度提升至前代三倍,近乎“零延迟”,且在多项高难度基准测试中超越同代旗舰Gemini 3 Pro。该模型已作为默认引擎集成于谷歌搜索AI模式及Gemini应用,并全球免费开放。
深度解读 & 洞察:
- Gemini 3 Flash是史上首个在同期对比中“小弟干翻大哥”的Flash模型,打破了轻量级模型性能必然弱于旗舰版的常规认知
- 免费策略+极致性价比(速度3倍、成本大幅降低)将对OpenAI等竞争对手形成“降维打击”,尤其利好中小企业和开发者
- 谷歌同步推出“氛围编程”工具Opal,用户可通过自然语言在Gemini网页端零代码创建专属AI助手Gems,进一步降低AI应用开发门槛
千问App全面接入高德地图,阿里AI实现物理世界行动能力
阿里通义千问App正式接入高德地图,融合AI处理能力与地理位置数据,用户可通过文字指令直接获取餐厅推荐、导航路线等生活服务,实现“问答即服务”的出行体验。
深度解读 & 洞察:
- 此次接入标志着大模型从纯文本交互迈向“地理空间推理与服务执行”,具备了理解并作用于物理世界的能力
- 依托高德时空引擎和POI(兴趣点)数据,千问能生成包含具体位置、路线、营业时间等细节的行动建议,实用性大幅提升
- 阿里正构建“AI+本地生活”闭环,未来可能进一步接入打车、外卖等更多高德生态服务
国产大模型商业化加速:IPO潮与企业级落地
MiniMax、智谱等国产大模型公司集体通过港交所聆讯
国产大模型企业迎来上市潮,MiniMax(稀宇科技)、智谱华章、壁仞科技等头部公司近期相继通过港交所上市聆讯或完成备案,有望成为“全球大模型第一股”。
深度解读 & 洞察:
- 这标志着国产大模型产业从技术研发阶段正式迈入商业化与资本化关键节点
- MiniMax获阿里、腾讯等巨头投资,智谱背靠清华技术团队,均具备较强技术实力和商业化前景
- 上市融资将加速这些公司的算力投入、人才招募和产品迭代,推动行业竞争格局重塑
火山引擎FORCE大会:豆包大模型日均调用量破50万亿,登顶中国第一
火山引擎在FORCE原动力大会上宣布,豆包大模型日均Tokens调用量已突破50万亿,较2024年5月发布时增长417倍,稳居中国第一、全球第三。同时发布豆包大模型1.8和视频生成模型Seedance 1.5 Pro,并推出“AI节省计划”最高降价47%。
深度解读 & 洞察:
- 50万亿Tokens的日均调用量证明豆包已成为国内最活跃的大模型基础设施,背后是字节系产品(抖音、今日头条等)的海量应用场景支撑
- Seedance 1.5 Pro实现100%视听同步,支持希区柯克变焦等高难度镜头运动,视频生成能力达到行业领先水平
- “AI节省计划”通过大幅降价降低企业使用门槛,将进一步扩大豆包的市场份额
AI硬件与具身智能新突破
人形机器人“小墨”规模化入驻宁德时代产线
宁德时代投运全球首条人形机器人规模化生产线,“小墨”机器人批量负责电池包高压测试工序,替代了传统依赖人工的复杂操作。
深度解读 & 洞察:
- 这是人形机器人首次在高端制造业实现规模化商用落地,验证了其在精密工业场景的实用价值
- 电池包高压测试对安全性和精度要求极高,机器人能胜任说明其感知、决策和执行能力已达到工业级标准
- 宁德时代的示范效应将加速人形机器人在汽车、电子等制造业的渗透
豆包AI眼镜明年上市,定价2000元以内
字节跳动旗下豆包AI眼镜已进入量产前阶段,由火山引擎提供技术支持,润欣科技负责硬件设计,老凤祥合作打造外观,预计2025年初上市,定价2000元以内。
深度解读 & 洞察:
- 这是国内首款融合大模型的亲民AI眼镜,依托火山引擎的实时音视频技术,有望实现语音交互、实时翻译、AR导航等功能
- 2000元以内的定价策略旨在快速抢占消费级AI硬件市场,与Meta、苹果等巨头形成差异化竞争
- 联合老凤祥设计外观,表明字节重视AI硬件的时尚属性,试图打破科技产品“笨重”的刻板印象
开源与技术创新动态
- 微软开源TRELLIS.2:仅需一张图片即可快速生成带材质的3D模型,输出兼容Blender、Unity等平台
- Meta发布SAM Audio:全球首个支持“点击分离声音”的多模态音频模型,可通过文本、视觉或时间段提示精准提取目标声音
- 英伟达发布Nemotron 3开源模型:MoE架构支持百万token上下文,Nano版已发布,吞吐量比前代提升4倍
- 小米MiMo-V2-Flash开源:309B总参数的MoE大语言模型,Agent能力强劲,API限时免费
- 苹果开源SHARP模型:1秒内将2D照片转为物理比例准确的3D场景
- 美团开源LongCat虚拟人模型:支持音频驱动照片生成视频,可稳定生成5分钟高质量视频
其他重要动态
- AI版权争议升级:Adobe因被指控使用盗版书籍数据集(SlimPajama-627B)训练其SlimLM模型,遭作家提起集体诉讼
- 亚马逊AGI部门换帅:Nova模型生父、高级副总裁罗希特·普拉萨德离职,由AWS资深高管彼得·德桑提斯接任新AI组织负责人
- 英伟达收购Slurm开发商SchedMD:强化其在超算资源调度领域的优势,Slurm是全球超半数TOP500超算使用的调度工具
- GitHub Actions将收取平台费:自2026年起,私有仓库和自托管runner调度按$0.002/分钟计费,小型团队成本压力增大
- 马斯克豪言xAI三年登顶:称AGI时代最快明年开启,公司有望在未来两三年内超越所有对手