AI大模型融资纪录刷新社交AI与具身智能成新战场

要点速览

阶跃星辰完成超50亿元B+轮融资，印奇出任董事长
腾讯元宝春节发10亿红包，推"元宝派"社交AI
阿里发布万亿参数Qwen3-Max-Thinking模型
全球首个跨本体视触觉数据集白虎-VTouch发布
AI实际办公准确率不足25%，但进步超预期
李飞飞World Labs估值飙至50亿美元
72% ChatGPT用户设为主页，谷歌搜索引擎地位受挑战
苹果Siri将接入谷歌Gemini，2月发布

大模型赛道硝烟再起：阶跃星辰刷新融资纪录，阿里腾讯同步亮剑

本周AI大模型赛道重磅消息频出。1月26日，阶跃星辰宣布完成超50亿元人民币的B+轮融资，刷新了过去12个月中国大模型赛道的单笔融资纪录。这轮融资由上国投先导基金、国寿股权等国资和地方基金领投，腾讯、五源资本等老股东跟投。值得注意的是，原旷视科技创始人印奇正式出任阶跃星辰董事长，与CEO姜大昕、首席科学家张祥雨、CTO朱亦博组成核心管理层。印奇同时担任A股上市公司千里科技董事长，这意味着阶跃星辰与千里科技将在"AI+终端"战略上深度绑定，汽车场景成为首个突破口。

同一天，阿里千问发布旗舰推理模型Qwen3-Max-Thinking，总参数超万亿，在19项基准测试中性能可媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro。该模型的核心创新在于自适应工具调用能力和测试时扩展技术，通过迭代式自我反思机制，在GPQA上从90.3提升至92.8，LiveCodeBench v6从88.0提升至91.4。腾讯混元也发布了混元图像3.0图生图模型，采用80亿参数的混合专家架构，支持一句话修图和80多种细分任务。

深度解读： 大模型竞争已从单纯的技术参数比拼，转向"模型能力+商业落地"的双轨竞赛。阶跃星辰获得50亿融资说明资本市场对国产大模型仍有信心，但印奇兼任千里科技董事长的安排表明，纯模型公司难以独立存活，必须与终端场景深度绑定才能实现商业闭环。阿里和腾讯同一天发布重要模型，既是技术秀肌肉，也是向市场宣示竞争力。

社交AI新战场：腾讯推"元宝派"，春节红包战升级

腾讯在AI应用落地层面打出一记重拳。1月26日，腾讯宣布AI助手"元宝"将于2月1日启动春节分发活动，发放10亿元现金红包，单人最高可领万元。这不是普通的红包活动——腾讯同时曝光了此前保密的"元宝派"项目，这是将AI融入群体社交场景的全新尝试。

"元宝派"的玩法与现有Chatbot截然不同：用户可以创建或加入不同主题的社交空间，在群聊中@元宝来总结内容、发起健身或阅读打卡，甚至借助腾讯会议的音视频能力实现"一起看"和"一起听"的沉浸式体验。该功能已打通微信和QQ，用户可通过分享"派号"一键拉人加入。

百度也不甘示弱，文心助手宣布春节期间推出5亿元现金红包雨活动，单人最高1万元，同时上线近百种春节主题AI玩法，包括AI写春联、AI拍贺岁大片等。

深度解读： 腾讯和百度把AI竞争拉到了自己最擅长的社交和流量战场。“元宝派"的真正价值不在于技术突破，而在于证明了"AI+社交"的可行性——当AI不再是冷冰冰的一对一对话工具，而是能参与群体互动的"社交成员”，用户的留存和使用频率都会显著提升。这是对纯技术公司的一次降维打击。春节红包战本质是用户心智争夺战，谁能先把用户习惯培养起来，谁就能在AI应用的下半场占据优势。

具身智能数据基建突破：白虎-VTouch数据集发布

国家地方共建人形机器人创新中心联合纬钛机器人发布了全球首个大规模跨本体视触觉多模态数据集"白虎-VTouch"。这个数据集包含超过60000分钟的真实物体交互样本，约9072万对接触数据，覆盖轮臂机器人、双足人形机器人、手持智能终端三种构型，重点覆盖家居、餐饮、工业、特种四大场景的260多个接触密集型任务。

该数据集的核心突破在于"跨本体"：不局限于单一设备，而是整合了多种机器人形态，让训练出的算法具备更强的通用性。传感器支持640×480分辨率和120Hz刷新率，能够捕捉接触过程中的细微物理变化。研究显示，加入视触觉感知后，68%的任务获得了更连续的接触状态描述，这对精细抓取、力控调整和失败恢复至关重要。

深度解读： 具身智能的Scaling Law（规模定律）一直缺了"触觉与接触"这一维度。白虎-VTouch的价值在于，它让机器人不仅能"看"世界，还能"摸"世界。这解决了过去纯视觉方案在光照变化、遮挡等情况下的鲁棒性问题。更重要的是，跨本体设计意味着数据可以复用在不同形态的机器人上，降低了行业整体的数据采集成本。当数据问题得到缓解，具身智能的落地速度会明显加快。

AI实际办公能力遭质疑：准确率不足25%

训练数据公司Mercor发布的APEX-Agents基准测试显示，当前主流AI模型处理实际办公室任务的表现远低于预期。测试采用真实工作流评估，包括律师、顾问、银行家的真实任务场景，结果显示即使是GPT-5.2和Gemini 3 Flash这样的顶尖模型，准确率也仅为23%和24%，其他模型普遍低于20%。

Mercor CEO Brendan Foody分析认为，AI失败的关键在于缺乏上下文处理能力——真实办公场景需要整合分散资源，如查看日程、翻阅即时通讯记录、阅读PDF和电子表格，而AI在跨源信息搜索与整理时容易混淆出错。研究同时指出，AI的进步速度超出预期：一年前同类测试的准确率仅为5%-10%，如今已提升至24%。

深度解读： 这个结果给AI行业泼了一盆冷水。聊天机器人能写诗解题，但一到真实办公场景就"露馅"，说明AI离取代知识工作者还有很长距离。但另一面看，24%相比去年的10%进步了140%，迭代速度惊人。APEX-Agents的启示是：评估AI能力不能只看数学和编程 benchmarks，必须用真实工作流来测试。企业在引入AI时也要理性预期——AI现在更像一个"不可靠的实习生"，而非成熟的职业人士。

李飞飞World Labs估值飙至50亿美元

斯坦福教授李飞飞创办的初创公司World Labs正在进行估值50亿美元的融资，计划筹集5亿美元。一年前该公司估值还只有2亿美元，现在翻了25倍。World Labs专注于"大世界模型"，首款产品Marble能用文本或图像直接生成可探索的3D空间，为物理仿真和机器人模拟提供数据支持。

李飞飞认为，AI不应该只会生成图片或文字，而应该真正理解物理世界怎么运作。世界模型是进入"空间智能"的关键路径，能创造遵守物理规律的世界，处理多种数据类型和预测相互作用。图灵奖得主Yann LeCun也在做类似的事情，他创办的AMI Labs估值35亿美元，但路线不同——LeCun坚持抽象认知，李飞飞做的是可以直接生成的3D环境。

深度解读： 50亿美元估值背后是资本市场对"空间智能"赛道的高度认可。当语言模型的能力趋于同质化，下一个增长点必然是多模态和空间理解。World Labs和LeCun的AMI Labs分别代表两种路线：生成式和认知式，谁能最终胜出尚未可知。但有一点可以确定：AI的下一个阶段不再只关乎"语言"，而是关乎"世界"。具备空间智能的模型将赋能3D资产生成、虚拟拍摄、具身智能机器人等多个万亿级市场。

谷歌与OpenAI搜索引擎大战升级

调查显示，72%的ChatGPT订阅用户已将网页版GPT设为浏览器主页。如果这一数据属实，谷歌在搜索引擎领域的霸主地位将面临严峻挑战。自ChatGPT问世以来，谷歌已将其视为直接竞争对手，尽管通过Gemini 3和与苹果合作试图稀释市场份额，但ChatGPT在"互联网入口"这一关键战场上依然表现强劲。

OpenAI CEO萨姆·奥尔特曼此前已将公司状态提升至"红色警戒"，以应对日益激烈的竞争格局。谷歌每年向苹果支付约200亿美元以确保其作为iPhone默认搜索引擎的地位，但ChatGPT正在改变用户的搜索习惯。

深度解读： 搜索引擎是互联网最核心的入口，广告市场规模高达数千亿美元。ChatGPT正在从"答案引擎"变成"入口引擎"——用户不再需要先打开搜索引擎再点击链接，而是直接问ChatGPT就能获得答案。这种范式转移对谷歌的商业模式构成根本性威胁。谷歌的优势在于数据积累和用户习惯，但AI原生产品体验一旦形成惯性，迁移成本会越来越高。这场大战的结果将决定未来十年互联网的流量分发格局。

AI大模型融资纪录刷新 社交AI与具身智能成新战场

大模型赛道硝烟再起：阶跃星辰刷新融资纪录，阿里腾讯同步亮剑

社交AI新战场：腾讯推"元宝派"，春节红包战升级

具身智能数据基建突破：白虎-VTouch数据集发布

AI实际办公能力遭质疑：准确率不足25%

李飞飞World Labs估值飙至50亿美元

谷歌与OpenAI搜索引擎大战升级

更多动态

AI大模型融资纪录刷新社交AI与具身智能成新战场