AI生态爆发:开源、融资与产品创新齐发

要点速览
  • OpenAI计划融资1000亿美元,估值或达8300亿美元
  • 小红书开源InstanceAssemble,实现复杂图像精准布局生成
  • ChatGPT将推“Skills”功能,2026年初上线
  • Liquid AI发布2.6B参数模型LFM2-2.6B-Exp,性能碾压百亿级大模型
  • 联想CES将推AI超级智能体,对标豆包打通全设备生态
  • 快看漫画联合MiniMax推出AI互动漫画
  • 清华开源TurboDiffusion,视频生成提速200倍
  • 意大利勒令Meta暂停WhatsApp AI限制政策,欧盟同步反垄断调查

AI生态爆发:开源、融资与产品创新齐发

重磅融资与资本动态

OpenAI 计划融资高达 1000 亿美元,估值或达 8300 亿美元

OpenAI正在积极寻求高达1000亿美元的融资以支持其增长计划,如果融资成功,OpenAI的估值可能达到8300亿美元。目前融资处于早期阶段,预计一季度完成,但市场热情减退可能影响投资者需求。

深度解读 & 洞察:

  • 这笔融资若成功,将成为科技史上最大规模的私募融资之一,远超此前微软对OpenAI的百亿美元级别投资。
  • 高估值反映了市场对AGI(通用人工智能)前景的高度期待,但也隐含巨大风险——若技术进展不及预期,估值泡沫可能破裂。
  • 融资资金将主要用于算力基础设施(如与博通合作开发定制芯片)、人才争夺和产品生态扩张(如即将推出的Skills功能)。

HodlHer 完成 150 万美元融资,构建 AI 驱动的 Web3 操作系统

HodlHer 完成 150 万美元战略融资,投资方包括 Chain Capital 等。资金将用于发展其核心操作系统 HodlOS,重点提升情感交互、多代理系统及链上代理经济等技术能力。

深度解读 & 洞察:

  • 该项目试图将AI智能体与Web3结合,打造能理解用户意图并自主执行链上操作的“数字员工”。
  • 情感交互能力是其差异化亮点,旨在解决当前Web3应用冰冷、难用的问题,但技术成熟度和安全性仍是巨大挑战。

开源技术突破

小红书开源 InstanceAssemble!轻量级布局可控生成框架,复杂多实例图像生成精度再突破

小红书与复旦大学联合推出布局控制生成方案InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单布局到密集复杂场景的精准图像生成。技术能根据用户指定的物体位置和内容描述,在对应位置高精度生成图像,解决了布局对齐不准的行业难题。

深度解读 & 洞察:

  • 传统文生图模型难以精确控制多个物体的空间关系,导致电商、设计等场景落地困难。InstanceAssemble通过级联建模和专用注意力机制,在几乎不增加参数量的前提下,显著提升了空间对齐精度。
  • 该框架的开源将极大降低高精度可控生成的技术门槛,有望催生一批新的AI设计工具和应用。

清华开源 TurboDiffusion 视频生成提速 200 倍

清华联手生数科技开源了速度惊人的TurboDiffusion,单张RTX 5090显卡生成视频仅需不到2秒钟,相比原始模型提速了恐怖的200多倍,核心技术SageAttention将计算量大幅压缩,视频动态和光影质感却几乎没有任何损失。

深度解读 & 洞察:

  • 视频生成的高算力成本一直是制约其普及的核心瓶颈。TurboDiffusion通过算法创新(SageAttention)实现了数量级的速度提升,使得消费级显卡也能流畅运行高质量视频生成。
  • 这一突破将加速AI视频在短视频、广告、游戏等领域的商业化应用。

1美元跑200个浏览器任务!开源浏览器操控神器 BU-30B-A3B-Preview 横空出世

近日,开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。

深度解读 & 洞察:

  • MoE(Mixture of Experts)架构是当前大模型降本增效的关键技术,它允许模型在保持巨大参数总量的同时,只激活与当前任务相关的“专家”子网络进行推理。
  • 该模型的出现,意味着自动化、智能化的网页操作(如自动填表、数据抓取、流程自动化)将变得极其廉价和普及,对RPA(机器人流程自动化)行业构成潜在颠覆。

产品与功能创新

ChatGPT将推“技能(Skills)”!OpenAI内部代号“榛子”,可组合、可移植、支持代码,2026年初或上线

OpenAI正在开发的ChatGPT新功能“Skills”,设计理念与Anthropic的Claude Skills相似,但更强调模块化、可执行性与跨平台复用,预计在2026年1月上线。

深度解读 & 洞察:

  • “Skills”功能标志着AI助手从“万能但浅层”的聊天模式,向“专业且可集成”的能力模块进化。用户可以像安装App一样,为AI助手添加特定技能(如订机票、分析财报)。
  • 可移植性和支持代码是其关键优势,意味着开发者可以轻松地将AI能力嵌入到自己的应用中,这将极大扩展ChatGPT的生态边界。

联想 CES 战略级 AI 曝光:打通 PC 手机生态的“超级智能体”来了

联想在CES上发布战略级AI超级智能体,旨在与字节跳动的豆包手机助手竞争,能够打通摩托罗拉手机、联想PC、平板电脑及可穿戴设备,实现跨设备、跨系统的无缝衔接。

深度解读 & 洞察:

  • 在AI硬件入口之争中,联想选择了一条与手机厂商(如小米、荣耀)不同的路径:依托其强大的PC和多元化硬件生态,打造一个覆盖全场景的“超级智能体”。
  • 这一战略能否成功,取决于其跨设备协同体验的流畅度以及能否提供超越单一设备助手的独特价值。

快看漫画联手 MiniMax 发布 AI 互动漫画 首批顶级 IP 已开启沉浸模式

快看漫画与MiniMax合作推出AI陪伴互动漫画,通过AI技术让漫画角色“活”起来,实现多模态互动和深层情感连接,标志着漫画行业进入“AI体验第四赛道”。

深度解读 & 洞察:

  • 传统的漫画是单向内容消费,而AI互动漫画则将其转变为一种双向的情感陪伴体验。用户可以与喜爱的角色对话、互动,甚至影响剧情走向。
  • 这不仅是内容形式的创新,更是IP运营模式的升级,有望大幅提升用户粘性和付费意愿。

行业监管与社会影响

意大利勒令 Meta 暂停 WhatsApp AI 禁令!欧盟同步调查,Meta 被指滥用市场支配地位打压竞品聊天机器人

意大利监管机构紧急叫停Meta限制第三方AI接入WhatsApp Business API的政策,认为其涉嫌滥用市场支配地位,损害AI市场竞争与消费者利益。此举紧随欧盟同类调查,显示欧洲正对Meta的AI入口布局展开系统性反垄断审查。

深度解读 & 洞察:

  • WhatsApp作为全球最大的即时通讯平台之一,其API是AI公司触达用户的重要入口。Meta限制第三方AI接入,被解读为利用其市场支配地位为自家AI服务(如Llama)铺路。
  • 欧洲监管机构的快速反应,凸显了其对AI时代新型垄断行为的高度警惕,这可能会成为全球AI反垄断的一个标志性案例。

纽约州签署 RAISE 法案严管 AI 巨头

纽约州正式签署了严管AI的RAISE法案,年收超5亿的巨头必须公开安全协议,发生事故72小时内必须向州政府上报,这是对联邦削弱州级监管的强硬回击,违规企业最高面临300万美元的罚款。

深度解读 & 洞潜:

  • 在联邦层面AI立法进展缓慢的背景下,纽约州等地方政府开始主动出击,试图为AI的快速发展设立安全护栏。
  • 该法案聚焦于透明度和问责制,要求巨头对其AI系统的安全性和潜在危害负责,这可能会推动整个行业提升AI治理水平。

更多动态

  • 模型与研究:Liquid AI发布2.6B参数模型LFM2-2.6B-Exp,性能碾压百亿级大模型;南京大学推出RunawayEvil攻破视频模型防线;研究发现人类可通过5分钟训练识破AI合成人脸。
  • 编程工具:阿里云通义千问Qwen Code升级至v0.5.0,从命令行工具迈向完整开发生态;智谱推出轻量级AI IDE Zcode;Cursor CEO警告“氛围编程”风险。
  • 硬件与生态:比亚迪全系车型搭载豆包大模型;Waymo车内集成Gemini助手定义AI伦理;曦诺未来完成超亿元融资,发布高自由度灵巧手。
  • 开源项目:Yuxi-Know知识图谱智能体平台、X平台核心推荐算法、Chatterbox TTS系统、LightX2V视频生成框架等开源。
  • 行业数据:“十四五”收官,中国鸿蒙设备破11.9亿台,700+大模型备案;飞猪旅行AI调用量暴涨20倍。

想第一时间获取最新内容?
欢迎加入我们的 Telegram 群组 @ai_news_plus,抢先获取每日更新。
立即加入群组
Telegram 群组二维码