AI视频生成与研究代理爆发日:迪士尼授权Sora、谷歌开源Deep Research、智谱全栈开源

AI视频生成与研究代理爆发日:迪士尼授权Sora、谷歌开源Deep Research、智谱全栈开源

今日AI领域呈现三大核心趋势:视频生成技术全面开源与商业化落地加速AI研究代理能力开放引发开发者争夺战大模型性能边界持续突破。迪士尼与OpenAI的IP授权合作标志着生成式AI正式进入主流娱乐内容生产,而谷歌与智谱则通过开源策略推动技术普惠。

迪士尼10亿美元投资OpenAI,Sora获米老鼠等200+角色授权

事件时间:2025年12月12日

迪士尼宣布与OpenAI达成三年期战略合作,向其投资10亿美元并获得股权。作为协议核心,OpenAI的Sora视频生成平台将获得迪士尼旗下超200个经典角色(包括米老鼠、漫威英雄、星球大战人物等)的官方IP授权。用户未来可直接在Sora中生成包含这些角色的短视频,部分优质内容还将在Disney+平台播出。值得注意的是,就在宣布合作的同一天上午,迪士尼还向谷歌发出了侵权警告函,指控其AI模型侵犯版权,展现了其“一手维权、一手合作”的双轨策略。

深度解读 & 洞察

这一合作是传统娱乐巨头与生成式AI平台的里程碑式联姻。对迪士尼而言,这不仅是技术投资,更是IP价值在AI时代的新变现路径。通过授权而非完全封闭,迪士尼既能控制内容调性,又能借力Sora的庞大用户群进行低成本内容共创和营销。对OpenAI来说,获得全球最具影响力的IP库授权,极大地提升了Sora的内容吸引力和商业壁垒,为其从技术演示走向大规模应用铺平了道路。此举也预示着未来更多IP持有方将采取类似策略,AI内容生态将迎来一波高质量、合规的IP内容浪潮。

影响

  • 对普通人:未来创作包含米老鼠、钢铁侠等角色的短视频将变得合法且简单,极大丰富个人创作内容。
  • 对创作者/开发者:获得了前所未有的官方素材库,可基于此开发衍生工具、游戏或互动体验。
  • 对投资者:验证了AI+IP的巨大商业潜力,相关领域的投资热度将进一步提升。
  • 对未来生活:我们消费的短视频、广告甚至教育内容中,将出现更多由AI生成的、但形象和风格高度一致的经典角色,模糊虚拟与现实的边界。

谷歌开源Gemini Deep Research Agent,性能对标GPT-5 Pro

事件时间:2025年12月12日

谷歌正式开源其深度研究智能体(Agent)——Gemini Deep Research。该Agent基于Gemini 3 Pro模型,在DeepSearchQA基准测试中取得了46.4%的SOTA(当前最佳)成绩,性能与传闻中的GPT-5 Pro相当,但成本仅为后者的十分之一。其核心能力在于能进行多步搜索、交叉验证信息并自动生成结构化的深度研究报告。更重要的是,谷歌首次开放了其Interactions API,允许开发者将这一高级研究能力集成到自己的应用中。

深度解读 & 洞察

谷歌此举直指AI竞争的核心战场——智能体(Agent)生态。过去的大模型竞争聚焦于单次问答的准确率,而未来的竞争将是谁能构建更强大、可组合、可嵌入的智能体。通过开源API,谷歌旨在吸引广大开发者围绕其Gemini模型构建丰富的应用生态,形成网络效应。这不仅是技术展示,更是一场生态卡位战。其“低成本、高性能”的定位,也意在挑战OpenAI等对手的高端定价策略,为开发者提供更具性价比的选择。

影响

  • 对开发者:获得了强大的研究型AI能力,可以快速为自己的产品(如知识库、客服、教育软件)添加深度信息整合功能,大幅降低开发门槛。
  • 对创业者:催生了新的创业机会,例如基于此API构建垂直领域的研究助手、市场分析工具或学术写作平台。
  • 对普通人:未来使用的各类APP可能会内置这种“研究员”功能,能自动为你整理复杂的新闻事件、产品评测或学习资料。
  • 对行业:加剧了AI平台间的“军备竞赛”,迫使所有玩家加速开放其核心能力,最终受益者将是整个开发者社区和终端用户。

智谱AI开源四项视频生成核心技术,打造全栈式开源方案

事件时间:2025年12月12日

智谱AI在其多模态开源周收官之际,一口气开源了四项关键的视频生成技术:SCAIL(影视级角色动画框架)、RealVideo(实时流式视频生成系统)、Kaleido(多主体生成框架)和SSVAE(频谱结构化变分自编码器)。这套组合拳覆盖了从角色控制、实时生成、多主体协调到模型训练加速等视频生成的核心痛点,旨在为社区提供一套完整的、可商用的开源视频生成解决方案。

深度解读 & 洞察

智谱的策略非常清晰:以开源换生态,以全栈打碎片。当前视频生成领域多为单点技术突破,缺乏系统性整合。智谱通过一次性开源整套工具链,直接降低了开发者从0到1构建视频生成应用的复杂度。RealVideo将首响延迟压缩至2-3秒,解决了实时交互的关键瓶颈;SCAIL则瞄准了高精度角色控制这一专业需求。这种“交钥匙”工程式的开源,不仅能快速聚集开发者,还能确立其在中文乃至全球开源多模态社区的技术领导地位,为其商业化产品(如GLM系列)引流。

影响

  • 对开发者:可以直接使用这套成熟的技术栈,无需从头研发,快速构建自己的视频生成应用或服务。
  • 对创业者:降低了视频生成赛道的创业门槛,使得基于特定场景(如电商、教育、游戏)的视频生成工具创业成为可能。
  • 对行业:推动了视频生成技术的标准化和普及化,有望加速AIGC在视频领域的渗透速度。
  • 对普通人:未来可能会涌现出大量基于这些开源技术的免费或低价视频创作工具,让视频内容创作真正“零门槛”。

更多