您的位置:文章正文

传媒行业点评报告:AGI里程碑:OPENAI发布视频生成模型SORA,多模态有望加速

加入日期:2024-2-21 18:21:05

  中华财富网(www.chinacaifu.cn)2024-2-21 18:21:05讯:

(以下内容从东吴证券《传媒行业点评报告:AGI里程碑:OPENAI发布视频生成模型SORA,多模态有望加速》研报附件原文摘录)
投资要点
事件:2月17日,OPENAI发布首个视频生成模型Sora,可实现文生视频、图生视频、扩展或补充视频等,最高可生成一分钟的高清视频,能生成具有多个角色、包含特定运动的复杂场景,表现出突破性的语义理解能力、复杂场景理解能力和一致性等。
视频生成能力显著突破,向着AGI目标再进一步。相比行业原有视频生成模型gen2、pika等,Sora在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1)模型层面,Sora是一种扩散模型,从一个看起来像静态噪音的视频开始生成视频,通过多个步骤去除噪音,逐渐转换视频。Sora可以一次性生成整个视频,也可以扩展生成的视频。与GPT模型类似,Sora也采用了transformer架构,模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展,算力需求有望增加。2)训练数据层面,Sora将视频和图像表示为更小的数据单元集合patch(类似于GPT中的token),通过统一数据表示方式,可在比以往更广泛的视觉数据上训练模型,包括不同的持续时间、分辨率和宽高比,最终生成的视频在这些维度也具有更高的灵活性。OpenAI未将Sora单纯视作视频模型,而是将其作为“世界模拟器”,在物理世界模拟上已开始出现涌现效应,我们认为其亦有望为AI3D等其他多模态领域提供经验借鉴,多模态大模型有望加速发展。
建议关注Sora带来的多模态应用发展机遇。1)视频生成技术在广告、电商等垂直领域的商用可行性大幅提高,如广告营销领域为客户提供更多的营销工具,电商领域为卖家提供相关的工具服务,已积累对应客户资源的行业玩家有望借此打开变现空间。2)创意落地的成本大幅缩减。SORA最高可生成一分钟的高清视频,基本达到主流短视频平台创作时长的要求,加上文字创作、文生图等技术日趋成熟,制作不同形态内容的门槛和成本大幅降低,一方面优质IP有望降低试错成本,扩大IP变现途径,另一方面视频生成技术成熟后可能会诞生新的AI时代的抖音,国内市场聚焦在AI大模型上持续投入的公司可有更大的拓展空间,海外接入外部大模型能力,发挥工具价值的公司可实现垂类场景的深耕。3)专业内容生产方可降本增效。影视、游戏和MR领域专业创作者可以利用先进AI技术降本增效,如动画电影生产周期缩短,相关内容生产方有望受益。
投资建议:我们推荐在多模态方向已有布局或具备布局能力的标的,包括昆仑万维万兴科技、美图等,建议关注新国都。头部IP变现有望受益于视频生成技术成熟,推荐中文在线,建议关注上海电影等。多模态技术进步利好电商、营销、影视、游戏、教育、MR等领域AI应用发展,推荐焦点科技蓝色光标风语筑盛天网络世纪天鸿华策影视光线传媒等,建议关注丝路视觉、易点天下、因赛集团虹软科技等。算力方向建议把握板块龙头投资机会,推荐中际旭创天孚通信等龙头。建议关注可能受益于AI视频发展的视频技术公司,如当虹科技等。
风险提示:多模态技术发展不及预期,伦理与隐私问题,商业化拓展不及预期,算力基础设施发展不及预期。





编辑: 来源: