投资要点
摘要
1、OpenAI发布视频生成模型Sora,大大提高了视频生成能力
2024年2月16日,OpenAI发布视频生成模型Sora,可生成各种持续时间(甚至长达1分钟)、视频和图片的宽高比和分辨率。基于Diffusion的Sora模型 Transformer技术,采用视频压缩网络(Video compression network)、潜水空间patch(Spacetime latent patches)、直接在原来的大小训练(Training on data at its native size)以及重新标注技术(Re-captioning technique)技术,可以输入图像和视频,实现制作无缝循环视频、添加静态图片动画、扩展视频时间线、视频编辑、视频拼接等功能;
2、国内外厂商纷纷努力布局多模态大模型领域,预计2024年文生视频将进入商业化探索阶段
除OpenAI外,谷歌、字节跳动等厂商都推出了具有文生视频能力的多模态模型。基于Stable Video Diffusion、谷歌W.A.L.分析T等文生视频模型,我们认为高质量数据和底层通用大模型是文生视频能力的重要决定因素。随着Transformer架构的引入和3D建模领域模型的迭代,2024年,文生视频有望在时间长度、画面清晰度、内容逼真度等方面实现显著迭代,开辟商业应用空间。
3、一些海外文生视频商业化案例预计未来将覆盖全球100亿视频内容生成市场
根据PR Newswire数据预测,2025年全球数字视频市场内容有望达到3271.9亿美元,2021-2025年CAGR超过14%。Synthesia目前在海外、Runway和其他制造商在文生视频领域形成了成熟的商业解决方案,用于企业产品介绍、操作指南、客户服务等场景。以Sora为代表的多模态模型有望显著降低视频等数字内容的创作成本,具有广阔的市场空间。【浙商计算机】
标的
(1)大型制造商:科大讯飞、云从科技、微软、谷歌;
(2)多模态应用厂商:万兴科技、虹软科技、焦点科技Adobe。
风险提示
1、人工智能技术迭代低于预期风险;2、人工智能商业化产品发布不如预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险。
报告全文




























