海通证券:视频和多模式模型需要通过大量高质量的视频数据进行预
2024-03-22 09:52:03
描述
海通证券:视频和多模式模型需要通过大量高质量的视频数据进行预训练和优化,大量高质量的真实视频数据许可是关键。此外,合成数据有望解决人工智能开发应用中的数据限制,如果在现实世界中难以观察、标记数据获取成本高、数
[本文共字,阅读完需要分钟]

海通证券:视频和多模式模型需要通过大量高质量的视频数据进行预训练和优化,大量高质量的真实视频数据许可是关键。

此外,合成数据有望解决人工智能开发应用中的数据限制,如果在现实世界中难以观察、标记数据获取成本高、数据获取和处理涉及现实世界隐私信息等问题。合成数据是计算机模拟技术生活算法创建和生成的自标记信息,可以反映数学或统计中真实世界数据的属性。因此,它可以作为培训、测试和验证人工智能模型的替代品。Sora文生视频模型采用游戏引擎合成的视频数据作为训练集。

我们重申视频数据元素对视频和多模态模型训练的重要价值,并对相关目标进行逻辑梳理:

1)中广天择:主要从事纪录片、综艺、影视剧等视频内容的制作和运营,创作了《守护解放西》系列等高口碑综艺节目。公司是版权运营的先驱,依托广播电视资源,每年为50多个省、省台湾电视频道和400多个市县电视台提供1万多集电视版权内容,最近公司与万兴天幕大模型签署了战略合作协议,并达成了视频语料方向的战略合作。

2)华策影视:公司影视剧版权超过5万小时,旨在打造中国最大的影视素材运营平台。

3)捷成股份有限公司:主要从事新媒体版权运营,积累影视、动画、节目版权内容5万多小时。公司主要涵盖腾讯、优酷、爱奇艺、华为、咪咕等互联网视频渠道,大屏幕电视 快手和头条新短视频平台的渠道。

4)上海电影:上美电影有600多部动画作品,上美电影制片厂有800多部故事片和800多部电视剧资源。

与此同时,高质量的内容制作公司:光媒体、万达电影、博纳电影