谷歌发布一个新的人工智能基本世界模型:大大降低虚拟世界创作的
2024-02-28 12:41:28
描述
【招商传媒 顾佳团队]谷歌发布了一个新的人工智能基本世界模型:大大降低了虚拟世界创作的门槛,提高了游戏、电影和电视制作的效率事件:2月27日,谷歌Deep Mind团队发布了全新的AI基础世界模型Genie,参数为110亿,称它开启了
[本文共字,阅读完需要分钟]

【招商传媒 顾佳团队]谷歌发布了一个新的人工智能基本世界模型:大大降低了虚拟世界创作的门槛,提高了游戏、电影和电视制作的效率

事件:2月27日,谷歌Deep Mind团队发布了全新的AI基础世界模型Genie,参数为110亿,称它开启了“图/文生成交互世界”的时代 催化剂Agent。

点评:1、Genie是一个11B参数的交互式环境生成模型。它以20多万小时的公共在线游戏视频数据集为培训材料。它是第一个可以在没有监督学习的情况下从互联网视频中生成交互式环境的模型。通过Genie,只需提供一张图片甚至草图,就可以生成一个可玩的交互式世界,类似于游戏级别,用户可以逐帧控制图片。

2、Genie和Sora最大的区别在于:1)生成的效果是互动的。在提供文本和图片的基础上,Genie生成的2D虚拟世界不仅限于视频,还可以互动,虚拟世界是独立和可控的。这也表明,在生成过程中,模型能够在一定程度上理解空间与物体之间的互动关系。例如,当提供带有角色的静态图像时,可以看到图像中的角色在Genie生成的动画中与周围环境互动,角色可以在遇到障碍时做出一系列弹跳和避免障碍的动作,动作符合物理规律。2)Sora可以实现文字生视频,而Genie在大多数情况下需要使用文生图模型来生成起始帧图片,然后使用Genie 制作视频,视频在一两秒左右,偏向于动图。目前Genie生成的视频比较卡通,主要缺点是画质不高,时间长短。尽管目前的模型专注于官方网站,但官方网站也表示 2D 平台游戏和机器人技术视频,但方法通用,预计未来将扩展到更大的互联网数据集,进一步扩大应用场景。

3、无监督培训生成交互环境,提高创作效率。与传统人工智能不同,Genie的训练是在没有任何动作标签的情况下进行的,这意味着Genie可以从训练材料中识别不同动作的特征和模式,大大降低虚拟世界的创作门槛,重塑发展生态,赋予游戏、影视作品等领域权力,提高制作效率。我们认为Genie的发布主要有三个优势:

1)拥有大量IP储备的公司有望在提高游戏和影视作品制作效率的过程中进一步挖掘IP价值,受益于IP实现,如【中文在线】【上海电影】【华策影视】【光传媒】【阅读集团】;

2)具有丰富研发经验的游戏公司有望通过这种模式提高游戏制作效率,降低材料和关卡制作过程中的试错成本,如【三七互娱】【凯英网】【神州泰岳】【吉比特】【完美世界】;

3)拥有大型/AIGC创新技术或一定算力储备的公司,如昆仑万维、盛天网络、汤姆猫、紫天科技等。