1、Meta更新多模态工具
新的独立AI图像生成器Imagine with Meta,允许用户用自然语言创建图像;以及在群聊中重新创建AI图像的功能。
2、Pika1.0超预期
第一次正式评估,Pika的语义理解、视频连贯性和质量效果都很出色。
3、谷歌发布了多模态模型
Gemini模型可以听、说、看,中文交互,视觉理解环境,支持文本/图像/语音/视频/代码。
AI多模态加速,国内映射
1)产品:#易点世界(KreadoAI)、盛天网络(给麦)、聚焦科技,万兴科技
2)数据:根据Pika创始人和高质量的视频模型,培训数据应具有高像素+高审美/艺术构图+一定长度的视频
#华策、捷成、视觉中国(机构调研纪要关注:兄弟调研)
3)其他:#掌趣科技(AI+UGC)、巨人网络(AI推理游戏)、世纪天鸿,汤姆猫
【建投传媒互联网】