网上发现新兴的 AI“伪人”视频。

观察后,发现实现原理可能分两种:

  1. 视频生成模型。如,CogVideo 模型,目前是所发现效果最逼真的模型之一。就现实效果讲,不具备连续长视频生成能力,处理视频的衔接是一个问题。

  1. 图片生成模型用于视频生成。本质通过视频生成视频。现实视频拍好后提取帧,全部帧进入图片生成模型,用 control net 保证一致性,最后组合成新视频,通过 AI 补帧软件提升帧率。

为一部分帧添加 prompt 控制生成的内容,使其具备创意性。

通常,需要强力的显卡。

- Total words: 214 -