自从 OpenAI 展示 Sora 以来并没有多久,Sora 凭借其根据文本提示制作(某种程度上)逼真的视频剪辑的能力给很多人留下了深刻的印象,也让很多人感到害怕。在过去的几个月里,人工智能图像生成已经得到了很大的改进,所以正如你所料,下一个自然步骤是视频。谷歌还推出了自己的视频生成方法,在 Imagen 2 的保护下推出新的人工智能模型,也有望实现大目标。
谷歌推出了 Imagen 2,这是其 Vertex AI 平台中的一系列模型。谷歌因其Gemini 中的图像生成模型有点像垃圾箱火灾而受到批评。它被删除了,虽然 Gemini 没有包含 Imagen 2(至少不是立即包含),但它确实进行了一系列改进,使其能够更好地生成图像甚至视频。
Imagen 2 的增强功能包括修复和修复功能,允许进行图像操作,例如删除不需要的元素或添加新组件。然而,最重要的更新是引入了“文本到实时图像”,可以根据文本输入创建短视频。
与现有的视频生成工具相比,Imagen 2 的功能在分辨率和自定义选项方面可能有所不足。我们必须看看它在现实生活中的使用效果如何。这也有点技术性,但这会生成“实时图像”,即 4 秒的短片。然而,这仍然是一个开始,这可以作为未来几个月或几年内实际文本到视频模型的基础。
为了解决有关深度伪造的问题,谷歌采用了 SynthID 技术,将加密水印应用于实时图像,以确保真实性和安全性。尽管谷歌强调安全措施,但其方法的有效性和培训数据源的透明度仍然存在疑问。一方面,对于那些作品可能包含在培训数据中的创作者来说,缺乏选择退出机制可能会让一些人感到惊讶。此外,谷歌的生成式人工智能赔偿政策不涵盖文本到实时图像,使客户容易受到潜在版权索赔的影响。
暂无评论