谷歌新的 Imagen 2 模型可以生成视频

zhang • 2024年4月12日 • 发表评论

自从 OpenAI 展示 Sora 以来并没有多久，Sora 凭借其根据文本提示制作（某种程度上）逼真的视频剪辑的能力给很多人留下了深刻的印象，也让很多人感到害怕。在过去的几个月里，人工智能图像生成已经得到了很大的改进，所以正如你所料，下一个自然步骤是视频。谷歌还推出了自己的视频生成方法，在 Imagen 2 的保护下推出新的人工智能模型，也有望实现大目标。

谷歌推出了 Imagen 2，这是其 Vertex AI 平台中的一系列模型。谷歌因其Gemini 中的图像生成模型有点像垃圾箱火灾而受到批评。它被删除了，虽然 Gemini 没有包含 Imagen 2（至少不是立即包含），但它确实进行了一系列改进，使其能够更好地生成图像甚至视频。

Imagen 2 的增强功能包括修复和修复功能，允许进行图像操作，例如删除不需要的元素或添加新组件。然而，最重要的更新是引入了“文本到实时图像”，可以根据文本输入创建短视频。

与现有的视频生成工具相比，Imagen 2 的功能在分辨率和自定义选项方面可能有所不足。我们必须看看它在现实生活中的使用效果如何。这也有点技术性，但这会生成“实时图像”，即 4 秒的短片。然而，这仍然是一个开始，这可以作为未来几个月或几年内实际文本到视频模型的基础。

为了解决有关深度伪造的问题，谷歌采用了 SynthID 技术，将加密水印应用于实时图像，以确保真实性和安全性。尽管谷歌强调安全措施，但其方法的有效性和培训数据源的透明度仍然存在疑问。一方面，对于那些作品可能包含在培训数据中的创作者来说，缺乏选择退出机制可能会让一些人感到惊讶。此外，谷歌的生成式人工智能赔偿政策不涵盖文本到实时图像，使客户容易受到潜在版权索赔的影响。

暂无评论

发表回复取消回复