主要内容
谷歌欲让 AI 视频创作更简便,为此推出新工具。名为 Flow,谷歌在发布新的 Veo 3 视频生成模型、Veo 2 模型的更多控制功能以及新的图像生成模型 Imagen 4 时一并宣布。
借助 Flow,可使用文本转视频提示和素材转视频提示(本质上是分享几张图片,Flow 可结合提示使用这些图片,以帮助模型了解需求)来生成 8 秒的 AI 视频片段。然后,利用 Flow 的场景构建工具将多个片段拼接在一起。Flow 有点像电影编辑应用,但用于构建 AI 生成视频。虽我不是电影制作人,但基于所见演示,能看出它或许是个有用的工具。
在一次简报中,谷歌实验室产品经理托马斯·伊里奇向我展示了 Flow 的一些实例。在一个演示中,我们观看了一个动画风格的视频,“摄像机”拉远显示视频在电视上播放,视频再次拉远展示电视所在的房间,接着“摄像机”缓缓飞过窗户,看着一辆卡车驶过。尽管我只是在一个小小的 Google Meet 窗口中短暂观看了视频,无法谈及仔细观察时可能出现的任何 AI 异常,但 Flow 的理念并非创建长视频,而是帮助电影制作人快速将想法“呈现在纸上”,伊里奇称。
在 I/O 大会上宣布的新模型方面,谷歌 DeepMind 的创意主管马蒂厄·洛兰告诉 The Verge,Veo 3 将具有更高质量,更易提示,可同时生成视频和声音(包括对话),且更擅长理解较长提示并正确处理提示中的连续事件。Veo 2 将提供诸如相机控制和物体移除等工具。谷歌的新图像生成模型 Imagen 4 质量有所提升,可以更多格式导出,且显然更擅长写出真实文本,而非这些图像中常出现的 AI 乱码。
Flow 今日在美国面向订阅谷歌新的 Google AI Pro 和 Google AI Ultra 计划的用户推出。一篇博客文章称:“Google AI Pro 提供关键的 Flow 功能和每月 100 次生成,Google AI Ultra 提供最高使用限制和原生音频生成的 Veo 3 早期访问权限。”