主要内容
Lightricks 凭借其最新的人工智能模型,为快速视频创作和迭代增加了筹码。该公司称其新发布的 LTX - 2 基础模型生成新内容的速度比播放速度更快,并且在分辨率和质量方面提高了标准。开源的 LTX - 2 只需 5 秒就能生成一个风格化的高清 6 秒视频,且质量不打折扣,使创作者能够比以前更快地制作出专业内容。这是一项令人印象深刻的成就,但这并非 LTX - 2 与其他模型的唯一区别。它将原生音频和视频合成与开源透明度相结合,并且如果用户愿意多等待几秒钟,就可以将输出提升至 4K 分辨率,每秒高达 48 帧,该公司表示。更棒的是,创作者可以在消费级 GPU 上运行该软件,大大降低了计算成本。
扩散模型已成熟
LTX - 2 是一种扩散模型,通过逐步向生成的内容中添加“噪声”,然后减少该噪声,直到输出类似于模型训练的视频资产。借助 LTX - 2,Lightricks 加速了扩散过程,因此创作者可以通过几乎即时输出实时预览来迭代他们的想法。该模型还能够同时生成伴随音频——无论是配乐、对话还是环境音效——大大加速了创作工作流程。这是一个重要的进展,因为以前,创作者必须分别从视频中创建任何音频,然后花费时间将其拼接在一起并确保完美同步。谷歌的 Veo 模型因其强大的同步声音生成集成而受到赞誉,因此 LTX 中的这些新功能有助于强化 Lightricks 的技术与前沿技术相当的观点。
在访问选项方面,Lightricks 仍为创作者提供了 LTX - 2 的大量灵活性。该公司的旗舰 LTX Studio 平台面向专业人士,在某些情况下,他们愿意牺牲一些速度以创建最高质量的视频。随着处理速度的相应降低,他们将能够以每秒高达 48 帧的原生 4K 分辨率输出视频,达到电影制作所期望的相同标准,Lightricks 称。该平台提供了广泛的创意控制,影响模型的可定制参数。关于这些的更多细节将很快公布,但应包括姿势和深度控制、视频到视频生成以及渲染替代方案——请留意今年秋天的发布日期。
Lightricks 联合创始人兼首席执行官 Zeev Farbman 认为,LTX - 2 的增强功能说明了扩散模型最终成熟的程度。他在一份声明中表示,LTX - 2 是:“我们构建的最完整、最全面的创意 AI 引擎,结合了同步音频和视频、4K 保真度、灵活的工作流程和彻底的效率。”“这不是空头支票或研究演示,”他说。“这是视频生成的真正突破。”
一个重要里程碑
凭借 LTX - 2,Lightricks 证明了它处于 AI 视频生成的前沿,该平台是在之前的 LTXV 模型中的一些行业首创之后推出的。7 月,该公司的 LTXV 模型家族,包括 LTXV - 2B 和 LTXV - 13B,成为第一个支持长格式视频生成的模型,此前进行了一次更新,将输出扩展至长达 60 秒。有了这个,AI 视频制作变得“真正有方向性”,用户可以从初始提示开始,并在视频实时流传输时实时添加更多提示。在那一分钟的更新之前,LTXV - 13B 就已经以是周围最强大的视频创建模型之一而闻名。5 月推出时,它是行业中第一个支持多尺度渲染的平台,这使得