开源人工智能视频提供4K画质、音效及更快渲染速度 - AI News
开源人工智能视频提供4K画质、音效及更快渲染速度

开源人工智能视频提供4K画质、音效及更快渲染速度

2025-10-24

新闻要点

Lightricks推出开源AI视频模型LTX - 2,在多方面实现突破。该模型生成速度快,可在5秒生成6秒高清视频,还能合成音频,支持4K分辨率。其加速扩散过程,降低计算成本。此技术推动AI视频发展,彰显公司在该领域的前沿地位。

- LTX - 2 5秒生成6秒高清视频且支持4K

- LTX - 2同步合成音频加速创作流程

- LTX - 2可在消费级GPU运行降低成本

主要内容

Lightricks 凭借其最新的人工智能模型,为快速视频创作和迭代增加了筹码。该公司称其新发布的 LTX - 2 基础模型生成新内容的速度比播放速度更快,并且在分辨率和质量方面提高了标准。开源的 LTX - 2 只需 5 秒就能生成一个风格化的高清 6 秒视频,且质量不打折扣,使创作者能够比以前更快地制作出专业内容。这是一项令人印象深刻的成就,但这并非 LTX - 2 与其他模型的唯一区别。它将原生音频和视频合成与开源透明度相结合,并且如果用户愿意多等待几秒钟,就可以将输出提升至 4K 分辨率,每秒高达 48 帧,该公司表示。更棒的是,创作者可以在消费级 GPU 上运行该软件,大大降低了计算成本。

扩散模型已成熟
LTX - 2 是一种扩散模型,通过逐步向生成的内容中添加“噪声”,然后减少该噪声,直到输出类似于模型训练的视频资产。借助 LTX - 2,Lightricks 加速了扩散过程,因此创作者可以通过几乎即时输出实时预览来迭代他们的想法。该模型还能够同时生成伴随音频——无论是配乐、对话还是环境音效——大大加速了创作工作流程。这是一个重要的进展,因为以前,创作者必须分别从视频中创建任何音频,然后花费时间将其拼接在一起并确保完美同步。谷歌的 Veo 模型因其强大的同步声音生成集成而受到赞誉,因此 LTX 中的这些新功能有助于强化 Lightricks 的技术与前沿技术相当的观点。

在访问选项方面,Lightricks 仍为创作者提供了 LTX - 2 的大量灵活性。该公司的旗舰 LTX Studio 平台面向专业人士,在某些情况下,他们愿意牺牲一些速度以创建最高质量的视频。随着处理速度的相应降低,他们将能够以每秒高达 48 帧的原生 4K 分辨率输出视频,达到电影制作所期望的相同标准,Lightricks 称。该平台提供了广泛的创意控制,影响模型的可定制参数。关于这些的更多细节将很快公布,但应包括姿势和深度控制、视频到视频生成以及渲染替代方案——请留意今年秋天的发布日期。

Lightricks 联合创始人兼首席执行官 Zeev Farbman 认为,LTX - 2 的增强功能说明了扩散模型最终成熟的程度。他在一份声明中表示,LTX - 2 是:“我们构建的最完整、最全面的创意 AI 引擎,结合了同步音频和视频、4K 保真度、灵活的工作流程和彻底的效率。”“这不是空头支票或研究演示,”他说。“这是视频生成的真正突破。”

一个重要里程碑
凭借 LTX - 2,Lightricks 证明了它处于 AI 视频生成的前沿,该平台是在之前的 LTXV 模型中的一些行业首创之后推出的。7 月,该公司的 LTXV 模型家族,包括 LTXV - 2B 和 LTXV - 13B,成为第一个支持长格式视频生成的模型,此前进行了一次更新,将输出扩展至长达 60 秒。有了这个,AI 视频制作变得“真正有方向性”,用户可以从初始提示开始,并在视频实时流传输时实时添加更多提示。在那一分钟的更新之前,LTXV - 13B 就已经以是周围最强大的视频创建模型之一而闻名。5 月推出时,它是行业中第一个支持多尺度渲染的平台,这使得