主要内容
Runway在周一的博客中宣布,其最新文本生成视频模型Gen-4.5的视觉效果较上一代更精准,可生成“电影级、高度逼真的输出”,或使AI生成内容更难与真实影像区分。
Gen-4.5实现了前所未有的物理精度和视觉精确性,能更好遵循文本提示,在不降低视频质量的前提下生成细节丰富的场景。其生成的AI物体运动符合真实重量、动量和力,液体流动也具备正确动力学特征。
该模型正逐步向所有用户开放,保持与前代相同的速度和效率。但存在局限性:模型可能出现物体持久性和因果推理问题,如门在未被操作时先打开等因果倒置情况。
除Runway外,OpenAI也在加速提升AI生成视频的逼真度。9月发布的Sora 2文本生成视频模型通过物理升级强化效果,其负责人Bill Peebles称“能在水面上的桨板上准确做后空翻,流体动力学和浮力均得到精确建模”。
Runway表示,Gen-4.5还擅长处理不同视觉风格,可生成一致的照片级真实感、风格化及电影级画面,其生成的照片级真实影像“细节与准确性逼真,几乎与真实素材难以区分”。