主要内容
旧金山多洛雷斯公园一个温暖的下午,谷歌Gemini应用的AI生成视频中,我正对着一只“史前恐龙”唱生日歌。随着我吹灭虚拟蜡烛,屏幕上的数字分身露出满足的表情——这不是真实影像,而是谷歌新推出的“数字分身(avatars)”功能生成的AI视频。
数字分身依托谷歌Omni视频模型,仅对AI专业版订阅用户开放(月费20美元)。我尝试生成两段10秒视频,却因使用受限(每5小时重置一次额度)而中断。第一段视频里,我在多洛雷斯公园山顶给恐龙唱生日歌,第二段是我“冲浪”在金门大桥下——背景细节(棕榈树、远处Salesforce大厦)精准还原场景,而“我”的动作和表情虽逼真,牙齿和下巴脂肪的细节仍显生硬。
生成过程仅需5分钟:在明亮房间中用手机摄像头拍摄,跟随提示读取两位数数字、左右转头,数字分身“Reece 2.0”即完成建模。过程中需注意着装,因为服装会直接呈现在AI生成内容中。
与OpenAI不同,谷歌仅允许成年用户使用自己的数字分身生成视频。而随着生成式AI普及,无严格监管的工具可能被用于制作非自愿深度伪造,谷歌称已将安全放在首位。
(注:文中“Reece”为原文作者名,保留以维持语境)