主要内容
本周,Meta 要求美国地方法院驳回一项诉讼,该诉讼称这家科技巨头非法通过比特流(torrent)下载色情内容来训练人工智能。此前,Strike 3 Holdings 发现其一些成人影片在 Meta 公司的 IP 地址上被非法下载,以及其他据称 Meta 利用 2500 个“隐藏 IP 地址”的“隐形网络”隐藏的下载内容。Strike 3 指控 Meta 窃取色情内容秘密训练其未宣布的成人版 AI 模型 Movie Gen,并寻求可能超过 3.5 亿美元的赔偿。Meta 在周一提交的驳回诉讼动议中指责 Strike 3 依赖“猜测和影射”,同时称 Strike 3“被一些人贴上了‘版权巨魔’的标签,提起勒索诉讼”。Meta 要求放弃所有版权主张,称没有证据表明这家科技巨头指导了 Strike 3 拥有的约 2400 部成人影片的任何下载,甚至不知道非法活动。Meta 声称,Strike 3 也没有引用“任何事实表明 Meta 曾在成人图像或视频上训练过 AI 模型,更不用说故意这样做了”。Meta 的发言人告诉 Ars,“这些主张是假的”。值得注意的是,据称的下载跨越了 7 年,从 2018 年开始。这大约在 Meta 的 AI 研究“多模态模型和生成视频”开始的 4 年前,使得下载用于 AI 训练的说法不太可信。Meta 称,更“明显”的缺陷是,Meta 的条款禁止生成成人内容,“与这种材料甚至可能对 Meta 的 AI 训练有用的前提相矛盾”。相反,Meta 称,现有证据“明显表明”,被标记的成人内容是为“私人个人使用”而比特流下载的——因为与 Meta IP 地址和员工相关的少量内容每年仅间歇性地获得一次,每次仅一个文件。Meta 的文件称,从这种微薄、不协调的活动中可以得出更合理的推断,即不同的个人下载成人视频用于个人使用。例如,与书籍作者提起的诉讼不同,他们的作品是用于训练 AI 的庞大数据集中的一部分,据称在 Meta 的公司 IP 地址上的活动每年仅约 22 次下载。Meta 称,这远非“齐心协力收集原告声称有效 AI 训练所需的大规模数据集”。此外,据称的活动甚至无法可靠地与任何 Meta 员工联系起来。Meta 写道,Strike 3“没有识别出据称使用这些 Meta IP 地址的任何个人,没有声称他们受雇于 Meta 或在 Meta 的 AI 训练中发挥任何作用,也没有具体说明据称下载的(哪些)内容用于训练任何特定的 Meta 模型”。与此同时,Meta 称,“数万名员工”以及“无数的承包商、访客和第三方每天都在 Meta 访问互联网”。因此,虽然“过去 7 年中可能有一名或多名 Meta 员工”下载了 Strike 3 的内容,但“同样可能”是“客人、蹭网者、承包商、供应商或维修人员——或这些人的任何组合”对此负责。其他据称的活动包括声称 Meta 的一名承包商被指示在他父亲的家中下载成人内容,但这些下载“也明显表明是个人消费”。Meta 指出,该承包商是一名“自动化工程师”,没有提供明显的依据说明为什么他会被期望在该角色中获取 AI 训练数据。Meta 称,“没有事实合理地将 Meta 与这些下载联系起来”。“当他与 Meta 的合同结束时,据称的比特流下载停止了这一事实,对于据称的比特流下载是否是在 Meta 的知情或指示下进行的没有任何说明”。