主要内容
Reddit 指责 Anthropic 在未经许可且未付费的情况下,利用 Reddit 用户的数据构建其 Claude AI 模型。任何使用 Reddit 的人,甚至是网络抓取机器人,都同意该网站的用户协议。该协议明确规定:未经书面协议,不得将网站内容用于自己的商业产品。Reddit 称,多年来,Anthropic 的机器人一直在这样做,抓取大量的对话和帖子来训练和改进 Claude。使这起诉讼特别引人关注的是,它针对 Anthropic 的声誉。Anthropic 一直努力将自己打造成道德、可信赖的 AI 公司,行业中的“白马骑士”。然而,诉讼称这些说法只不过是“空洞的营销噱头”。例如,Reddit 指出 2024 年 7 月 Anthropic 声称已停止其机器人抓取 Reddit 的声明。诉讼称这是“虚假的”,称其日志在随后的几个月中捕获了 Anthropic 的机器人试图访问该网站超过 10 万次。但这不仅仅是公司之间的争吵;它直接涉及用户隐私。当你在 Reddit 上删除一篇帖子或一条评论时,你希望它消失。Reddit 与其他大型 AI 公司如谷歌和 OpenAI 有官方许可协议,这些协议包括技术措施,以确保当用户删除内容时,AI 公司也会这样做。根据 Reddit 的诉讼,Anthropic 没有这样的协议,并且拒绝签订。这意味着,如果他们的 AI 是在你后来删除的帖子上训练的,该内容仍可能被纳入 Claude 的知识库, effectively 忽略了你的删除选择。诉讼甚至包括一张截图,其中 Claude 本身承认它无法真正知道其训练所用的 Reddit 数据是否后来被用户删除:那么,Reddit 想要什么?这不仅仅是关于金钱,尽管他们要求赔偿诸如增加的服务器成本和失去的许可费用等费用。他们要求法院发出禁令,迫使 Anthropic 立即停止使用任何 Reddit 数据。此外,Reddit 希望禁止 Anthropic 销售或许可任何使用该数据构建的产品。这意味着他们要求法官有效地将 Claude 从市场上撤下。这起案件迫使一个棘手的问题:在互联网上“公开可用”是否意味着内容可供任何公司获取和获利?Reddit 坚定地回答“否”,其结果可能会从此改变 AI 的开发规则。(照片由 Brett Jordan 拍摄)