将利用欧盟用户数据训练人工智能模型 - AI News
将利用欧盟用户数据训练人工智能模型

将利用欧盟用户数据训练人工智能模型

2025-04-15

新闻要点

Meta 将利用欧盟成年用户共享的公开内容训练 AI 模型 ,本周起用户将收到通知并可提交异议 。该公司称部分数据类型不用于训练 ,还表示此举是为打造适合欧盟用户的 AI 工具 ,但这一做法引发隐私倡导者担忧 。

- Meta 用欧盟成年用户公开数据训练 AI 模型

- 本周起欧盟用户将收到数据使用通知

- Meta 称部分数据不用于 AI 训练

- 此举引发隐私倡导者对数据使用的担忧

主要内容

Meta 已确认计划利用其在欧盟(European Union)的成人用户共享的内容来训练其 AI 模型。该公告是在 Meta AI 功能最近在欧洲推出之后发布的,旨在增强其 AI 系统在该地区多样化人口中的能力和文化相关性。

Meta 在一份声明中写道:“今天,我们宣布计划在 Meta 利用公共内容(如公共帖子和评论)来训练 AI,这些内容是欧盟成年人在我们的产品上共享的。人们与 Meta AI 的互动(如提问和查询)也将用于训练和改进我们的模型。”从本周开始,欧盟内 Meta 的平台(包括 Facebook、Instagram、WhatsApp 和 Messenger)用户将收到通知,解释数据使用情况。这些通知将通过应用内和电子邮件发送,详细说明涉及的公共数据类型,并链接到一个反对表格。Meta 解释说:“我们使这个反对表格易于查找、阅读和使用,我们将尊重我们已经收到的以及新提交的所有反对表格。”

Meta 明确澄清,某些数据类型仍禁止用于 AI 训练目的。该公司表示,不会“使用人们与朋友和家人的私人消息”来训练其生成式 AI 模型。此外,欧盟 18 岁以下用户账户的公共数据将不包括在训练数据集中。

Meta 希望为欧盟用户构建 AI 工具,将此举措视为为欧盟用户创建 AI 工具的必要步骤。上个月,Meta 在其欧洲的消息应用程序中推出了 AI 聊天机器人功能,将此数据使用视为改进服务的下一阶段。“我们认为我们有责任构建不仅对欧洲人可用,而且实际上是为他们构建的 AI,”该公司解释说。“这意味着从方言和俗语,到超本地知识以及不同国家在我们的产品上使用幽默和讽刺的不同方式。”随着 AI 模型随着跨越文本、语音、视频和图像的多模态能力的发展,这一点变得越来越重要。

Meta 还将其在欧盟的行动置于更广泛的行业环境中,指出在用户数据上训练 AI 是常见做法。声明写道:“重要的是要注意,我们正在做的这种 AI 训练不仅对 Meta 是独特的,对欧洲也不是独特的。我们正在遵循包括谷歌和 OpenAI 在内的其他公司的榜样,它们已经使用来自欧洲用户的数据来训练其 AI 模型。”Meta 进一步声称其方法在开放性方面超过了其他方法,“我们为我们的方法比我们的许多行业同行更透明而感到自豪。”

在监管合规方面,Meta 提到了先前与监管机构的接触,包括去年在等待法律要求的澄清时启动的延迟。该公司还引用了 2024 年 12 月欧洲数据保护委员会(EDPB)的有利意见。Meta 写道:“我们欢迎 EDPB 12 月提供的意见,该意见确认我们的原始方法符合我们的法律义务。”

尽管 Meta 在欧盟的做法呈现出透明和合规的特点,但使用社交媒体平台上大量的公共用户数据来训练大型语言模型(LLMs)和生成式 AI 仍在隐私倡导者中引起了重大关注。首先,“公共”数据的定义可能存在争议。在 Facebook 或 Instagram 等平台上公开共享的内容可能并非是在预期它将成为能够生成全新内容或见解的商业 AI 系统的原材料的情况下发布的。用户可能在其感知范围内公开分享个人轶事、意见或创意作品。