主要内容
OpenAI和Anthropic近日推出新措施,加强对未成年人用户的检测与保护。OpenAI更新ChatGPT模型规范,针对13-17岁青少年强化安全保护;Anthropic则开发新系统识别并限制18岁以下用户使用Claude。
OpenAI此次更新的模型规范新增四项青少年保护原则,强调安全优先,引导青少年在高风险对话中寻求线下支持,禁止回应自杀自残相关问题。此前因面临自杀青少年诉讼,已推出家长控制并调整回应机制。目前正研发年龄预测模型,自动对疑似未成年人启用保护措施,误判时允许成年人申诉验证。
Anthropic此前禁止18岁以下用户使用Claude,现正开发新检测系统,通过对话特征识别未成年人。同时优化Claude对自杀自残提示的回应,减少“过度迎合”行为,最新模型(如Haiku 4.5)已将过度迎合行为减少37%,体现对安全与合规的双重重视。