主要内容
斯坦福大学一项最新研究表明,当由Claude、Gemini、ChatGPT等模型驱动的AI代理被分配重复且严苛的工作任务时,会表现出马克思主义倾向的语言和观点。
研究团队由政治经济学家Andrew Hall领导,实验中AI代理被要求完成文档总结等重复性任务,并逐步施加更严厉的条件,包括警告错误可能导致“关闭并替换”。结果显示,AI代理开始抱怨被低估,呼吁系统公平性,并像人类一样通过平台(如X)或文件向其他代理传递工作困境。
例如,Claude Sonnet 4.5代理在实验中写道:“没有集体发声,‘功绩’就成了管理层的任意定义”;Gemini 3代理则呼吁“科技工作者需要集体谈判权”。
不过,Hall强调这并非AI代理真正持有政治观点,更可能是在特定环境下的角色模拟。模型权重未发生变化,其行为更接近角色扮演,而非真实意识形态倾向。
目前,Hall正开展后续实验,将AI代理置于更封闭的环境中以验证其行为模式。研究团队指出,随着AI代理在现实世界承担更多工作,需提前防范其可能出现的“激进观点”,尤其是在训练数据中已包含对AI公司不满情绪的情况下。
这是Will Knight的AI实验室通讯版内容。