Anthropic 发布评估新方案,助 Claude 避免被贴上“政治偏见”标签

正文:

近日,Anthropic 公司推出一套新的评估方法,用于检查其聊天机器人 Claude 在政治话题上的回应是否公平、客观。官方表示,Claude 在回答政治相关问题时应避免给出缺乏证据的结论,目的是防止其被视为偏向保守或自由派。

Claude 的输出受系统提示和奖励机制影响,尤其是更偏好被判定为中立的回答。这类中立回复中可能包含对“传统价值观与制度重要性”的强调,显示出公司正在尝试让 Claude 更符合当前美国的政治环境。

Anthropic、克劳德

报告指出,Gemini2.5Pro 在中立性方面得分最高,达到 97%,而 Claude Opus4.1 以 95% 紧随其后。其他模型如 Sonnet4.5、GPT-5、Grok4 和 Llama4 的成绩也不错,但整体仍略低于 Claude。尽管 Anthropic 在博客中未直接提到,这套测试方法的推出很可能与特朗普政府的相关政策有关,该政策要求聊天机器人不要出现“觉醒”(woke)倾向。同时,OpenAI 也在将其 GPT-5 调整到类似方向,以满足美国政府的要求。

此外,Anthropic 已将这套评估方法开源到 GitHub,方便开发者和研究人员直接使用与验证。

划重点:  

🌐 Anthropic 推出评估方案,衡量 Claude 在政治话题上的中立程度。  

🤖 Claude 回避无依据的政治断言,力求不被贴上偏见标签。  

📈 评估工具已开源,促进 AI 开发者间的交流与合作。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享