Anthropic 发布评估新方案，助 Claude 避免被贴上“政治偏见”标签-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

Anthropic 发布评估新方案，助 Claude 避免被贴上“政治偏见”标签

拥抱AI，AIGC最佳实践者

487

正文：

近日，Anthropic 公司推出一套新的评估方法，用于检查其聊天机器人 Claude 在政治话题上的回应是否公平、客观。官方表示，Claude 在回答政治相关问题时应避免给出缺乏证据的结论，目的是防止其被视为偏向保守或自由派。

Claude 的输出受系统提示和奖励机制影响，尤其是更偏好被判定为中立的回答。这类中立回复中可能包含对“传统价值观与制度重要性”的强调，显示出公司正在尝试让 Claude 更符合当前美国的政治环境。

Anthropic、克劳德

报告指出，Gemini2.5Pro 在中立性方面得分最高，达到 97%，而 Claude Opus4.1 以 95% 紧随其后。其他模型如 Sonnet4.5、GPT-5、Grok4 和 Llama4 的成绩也不错，但整体仍略低于 Claude。尽管 Anthropic 在博客中未直接提到，这套测试方法的推出很可能与特朗普政府的相关政策有关，该政策要求聊天机器人不要出现“觉醒”（woke）倾向。同时，OpenAI 也在将其 GPT-5 调整到类似方向，以满足美国政府的要求。

此外，Anthropic 已将这套评估方法开源到 GitHub，方便开发者和研究人员直接使用与验证。

划重点:

🌐 Anthropic 推出评估方案，衡量 Claude 在政治话题上的中立程度。

🤖 Claude 回避无依据的政治断言，力求不被贴上偏见标签。

📈 评估工具已开源，促进 AI 开发者间的交流与合作。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐