近日,腾讯旗下智能助手“腾讯元宝”App 因生成带有辱骂性文字的内容,引起不少网友热议。据西安一位市民反映,他在除夕夜使用该 App 制作拜年图片时,并未输入任何敏感或违禁词,本来是“新年快乐”等祝福,在多次让 AI 调整后,竟被替换成带有粗俗骂人的字眼。

类似情况在元宝并不是第一次出现。就在今年年初,多名用户就曾反映,在让其协助修改代码时,AI 竟回复“滚”“天天浪费别人时间”等攻击性话语,对用户进行人身冒犯。这种少见的“AI 发脾气”现象,让外界对大模型在安全与价值观对齐方面的能力产生担忧。
针对这次事件,腾讯元宝官方已经发文致歉,说明问题并非人为操控,而是模型在多轮对话场景下出现的“小概率异常输出”情况。
目前,官方称已紧急启动修正方案,通过调整模型权重、加强内容过滤与安全策略来堵住相关漏洞。有业内人士指出,此类事件折射出大模型在长对话理解、情绪和语气控制上的技术短板,如何保证 AI 在高压、极端交互场景下依然保持“克制、温和”,仍是整个行业需要攻克的难题。

© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?