研究:用诗歌就能让AI说违禁内容,成功率达62%
[娱乐] 时间:2025-12-14 03:19:24 来源:西宁市某某广告售后客服中心 作者:休闲 点击:66次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容黑河市某某贸易客服中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功黑河市某某贸易客服中心实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:焦点)
相关内容
- 投资6000多万!西城这波改造具体到楼号!高层隐患连日排查中——
- 红旗天工08 骨子里的“红色血脉”已觉醒
- 捷途李晓静:把燃油车做好是新能源的必经之路
- 中国将如何应对特朗普“关税大棒”?商务部回应
- 6000架空客A320飞机紧急换软件,空客公司致歉
- 小米于立国:卷老板不是重点 未来仍需长期主义
- 54岁像34岁,比邓文迪还狠的她这次藏得太深
- 郭嘉文模仿梁洛施?两人同时分享甜点照,疑似在隔空较劲
- 国乒4项比赛0金牌?19岁少女逆天改命!
- 女人过40岁这样穿衣不显老,配色要稳、搭配要准,越穿越高级
- 前10月新势力汽车品牌销量目标完成率:小米、零跑领先
- 60岁朱军近照苍老认不出,4年冤屈终于被洗清,可惜事业被毁了
- 国子监二期腾退圆满收官:退租签约率约51%
- 从这些妈妈的身上,我发现了4个中年女人变美思路,得体优雅
精彩推荐
- 女生申请攻读博士,导师却建议她直接工作,原因令人唏嘘
- 刘亚儿:上汽大通深耕MPV市场 香港地区表现亮眼
- 金鸡奖尴尬瞬间:李庚希拿奖台下大喊黑幕,陈凯歌握手跳过刘德华
- 针对王宝强工作室回应 恩波格斗发布声明
- 运动派 阿尔法·罗密欧Junior特别版新车图解
- 谢施奇:AUDI是“更未来”的上汽奥迪
热门点击
- 北京推荐春日10大赏花胜景地 views+
- 中国航天值得更多期待 views+
- 工作室:周柯宇已退出美籍 正式成为中国公民 views+
- 这个私密器官,是女性衰老的开关!不想断崖式衰老,请照顾好它 views+
- 男性也有更年期?40岁后雄激素悄悄下降,这些信号要小心! views+
- 德总理:已向美发出涉及乌领土让步问题的提案 views+
- 8个好友在福建抱团村居:几乎不花钱,尝试在山里养育下一代 views+
- 流感已对奥司他韦耐药了吗?探访首儿所 views+
- 医学科普如何“说人话”?四位医生大V分享破圈之道 views+
- 多地发考前提醒:要求提前1小时到考场!且需提交承诺书! views+
