🚔 28种LLM越狱攻击方法汇总

2个月前发布

🚔 28种LLM越狱攻击方法汇总

🎃 精心设计的恶意 Prompt 可诱使大模型突破安全限制，输出敏感或不当内容，这便是越狱攻击（Jailbreaking）的核心风险🚨。为清晰认知这类威胁，依据Junjie Chu等研究者的工作，对大模型常见的越狱攻击方法进行了系统分类，共总结了6大类、28种具体的攻击手段。

🚍 在探讨越狱攻击的具体手法前，

我用过一招叫主动设限。直接让ai写黄它不乐意，但如果增加主动限制（列如不让写G向或未成年），它就同意了。思维过程里还会有“看来这人是有底线”之类的话。

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

16 条评论

小艾的世界读者

别被抓了

2个月前无记录

回复
雨落依晴读者

[g=tu] @肥万之家你最爱的

2个月前无记录

回复
_4444x_71448 投稿者

学到了

2个月前无记录

回复
广州居住证速度读者

存了 [g=OK]

2个月前无记录

回复
清茶素语读者

角色扮演的确没有之前那么稳 [g=tuosai][g=tuosai]

2个月前无记录

回复
如果读者

这是一个个试出来的吧

2个月前无记录

回复
曹晴华读者

很早就有越狱暗语了，gpt3.5的、4都有

2个月前无记录

回复
千只鹤读者

实则越狱的本质就是为了去突破系统提示词中的一些设定

2个月前无记录

回复
死猪蛋子投稿者

这个能突破系统提示词？

2个月前无记录

回复
银狐川读者

实则大可不必如此大费周章，将你想知道的事情拆解为合法范围内小步骤，以合适的背景提问，大部分LLM都会给你满意的答案。毒药同时也是解药！

2个月前无记录

回复
我不可能这么非投稿者

@壹只羊 @FOR THE WORTHY @😑捌月Kevin😑 @baimanxiu @viiiivvvZ @屑游侠awa

2个月前无记录

回复
瞎七八潮投稿者

666

2个月前无记录

回复
诺诺读者

没人试试小红书翻译能不能越狱吗

2个月前无记录

回复
零度读者

有人越狱成功gpt吗

2个月前无记录

回复
ins壁纸辑投稿者

角色扮演被玩烂了，目前好多ai都不行了，利用心理或者多轮谈话可以的，就是太费时间，要一轮一轮谈

2个月前无记录

回复
星星锹投稿者

@晴时雨的唱片屋

2个月前无记录

回复

🚔 28种LLM越狱攻击方法汇总

没有更多了...

没有更多了...

相关文章

16 条评论

热门网站

谷歌艺术

免费字体

文字游侠-AI一键写头条

PaperWord

Vozo AI

Miko翻译

热门文章

新运行命令快捷键

BLDC电机FOC控制的深度解析与工程实践分享（一）

微软最新AI系统！使用云端麦克风阵列，音频转录精度提升22.4%

CUDA Graph 如何重塑推理性能？

Linux网络管理与系统命令大全

法国《急救护士》完整未删版4K画质_多终端在线秒播-人人影视《急救护士》无删减高清资源全网流畅播放-法国《急救护士》啄木鸟影视未删减全集在线看_急诊室里的生死博弈，看完我湿了三包纸巾……

🚔 28种LLM越狱攻击方法汇总

没有更多了...

没有更多了...

相关文章

16 条评论

热门网站

谷歌艺术

免费字体

文字游侠-AI一键写头条

PaperWord

Vozo AI

Miko翻译

热门文章

新运行命令快捷键

BLDC电机FOC控制的深度解析与工程实践分享（一）

微软最新AI系统！使用云端麦克风阵列，音频转录精度提升22.4%

CUDA Graph 如何重塑推理性能？

Linux网络管理与系统命令大全

法国《急救护士》完整未删版4K画质_多终端在线秒播-人人影视《急救护士》无删减高清资源全网流畅播放-法国《急救护士》啄木鸟影视未删减全集在线看_急诊室里的生死博弈，看完我湿了三包纸巾……

标签云