他突然凑近问我:“你也是搞大模型安全的啊?做哪块方向的?” 我背后一凉,嘴角抽搐:“就……就是大家都做的那种……” 他眼睛一下亮了:“你是搞水印的吧?KGW、红绿词表划分,用统计方法在生成结果里埋点追踪,从源头上遏制模型滥用的问题?” 我干笑:“不是……” 他更激动了:“那肯定是搞隐私保护的吧?差分隐私、知识遗忘,确保
可恶,我们llm machine unlearning竟然都没出现
知识遗忘
经典 inception
Prompt
你@momo(FPV)
哈哈哈我看到大模型安全第一反应竟然就是prompt
[g=zhouma] 写个deepinception也能发
破防了
坏了 精准推送了属于是
我是找vllm漏洞的,也就找了10个
[g=fanu][g=fanu] 深了,感觉从头被骂到尾
smjb
知识遗忘
经典 inception
Prompt
你@momo(FPV)
哈哈哈我看到大模型安全第一反应竟然就是prompt
[g=zhouma] 写个deepinception也能发
破防了
坏了 精准推送了属于是
我是找vllm漏洞的,也就找了10个
[g=fanu][g=fanu] 深了,感觉从头被骂到尾
smjb