头像

花叔

帅气的我简直无法用语言描述!

ICLR25|大模型“安全层”及其防御之道

大型语言模型(LLM)在文本生成方面展现出惊人的能力,但如何确保其输出安全、不产生有害内容,一直是研究的重点。近期一项发表在ICLR 2025的论文《Aligned Large Language Mo...
头像21小时前
200