头像

沙雕男友的日常

帅气的我简直无法用语言描述!

LLM评估系列(二):LLM 乱输出难控?五篇顶会论文教你用 LLM 评估器破解五大关键场景

接下来将探讨那些把 LLM 评估器应用于具体场景的论文,例如评估有害输出、摘要质量、问答表现等。 1 评估有害性 论文地址:https://arxiv.org/abs/2212.08073 1.1 构...
头像9小时前
000