AgentCLUE-General是专注于中文通用AI智能体的测评基准。该基准立足中文应用场景,聚焦现实世界中可借助工具解决的实际问题,全面评估智能体在联网检索、数据分析、多模态理解和多场景组合四个核心应用场景的表现,并对任务根据难度进行了三个等级划分。
本次我们测评了国内外8个代表性智能体产品的表现,以下为详细测
© 版权声明
文章版权归作者所有,未经允许请勿转载。
上一篇
没有更多了...
下一篇
没有更多了...
相关文章
没有相关内容!
暂无评论...


