AgentCLUE-General是专注于中文通用AI智能体的测评基准。该基准立足中文应用场景,聚焦现实世界中可借助工具解决的实际问题,全面评估智能体在联网检索、数据分析、多模态理解和多场景组合四个核心应用场景的表现,并对任务根据难度进行了三个等级划分。 本次我们测评了国内外8个代表性智能体产品的表现,以下为详细测