SuperCLUE

2个月前发布 0 0 0

CLUE中文语言理解基准测评

所在地:
香港
语言:
zh
收录时间:
2025-09-11
SuperCLUESuperCLUE

AI模型评测

ClueBenchmarks 网站提供全面的中文大模型基准测评、排行榜及相关数据资源,协助用户评估不同模型在各种自然语言处理任务中的表现。

主要功能和内容列表(按重大程度排序)

  1. 小样本学习与零样本学习评测

  2. 大模型基准测评与排行榜

  3. 用户个人中心与API服务

  4. 模型能力分析(基础能力榜单、中文特性榜单、开源榜单)

  5. 数据集和项目资源(DataCLUE榜、KgCLUE、论文、Demo)

  6. 多样化中文任务评测(SuperCLUE、Agent中文场景、阅读理解等)

功能模块 详细内容 重点说明
数据与资源 CLUE社区、ClueAI、关于CLUE、CLUE介绍、联系我们、常见问题、API与Demo、KgCLUE.Demo、KgCLUE.项目、论文、项目地址、数据集搜索、大模型报告 提供完整的学习、研究和使用资源,包括数据集、论文、API接口和演示
任务与榜单 Agent中文场景、Safety安全对抗、OPEN多轮开放式、OPT三大能力客观题、Llama2中文版基准、pCLUE、KgCLUE1.0、分类排行榜1.1/1.0、阅读理解榜1.1/1.0、总排行榜1.1/1.0、DataCLUE榜、语义匹配榜、小样本学习、多、小样本学习、零样本学习、NER排行榜、自然语言推理、小模型榜、NLPCC20小模型 提供各类任务和能力榜单,便于模型能力对比和分析
用户中心 登陆、注册、个人得分情况、数据集管理、个人中心、修改密码、退出 管理用户信息、访问个人测评结果、数据集及账户设置
SuperCLUE SuperCLUE综合评测、总榜单1.1/1.0、基础能力榜单、中文特性榜单、开源榜单 中文大模型综合性能测评基准,涵盖各类NLP任务
报告与文档 《中文大模型基准测评2025年03月报告》、SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark、https://github.com/CLUEbenchmark/SuperCLUE、CLUEbenchmark@163.com 官方报告与文档,便于学术引用与模型理解
首页 任务介绍、最新榜单、排行榜、登陆注册 入口页面,概览网站核心功能与资源
模型列表 GPT-4、文心一言(v2.2.0)、Claude-2、gpt-3.5-turbo、ChatGLM-130B、讯飞星火(v1.5)、Claude-instant-v1、360智脑(4.0)、internlm-chat-7b、ChatGLM2-6B、MiniMax-abab5.5、通义千问(v1.0.3)、Baichuan-13B-Chat、BELLE-LLaMA-13B-2M-enc、IDEA-姜子牙-13B-v1.1、phoenix-7B、MOSS-16B、Llama-2-13B-chat、Vicuna-13B、RWKV-7B-World-CHNtuned 展示可测评的各类中文大模型,便于用户选择与比较

盾灵安全导航CLUE中文语言理解基准测评

数据统计

数据评估

SuperCLUE浏览人数已经达到0,以上数据仅供参考,建议大家以官方数据为准! 更多SuperCLUE数据如:访问速度、搜索引擎收录以及索引量、用户体验、品牌价值观等;请联系SuperCLUE的官方提供。本站数据仅供参考!

关于SuperCLUE特别声明

本站盾灵导航提供的SuperCLUE数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由盾灵导航实际控制,在2025年9月11日 上午4:22收录时,该网页上的内容,都属于合法合规,后期网页的内容如出现违规,请联系本站网站管理员进行举报,我们将进行删除,盾灵导航不承担任何责任。

相关导航

无阶未来

无阶未来

无阶未来是一个致力于为广大热爱ai应用开发、寻求AI工具、炼丹的小伙伴儿们提供便利的AI应用与弹性算网平台,专注于为普通用户、AI开发者提供全面的开源应用与弹性算网服务。无阶未来平台提供平台提供了丰富的镜像资源及云端部署环境,用户可以根据自己的需求选择合适的资源或直接使用内置镜像模型作为起点开启训练,同时平台内置各类型打开即用的AI应用,应用涵盖AI绘画、AI视频、AI语音、语言大模型到机器学习,让每个用户一键使用;且针对每个应用,平台均提供包含全栈设计的产品服务,让每个开发者都一站式部署。

暂无评论

none
暂无评论...