SuperCLUE

4小时前发布 0 0 0

CLUE中文语言理解基准测评

所在地:
香港
语言:
zh
收录时间:
2025-09-11
SuperCLUESuperCLUE

AI模型评测

ClueBenchmarks 网站提供全面的中文大模型基准测评、排行榜及相关数据资源,协助用户评估不同模型在各种自然语言处理任务中的表现。

主要功能和内容列表(按重大程度排序)

  1. 小样本学习与零样本学习评测

  2. 大模型基准测评与排行榜

  3. 用户个人中心与API服务

  4. 模型能力分析(基础能力榜单、中文特性榜单、开源榜单)

  5. 数据集和项目资源(DataCLUE榜、KgCLUE、论文、Demo)

  6. 多样化中文任务评测(SuperCLUE、Agent中文场景、阅读理解等)

功能模块 详细内容 重点说明
数据与资源 CLUE社区、ClueAI、关于CLUE、CLUE介绍、联系我们、常见问题、API与Demo、KgCLUE.Demo、KgCLUE.项目、论文、项目地址、数据集搜索、大模型报告 提供完整的学习、研究和使用资源,包括数据集、论文、API接口和演示
任务与榜单 Agent中文场景、Safety安全对抗、OPEN多轮开放式、OPT三大能力客观题、Llama2中文版基准、pCLUE、KgCLUE1.0、分类排行榜1.1/1.0、阅读理解榜1.1/1.0、总排行榜1.1/1.0、DataCLUE榜、语义匹配榜、小样本学习、多、小样本学习、零样本学习、NER排行榜、自然语言推理、小模型榜、NLPCC20小模型 提供各类任务和能力榜单,便于模型能力对比和分析
用户中心 登陆、注册、个人得分情况、数据集管理、个人中心、修改密码、退出 管理用户信息、访问个人测评结果、数据集及账户设置
SuperCLUE SuperCLUE综合评测、总榜单1.1/1.0、基础能力榜单、中文特性榜单、开源榜单 中文大模型综合性能测评基准,涵盖各类NLP任务
报告与文档 《中文大模型基准测评2025年03月报告》、SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark、https://github.com/CLUEbenchmark/SuperCLUE、CLUEbenchmark@163.com 官方报告与文档,便于学术引用与模型理解
首页 任务介绍、最新榜单、排行榜、登陆注册 入口页面,概览网站核心功能与资源
模型列表 GPT-4、文心一言(v2.2.0)、Claude-2、gpt-3.5-turbo、ChatGLM-130B、讯飞星火(v1.5)、Claude-instant-v1、360智脑(4.0)、internlm-chat-7b、ChatGLM2-6B、MiniMax-abab5.5、通义千问(v1.0.3)、Baichuan-13B-Chat、BELLE-LLaMA-13B-2M-enc、IDEA-姜子牙-13B-v1.1、phoenix-7B、MOSS-16B、Llama-2-13B-chat、Vicuna-13B、RWKV-7B-World-CHNtuned 展示可测评的各类中文大模型,便于用户选择与比较

盾灵安全导航CLUE中文语言理解基准测评

数据统计

数据评估

SuperCLUE浏览人数已经达到0,以上数据仅供参考,建议大家以官方数据为准! 更多SuperCLUE数据如:访问速度、搜索引擎收录以及索引量、用户体验、品牌价值观等;请联系SuperCLUE的官方提供。本站数据仅供参考!

关于SuperCLUE特别声明

本站盾灵导航提供的SuperCLUE数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由盾灵导航实际控制,在2025年9月11日 上午4:22收录时,该网页上的内容,都属于合法合规,后期网页的内容如出现违规,请联系本站网站管理员进行举报,我们将进行删除,盾灵导航不承担任何责任。

相关导航

暂无评论

none
暂无评论...