首页
AI资讯
AI百科
AI教程
AI名人
排行榜
今日热点
提交AI工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
AI名人
AI教程
AI百科
AI资讯
排行榜
工具提交
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI模型评测
共 12 篇网址
排序
发布
更新
浏览
点赞
Chatbot Arena
是一个基于人类偏好评估AI聊天机器人性能的开放平台
0
7
0
AI模型评测
# AI模型评测
Helm Lite
斯坦福大学CRFM团队开发的一个轻量级语言模型评估基准
0
5
0
AI模型评测
# AI模型评测
H2O Eval Studio
由H2O.ai开发的一款企业级AI模型评估平台
0
8
0
AI模型评测
# AI模型评测
PubMedQA
一个用于生物医学研究问题回答的数据集
0
8
0
AI模型评测
# AI模型评测
MMBench
由OpenCompass社区开发的多模态基准测试工具
0
8
0
AI模型评测
# AI模型评测
CMMLU
一个专门为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准
0
7
0
AI模型评测
# AI模型评测
AGI-Eval
一个AI大模型评测社区
0
5
0
AI模型评测
# AI模型评测
SuperCLUE
中文通用大模型综合性测评基准
0
8
0
AI模型评测
# AI模型评测
FlagEval
北京智源人工智能研究院推出的大模型评测体系及开放平台
0
7
0
AI模型评测
# AI模型评测
MMLU
一个用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具
0
10
0
AI模型评测
# AI模型评测
Open LLM Leaderboard
一个由Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台
0
12
0
AI模型评测
# AI模型评测
C-Eval
一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件
0
7
0
AI模型评测
# AI模型评测
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍