AI工具集
  • 首页
  • AI资讯
  • AI百科
  • AI教程
  • AI名人
  • 排行榜
  • 今日热点
  • 提交AI工具
      • 未登录
        登录后即可体验更多功能
    • 首页
    • AI名人
    • AI教程
    • AI百科
    • AI资讯
    • 排行榜
    • 工具提交
    未登录
    登录后即可体验更多功能

    AI模型评测

    共 12 篇网址
    AI写作工具AI图像工具AI视频工具AI办公工具AI对话工具AI语言翻译AI提示指令AI内容检测AI设计工具AI音频工具AI学习网站AI开发平台AI搜索引擎AI模型评测AI法律助手AI编程工具AI训练模型常用AI工具
    排序
    发布更新浏览点赞
    Chatbot Arena

    Chatbot Arena

    是一个基于人类偏好评估AI聊天机器人性能的开放平台
    060
    AI模型评测# AI模型评测
    Helm Lite

    Helm Lite

    斯坦福大学CRFM团队开发的一个轻量级语言模型评估基准
    050
    AI模型评测# AI模型评测
    H2O Eval Studio

    H2O Eval Studio

    由H2O.ai开发的一款企业级AI模型评估平台
    070
    AI模型评测# AI模型评测
    PubMedQA

    PubMedQA

    一个用于生物医学研究问题回答的数据集
    080
    AI模型评测# AI模型评测
    MMBench

    MMBench

    由OpenCompass社区开发的多模态基准测试工具
    080
    AI模型评测# AI模型评测
    CMMLU

    CMMLU

    一个专门为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准
    070
    AI模型评测# AI模型评测
    AGI-Eval

    AGI-Eval

    一个AI大模型评测社区
    050
    AI模型评测# AI模型评测
    SuperCLUE

    SuperCLUE

    中文通用大模型综合性测评基准
    080
    AI模型评测# AI模型评测
    FlagEval

    FlagEval

    北京智源人工智能研究院推出的大模型评测体系及开放平台
    070
    AI模型评测# AI模型评测
    MMLU

    MMLU

    一个用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具
    080
    AI模型评测# AI模型评测
    Open LLM Leaderboard

    Open LLM Leaderboard

    一个由Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台
    090
    AI模型评测# AI模型评测
    C-Eval

    C-Eval

    一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件
    070
    AI模型评测# AI模型评测
    没有了
    AI工具集
    AI工具集(aitools.cc)专注聚合全球优质AI人工智能工具导航站,涵盖AI写作、文本生成、图片生成、视频处理、代码开发、语音识别等10+领域精选AI应用推荐,每日更新AI工具评测与使用攻略。立即探索1000+款免费与付费AI工具,快速匹配您的需求!

    友链申请 免责声明 关于我们 联系我们 联系删除 工具提交

    扫码加QQ群AI工具集
    扫码加QQ群
    扫码加微信AI工具集
    扫码加微信
    Copyright © 2025 AI工具集 沪ICP备2025121622号 由 OneNav 强力驱动 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍