钢铁人AI工具网

      AI模型评测工具

      共 13 篇网址
      AI内容检测工具AI写作创意工具AI办公效率提升AI对话聊天工具AI平面设计工具AI开发构建平台AI提示指令工程AI搜索引擎平台AI模型评测工具AI法律合同助手AI绘画图像工具AI编程辅助工具AI视频生成工具AI训练模型平台AI语言翻译工具AI课程学习网站AI音频音乐工具AI营销工具集合
      排序
      发布更新浏览点赞
      FlagEval

      FlagEval

      智源研究院推出的FlagEval(天秤)大模型评测平台
      0550
      AI模型评测工具
      H2O EvalGPT

      H2O EvalGPT

      H2O.ai推出的基于Elo评级方法的大模型评估系统
      0580
      AI模型评测工具
      SuperCLUE

      SuperCLUE

      中文通用大模型综合性测评基准
      01290
      AI模型评测工具
      PubMedQA

      PubMedQA

      生物医学研究问答数据集和模型得分排行榜
      0550
      AI模型评测工具
      OpenCompass

      OpenCompass

      上海人工智能实验室推出的大模型开放评测体系
      0570
      AI模型评测工具
      CMMLU

      CMMLU

      一个综合性的大模型中文评估基准
      0580
      AI模型评测工具
      MMBench

      MMBench

      全方位的多模态大模型能力评测体系
      0730
      AI模型评测工具
      MMLU

      MMLU

      大规模多任务语言理解基准
      0630
      AI模型评测工具
      HELM

      HELM

      斯坦福大学推出的大模型评测体系
      0670
      AI模型评测工具
      Open LLM Leaderboard

      Open LLM Leaderboard

      Hugging Face推出的开源大模型排行榜单
      0730
      AI模型评测工具
      Chatbot Arena

      Chatbot Arena

      以众包方式进行匿名随机对战的LLM基准平台
      0610
      AI模型评测工具
      C-Eval

      C-Eval

      一个全面的中文基础模型评估套件
      0920
      AI模型评测工具
      LLMEval3

      LLMEval3

      由复旦大学NLP实验室推出的大模型评测基准
      0720
      AI模型评测工具
      没有了
      钢铁人AI工具网
      钢铁人AI工具网,收集1000+热门AI工具、AI资料、AI证书、AI智能体、AI行业解决方案等为一体导航网站,你有好用的工具欢迎上架!

      友情链接 果果AI社区

      扫码加微信进AI交流群,领取AI资料包钢铁人AI工具网
      扫码加微信进AI交流群,领取AI资料包
      Copyright © 2025 钢铁人AI工具网 粤ICP备2025368416号-1 
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍