此刻AI
  • 首页
  • Blog
  • 排行榜
  • 友情链接
  • 投稿

      AI模型评测

      共 13 篇网址
      AI写作工具AI图像工具AI视频工具AI办公工具AI编程工具AI搜索引擎AI音频工具AI开发框架AI训练模型AI内容检测AI法律助手AI提示指令AI模型评测AI对话工具AI金融工具AI学习网站AI语言翻译常用AI工具AI数字人
      排序
      发布更新浏览点赞
      H2O EvalGPT

      H2O EvalGPT

      H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
      03,9560
      AI模型评测# AI# H2O EvalGPT
      LLMEval3

      LLMEval3

      LLMEval是由复旦大学NLP实验室推出的大模型评测基准,...
      04220
      AI模型评测# AI# LLMEval3
      HELM

      HELM

      HELM全称Holistic Evaluation of L...
      04000
      AI模型评测# AI# HELM
      SuperCLUE

      SuperCLUE

      SuperCLUE 是一个中文通用大模型综合性评测基准,从三...
      03770
      AI模型评测# AI# SuperCLUE
      MMBench

      MMBench

      MMBench是一个多模态基准测试,由上海人工智能实验室、南...
      03620
      AI模型评测# AI# MMBench
      PubMedQA

      PubMedQA

      PubMedQA是一个生物医学研究问答数据集,包含了1K专家...
      03570
      AI模型评测# AI# PubMedQA
      Chatbot Arena

      Chatbot Arena

      Chatbot Arena是一个大型语言模型 (LLM) 的...
      03530
      AI模型评测# AI# Chatbot Arena
      C-Eval

      C-Eval

      C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
      03500
      AI模型评测# AI# C-Eval
      OpenCompass

      OpenCompass

      OpenCompass是由上海人工智能实验室(上海AI实验室...
      03400
      AI模型评测# AI# OpenCompass
      FlagEval

      FlagEval

      FlagEval(天秤)由智源研究院将联合多个高校团队打造,...
      03280
      AI模型评测# AI# FlagEval
      Open LLM Leaderboard

      Open LLM Leaderboard

      Open LLM Leaderboard 是最大的大模型和数...
      03020
      AI模型评测# AI# Open LLM Leaderboard
      CMMLU

      CMMLU

      CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在...
      02990
      AI模型评测# AI# CMMLU
      MMLU

      MMLU

      MMLU 全称 Massive Multitask Lang...
      02960
      AI模型评测# AI# MMLU
      没有了

      COPYRIGHT © 2024

        
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍