LOADING
首页
Blog
排行榜
友情链接
投稿
AI模型评测
共 13 篇网址
AI写作工具
AI图像工具
AI视频工具
AI办公工具
AI编程工具
AI搜索引擎
AI音频工具
AI开发框架
AI训练模型
AI内容检测
AI法律助手
AI提示指令
AI模型评测
AI对话工具
AI金融工具
AI学习网站
AI语言翻译
常用AI工具
AI数字人
排序
发布
更新
浏览
点赞
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
0
340
0
AI模型评测
# AI
# OpenCompass
PubMedQA
PubMedQA是一个生物医学研究问答数据集,包含了1K专家...
0
357
0
AI模型评测
# AI
# PubMedQA
SuperCLUE
SuperCLUE 是一个中文通用大模型综合性评测基准,从三...
0
377
0
AI模型评测
# AI
# SuperCLUE
MMBench
MMBench是一个多模态基准测试,由上海人工智能实验室、南...
0
362
0
AI模型评测
# AI
# MMBench
MMLU
MMLU 全称 Massive Multitask Lang...
0
296
0
AI模型评测
# AI
# MMLU
Open LLM Leaderboard
Open LLM Leaderboard 是最大的大模型和数...
0
302
0
AI模型评测
# AI
# Open LLM Leaderboard
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
0
350
0
AI模型评测
# AI
# C-Eval
Chatbot Arena
Chatbot Arena是一个大型语言模型 (LLM) 的...
0
353
0
AI模型评测
# AI
# Chatbot Arena
CMMLU
CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在...
0
299
0
AI模型评测
# AI
# CMMLU
FlagEval
FlagEval(天秤)由智源研究院将联合多个高校团队打造,...
0
328
0
AI模型评测
# AI
# FlagEval
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
0
3,956
0
AI模型评测
# AI
# H2O EvalGPT
HELM
HELM全称Holistic Evaluation of L...
0
400
0
AI模型评测
# AI
# HELM
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准,...
0
422
0
AI模型评测
# AI
# LLMEval3
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍