adminLv.1 初级画师

帅气的我简直无法用语言描述!

IP: 加入时间:2026-04-06

  • 获赞
  • 粉丝
    0
  • 关注
    0
  • 评论
    0
H2O EvalGPT

H2O EvalGPT

  • 6

基于LLM的评估工具

LLMEval3

LLMEval3

  • 6

用于评估大模型的工具

HELM

HELM

  • 7

语言模型评估工具

MMBench

MMBench

  • 8

评估LVLMs的工具

CMMLU

CMMLU

  • 6

综合性的中文评估基准

OpenCompass

OpenCompass

  • 6

开源大模型评估平台

AGI-Eval

AGI-Eval

  • 6

AI大模型评测社区

SuperCLUE

SuperCLUE

  • 8

中文大模型测评基准