C-Eval是一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件。它旨在全面评估大语言模型在中文环境下的高级知识和推理能力。C-Eval包含13948个多选题,覆盖52个不同学科和四个难度级别,适用于从中学到大学的多层级评估。该工具通过标准化的评测基准,帮助研究人员和开发者衡量模型的中文理解和生成能力。

网站域名:cevalbenchmark.com 更新日期:2025-03-23 网站简称:C-Eval 网站分类:AI 开源模型 人气指数:11