C-Eval

C-Eval是一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件。它旨在全面评估大语言模型在中文环境下的高级知识和推理能力。C-Eval包含13948个多选题，覆盖52个不同学科和四个难度级别，适用于从中学到大学的多层级评估。该工具通过标准化的评测基准，帮助研究人员和开发者衡量模型的中文理解和生成能力。

网站域名：cevalbenchmark.com 更新日期：2025-03-23 网站简称：C-Eval 网站分类：AI 开源模型人气指数：11

进入网站同类网站

站内搜索