CMMLU(中文多任务语言理解评估)是一个专门为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准。它涵盖了从基础学科到高级专业水平的67个主题,包括自然科学、人文科学、社会科学以及中国特定的生活常识等。CMMLU的设计旨在提供一个全面的测试平台,以便更好地评估和提升中文语言模型的表现。

网站域名:github.com 更新日期:2025-03-23 网站简称:CMMLU 网站分类:AI 开源模型 人气指数:8