豆包大模型团队开源基准测试集SuperGPQA
田宁
2025-03-04 11:53
3月4日消息,豆包大模型团队近日开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
声明
1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn

田宁
电商脉搏,媒体前沿洞察。