BT财经

境内金融信息服务备案编号:

【京金信备(2021)5号】

2025年06月26日

SuperGLUE还是SuperCLUE,大模型评测榜单惊现“李逵李鬼”?

7606500.jpeg

随着国内百度、阿里、讯飞等各大厂商陆续发布大语言模型,百模大战的态势愈演愈烈、一触即发。各类评测也纷纷登场,分析到底谁才是国产ChatGPT的“扛把子”。


评测榜单是技术圈常见的一个评估维度。不过,前提是榜单得是公开透明、且具有权威性,国内外行业巨头都参与并认可,榜单才具有公信力,否则就会成为一家之言,毫无说服力,甚至会诱导大众。近日,一份自称“中文通用大模型综合性评测基准SuperCLUE”发布,权威性待考证,存在三点较大疑问。

 

SuperCLUE而非SuperGLUE,啥啥分不清楚

众所周知,在国际NLP领域,有大名鼎鼎的数据集GLUESuperGLUE,非常权威,OpenAI、谷歌等的大模型都在上面评测,极大推动了NLP领域的发展。



未完......
请加入BT财经数据通会员查看全文!
加入BT财经数据通会员 >>




版权声明:本文版权归BT财经所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

北京领讯时代信息技术有限公司 | Copyright ©️ 2025 BT财经 版权所有 京ICP备19043396号-7

京公网安备 11010602007380号 | 境内金融信息服务备案编号:京金信备(2021)5号

网信算备110106674807801230011号


声明:未经授权,不得复制、转载或以其他方式使用本网站的内容。BT财经尽最大努力确保数据准确,但不保证数据绝对正确。