登顶全球开源大模型第一!阿里Qwen2也来炸场了

AI快讯 2024-06-28
全球知名开源巨头Hugging Face的CEO Clem近日在社交媒体上公开称赞,根据最新一轮的评测结果,阿里巴巴最新推出的Qwen2-72B指令微调版本再次荣登全球开源模型排行榜的榜首,持续巩固了中国在全球开源大模型领域的领先地位。
Clem透露,为了全面评估全球开源大模型的性能,他们动用了300块H100高性能计算资源,对包括Qwen2、Llama-3、Mixtral、Phi-3等在内的100多个主流开源大模型,在BBH、MUSR、MMLU-PRO、GPQA等多个基准测试集上进行了深入的评估。
image.png
经过严格测试,阿里巴巴的Qwen-2 72B模型脱颖而出,不仅在性能上超越了科技巨头Meta的Llama-3和法国知名大模型平台Mistralai的Mixtral,更在排行榜上稳坐头把交椅。值得一提的是,Qwen系列模型在前十名中占据了三个席位,包括蝉联冠军的Qwen2-72B指令微调模型,以及曾经登顶的Qwen1.5-110B模型(base和chat版本各一),充分展示了中国在全球开源大模型领域的强劲实力。
然而,就在全球开源大模型领域竞争日趋激烈之际,美国人工智能巨头OpenAI却宣布将从7月9日起,限制来自非支持国家和地区的API服务,这无疑给中国开发者带来了不小的挑战。不过,面对这一困境,阿里云百炼迅速站出来,宣布将为中国开发者提供最具性价比的中国大模型替代方案,并额外提供2200万免费tokens和专属迁移服务,以帮助他们顺利过渡到新的平台。
值得一提的是,根据斯坦福大学最新公布的大模型测评榜单HELM MMLU,Qwen2-72B的得分高达0.824,与全球领先的GPT-4模型并列第四,再次证明了其卓越的性能和广泛的市场认可度。这一成绩不仅是对Qwen2-72B模型本身的肯定,更是对中国在全球开源大模型领域领先地位的巩固和彰显。
@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章