谷歌再展雄风,Gemma2横空出世,LMSYS竞技场惊艳四座

AI快讯 2024-07-02

上周新鲜出炉的Gemma2,一经发布便在LMSYS的竞技场中大放异彩,不仅摘得了开源模型评分桂冠,更以惊人的27B参数规模,力压Llama3-70B-Instruct、Claude3Sonnet等重量级选手,上演了一场“以小胜大”的精彩对决。这一壮举,连谷歌研究院的领航人Jeff Dean也不禁发文庆贺,盛赞Gemma-2-27B的卓越表现与适中的规模完美契合多样场景需求。

image.png

更令人瞩目的是,在LMSYS最新推出的“多轮对话”排行榜上,Gemma2继续其强劲势头,不仅名次攀升,还成功跻身前十,对Llama3-70B-Instruct形成了有力挑战。同时,Claude家族也不甘示弱,Claude3.5Sonnet与GPT-4o并驾齐驱,Claude3Opus则实现了显著飞跃。

image.png

因此他们推出了新的排行类别「多轮对话」,其中包括两轮或多轮的测试,以衡量模型在更长时间内交互的能力。

而DeepMind内部传来的消息更是让人期待满满,Clement在推特上预告了Gemma系列即将迎来的2B版本,预示着这场开源模型之战将愈演愈烈,尤其是Meta的开源策略或将面临前所未有的挑战。

那么,Gemma2究竟有何过人之处,能以区区27B之姿,撼动70B巨擘的地位?答案或许藏在谷歌那神秘的技术黑盒之中。从官方技术报告中我们或许能窥见一二:庞大的训练数据集、精妙的模型架构以及高效的知识蒸馏策略,共同铸就了Gemma2的非凡实力。

然而,荣耀背后也伴随着争议。Allen AI的Nathan Lambert便对Gemma2微调数据的来源提出了质疑,直指其可能使用了LMSYS的聊天数据集。尽管谷歌方面已澄清仅使用了提示语而未包含答案,但这一争议仍引发了业界的广泛关注与讨论。

在这场技术与伦理交织的较量中,Gemma2无疑已经站上了新的高度。未来,它能否继续引领开源模型的新风尚,又将如何回应外界的质疑与挑战,让我们拭目以待。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章