AI又迎来大地震！狂卷 Llama 3，Gemma 2深夜迎来重大更新

AI快讯 2024-06-28

Google 挤牙膏式的创新真是令人爱恨交织。

早在一个多月前的 Google I/O 上，Google 便官宣将会在未来几周内推出开源模型 Gemma 的第二代 Gemma 2，结果，万万没想到，在深夜更新了。

Google DeepMind 研究 VP Clement Farabet、主管 Tris Warkentin 联袂发文，宣告 Gemma 2 正式向所有研究人员和开发者开放，接下来，就让我们一起来看 Gemma 2 究竟带来了什么。

博文链接：

https://blog.google/technology/developers/google-gemma-2/

Gemma 2 提供业界领先的性能，在各种硬件上运行速度惊人，并且能够轻松集成其他 AI 工具。

Gemma 2 提供 90 亿（9B）和 270 亿（27B）参数规模，性能更高，推理效率更优，并内置了显著的安全进步。特别是在 270 亿参数规模下，它提供了竞争性的替代方案，与体积是其两倍多的模型相比肩，并且能在单个 NVIDIA H100 Tensor Core GPU 或 TPU 主机上实现，大幅降低部署成本。以下是其几个显著特点：

卓越性能：在 270 亿参数规模下，Gemma 2 为其规模类别提供了最佳性能，甚至提供了与体量是其两倍的模型竞争的选择。90 亿参数的 Gemma 2 模型同样表现出色，超越了 Llama 3 8B 和其他同规模的开放模型。有关详细的性能分析，请查阅技术报告。

无与伦比的效率和成本节约：270 亿参数的 Gemma 2 模型旨在在单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 上以全精度高效运行推理，显著降低成本同时保持高性能。这使得 AI 部署更加易于访问且经济实惠。

跨硬件的极速推理：Gemma 2 优化以在从强大的游戏笔记本和高端桌面到基于云的配置的各种硬件上以惊人的速度运行。在 Google AI Studio 中体验 Gemma 2 的全精度性能，在您的 CPU 上通过 Gemma.cpp 解锁本地性能，或者在家用电脑上通过 Hugging Face Transformers 使用 NVIDIA RTX 或 GeForce RTX 试用。

Google的Gemma 2 不仅仅是一个技术产品，它更是Google对于AI技术不断探索和追求的体现。正是这种不断推陈出新、持续进化的精神，推动着AI领域的快速发展，为AI领域的发展注入更多的活力和动力也为我们的工作和生活带来了更多的便利和可能性。而在这个过程中，我们也将与Google一起，共同见证和迎接AI技术带来的新变革。