谷歌gemma：先进的轻量级开源大模型

发布于 2024-10-26

310

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：谷歌gemma：先进的轻量级开源大模型

文章来源：

Python学习杂记

扫码关注公众号

扫码阅读

手机扫码阅读

文章摘要

谷歌发布新大模型Gemma

谷歌宣布发布了一款名为Gemma的开源大模型，紧接在其上一次发布的大模型Gemini1.5之后不到一周。这一快速连续的发布行为体现了大模型领域内的竞争日趋激烈。

OpenAI的Sora和行业竞争

OpenAI发布的Sora模型，具备生成视频的能力，引起了行业的广泛关注。Sora的发布导致了其全球范围内的快速传播，凸显了OpenAI在营销方面的实力。由于Sora的影响力，即便谷歌的Gemini 1.5比Sora早发布两小时，也未能获得预期的关注度。这一趋势证明了AI大模型领域的竞争非常剧烈，谷歌和OpenAI作为行业领导者，不仅在技术创新上相互竞争，还在营销策略上斗争激烈。

Gemma模型简介

Gemma来源于拉丁文"宝石"，是谷歌最新的开源大模型，包括两个小模型：Gemma 2B和Gemma 7B。这两个模型采用与Gemini相同的技术架构，可以直接在个人电脑上运行。Gemma在多项基准测试中超越了Meta的Llama-2模型，被官方宣称为同类型尺寸中性能最佳模型。

大模型开源趋势

Meta在2023年7月开源了Llama 2大模型，当时被视为ChatGPT的竞争产品。国内方面，阿里云在2023年8月开源了通义千问7B大模型，成为国内大模型开源的先行者。科技巨头通过开源大模型，一方面可以利用开源社区的力量加速技术发展，另一方面可以推动自家产品的影响力。

Gemma模型的未来展望

谷歌在发布Gemma的同时，提供了包括Keras、PyTorch等在内的多种深度学习框架支持，并且Gemma可以在多种设备上运行。通过与NVIDIA的合作，Gemma还能利用GPU提升计算性能。Google Cloud的Vertex AI提供了丰富的MLOps工具以支持模型的部署。随着Meta即将发布Llama 2.0，谷歌通过Gemma的开源及其在基准测试上的表现，展现了其在AI开源领域的竞争态度，预示着2024年大模型领域的竞争将更加激烈。