扫码阅读
手机扫码阅读

谷歌gemma:先进的轻量级开源大模型

79 2024-10-26

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:谷歌gemma:先进的轻量级开源大模型
文章来源:
Python学习杂记
扫码关注公众号
文章摘要

谷歌发布新大模型Gemma

谷歌宣布发布了一款名为Gemma的开源大模型,紧接在其上一次发布的大模型Gemini1.5之后不到一周。这一快速连续的发布行为体现了大模型领域内的竞争日趋激烈。

OpenAI的Sora和行业竞争

OpenAI发布的Sora模型,具备生成视频的能力,引起了行业的广泛关注。Sora的发布导致了其全球范围内的快速传播,凸显了OpenAI在营销方面的实力。由于Sora的影响力,即便谷歌的Gemini 1.5比Sora早发布两小时,也未能获得预期的关注度。这一趋势证明了AI大模型领域的竞争非常剧烈,谷歌和OpenAI作为行业领导者,不仅在技术创新上相互竞争,还在营销策略上斗争激烈。

Gemma模型简介

Gemma来源于拉丁文"宝石",是谷歌最新的开源大模型,包括两个小模型:Gemma 2B和Gemma 7B。这两个模型采用与Gemini相同的技术架构,可以直接在个人电脑上运行。Gemma在多项基准测试中超越了Meta的Llama-2模型,被官方宣称为同类型尺寸中性能最佳模型。

大模型开源趋势

Meta在2023年7月开源了Llama 2大模型,当时被视为ChatGPT的竞争产品。国内方面,阿里云在2023年8月开源了通义千问7B大模型,成为国内大模型开源的先行者。科技巨头通过开源大模型,一方面可以利用开源社区的力量加速技术发展,另一方面可以推动自家产品的影响力。

Gemma模型的未来展望

谷歌在发布Gemma的同时,提供了包括Keras、PyTorch等在内的多种深度学习框架支持,并且Gemma可以在多种设备上运行。通过与NVIDIA的合作,Gemma还能利用GPU提升计算性能。Google Cloud的Vertex AI提供了丰富的MLOps工具以支持模型的部署。随着Meta即将发布Llama 2.0,谷歌通过Gemma的开源及其在基准测试上的表现,展现了其在AI开源领域的竞争态度,预示着2024年大模型领域的竞争将更加激烈。

想要了解更多内容?

查看原文:谷歌gemma:先进的轻量级开源大模型
文章来源:
Python学习杂记
扫码关注公众号

探索运筹优化、机器学习、AI 和数据可视化的奥秘及其落地应用

256 篇文章
浏览 21.7K
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设 白皮书上线