本地运行 Google 开源 AI 大模型 Gemma 完整教程
谷歌发布了轻量级开源系列模型 Gemma,其性能强大,可与主流开源模型竞争。通过 Ollama 可轻松部署 Gemma 模型,并使用 JAN AI 美化 UI 界面。显卡在 AIGC 应用中至关重要,推荐选择性能强、显存大的 NVIDIA 系列显卡。
半个月前,谷歌发布了新一代 AI 模型 Gemma,并宣称这是全球性能最强大的轻量级开源系列模型。

根据 Google 介绍,开源模型 Gemma 使用了和 Gemini 同源的技术,总共有 20 亿参数和 70 亿参数两种规模,每个规模又分预训练和指令微调两个版本。

在 Gemma 官方页面上,Google 给出了 Gemma 在语言理解、推理、数学等各项标准测试中的得分,其中 70 亿参数模型击败了主流开源模型 Llama-2 和 Mistral,直接登顶 Hugging Face 开源大模型排行榜,成为目前全球最火热的开源大模型之一。

与 Gemini 的全家桶路线不同,Gemma 这次主打轻量高性能,拥有 2b、2b 全量版、7b、7b 全量版 4 种版本。

其中最基础的 2b 模型即便是在没有独显的笔记本电脑上都能尝试运行,而规模更大的 7b、7b 全量版分别需要 8GB 和 16GB 显存。
经过实测,虽然 Gemma 的使用体验不如 ChatGPT-4 等成熟的闭源大模型,但是本地运行模式还是有其存在的意义的,对于私密性要求较强的用户,也可以在断网的情况下本地加载运行,不用担心相关信息泄露等等。

本次就为大家分享本地部署 Gemma 的操作流程,并演示如何使用 JAN AI 来实现 UI 界面访问 Gemma。
一、安装 Ollama
Ollama 是一个专为运行、创建和分享大型语言模型而设计的开源项目,为开发者和研究者提供了一个平台,使得他们可以更方便地部署、管理和使用这些大型语言模型。目前 Ollama 支持 macOS、Windows、Linux 和 Docker 等多种安装方式,还能通过 API 方式为本地 AI 服务提供便捷途径。
目前 Ollama 支持的模型如下图所示:




















