基于 Ollama 本地部署 Llama3 模型指南
引言
Meta 近期发布了 Llama3 系列大语言模型,标志着人工智能领域的重要进展。Llama3 是开源的,允许用户在本地环境中进行部署和运行。相比云端 API,本地部署具有数据隐私保护、无需网络依赖、成本可控等优势。本文将详细介绍如何在个人电脑上通过 Ollama 客户端和 WebUI 界面部署 Llama3 模型。
环境准备
在开始部署之前,请确保您的计算机满足以下基本要求:
- 操作系统:macOS (12.0+), Windows (10/11), Linux (Ubuntu 20.04+)
- 内存 (RAM):建议至少 8GB,推荐 16GB 或以上(运行 8B 参数版本)
- 存储:预留 5GB 以上空间用于模型文件
- 网络:首次下载模型需要联网,后续推理可断网使用
硬件配置示例
笔者测试使用的硬件配置如下:
- CPU: 10 核 Apple M2 Pro
- 内存:16GB Unified Memory
- 系统:macOS Ventura
在此配置下,Llama3 8B 版本可以流畅运行,响应速度较快。
第一步:安装 Ollama
Ollama 是一个轻量级的工具,用于在本地运行大语言模型。它提供了命令行接口,方便用户与模型交互。
macOS / Linux 安装
打开终端,执行以下命令安装 Ollama:
curl -fsSL https://ollama.com/install.sh | sh
Windows 安装
访问 Ollama 官网下载 Windows 安装包,双击运行并按照提示完成安装。安装完成后,Ollama 服务将在后台启动。
验证安装
安装成功后,可以在终端输入以下命令检查版本:
ollama --version
如果显示版本号,说明安装成功。此时服务已默认启动,监听本地端口。
第二步:下载并运行 Llama3 模型
Ollama 支持多种模型,我们选择 Llama3 8B 版本,该版本在性能和资源占用之间取得了良好平衡。
拉取模型
在终端执行以下命令下载模型:
ollama run llama3
程序会自动从官方仓库拉取模型文件。首次运行可能需要几分钟时间下载,具体取决于网络速度。下载完成后,模型将保存在本地目录中。
模型交互测试
进入交互模式后,可以直接输入问题进行测试。例如:
>>> who are you?
I'm LLaMA, a large language model trained by a team of researchers at Meta AI...
您可以尝试让模型编写代码、翻译文本或回答问题。Ollama 会流式输出结果,体验接近实时对话。
第三步:配置 Node.js 环境
为了获得更好的用户体验,我们可以部署一个 Web 图形界面(WebUI)。推荐使用 ollama-webui-lite 项目,它基于 Vite 构建,轻量且易于维护。
安装 Node.js
访问 Node.js 官网 下载并安装 LTS 版本。安装完成后,在终端验证:
node -v
npm -v


