本地部署 Llama3 大模型:使用 Ollama 在个人电脑极速运行指南
概述
Ollama 是一个用于在本地计算机上运行大型语言模型(LLMs)的命令行工具。它允许用户下载并本地运行像 Llama 3、Code Llama 等模型,并支持自定义和创建自己的模型。Ollama 是免费开源的项目,支持 macOS、Linux 操作系统和 Windows 系统。它还提供了官方的 Docker 镜像,使用户可以通过 Docker 容器部署大型语言模型,确保所有与模型的交互都在本地进行,无需将私有数据发送到第三方服务。
环境准备
在开始部署之前,请确保您的计算机满足以下基本要求:
- 操作系统:Windows 10/11, macOS (Intel 或 Apple Silicon), Linux (Ubuntu/CentOS 等)
- 硬件要求:建议至少 8GB 内存,若运行较大参数模型(如 Llama3-70B),建议 32GB+ 内存及独立显卡
- 网络连接:首次下载模型需要稳定的网络环境
安装 Ollama
Windows 系统
- 访问 Ollama 官网下载页面,选择 Windows 版本进行下载。
- 下载完成后,双击安装包开始安装。
- 按照向导完成安装,默认安装到 C 盘根目录。
- 安装完成后,按下
Win + R键调出运行窗口,输入cmd打开控制台。 - 验证安装是否成功,输入命令:
如果显示版本号,则安装成功。ollama --version
macOS / Linux 系统
对于 macOS 和 Linux 用户,推荐使用 Homebrew 或 curl 命令进行安装:
# macOS
brew install ollama
# Linux
curl -fsSL https://ollama.com/install.sh | sh
运行 Llama3 模型
安装完成后,即可通过命令行拉取并运行模型。
拉取模型
在终端中输入以下命令拉取 Llama3 模型:
ollama run llama3
系统将自动下载模型文件(约 4.7GB),首次运行可能需要几分钟时间。下载完成后,即可进入对话模式。
测试对话
进入对话模式后,您可以直接输入问题,模型会即时响应。例如:
User: 你好,请介绍一下你自己。
Assistant: 我是 Llama3,一个由 Meta 开发的大型语言模型...
支持中文提问,模型能够理解并生成流畅的中文回复。
模型管理
Ollama 提供了一系列命令来管理本地模型库。
列出已安装的模型
查看当前本地存储的所有模型:
ollama list
删除模型
如果不再需要某个模型,可以将其删除以释放磁盘空间:
ollama rm llama3
复制模型
可以将一个模型复制为另一个名称,方便不同场景使用:


