本地部署 Llama3 大模型：使用 Ollama 在个人电脑极速运行指南

概述

Ollama 是一个用于在本地计算机上运行大型语言模型（LLMs）的命令行工具。它允许用户下载并本地运行像 Llama 3、Code Llama 等模型，并支持自定义和创建自己的模型。Ollama 是免费开源的项目，支持 macOS、Linux 操作系统和 Windows 系统。它还提供了官方的 Docker 镜像，使用户可以通过 Docker 容器部署大型语言模型，确保所有与模型的交互都在本地进行，无需将私有数据发送到第三方服务。

环境准备

在开始部署之前，请确保您的计算机满足以下基本要求：

操作系统：Windows 10/11, macOS (Intel 或 Apple Silicon), Linux (Ubuntu/CentOS 等)
硬件要求：建议至少 8GB 内存，若运行较大参数模型（如 Llama3-70B），建议 32GB+ 内存及独立显卡
网络连接：首次下载模型需要稳定的网络环境

安装 Ollama

Windows 系统

访问 Ollama 官网下载页面，选择 Windows 版本进行下载。
下载完成后，双击安装包开始安装。
按照向导完成安装，默认安装到 C 盘根目录。
安装完成后，按下 Win + R 键调出运行窗口，输入 cmd 打开控制台。
验证安装是否成功，输入命令：
```
ollama --version
```
如果显示版本号，则安装成功。

macOS / Linux 系统

对于 macOS 和 Linux 用户，推荐使用 Homebrew 或 curl 命令进行安装：

# macOS
brew install ollama

# Linux
curl -fsSL https://ollama.com/install.sh | sh

运行 Llama3 模型

安装完成后，即可通过命令行拉取并运行模型。

拉取模型

在终端中输入以下命令拉取 Llama3 模型：

ollama run llama3

系统将自动下载模型文件（约 4.7GB），首次运行可能需要几分钟时间。下载完成后，即可进入对话模式。

测试对话

进入对话模式后，您可以直接输入问题，模型会即时响应。例如：

User: 你好，请介绍一下你自己。
Assistant: 我是 Llama3，一个由 Meta 开发的大型语言模型...

支持中文提问，模型能够理解并生成流畅的中文回复。

模型管理

Ollama 提供了一系列命令来管理本地模型库。

列出已安装的模型

查看当前本地存储的所有模型：

ollama list

删除模型

如果不再需要某个模型，可以将其删除以释放磁盘空间：

ollama rm llama3

复制模型

可以将一个模型复制为另一个名称，方便不同场景使用：

本地部署 Llama3 大模型：使用 Ollama 在个人电脑极速运行指南