本地部署与运行 Llama3 模型实战指南
Meta 于近期发布了最新的开源模型 Llama 3,为本地化部署大语言模型提供了更强大的选择。Ollama 是一个简化的工具,专门用于在本地运行开源 LLM(如 Mistral、Llama 2/3),它将模型权重、配置和数据集捆绑到一个由 Modelfile 管理的统一包中。
系统要求与准备
在开始之前,请确保您的硬件满足以下基本要求:
- 内存 (RAM): 至少 8GB (推荐 16GB 或更高)。
- 存储: 根据模型大小预留空间,Llama 3 8B 约需 4.7GB,70B 版本约需 40GB。
- 显卡 (GPU): 推荐使用 NVIDIA 显卡以启用 CUDA 加速推理速度;若仅使用 CPU,响应速度会相对较慢。
支持的模型列表如下:
| Model | Parameters | Size |
|---|---|---|
| Llama 3 | 8B | 4.7GB |
| Llama 3 | 70B | 40GB |
| Mistral | 7B | 4.1GB |
| Dolphin Phi | 2.7B | 1.6GB |
| Phi-2 | 2.7B | 1.7GB |
| Neural Chat | 7B | 4.1GB |
| Starling | 7B | 4.1GB |
| Code Llama | 7B | 3.8GB |
| Llama 2 Uncensored | 7B | 3.8GB |
| Llama 2 13B | 13B | 7.3GB |
| Llama 2 70B | 70B | 39GB |
| Orca Mini | 3B | 1.9GB |
| LLaVA | 7B | 4.5GB |
| Gemma | 2B | 1.4GB |
| Gemma | 7B | 4.8GB |
| Solar | 10.7B | 6.1GB |
下载地址:https://ollama.com
安装 Ollama
macOS 和 Linux
对于 MacOS 和 Linux 用户,可以通过终端命令直接安装:
curl -fsSL https://ollama.com/install.sh | sh
Windows (WSL 环境)
Windows 原生支持预览版,但为了获得更好的兼容性和性能,建议通过 WSL (Windows Subsystem for Linux) 在 Ubuntu 上运行。


