Ollama 本地大模型部署与使用指南
1. Ollama 简介
Ollama 是一个开源工具,旨在让开发者能够在本地机器上轻松运行大型语言模型(LLM)。它支持 Linux、Windows 和 macOS 操作系统,通过一行命令即可启动服务。Ollama 简化了模型的管理、下载和推理过程,使得私有化部署 AI 模型变得更加便捷。
2. 安装部署
2.1 macOS 系统
推荐使用 Homebrew 进行安装:
brew install ollama
安装完成后,直接运行 ollama serve 启动服务,或者在后台运行:
ollama serve &
2.2 Linux 系统
Linux 用户可以使用官方提供的安装脚本:
curl -fsSL https://ollama.com/install.sh | sh
安装后,服务通常会自动配置为 systemd 服务并开机自启。如果未自动启动,可手动执行:
sudo systemctl enable ollama
sudo systemctl start ollama
2.3 Windows 系统
Windows 用户可以直接访问官网下载 .exe 安装包,双击运行即可。安装程序会自动创建桌面快捷方式并在后台启动服务。
2.4 Docker 部署
对于容器化环境,可以使用官方 Docker 镜像:
docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
3. 常用命令与模型管理
3.1 拉取模型
使用 pull 命令从 Ollama 库中下载模型:
ollama pull llama3.1
ollama pull mistral
ollama pull phi3
3.2 运行模型
使用 run 命令启动交互式对话:
ollama run llama3.1
在终端中输入提示词,模型将实时生成回复。
3.3 删除模型
清理不再需要的模型以释放磁盘空间:
ollama rm llama3.1
3.4 列出已安装模型
查看本地已下载的模型列表:
ollama list
4. 硬件配置要求
不同规模的模型对本地硬件资源有不同的需求。以下是常见模型的参数及体积参考:
| Model (大模型) | Parameters (参数量) |
|---|


