Ollama 概述
Ollama 是一个专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计的工具。它简化了模型的管理、下载和执行过程,支持 macOS、Linux 和 Windows 平台。
官方网站:https://ollama.com/ Github:https://github.com/ollama/ollama
系统要求与前置条件
在开始部署之前,请确保您的环境满足以下基本要求:
- 操作系统:macOS (12.3+), Linux (Ubuntu 20.04+, CentOS 7+), Windows (10/11)
- 内存:至少 8GB RAM(推荐 16GB 以上以运行 7B 及以上参数量的模型)
- 存储:根据模型大小预留空间,通常 4B-7B 模型需要 4-8GB 磁盘空间
- GPU:可选,但推荐使用 NVIDIA GPU 以获得更好的推理速度。需安装 CUDA 驱动
安装指南
Linux 系统安装
在 Linux 服务器上,可以通过官方提供的脚本直接安装:
curl -fsSL https://ollama.com/install.sh | sh
安装过程中会自动创建 ollama 用户,配置 systemd 服务,并尝试检测 NVIDIA GPU。
验证安装状态
安装完成后,检查服务状态:
systemctl status ollama
如果显示 active (running),则说明服务正常启动。查看版本信息:
ollama -v
输出示例:ollama version is 0.1.38
Docker 部署
对于容器化环境,可以使用 Docker Hub 上的镜像:
docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
配置详解
1. 网络访问配置
默认情况下,Ollama 仅监听本地回环地址。若需远程访问,需修改 systemd 配置文件。
编辑 /etc/systemd/system/ollama.service,添加或修改环境变量:
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
重载配置并重启服务:
systemctl daemon-reload
systemctl restart ollama
安全提示:开放 0.0.0.0 后,建议配合防火墙限制访问 IP,防止未授权调用。
2. 模型存储路径配置
默认模型存储路径因系统而异:
- macOS:
~/.ollama/models - Linux:
/usr/share/ollama/.ollama/models


