Ollama:本地部署与运行大型语言模型工具
概述
Ollama 是一个专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计的工具。它支持 macOS、Linux 和 Windows 多个平台,通过命令行即可快速拉取、运行和管理模型。
官方网站:https://ollama.com/ GitHub:https://github.com/ollama/ollama
安装
Linux 安装
由于服务器环境通常使用 Linux,以下以 Linux 操作系统为例记录说明。通过命令直接安装如下:
root@master:~/work# curl -fsSL https://ollama.com/install.sh | sh
安装过程中会显示下载进度、创建用户、配置 systemd 服务等步骤。若检测到 NVIDIA GPU,会自动识别。
验证安装
查看 ollama 的状态:
root@master:~/work# systemctl status ollama
输出应显示 Active: active (running)。安装成功后执行 ollama -v 命令,查看版本信息:
root@master:~# ollama -v
ollama version is 0.1.38
配置
编辑 /etc/systemd/system/ollama.service 文件来对 ollama 进行配置。
1. 更改 HOST
默认参数配置启动时仅本地访问,需配置 HOST 开启监听任何来源 IP:
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
2. 更改模型存储路径
不同操作系统大模型存储路径默认如下:
- macOS:
~/.ollama/models - Linux:
/usr/share/ollama/.ollama/models - Windows:
C:\Users\.ollama\models
官方提供设置环境变量 OLLAMA_MODELS 来更改模型文件的存储路径:
[Service]
Environment="OLLAMA_MODELS=/data/ollama/models"
注意:指定目录的权限需正确。如果服务无法启动,可通过授权给相应的目录权限解决:
chown ollama:ollama /data/ollama/models
查看日志调试问题:
journalctl -u ollama
3. 更改运行 GPU
配置环境变量 CUDA_VISIBLE_DEVICES 来指定运行 Ollama 的 GPU,适用于多卡环境:





