1. 显卡驱动检查与安装
在开始之前,我们需要确保显卡驱动正常。先查看一下硬件信息:
lspci | grep -i nvidia
看到输出后,使用系统推荐命令安装驱动:
sudo ubuntu-drivers devices
根据提示安装对应版本(例如 580):
sudo apt install nvidia-driver-580
安装完成后重启服务器,并验证驱动状态:
sudo reboot
# 重启后执行
nvidia-smi
如果能看到显卡详细信息,说明驱动已就绪。
2. 准备 Docker 环境
虽然 Ollama 支持直接安装,但为了后续扩展性(比如跑 OpenWebUI),建议先准备好 Docker:
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
sudo apt-get update
sudo apt-get install docker-ce
这里不需要启动 Docker 服务,留着备用即可。
3. 部署 Ollama 服务
这是核心步骤。我们使用官方脚本一键安装:
wget https://ollama.com/install.sh
sudo sh install.sh
安装完成后,默认只监听本地。如果你希望从局域网其他机器访问,需要修改服务配置。编辑 systemd 文件:
sudo vim /etc/systemd/system/ollama.service
在 [Service] 部分添加环境变量,允许跨域和监听所有网卡:
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_ORIGINS=*"
保存后重载配置并重启服务:
sudo systemctl daemon-reload
sudo systemctl restart ollama
此时可以通过 systemctl status ollama 确认服务状态。
4. 拉取与运行模型
环境好了,接下来就是拉取 DeepSeek R1 模型。注意模型体积较大,请确保磁盘空间充足:

