前言
在本地运行大模型越来越方便,Ollama 让这件事变得简单。配合 Open WebUI,我们就能拥有类似 ChatGPT 的网页体验,数据完全掌握在自己手里。
环境检查
确保系统是 Ubuntu 20.04,预留足够空间(建议 10GB+),显存决定能跑多大的模型。实际运行时如果显存不足,可能会遇到 OOM 错误,所以提前确认硬件配置很有必要。
lsb_release -a
nvidia-smi
安装 Ollama
直接运行官方脚本即可,它会自动处理依赖和配置:
curl -fsSL https://ollama.com/install.sh | sh
服务管理也很标准,用 systemd 控制启动、重启或查看日志。这里要注意,默认情况下 Ollama 会监听在 localhost:11434。
sudo systemctl start ollama
sudo systemctl enable ollama
sudo journalctl -u ollama -f
拉取与运行模型
常用命令很简单,比如拉取 deepseek-r1:7b:
ollama pull deepseek-r1:7b
ollama run deepseek-r1:7b
交互时可以用 /clear 清空上下文,或者通过参数调整温度、输出长度等。比如想固定随机性,可以加 --seed 42;限制输出 token 数则用 --num-predict 100。
ollama run deepseek-r1:7b --temperature 0.7 --num-predict 100
部署 Open WebUI
命令行虽然快,但图形界面更适合日常。Open WebUI 基于 Docker 部署,先确保 Docker 环境正常。
启动容器时注意端口映射,这里使用 host 网络模式简化配置:
docker run -d --network="host" -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main
访问 http://localhost:8080 注册账号后即可使用。首次登录会自动检测本地 Ollama 服务,之后就能在浏览器里切换模型、查看历史对话了。所有数据都保存在本地卷中,隐私安全有保障。


