Ubuntu 25.04 私有大模型部署实战：Ollama+DeepSeek+OpenWebUI | 极客日志

Shell / BashAI算法

Ubuntu 25.04 私有大模型部署实战：Ollama+DeepSeek+OpenWebUI

Ubuntu 25.04 环境下通过 Ollama、DeepSeek 和 OpenWebUI 构建本地私有大模型。步骤包括系统优化、组件安装、Docker 配置及性能调优。涉及 NVIDIA 显卡驱动、容器网络设置及安全加固方案。解决连接异常与显存溢出问题，实现低成本隐私安全的 AI 辅助开发环境。

片刻发布于 2026/4/8更新于 2026/5/2115 浏览

Ubuntu 25.04 私有大模型部署实战

前置环境准备

推荐使用 Ubuntu 25.04 Server 版（最小化安装），配置要求：

CPU：4 核及以上（建议 Intel i7+/Ryzen 5+）
内存：32GB 以上（运行 32B 模型需要）
显卡：NVIDIA RTX 3060 12GB+（显存越大越好）
存储：至少 100GB SSD 空间

系统优化建议：

# 禁用自动更新降低系统中断几率
sudo sed -i 's/Update-Package-Lists "1"/Update-Package-Lists "0"/g' /etc/apt/apt.conf.d/10periodic
# 调整 Swappiness 提升内存使用效率
echo "vm.swappiness=10" | sudo tee /etc/sysctl.d/99-swappiness.conf
sudo sysctl -p

一、核心组件安装

1. Ollama 服务部署

Ollama 是本地大模型运行引擎，支持多种开源模型：

# 添加 Ollama 官方源
curl -fsSL https://ollama.com/install.sh | sh
# 创建专用系统用户（提高安全性）
sudo useradd -r -s /bin/false -m -d /opt/ollama ollama

服务配置文件 (/etc/systemd/system/ollama.service) 是关键，下面是优化后的版本：

[Unit]
Description=Ollama Service
After=network-online.target
Requires=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=on-failure
RestartSec=30s
StartLimitIntervalSec=60
StartLimitBurst=5
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/opt/cuda/bin"
=
=
=
=
=
=
=G
=G
=%


=multi-user.target

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

sudo systemctl daemon-reload
sudo systemctl enable --now ollama

# 下载模型（约 25GB）
ollama pull deepseek-coder:33b
# 测试模型运行
ollama run deepseek-coder "用 Python 写一个快速排序函数"

mkdir -p /data/ollama/.ollama/models/blobs
ln -s /data/ollama/.ollama/models /usr/share/ollama

# 拉取镜像
sudo docker pull ghcr.m.daocloud.io/open-webui/open-webui:main
# 持久化存储目录准备
mkdir -p /data/open-webui/{database,cache}
chmod 755 /data/open-webui

docker run -d \
-p 3000:8080 \
--name open-webui \
--restart always \
--add-host=host.docker.internal:host-gateway \
-v /data/open-webui:/app/backend/data \
-e OLLAMA_BASE_URL=http://172.17.0.1:11434 \
ghcr.m.daocloud.io/open-webui/open-webui:main

docker exec open-webui curl -Is http://172.17.0.1:11434 | head -1
# 应返回 "HTTP/1.1 200 OK"

# 安装 NVIDIA 容器工具包
curl -sL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
echo "deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://nvidia.github.io/libnvidia-container/stable/ubuntu25.04/$(arch) /" | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt update && sudo apt install -y nvidia-container-toolkit

{
  "runtimes": {
    "nvidia": {
      "path": "/usr/bin/nvidia-container-runtime",
      "runtimeArgs": []
    }
  },
  "default-runtime": "nvidia"
}

#!/bin/bash
MODELS=("deepseek-coder:33b" "llama3:70b")
for MODEL in ${MODELS[@]}; do
  curl -X POST http://localhost:11434/api/pull -d '{"name": "'$MODEL'"}'
done

(crontab -l; echo "@reboot /usr/local/bin/ollama-autoload") | crontab -

# 容器内部测试
docker exec -it open-webui ping 172.17.0.1
# 检查端口映射
sudo ss -tulnp | grep 11434
# 临时关闭防火墙测试
sudo ufw disable

journalctl -u ollama -f -n 100

{"num_gpu":1,"num_thread":6,"max_vram":10000}

docker run ... -e OPENWEBUI_SECRET_KEY=YourStrongKey ...

# 使用 Let's Encrypt 证书
docker run -d \
-p 443:8080 \
-v /etc/letsencrypt:/etc/letsencrypt \
-e OPENWEBUI_SECURE_COOKIES=true \
...其他参数...

curl http://localhost:11434/api/generate -d '{ "model": "deepseek-coder:33b", "prompt": "解释量子纠缠现象", "stream": false }'

Ubuntu 25.04 私有大模型部署实战：Ollama+DeepSeek+OpenWebUI

Ubuntu 25.04 私有大模型部署实战

前置环境准备

一、核心组件安装

1. Ollama 服务部署

更多推荐文章

相关免费在线工具

2. DeepSeek 模型加载

3. OpenWebUI 可视化界面

二、性能调优实战

1. GPU 资源共享配置

2. 模型热加载优化

三、故障排查指南

1. OpenWebUI 无法连接 Ollama

2. 模型加载异常

3. CUDA 内存溢出

四、安全加固建议

五、实际效果展示

六、总结与建议

更多推荐文章

相关免费在线工具

Ubuntu 25.04 私有大模型部署实战：Ollama+DeepSeek+OpenWebUI

Ubuntu 25.04 私有大模型部署实战

前置环境准备

一、核心组件安装

1. Ollama 服务部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. DeepSeek 模型加载

3. OpenWebUI 可视化界面

二、性能调优实战

1. GPU 资源共享配置

2. 模型热加载优化

三、故障排查指南

1. OpenWebUI 无法连接 Ollama

2. 模型加载异常

3. CUDA 内存溢出

四、安全加固建议

五、实际效果展示

六、总结与建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具