DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南

DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南 | 极客日志

显存需求 = 参数数量 × 0.5 byte (4-bit) / 1024 / 1024 / 1024

模型名称	参数数量	模型大小	显存需求（大约）
deepseek-r1:1.5b	1.5B	1.1 GB	~2 GB
deepseek-r1:7b	7B	4.7 GB	~5 GB
deepseek-r1:8b	8B	4.9 GB	~6 GB
deepseek-r1:14b	14B	9.0 GB	~10 GB
deepseek-r1:32b	32B	20 GB	~22 GB
deepseek-r1:70b	70B	43 GB	~45 GB
deepseek-r1:70b-llama-distill-q4_K_M	70B	43 GB	~45 GB

curl -fsSL https://ollama.com/install.sh | sh

ollama pull deepseek-r1:7b

ollama pull deepseek-r1:7b-qwen-distill-q4_K_M

ollama run deepseek-r1:7b "你好，请介绍一下你自己。"

version: '3.8'
services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://host.docker.internal:11434
    volumes:
      - open-webui:/app/backend/data
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]
volumes:
  open-webui:

docker compose up -d

DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南

DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南

一、显存需求计算逻辑

1. 理论计算公式

2. 实际生产建议

二、DeepSeek R1 模型显存参考表

三、环境准备

四、Ollama 部署步骤

1. 安装 Ollama

2. 拉取 DeepSeek 模型

3. 验证模型

五、Open-WebUI 部署与集成

1. 创建 Docker Compose 文件

2. 启动服务

3. 访问界面

六、常见问题与优化建议

1. 显存不足怎么办？

2. 推理速度慢？

3. 连接失败？

七、总结

更多推荐文章

相关免费在线工具

DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南

DeepSeek + Ollama + Open-WebUI 本地化部署显存需求与配置指南

一、显存需求计算逻辑

1. 理论计算公式

2. 实际生产建议

二、DeepSeek R1 模型显存参考表

三、环境准备

四、Ollama 部署步骤

1. 安装 Ollama

2. 拉取 DeepSeek 模型

3. 验证模型

五、Open-WebUI 部署与集成

1. 创建 Docker Compose 文件

2. 启动服务

3. 访问界面

六、常见问题与优化建议

1. 显存不足怎么办？

2. 推理速度慢？

3. 连接失败？

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具