Ollama + Open WebUI 本地部署指南
简介
Ollama 是一个开源项目,提供了部署和运行各种大型语言模型的平台和工具集。Open WebUI 则是一个基于 Web 的用户界面,允许用户通过浏览器与 Ollama 进行交互。本文将详细介绍如何结合两者在本地构建私有化的 AI 问答系统。
环境准备
确保您的机器已安装 Docker 和 Docker Compose。建议使用 Linux 或 WSL2 环境以获得最佳性能。
Ollama 部署
推荐使用 Docker 方式部署,简单且易于管理。
1. 拉取镜像
docker pull ollama/ollama:latest
2. 启动容器
根据硬件配置选择相应的启动命令:
AMD 显卡 (ROCm)
docker run -d -v /mnt/c/ubuntu-wsl/data/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm
英伟达显卡 (CUDA)
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
仅 CPU 模式
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
模型管理
Ollama 支持多种主流开源模型。以下是常用模型列表:
| 模型名称 | 参数量 | 大小 | 启动命令 |
|---|---|---|---|
| llama3 | 8B | 4.7GB | ollama run llama3:8b |
| llama3 | 70B | 40GB | ollama run llama3:70b |
| gemma | 7B | 5.0GB | ollama run gemma:7b |
| mistral | 7B | 4.1GB | ollama run mistral:7b |
| qwen | 72B | 41GB | ollama run qwen:72b |
| phi3 | 3.8B |


