技术栈
- Ollama(模型运行)
- Open WebUI(Web 界面)
- DeepSeek/LLaMA(大模型)
适用场景:
- 个人开发者本地调试 AI 应用
- 企业内网私有化部署,数据不出网
- 学习研究大模型原理
- 搭建专属 AI 助手
一、架构介绍
| 组件 | 作用 | 端口 |
|---|---|---|
| Ollama | 大模型运行引擎,负责模型加载和推理 | 11434 |
| Open WebUI | 类 ChatGPT 的 Web 界面,提供对话功能 | 8080 |
| 模型文件 | DeepSeek、LLaMA 等大语言模型 | - |
二、环境准备
2.1 硬件要求
| 模型大小 | 最低内存 | 推荐内存 | GPU(可选) |
|---|---|---|---|
| 7B 参数 | 8GB | 16GB | 6GB 显存 |
| 14B 参数 | 16GB | 32GB | 12GB 显存 |
| 70B 参数 | 64GB | 128GB | 48GB 显存 |
2.2 软件要求
# 检查 Docker 是否安装
docker --version
# 如果未安装,请先安装 Docker
# Windows/Mac: 下载 Docker Desktop
# Ubuntu: sudo apt install docker.io docker-compose
三、Ollama 部署(核心组件)
3.1 方式一:直接安装(推荐新手)
Windows 安装:
- 访问官网下载安装包:https://ollama.com/download
- 双击安装,一路下一步
- 打开命令行验证安装
# 验证安装
ollama --version
# 输出示例
ollama version is 0.1.27
Linux/macOS 安装:
# 一键安装脚本
curl -fsSL https://ollama.com/install.sh | sh
# 验证安装
ollama --version

