DeepSeek 本地化部署指南
近期 DeepSeek 大模型表现优异,但官方服务可能存在不稳定性。本文将详细介绍如何在本地环境部署 DeepSeek,并应用于实际开发和生活场景。在大多数情况下,优先推荐官网 Chat 或 API 调用以获得最佳效果。本文主要面向追求免费、稳定、高效且隐私安全的开发者场景。
核心应用场景
- AI 编程助手:通过 Ollama(本地大模型引擎)+ VS Code + Continue 插件,实现类似 Cursor 的本地代码补全与解释功能。
- 聊天机器人:集成 Open WebUI 或 Chatbox 实现可视化聊天,用于生活咨询、文案写作,构建本地 Agent 库。
- API 调用:集成 Python API 实现本地模型调用,适用于 NLP 算法开发与自动化脚本。
- 本地知识库:集成 AnythingLLM 构建 RAG 系统,解决办公文档、法律文书等隐私数据上传云端的合规问题。
一、环境准备与 Ollama 安装
1. 硬件要求
- CPU:支持 AVX2 指令集的现代处理器。
- 内存 (RAM):建议 16GB 以上。运行 7B 参数模型至少需要 8GB 显存或同等内存占用。
- 存储:预留 10GB - 50GB 空间取决于模型量化等级。
- 操作系统:支持 macOS、Windows、Linux。
2. 安装 Ollama
访问 Ollama 官网下载对应版本安装包。安装完成后,打开终端执行以下命令拉取模型:
ollama run deepseek-r1:7b
该指令会自动下载模型权重到本地并启动服务。默认监听端口为 11434。
若需使用轻量级代码模型,可执行:
ollama run qwen2.5-coder:1.5b
验证模型是否就绪:
ollama list
二、VS Code AI 编程助手配置
1. 安装 Continue 插件
在 VS Code 扩展商店搜索 "Continue" 并安装。该插件支持多种后端,包括本地 Ollama。
2. 配置文件设置
点击 Continue 插件图标,选择 "Open Config" 或直接编辑 .vscode/settings.json 文件。确保 provider 字段设置为 ollama。
完整配置示例如下:
{
"models": [
{
"model": "AUTODETECT",
"title": "Autodetect",


