解锁DeepSeek潜能：Docker+Ollama打造本地大模型部署新范式

Ne0inhk

15 Mar 2026 — 6 min read

🐇明明跟你说过：个人主页

🏅个人专栏：《深度探秘：AI界的007》 🏅

🔖行路有良友，便是天堂🔖

一、引言

1、什么是Docker

Docker：就像一个“打包好的App”

想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

“这个软件需要 Python 3.8，但我只有 Python 3.6！”
“我没有你用的那个库，安装失败了！”
“你的程序要跑在 Linux，我的电脑是 Windows！”

💡 Docker 的作用：它就像一个“打包好的 App”，把你的软件、依赖、环境、系统配置等 全部封装到一个“容器” 里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

🚀 把 Docker 想象成“集装箱”

传统运输 vs. 集装箱运输

以前（传统部署）：

货物（程序）需要不同的包装方式（运行环境）
货物可能损坏（环境不兼容）
装卸麻烦（程序迁移难）

有了 Docker（容器部署）：

货物装进标准化集装箱（Docker 容器）
不管运到哪里，集装箱里东西不变（程序环境一致）
码头和船只可以直接装卸（轻松部署到不同系统）

Docker 让软件像“集装箱”一样标准化、可移植、易部署！ 🚢

2、什么是Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你 在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

💡 简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

🚀 Ollama 的核心特点

本地运行 🏠
- 你不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型 📚
- 可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用 🔧
- 只需要几条命令，就能下载并运行 AI 模型。
轻量化优化 ⚡
- 适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理 🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

二、准备工作

1、操作系统

这里我们使用的操作系统为Centos 7.9，配置为4核8G，大家也可以使用其他的Linux发行版本，或者使用Windows。

2、镜像准备

如果已经安装了Docker，可以提前准备好镜像，ollama/ollama，镜像比较大，拉取会耗一些时间

三、安装

1、安装Docker

1.关闭防火墙

systemctl stop firewalld && systemctl disabled firewalld

2.关闭SELinux

setenforce 0

3.更换yum源

rm -f /etc/yum.repos.d/* curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum clean all && yum makecache

4.安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

5. 添加Docker源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

6.安装Docker

yum install docker-ce -y

7.添加Docker镜像加速器

vim /etc/docker/daemon.json # 添加如下内容 { "registry-mirrors": [ "https://docker.m.daocloud.io", "https://noohub.ru", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com", "https://5tqw56kt.mirror.aliyuncs.com", "https://docker.1panel.live", "http://mirrors.ustc.edu.cn/", "http://mirror.azure.cn/", "https://hub.rat.dev/", "https://docker.ckyl.me/", "https://docker.chenby.cn", "https://docker.hpcloud.cloud", "https://docker.m.daocloud.io" ] }

8.启动Docker

systemctl start docker

2、启动Ollama

1.启动Ollama容器

docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run 运行一个新的 Docker 容器
-itd 组合多个选项：
- ✅ -i（保持标准输入）
- ✅ -t（分配终端）
- ✅ -d（后台运行容器）
-v ollama:/root/.ollama 挂载数据卷，把 ollama 这个 Docker 数据卷绑定到容器的 /root/.ollama 目录，确保数据持久化（如下载的模型不会丢失）。
-p 11434:11434 端口映射，把宿主机（本机）的 11434 端口映射到容器内部的 11434 端口，这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
--name ollama 指定容器名称为 ollama，方便管理和启动。
ollama/ollama 使用的 Docker 镜像，这里是官方的 Ollama 镜像。

如果是使用GPU运行，则用下面的命令启动

docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama

2.查看Ollama容器

docker ps

3、拉取Deepseek大模型

1.进入到容器中

docker exec -it ollama /bin/bash

2.拉取模型

ollama pull deepseek-r1:7b

在官网中，有许多Deepseek的模型，这里主要是演示，所以拉取了一个较小的模型

官网地址：deepseek-r1

3.查看模型

ollama list

4、启动Deepseek

ollama run deepseek-r1:7b

💕💕💕每一次的分享都是一次成长的旅程，感谢您的陪伴和关注。希望这些文章能陪伴您走过技术的一段旅程，共同见证成长和进步！😺😺😺

🧨🧨🧨让我们一起在技术的海洋中探索前行，共同书写美好的未来！！！

人工智能：大模型高效推理与部署技术实战

人工智能：大模型高效推理与部署技术实战 1.1 本章学习目标与重点 💡 学习目标：掌握大语言模型推理与部署的核心技术，理解模型量化、推理加速、服务化部署的原理，能够完成开源大模型的高性能生产级部署。 💡 学习重点：精通INT4/INT8量化技术的应用，掌握vLLM等高性能推理框架的使用方法，学会搭建高并发的大模型API服务。 1.2 大模型推理部署的核心挑战 1.2.1 大模型推理的痛点分析 💡 预训练大模型通常具备数十亿甚至上百亿的参数量，直接进行推理会面临显存占用高、推理速度慢、并发能力弱三大核心问题。 * 显存占用高：以LLaMA-2-7B模型为例，FP16精度下显存占用约14GB，单张消费级显卡难以承载；而70B模型FP16精度显存占用更是超过140GB，普通硬件完全无法运行。 * 推理速度慢：自回归生成的特性导致模型需要逐token计算，单条长文本生成可能需要数十秒，无法满足实时应用需求。 * 并发能力弱：传统推理方式下，单卡同时处理的请求数极少，高并发场景下会出现严重的排队和延迟问题。这些问题直接制约了大模型从实验室走向实际生产环境，因此高效

【开源发布】FinchBot (雀翎) — 当 AI 说“让我想办法“，而不是“我不会“（已获Gitee官方推荐）

玄同 765 大语言模型 (LLM) 开发工程师 | 中国传媒大学 · 数字媒体技术（智能交互与游戏设计） ZEEKLOG · 个人主页 | GitHub · Follow 关于作者 * 深耕领域：大语言模型开发 / RAG 知识库 / AI Agent 落地 / 模型微调 * 技术栈：Python | RAG (LangChain / Dify + Milvus) | FastAPI + Docker * 工程能力：专注模型工程化部署、知识库构建与优化，擅长全流程解决方案「让 AI 交互更智能，让技术落地更高效」欢迎技术探讨与项目合作，解锁大模型与智能交互的无限可能！ FinchBot (雀翎) — 当 AI 说"让我想办法"而不是"我不会&

Flutter 三方库 odoo_repository 的鸿蒙化适配指南 - 连接 Odoo 企业管理系统、实现端侧数据缓存、记录同步与 CRUD 抽象

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 odoo_repository 的鸿蒙化适配指南 - 连接 Odoo 企业管理系统、实现端侧数据缓存、记录同步与 CRUD 抽象前言在 Flutter for OpenHarmony 的企业级应用开发中，对接 Odoo（开源 ERP）是一项常见的业务需求。odoo_repository 是一个提供了高级抽象的服务层库，它不仅封装了复杂的 XML-RPC 调用，还内置了本地缓存机制和离线同步逻辑。本文将详细讲解如何在鸿蒙端利用该库构建一个高效、稳定的 Odoo 移动端助手。一、原理解析 / 概念介绍 1.1 基础原理 odoo_repository 采用了 Repository

【免费下载】 CentOS 7.6 国内镜像下载地址

CentOS 7.6 国内镜像下载地址【下载地址】CentOS7.6国内镜像下载地址CentOS 7.6 国内镜像下载地址本仓库提供了一个资源文件的下载，文件名为 `CentOS-7-x86_64-DVD-1810.iso`，该文件是 CentOS 7.6 的 ISO 镜像文件项目地址: https://gitcode.com/Open-source-documentation-tutorial/85a54 本仓库提供了一个资源文件的下载，文件名为 CentOS-7-x86_64-DVD-1810.iso，该文件是 CentOS 7.6 的 ISO 镜像文件。文件描述 * 文件名: CentOS-7-x86_64-DVD-1810.iso * 描述: 该文件是 CentOS 7.6 的完整安装镜像，

一、引言

1、什么是Docker

2、什么是Ollama

二、准备工作

1、操作系统

2、镜像准备

三、安装

1、安装Docker

2、启动Ollama

3、拉取Deepseek大模型

4、启动Deepseek

Read more

人工智能：大模型高效推理与部署技术实战

【开源发布】FinchBot (雀翎) — 当 AI 说“让我想办法“，而不是“我不会“（已获Gitee官方推荐）

Flutter 三方库 odoo_repository 的鸿蒙化适配指南 - 连接 Odoo 企业管理系统、实现端侧数据缓存、记录同步与 CRUD 抽象

【免费下载】 CentOS 7.6 国内镜像下载地址