解锁DeepSeek潜能：Docker+Ollama打造本地大模型部署新范式

Ne0inhk

15 Mar 2026 — 6 min read

🐇明明跟你说过：个人主页

🏅个人专栏：《深度探秘：AI界的007》 🏅

🔖行路有良友，便是天堂🔖

一、引言

1、什么是Docker

Docker：就像一个“打包好的App”

想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

“这个软件需要 Python 3.8，但我只有 Python 3.6！”
“我没有你用的那个库，安装失败了！”
“你的程序要跑在 Linux，我的电脑是 Windows！”

💡 Docker 的作用：它就像一个“打包好的 App”，把你的软件、依赖、环境、系统配置等 全部封装到一个“容器” 里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

🚀 把 Docker 想象成“集装箱”

传统运输 vs. 集装箱运输

以前（传统部署）：

货物（程序）需要不同的包装方式（运行环境）
货物可能损坏（环境不兼容）
装卸麻烦（程序迁移难）

有了 Docker（容器部署）：

货物装进标准化集装箱（Docker 容器）
不管运到哪里，集装箱里东西不变（程序环境一致）
码头和船只可以直接装卸（轻松部署到不同系统）

Docker 让软件像“集装箱”一样标准化、可移植、易部署！ 🚢

2、什么是Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你 在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

💡 简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

🚀 Ollama 的核心特点

本地运行 🏠
- 你不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型 📚
- 可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用 🔧
- 只需要几条命令，就能下载并运行 AI 模型。
轻量化优化 ⚡
- 适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理 🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

二、准备工作

1、操作系统

这里我们使用的操作系统为Centos 7.9，配置为4核8G，大家也可以使用其他的Linux发行版本，或者使用Windows。

2、镜像准备

如果已经安装了Docker，可以提前准备好镜像，ollama/ollama，镜像比较大，拉取会耗一些时间

三、安装

1、安装Docker

1.关闭防火墙

systemctl stop firewalld && systemctl disabled firewalld

2.关闭SELinux

setenforce 0

3.更换yum源

rm -f /etc/yum.repos.d/* curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum clean all && yum makecache

4.安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

5. 添加Docker源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

6.安装Docker

yum install docker-ce -y

7.添加Docker镜像加速器

vim /etc/docker/daemon.json # 添加如下内容 { "registry-mirrors": [ "https://docker.m.daocloud.io", "https://noohub.ru", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com", "https://5tqw56kt.mirror.aliyuncs.com", "https://docker.1panel.live", "http://mirrors.ustc.edu.cn/", "http://mirror.azure.cn/", "https://hub.rat.dev/", "https://docker.ckyl.me/", "https://docker.chenby.cn", "https://docker.hpcloud.cloud", "https://docker.m.daocloud.io" ] }

8.启动Docker

systemctl start docker

2、启动Ollama

1.启动Ollama容器

docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run 运行一个新的 Docker 容器
-itd 组合多个选项：
- ✅ -i（保持标准输入）
- ✅ -t（分配终端）
- ✅ -d（后台运行容器）
-v ollama:/root/.ollama 挂载数据卷，把 ollama 这个 Docker 数据卷绑定到容器的 /root/.ollama 目录，确保数据持久化（如下载的模型不会丢失）。
-p 11434:11434 端口映射，把宿主机（本机）的 11434 端口映射到容器内部的 11434 端口，这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
--name ollama 指定容器名称为 ollama，方便管理和启动。
ollama/ollama 使用的 Docker 镜像，这里是官方的 Ollama 镜像。

如果是使用GPU运行，则用下面的命令启动

docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama

2.查看Ollama容器

docker ps

3、拉取Deepseek大模型

1.进入到容器中

docker exec -it ollama /bin/bash

2.拉取模型

ollama pull deepseek-r1:7b

在官网中，有许多Deepseek的模型，这里主要是演示，所以拉取了一个较小的模型

官网地址：deepseek-r1

3.查看模型

ollama list

4、启动Deepseek

ollama run deepseek-r1:7b

💕💕💕每一次的分享都是一次成长的旅程，感谢您的陪伴和关注。希望这些文章能陪伴您走过技术的一段旅程，共同见证成长和进步！😺😺😺

🧨🧨🧨让我们一起在技术的海洋中探索前行，共同书写美好的未来！！！

通过URI Scheme实现从Web网页上打开本地C++应用程序（以腾讯会议为例，附完整实现源码）

目录 1、需求描述 2、选择URI Scheme实现 3、何为URI Scheme？ 4、将自定义的URL Scheme信息写入注册表的C++源码实现 5、如何实现最开始的3种需求 6、后续需要考虑的细节问题之前陆续收到一些从Web页面上启动我们C++客户端软件的需求，希望我们能提供一些技术上的支持与协助，支持从Web网页上将我们的C++客户端软件启动起来。于是我大概地研究了相关的实现方法，下面把研究的过程与结果在此做一个分享，希望能给大家提供一个借鉴或参考。 C++软件异常排查从入门到精通系列教程（核心精品专栏，订阅量已达10000多个，欢迎订阅，持续更新...）https://blog.ZEEKLOG.net/chenlycly/article/details/125529931C/C++实战专栏（重点专栏，专栏文章已更新500多篇，订阅量已达8000多个，欢迎订阅，持续更新中...）https://blog.ZEEKLOG.net/

Web 聊天室消息加解密方案详解

目录编辑一、Web 聊天室消息加解密需求与技术约束 1.1 核心安全需求 1.2 技术约束二、主流消息加解密方案详解 2.1 方案 1：对称加密（AES-256-GCM） 2.1.1 方案概述 2.1.2 核心原理 2.1.3 实现步骤（分场景）场景 1：单聊加密场景 2：群聊加密 2.1.4 代码实现（前端 + 后端）前端（Vue3 + Web Crypto API）后端（

免费开源！50+算法，Java基于YOLO框架的视频AI识别算法平台，适配低空无人机巡检、摄像头安防场景

文末联系小编，获取项目源码 YOLO视频AI识别算法管理平台核心是 YOLO v8神经网络模型的推理运算，推理运算涉及操作CPU内存、GPU内存、GPU并行计算等环节，这些环节可通过Python或C++来实现，每隔1分钟将推理结果信息和对应的图片推送到文件服务器MinIO和消息队列RocketMQ，便于开发者获取到推理结果进行业务开发。同时支持基于ONNX的推理运算和基于Tensorrt的加速推理运算两种方式，只需在调用时传递不同参数即可。 YOLO视频AI识别算法管理平台支持Linux和Windows环境，代码自动判断运行的环境并执行对应的.bat或.sh脚本文件以启动AI模型推理，包含前端完整代码和后端完整代码，开箱即用，为Java开发者训练、部署、使用AI模型提供了参考。可实现人、车、火灾烟雾、河道漂浮物、道路裂痕等视频的实时识别，并将识别结果通过 FFmpeg 推流到 ZLMediaKit 流媒体服务器，使得在 Web页面上可以同时查看原始视频和实时计算视频。 YOLO（You Only Look Once）是一种基于深度神经网络的高效、实时的目标检测算法。它将目标检测

随机森林核心参数详解｜从电信客户流失实战，对比决策树看集成学习的调参逻辑

目录一、前言：为什么你调的随机森林，和决策树效果差不了多少？二、前置铺垫：随机森林的核心原理（和决策树的本质区别）三、四大核心参数详解（含决策树对比 + 实战调参） 3.1 max_depth：树的最大深度 1. 参数定义 2. 和单棵决策树的调参差异（对比参考博文） 3. 实战调参逻辑 4. 本案例效果验证 3.2 min_samples_split：分裂内部节点所需的最小样本数 1. 参数定义 2. 和单棵决策树的调参差异 3. 实战调参逻辑 3.3 min_samples_leaf：叶节点所需的最小样本数 1. 参数定义 2. 和单棵决策树的调参差异 3.

一、引言

1、什么是Docker

2、什么是Ollama

二、准备工作

1、操作系统

2、镜像准备

三、安装

1、安装Docker

2、启动Ollama

3、拉取Deepseek大模型

4、启动Deepseek

Read more

通过URI Scheme实现从Web网页上打开本地C++应用程序（以腾讯会议为例，附完整实现源码）

Web 聊天室消息加解密方案详解

免费开源！50+算法，Java基于YOLO框架的视频AI识别算法平台，适配低空无人机巡检、摄像头安防场景

随机森林核心参数详解｜从电信客户流失实战，对比决策树看集成学习的调参逻辑