解锁DeepSeek潜能：Docker+Ollama打造本地大模型部署新范式

Ne0inhk

15 Mar 2026 — 6 min read

🐇明明跟你说过：个人主页

🏅个人专栏：《深度探秘：AI界的007》 🏅

🔖行路有良友，便是天堂🔖

一、引言

1、什么是Docker

Docker：就像一个“打包好的App”

想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

“这个软件需要 Python 3.8，但我只有 Python 3.6！”
“我没有你用的那个库，安装失败了！”
“你的程序要跑在 Linux，我的电脑是 Windows！”

💡 Docker 的作用：它就像一个“打包好的 App”，把你的软件、依赖、环境、系统配置等 全部封装到一个“容器” 里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

🚀 把 Docker 想象成“集装箱”

传统运输 vs. 集装箱运输

以前（传统部署）：

货物（程序）需要不同的包装方式（运行环境）
货物可能损坏（环境不兼容）
装卸麻烦（程序迁移难）

有了 Docker（容器部署）：

货物装进标准化集装箱（Docker 容器）
不管运到哪里，集装箱里东西不变（程序环境一致）
码头和船只可以直接装卸（轻松部署到不同系统）

Docker 让软件像“集装箱”一样标准化、可移植、易部署！ 🚢

2、什么是Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你 在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

💡 简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

🚀 Ollama 的核心特点

本地运行 🏠
- 你不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型 📚
- 可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用 🔧
- 只需要几条命令，就能下载并运行 AI 模型。
轻量化优化 ⚡
- 适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理 🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

二、准备工作

1、操作系统

这里我们使用的操作系统为Centos 7.9，配置为4核8G，大家也可以使用其他的Linux发行版本，或者使用Windows。

2、镜像准备

如果已经安装了Docker，可以提前准备好镜像，ollama/ollama，镜像比较大，拉取会耗一些时间

三、安装

1、安装Docker

1.关闭防火墙

systemctl stop firewalld && systemctl disabled firewalld

2.关闭SELinux

setenforce 0

3.更换yum源

rm -f /etc/yum.repos.d/* curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum clean all && yum makecache

4.安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

5. 添加Docker源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

6.安装Docker

yum install docker-ce -y

7.添加Docker镜像加速器

vim /etc/docker/daemon.json # 添加如下内容 { "registry-mirrors": [ "https://docker.m.daocloud.io", "https://noohub.ru", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com", "https://5tqw56kt.mirror.aliyuncs.com", "https://docker.1panel.live", "http://mirrors.ustc.edu.cn/", "http://mirror.azure.cn/", "https://hub.rat.dev/", "https://docker.ckyl.me/", "https://docker.chenby.cn", "https://docker.hpcloud.cloud", "https://docker.m.daocloud.io" ] }

8.启动Docker

systemctl start docker

2、启动Ollama

1.启动Ollama容器

docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run 运行一个新的 Docker 容器
-itd 组合多个选项：
- ✅ -i（保持标准输入）
- ✅ -t（分配终端）
- ✅ -d（后台运行容器）
-v ollama:/root/.ollama 挂载数据卷，把 ollama 这个 Docker 数据卷绑定到容器的 /root/.ollama 目录，确保数据持久化（如下载的模型不会丢失）。
-p 11434:11434 端口映射，把宿主机（本机）的 11434 端口映射到容器内部的 11434 端口，这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
--name ollama 指定容器名称为 ollama，方便管理和启动。
ollama/ollama 使用的 Docker 镜像，这里是官方的 Ollama 镜像。

如果是使用GPU运行，则用下面的命令启动

docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama

2.查看Ollama容器

docker ps

3、拉取Deepseek大模型

1.进入到容器中

docker exec -it ollama /bin/bash

2.拉取模型

ollama pull deepseek-r1:7b

在官网中，有许多Deepseek的模型，这里主要是演示，所以拉取了一个较小的模型

官网地址：deepseek-r1

3.查看模型

ollama list

4、启动Deepseek

ollama run deepseek-r1:7b

💕💕💕每一次的分享都是一次成长的旅程，感谢您的陪伴和关注。希望这些文章能陪伴您走过技术的一段旅程，共同见证成长和进步！😺😺😺

🧨🧨🧨让我们一起在技术的海洋中探索前行，共同书写美好的未来！！！

Java Web 开发环境搭建：IDEA+Tomcat 安装与部署超详细教程

在 Java Web 开发中，IDEA 作为主流的集成开发工具，搭配 Tomcat 轻量级 Web 服务器是入门首选。本文将基于 Java Web 基础开发要求，从 JDK 环境配置、Tomcat 安装配置、IDEA 安装、Web 项目创建，到 Tomcat 在 IDEA 中的部署运行，进行一步一图式详细讲解，零基础也能轻松上手。一、前置准备：JDK 环境配置 Java Web 开发的核心基础是 JDK，Tomcat 和 IDEA 的运行都依赖 JDK 环境，需先完成 JDK 的安装与环境变量配置。 1. 下载与安装

InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频支持50系显卡 ComfyUI+WebUI 一键整合包下载

InfiniteTalk 是一个能根据音频生成无限时长人物说话/唱歌视频的AI模型，无论是给现有视频配音，还是让静态图片“开口说话”，还是让人物图片“唱歌”，它都能实现精准的唇形同步和自然的肢体动作。今天分享的 InfiniteTalk V2版，基于上个版本的工作流更新升级，新增了适合新手小白操作的WebUI，如果是使用ComfyUI且下载过上个ComfyUI的老司机，无需下载这个版本。WebUI支持自定义切换Wan主模型和InfiniteTalk 模型，网盘自带Q4和Q8两个版本，大家根据自己的显卡切换。当前WebUI只支持单人生成，下个版本会集成双人版。下载地址：点此下载核心特点 ‌ 全维度同步‌ 不仅唇形与音频匹配，还会自动生成对应的‌头部转动、身体姿态和面部表情‌，让虚拟人物更生动。传统配音工具只调整嘴唇，而InfiniteTalk连肢体语言一起模拟。无限时长生成‌ 支持超长视频生成（如1小时以上），通过分段处理技术保证连贯性。普通AI视频模型通常限制在几十秒内。双模式输入‌ ‌ 视频+音频‌：给现有视频换配音（如翻译配音、内容修改

《C++ Web 自动化测试实战：常用函数全解析与场景化应用指南》

🔥草莓熊Lotso：个人主页 ❄️个人专栏: 《C++知识分享》《Linux 入门到实践：零基础也能懂》 ✨生活是默默的坚持，毅力是永久的享受！ 🎬 博主简介：文章目录 * 前言： * 一. 元素定位：自动化测试的 “精准导航” * 1.1 cssSelector：简洁高效的选择器 * 1.2 xpath：灵活强大的路径语言 * 二. 测试对象操作：定位后的 “核心动作” * 2.1 点击与提交：触发页面交互 * 2.2 文本输入与清除：模拟用户输入 * 2.3 文本与属性获取：验证测试结果 * 三. 窗口与弹窗控制：解决 “多窗口与弹窗干扰” * 3.1 窗口控制：句柄是关键 * 3.

PDF压缩工具：纯前端、开源、高效智能的本地压缩方案（在线demo+实现思路）

在日常办公和文件管理中，PDF文件体积过大常常带来诸多困扰：邮件附件发送受限、云端存储空间紧张、文档传输耗时过长。一个安全、高效且不泄露隐私的PDF压缩工具，成为许多用户和开发者的刚需。为此，吾爱IIS（52IIS.COM）推出了这款完全开源的 PDF压缩工具。它采用先进的纯前端技术，通过智能优化图片质量和移除冗余数据，在保证可读性的前提下显著减小PDF文件体积。所有处理均在浏览器本地完成，确保您的文档隐私零泄露。作为开源项目，您可以在 GitHub 上查看其完整源代码。 ✨ 核心功能亮点 1. 智能压缩，灵活可控 * 多级压缩质量：提供高质量（较小压缩）、中等质量（推荐）和低质量（最大压缩）三种预设，满足不同场景需求。 * 精细图片质量控制：通过直观的滑块（10%-100%），可精确控制PDF中图片的压缩程度，在文件大小和视觉效果间找到最佳平衡。 2. 批量处理，高效便捷 * 支持同时选择多个PDF文件进行压缩，大幅提升处理效率。 * 压缩完成后，可单独下载每个文件，或一键打包下载所有压缩后的文件。

一、引言

1、什么是Docker

2、什么是Ollama

二、准备工作

1、操作系统

2、镜像准备

三、安装

1、安装Docker

2、启动Ollama

3、拉取Deepseek大模型

4、启动Deepseek

Read more

Java Web 开发环境搭建：IDEA+Tomcat 安装与部署超详细教程

InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频 支持50系显卡 ComfyUI+WebUI 一键整合包下载

《C++ Web 自动化测试实战：常用函数全解析与场景化应用指南》

PDF压缩工具：纯前端、开源、高效智能的本地压缩方案（在线demo+实现思路）

InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频支持50系显卡 ComfyUI+WebUI 一键整合包下载