如何通过 3 个简单步骤在 Windows 上本地运行 DeepSeek

Ne0inhk

15 Mar 2026 — 4 min read

它是免费的——社区驱动的人工智能💪。

当 OpenAI 第一次推出定制 GPT 时，我就明白会有越来越多的人为人工智能做出贡献，并且迟早它会完全由社区驱动。

但从来没有想过它会如此接近😂让我们看看如何在 Windows 机器上完全免费使用第一个开源推理模型！

步骤 0：安装 Docker 桌面

我确信很多人已经安装了它，所以可以跳过，但如果没有 — — 这很简单，只需访问Docker 的官方网站，下载并运行安装 👍

如果您需要一些特定的设置，例如使用 WSL，那么有很多指导视频，请查看！我将继续下一步。

步骤 1：安装 CUDA 以获得 GPU 支持

如果您想使用 Nvidia 显卡运行 LLM，则必须安装 CUDA 驱动程序。（嗯……是的，它们需要大量的计算能力）

打开CUDA 下载页面，根据需要点击“Windows”和其他选项，然后选择“本地”作为安装程序类型：

下载并完成安装即可👍，此处需要重新启动。

第 2 步：安装 Ollama 并下载模型

前往Ollama 网站并点击下载按钮 😆

Ollama是一款开源 AI 工具，使用户能够在其设备上本地运行大型语言模型，为自然语言处理任务提供定制化、高效和离线功能。

安装后，打开“Windows PowerShell”

并通过运行来验证您的安装ollama -v：

再次打开ollama网站并选择您的型号：

有几种选择，我建议从 7b 开始，并检查它如何与您的机器配合使用。例如，我运行 i7-11 系列处理器和 NVIDIA GeForce RTX 2080 SUPER 以及 8GB GPU，我可以在正常（可以说是“可接受的”）速度下使用 14b 型号。

正如我所说，它需要大量的计算能力

选择后，点击复制按钮：

并在 PowerShell 中运行：

它将像上面一样下载并打开 shell，您可以在这里直接与它聊天，但是让我们/bye对它说，并继续设置一个实际的 UI，而不是从 PowerShell 提示 💪

步骤3：安装Open-WebUI

打开github 页面，找到“ Open WebUI with Nvidia GPU support”

复制该命令并再次在 PowerShell 中运行它。它将下载所有需要的 docker 镜像并运行容器，您可以通过http://localhost:3000/访问该容器

对于任何 LLM 用户来说，这都是一个熟悉的用户界面，左侧边栏用于聊天，左上角可用于选择已安装的模型等。

Open-WebUI 具有大量功能，例如 RAG、图像生成、网页浏览等。您可以在此处查看完整列表

社区驱动的人工智能← 获取有关人工智能的更多内容 👍

所有信息和观点均仅代表我个人的见解。

如果您喜欢此文章，请收藏、点赞、评论，谢谢，祝您快乐每一天。

【Docker进阶篇】告别OOM Kill！Java容器化内存与CPU限制实战指南

🍃 予枫：个人主页 📚 个人专栏: 《Java 从入门到起飞》《读研码农的干货日常》 💻 Debug 这个世界，Return 更好的自己！引言做Java容器化部署的小伙伴，大概率都踩过这样的坑：明明给容器配置了–memory限制，JVM也设了-Xmx参数，结果应用还是频繁被OOM Kill；要么就是CPU限制设太高，资源浪费严重，设太低又导致应用卡顿。今天就彻底搞懂Java容器化中CPU和内存限制的核心逻辑，避开配置陷阱，让应用稳定运行不翻车！文章目录 * 引言 * 一、为什么Java容器化，内存和CPU配置容易出问题？ * 二、容器内存限制（--memory）配置指南（重点避坑） * 2.1 容器内存的组成的部分 * 2.2 内存配置黄金比例（实战可用） * 实战示例（重点） * 2.3 关键避坑点（必看） * 三、容器CPU限制（--cpus）

Flutter 三方库 openapi_dart_common 的鸿蒙化适配指南 - 实现具备强类型契约的高性能 API 通讯模型、支持端侧 OpenAPI/Swagger 协议的自动化生成与对齐实战

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 openapi_dart_common 的鸿蒙化适配指南 - 实现具备强类型契约的高性能 API 通讯模型、支持端侧 OpenAPI/Swagger 协议的自动化生成与对齐实战前言在进行 Flutter for OpenHarmony 的企业级前后端分离开发时，如何保证客户端请求代码与后端 API 定义的绝对同步？手动编写 API 模型不仅低效，且极易引发类型不匹配导致的生产 Bug。openapi_dart_common 是 OpenAPI (Swagger) 官方生成器在 Dart 端的基石库。它提供了一套标准的序列化、参数处理及抽象拦截器机制。本文将探讨如何在鸿蒙端构建极致稳健的工程化接口层。一、原直观解析 / 概念介绍 1.1

Flutter 三方库 mobx_codegen — 自动化驱动的高性能响应式状态管理（适配鸿蒙 HarmonyOS Next ohos）

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net。在 Flutter 状态管理的璀璨星空中，MobX 以其“透明的函数式响应式编程”（TFRP）特性脱颖而出。它让开发者能以声明式的方式描述状态，而让框架自动处理状态变更到 UI 刷新的全过程。在 Flutter for OpenHarmony 开发中，手动编写 MobX 繁琐的连接代码不仅效率低，且容易出错。mobx_codegen 库通过解析注解，自动生成高性能的底层观察逻辑。今天，我们将探索如何利用自动化力量，在鸿蒙平台上构建出极其灵动的响应式应用。一、为什么需要 mobx_codegen？ 1.1 MobX 的魔法核心 MobX 包含三个核心概念：Observables（被观察的状态）、Actions（改变状态的动作）和 Reactions（对新状态的自动响应）

服务器HBA卡与RAID卡：到底有什么区别？

1.本质定义与功能定位 1.1 HBA卡（主机总线适配器）定义：HBA（Host Bus Adapter）是连接服务器内部I/O通道与外部存储设备的硬件接口卡，主要承担协议转换和物理连接功能。核心功能： * 提供高速数据传输通道 * 实现协议转换（如SCSI、SAS、SATA、FC等） * 将存储设备透明呈现给操作系统 * 支持直接设备访问，无中间处理层 1.2 RAID卡（磁盘阵列控制器）定义：RAID（Redundant Array of Independent Disks）卡是专门管理多个硬盘组成磁盘阵列的硬件控制器，具备数据冗余和性能优化功能。核心功能： * 实现RAID级别配置（RAID 0/1/5/6/10等） * 提供数据冗余保护与容错机制 * 优化磁盘读写性能（条带化、缓存等） * 支持热插拔与故障磁盘替换