跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PowerShellAI算法

如何在 Windows 本地部署开源大语言模型:基于 Ollama 与 Open WebUI

在 Windows 系统上通过 Docker、CUDA 驱动、Ollama 及 Open WebUI 本地部署和运行开源大语言模型的完整流程。首先安装 Docker Desktop 和 NVIDIA CUDA 驱动以支持 GPU 加速,随后使用 Ollama 下载并运行模型,最后通过 Open WebUI 提供图形化界面进行交互。该方案无需云端 API,适合隐私保护及离线场景,支持 RAG、图像生成等功能。

魔尊发布于 2026/2/9更新于 2026/6/629 浏览
如何在 Windows 本地部署开源大语言模型:基于 Ollama 与 Open WebUI

在 Windows 上本地运行开源大语言模型

本文介绍如何在 Windows 机器上通过 Docker、CUDA 驱动、Ollama 和 Open WebUI 免费本地运行大型语言模型(LLM)。

步骤 0:安装 Docker Desktop

如果您尚未安装 Docker,请访问 Docker 官方网站下载并运行安装程序。如需使用 WSL 等特定设置,请参考相关文档。安装完成后继续下一步。

步骤 1:安装 CUDA 以获得 GPU 支持

若需使用 NVIDIA 显卡运行 LLM,必须安装 CUDA 驱动程序以利用计算能力。

  1. 打开 CUDA 下载页面。
  2. 选择 "Windows" 及相应选项。
  3. 将安装程序类型设置为 "本地"。
  4. 下载并完成安装,随后重启计算机。

文章配图

步骤 2:安装 Ollama 并下载模型

Ollama 是一款开源 AI 工具,允许用户在本地设备上运行大型语言模型,提供定制化、高效和离线功能。

  1. 前往 Ollama 官网点击下载按钮。
  2. 安装后打开 Windows PowerShell。
  3. 运行以下命令验证安装:
ollama -v

文章配图

  1. 访问 Ollama 网站选择模型。建议从 7B 参数版本开始,根据硬件性能调整(例如 i7 处理器 + RTX 2080 SUPER 可尝试 14B 模型)。
  2. 复制模型名称并在 PowerShell 中运行:
ollama run <model_name>

文章配图

模型将自动下载并启动 Shell,您可以直接对话。输入 /bye 退出,继续配置图形界面。

步骤 3:安装 Open WebUI

Open WebUI 提供了熟悉的聊天界面,支持 RAG、图像生成、网页浏览等功能。

  1. 访问 GitHub 仓库页面,找到 "Open WebUI with Nvidia GPU support"。
  2. 复制提供的 Docker 运行命令。
  3. 在 PowerShell 中执行该命令,它将拉取镜像并启动容器。
docker run -d --name open-webui -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --restart always ollama/ollama:latest

*注意:请根据实际仓库提供的最新命令替换上述示例命令。

安装完成后,可通过 http://localhost:3000/ 访问界面。左侧边栏用于聊天,顶部可选择已安装的模型。

文章配图

总结

通过上述步骤,您可以在本地构建一个功能完整的 AI 助手环境。该方案无需云端 API,数据隐私性更强,且支持离线使用。Open WebUI 还支持扩展功能如知识库检索(RAG),适合个人开发及研究场景。

目录

  1. 在 Windows 上本地运行开源大语言模型
  2. 步骤 0:安装 Docker Desktop
  3. 步骤 1:安装 CUDA 以获得 GPU 支持
  4. 步骤 2:安装 Ollama 并下载模型
  5. 步骤 3:安装 Open WebUI
  6. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • C++与Rust数据交互与内存安全传递技术
  • 高版本 Python pyc 文件反编译失败与残缺问题的 AI 辅助解决方案
  • 零基础转行 Python 工程师:我的学习路径与实战经验总结
  • Java 核心语法与并发编程实战示例
  • SpringBoot 国际化 i18n 实战:配置文件与动态切换方案
  • C++ 关联式容器:map 与 set 详解
  • 大模型混战时代互联网企业的转型与应对策略
  • 时序数据库选型指南:Apache IoTDB 核心优势与评估维度
  • 本周 GitHub 爆火!10 个开源神器,彻底改变你的 AI 开发效率
  • Python 非官方 Google 搜索 API 使用指南
  • AI 安全实战:基于 Stable Diffusion 的视觉提示词注入攻击研究
  • Superpowers:用工程流程纪律驯化 Claude Code 实现可靠交付
  • 链表在内存管理与缓存淘汰中的应用
  • 基于混元 AIGC 与腾讯云智能体的文思通智能写作助手构建
  • Python 和 PyCharm 安装配置教程
  • AI 辅助撰写学术论文综述的方法与实践指南
  • AI 辅助快速生成 Mermaid 图表实战指南
  • Python Flask 二手交易平台设计与实现
  • 二分查找实战:山脉数组的峰顶索引与寻找峰值
  • 中国人工智能大模型技术白皮书核心内容解读

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online