Open-WebUI—开箱即用的AI对话可视化神器

优质文章学习记录

10 Apr 2026 — 6 min read

你是否曾兴奋地在本地部署了Ollama，却很快被冰冷的命令行和繁琐的指令劝退？是否羡慕ChatGPT那样优雅的聊天界面，却又希望数据能牢牢掌握在自己手中？OpenWebUI。这个在GitHub上狂揽 110,000 Stars 的明星项目，完美地解决了所有痛点

github地址： https://github.com/open-webui/open-webui

1.什么是Open WebUI？

Open WebUI 是一款专为大型语言模型（LLM）设计的 开源可视化交互框架，它通过简洁的Web界面，让用户无需编写代码即可与本地部署的AI模型/各大服务商提供大模型API（如DeepSeek、Llama、ChatGLM等）进行自然对话。其核心使命是 “让LLM私有化部署像打开浏览器一样简单” ，尤其适合需要快速搭建企业级AI平台或追求数据隐私的开发者。

2. 核心价值

开箱即用：无需复杂的前端开发，快速搭建 AI 交互界面。完全开源，可自由部署、修改和二次开发，无商业使用限制。
多模型支持：兼容 Ollama、OpenAI API（包括百炼、DeepSeek 等）。
功能丰富：支持 RAG（检索增强生成）、多模态输入（文本、图片）、网络搜索等高级功能。支持对话历史管理、提示词模板、上下文连续对话、Markdown 渲染、代码高亮等实用功能。
本地部署：数据完全存储在本地，保障隐私安全。

3. 功能概览

模块	能力	价值
模型管理	多后端支持、模型下载/切换/加载、参数实时调整	统一管理入口，灵活适配不同场景
交互体验	类 ChatGPT 界面、代码高亮、Markdown 渲染、多会话管理	降低使用门槛，提供流畅体验
知识管理	文档上传、知识库构建、语义搜索、上下文增强	利用私有数据提升回答准确性
高级功能	工具调用、Web 搜索集成、提示词工作流、多模态支持	扩展模型能力边界，实现任务自动化
用户管理	多用户系统、角色权限控制、团队协作	满足企业级部署需求，保障数据安全
部署隐私	全离线、自托管、Docker 容器化、数据本地存储	彻底掌控数据，保障隐私安全

4. 安装Ollama（Linux）

本次实验环境为 Rocky Linux , IP 地址配置为 192.168.31.254

打开终端，通过官方脚本安装 Ollama

curl -fsSL https://ollama.com/install.sh |sh

但是这个下载太慢，是因为国内访问 https://ollama.com/download 太慢，这里使用加速的方法：

# 下载安装脚本curl -fsSL https://ollama.com/install.sh -o ollama_install.sh # 给脚本添加执行权限chmod +x ollama_install.sh # 替换下载地址sed -i 's|https://github.com|https://gh-proxy.ygxz.in/https://github.com|g' ollama_install.sh # 开始安装sh ollama_install.sh

也可以手动安装：

下载地址为: https://ollama.com/download/ollama-linux-amd64.tgz

这里使用手动安装的方式，先试用迅雷等下载工具，下载安装包，下载完毕后，上传到 Linux 系统 /usr/local/src目录下备用,完整文件为 : /usr/local/src/ollama-linux-amd64.tgz

# 进入目录cd /usr/local/src # 创建目录mkdir /usr/local/ollama # 解压到创建的目录tar -xzvf ollama-linux-amd64.tgz -C /usr/local/ollama # 创建运行用户和用户组sudouseradd -r -s /bin/false -U -m -d /usr/share/ollama ollama sudousermod -a -G ollama $(whoami)# 添加环境变量echo"PATH=$PATH:/usr/local/ollama/bin">> etc/profile # 环境变量生效source ect/profile

配置Linux服务：

vim /etc/systemd/system/ollama.service 内容如下：

[Unit]Description=Ollama Service After=network-online.target [Service]ExecStart=/usr/local/ollama/bin/ollama serve User=ollama Group=ollama Restart=always RestartSec=3Environment="OLLAMA_HOST=0.0.0.0"# 关键配置：允许外部访问[Install]WantedBy=multi-user.target

# 重新载入配置sudo systemctl daemon-reload # 启动服务sudo systemctl start ollama # 查看状态sudo systemctl status ollama # 开机启动sudo systemctl enable ollama

下载模型：

# 查看已安装的模型 ollama list # 拉取模型,这里作为演示，拉取的0.6b qw3模型，大概 523MB 左右 ollama pull qwen3:0.6b # 查看模型详情 ollama show qwen3:0.6b # 测试 curl http://localhost:11434/api/generate -d '{ "model": "qwen3:0.6b", "prompt":"介绍一下React，20字以内" }'

5. Open WebUI安装

Open WebUI 支持多种安装方式，推荐使用 Docker 部署（最简单高效），也可通过源码编译安装（适合需要定制开发的场景）。
执行命令：（假设服务器IP地址为192.168.31.254 在本机上运行）, 服务器防火墙开放 3000端口。如果是做实验用，直接关闭防火墙

docker run -d -p 3000:8080 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui:main

-p 3000:8080：将容器内 8080 端口映射到本地 3000 端口（本地端口可修改，如 -p 80:8080）。
-v open-webui:/app/backend/data：使用数据卷持久化对话历史、配置等数据，避免容器删除后数据丢失。
--restart always：设置容器开机自启。

浏览器打开： http://192.168.31.254:3000

6. Open WebUI基本使用

6.1 初次登录

首次访问 Open WebUI 时，需注册管理员账号（输入用户名、密码即可）。

创建完账号后，使用账号登录

6.2 配置

禁用官方链接，如果不进行这一步，很有可能响应会非常慢，因为国内网络无法直接连上，所以系统会多次尝试，操作路径： 管理员面板/设置/外部连接

修改本地Ollama 服务地址：

6.3 开始聊天

选择下载好的模型：

Continue插件实现本地部署一个“cursor”或“github copilot”

本地部署 AI 代码助手，制作一个 Cursor/GitHub Copilot 的替代版本一需求分析 * 本地部署的定义与优势（数据隐私、离线使用、定制化）。 * Cursor 与 GitHub Copilot 的功能（代码补全、对话交互、模型差异）。 * 本地部署的AI 代码助手适用场景：企业内网开发、敏感数据环境。二环境准备与工具选择 * 硬件要求：GPU 要对应上你所部署的模型大小 * 模型选择：qwen2.5-14b-instruct （这里选择千问的大模型）三部署开源模型这里不详细介绍具体的大模型部署的具体过程，部署完成之后，你应该得到对应的模型的以下信息 model: "qwen2.5-14b-instruct" apiBase: "http://你的ip地址（自己的本机就写localhost）

vscode copilot 的配置文件提示警告

Claude 桌面版竟然是实时的。 vscode copilot 的配置文件提示 [{ “resource”: “/d:/.vscode/User/globalStorage/github.copilot-chat/ask-agent/Ask.agent.md”, “owner”: “prompts-diagnostics-provider”, “severity”: 4, “message”: “未知工具 “github/issue_read”。”, “startLineNumber”: 7, “startColumn”: 51, “endLineNumber”: 7, “endColumn”: 70 },{ “resource”: “/d:/.vscode/User/globalStorage/github.copilot-chat/ask-agent/Ask.agent.md”, “owner”: “prompts-diagnostics-provider”, “severity”: 4, “message”: “未知工具

别瞎改了！直接抄DeepSeek这5大降AIGC指令，搭配3款超有效工具，亲测98%暴降至5%！

毕业季最让人崩溃的瞬间，莫过于信心满满地把DeepSeek辅助写的论文传上去，结果查重报告一片红，AIGC检测率飙到90%以上。别慌！作为过来人，学姐告诉大家：AI生成的痕迹其实是有解决办法的。只要你懂得如何指挥DeepSeek自己净化自己，或者用对专业的辅助工具，把AI率降到5%以下真的不是梦。今天这篇文章，直接上干货。前半部分是5条经过实测的DeepSeek专属降AI指令，后半部分推荐3款确实能把AI率降下来的工具。建议先收藏，改论文时直接复制使用。一、【硬核实操】DeepSeek五大深度降AI指令这部分是核心干货。为了让DeepSeek更好地执行，我将所有复杂的降AI技巧整合成了一段完整、连续的指令。你只需要把论文分段，然后配合下面的指令发送即可，记得要开深度思考和联网搜索哦~ 💡 指令1：针对假大空特征【原理解析】 AI生成内容最容易被判定为机器痕迹的原因，是大量使用高频、通俗的万能词。根据同义词替换策略，我们需要强制模型调用学术语料库。 📋 复制这段Prompt发送给DeepSeek：请针对这段文字进行深度学术化重写，重点在于提升词汇的

大模型本地部署神器：llama.cpp使用介绍

介绍llama.cpp 本节主要介绍什么是llama.cpp，以及llama.cpp、llama、ollama的区别。同时说明一下GGUF这种模型文件格式。什么是llama.cpp llama.cpp是一个由Georgi Gerganov开发的高性能C++库，主要目标是在各种硬件上（本地和云端）以最少的设置和最先进的性能实现大型语言模型推理。主要特点： * 纯C/C++实现，没有任何依赖 * 对Apple Silicon（如M1/M2/M3芯片）提供一流支持 - 通过ARM NEON、Accelerate和Metal框架优化 * 支持x86架构的AVX、AVX2、AVX512和AMX指令集 * 支持1.5位、2位、3位、4位、5位、6位和8位整数量化，实现更快的推理和更低的内存使用 * 为NVIDIA GPU提供自定义CUDA内核（通过HIP支持AMD GPU，通过MUSA支持摩尔线程MTT GPU）