Open-WebUI—开箱即用的AI对话可视化神器

Open-WebUI—开箱即用的AI对话可视化神器

你是否曾兴奋地在本地部署了Ollama,却很快被冰冷的命令行和繁琐的指令劝退?是否羡慕ChatGPT那样优雅的聊天界面,却又希望数据能牢牢掌握在自己手中?OpenWebUI。这个在GitHub上狂揽 110,000 Stars 的明星项目,完美地解决了所有痛点

github地址: https://github.com/open-webui/open-webui

1.什么是Open WebUI?

Open WebUI 是一款专为大型语言模型(LLM)设计的 开源可视化交互框架,它通过简洁的Web界面,让用户无需编写代码即可与本地部署的AI模型/各大服务商提供大模型API(如DeepSeek、Llama、ChatGLM等)进行自然对话。其核心使命是 “让LLM私有化部署像打开浏览器一样简单” ,尤其适合需要快速搭建企业级AI平台或追求数据隐私的开发者。

2. 核心价值

  • 开箱即用:无需复杂的前端开发,快速搭建 AI 交互界面。完全开源,可自由部署、修改和二次开发,无商业使用限制。
  • 多模型支持:兼容 Ollama、OpenAI API(包括百炼、DeepSeek 等)。
  • 功能丰富:支持 RAG(检索增强生成)、多模态输入(文本、图片)、网络搜索等高级功能。支持对话历史管理、提示词模板、上下文连续对话、Markdown 渲染、代码高亮等实用功能。
  • 本地部署:数据完全存储在本地,保障隐私安全。

3. 功能概览

模块能力价值
模型管理多后端支持、模型下载/切换/加载、参数实时调整统一管理入口,灵活适配不同场景
交互体验类 ChatGPT 界面、代码高亮、Markdown 渲染、多会话管理降低使用门槛,提供流畅体验
知识管理文档上传、知识库构建、语义搜索、上下文增强利用私有数据提升回答准确性
高级功能工具调用、Web 搜索集成、提示词工作流、多模态支持扩展模型能力边界,实现任务自动化
用户管理多用户系统、角色权限控制、团队协作满足企业级部署需求,保障数据安全
部署隐私全离线、自托管、Docker 容器化、数据本地存储彻底掌控数据,保障隐私安全

4. 安装Ollama(Linux)

本次实验环境为 Rocky Linux , IP 地址配置为 192.168.31.254

打开终端,通过官方脚本安装 Ollama

curl -fsSL https://ollama.com/install.sh |sh

但是这个下载太慢,是因为国内访问 https://ollama.com/download 太慢,这里使用加速的方法:

# 下载安装脚本curl -fsSL https://ollama.com/install.sh -o ollama_install.sh # 给脚本添加执行权限chmod +x ollama_install.sh # 替换下载地址sed -i 's|https://github.com|https://gh-proxy.ygxz.in/https://github.com|g' ollama_install.sh # 开始安装sh ollama_install.sh 

也可以手动安装:

下载地址为: https://ollama.com/download/ollama-linux-amd64.tgz

这里使用手动安装的方式,先试用迅雷等下载工具,下载安装包,下载完毕后,上传到 Linux 系统 /usr/local/src目录下备用,完整文件为 : /usr/local/src/ollama-linux-amd64.tgz

# 进入目录cd /usr/local/src # 创建目录mkdir /usr/local/ollama # 解压到创建的目录tar -xzvf ollama-linux-amd64.tgz -C /usr/local/ollama # 创建运行用户和用户组sudouseradd -r -s /bin/false -U -m -d /usr/share/ollama ollama sudousermod -a -G ollama $(whoami)# 添加环境变量echo"PATH=$PATH:/usr/local/ollama/bin">> etc/profile # 环境变量生效source ect/profile 

配置Linux服务:

vim /etc/systemd/system/ollama.service 内容如下:

[Unit]Description=Ollama Service After=network-online.target [Service]ExecStart=/usr/local/ollama/bin/ollama serve User=ollama Group=ollama Restart=always RestartSec=3Environment="OLLAMA_HOST=0.0.0.0"# 关键配置:允许外部访问[Install]WantedBy=multi-user.target 
# 重新载入配置sudo systemctl daemon-reload # 启动服务sudo systemctl start ollama # 查看状态sudo systemctl status ollama # 开机启动sudo systemctl enable ollama 

下载模型:

# 查看已安装的模型 ollama list # 拉取模型,这里作为演示,拉取的0.6b qw3模型,大概 523MB 左右 ollama pull qwen3:0.6b # 查看模型详情 ollama show qwen3:0.6b # 测试 curl http://localhost:11434/api/generate -d '{ "model": "qwen3:0.6b", "prompt":"介绍一下React,20字以内" }'

5. Open WebUI安装

Open WebUI 支持多种安装方式,推荐使用 Docker 部署(最简单高效),也可通过源码编译安装(适合需要定制开发的场景)。
执行命令:(假设服务器IP地址为192.168.31.254 在本机上运行), 服务器防火墙开放 3000端口。如果是做实验用,直接关闭防火墙

docker run -d -p 3000:8080 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui:main 
  • -p 3000:8080:将容器内 8080 端口映射到本地 3000 端口(本地端口可修改,如 -p 80:8080)。
  • -v open-webui:/app/backend/data:使用数据卷持久化对话历史、配置等数据,避免容器删除后数据丢失。
  • --restart always:设置容器开机自启。

浏览器打开: http://192.168.31.254:3000

6. Open WebUI基本使用

6.1 初次登录

首次访问 Open WebUI 时,需注册管理员账号(输入用户名、密码即可)。

创建完账号后,使用账号登录

6.2 配置

  • 禁用官方链接,如果不进行这一步,很有可能响应会非常慢,因为国内网络无法直接连上,所以系统会多次尝试, 操作路径: 管理员面板/设置/外部连接

修改本地Ollama 服务地址:

6.3 开始聊天

选择下载好的模型 :

Read more

Continue插件实现本地部署一个“cursor”或“github copilot”

Continue插件实现本地部署一个“cursor”或“github copilot”

本地部署 AI 代码助手,制作一个 Cursor/GitHub Copilot 的替代版本 一 需求分析 * 本地部署的定义与优势(数据隐私、离线使用、定制化)。 * Cursor 与 GitHub Copilot 的功能(代码补全、对话交互、模型差异)。 * 本地部署的AI 代码助手适用场景:企业内网开发、敏感数据环境。 二 环境准备与工具选择 * 硬件要求:GPU 要对应上你所部署的模型大小 * 模型选择:qwen2.5-14b-instruct (这里选择千问的大模型) 三 部署开源模型 这里不详细介绍具体的大模型部署的具体过程,部署完成之后,你应该得到对应的模型的以下信息 model: "qwen2.5-14b-instruct" apiBase: "http://你的ip地址(自己的本机就写localhost)

vscode copilot 的配置文件提示警告

Claude 桌面版竟然是实时的。 vscode copilot 的配置文件提示 [{ “resource”: “/d:/.vscode/User/globalStorage/github.copilot-chat/ask-agent/Ask.agent.md”, “owner”: “prompts-diagnostics-provider”, “severity”: 4, “message”: “未知工具 “github/issue_read”。”, “startLineNumber”: 7, “startColumn”: 51, “endLineNumber”: 7, “endColumn”: 70 },{ “resource”: “/d:/.vscode/User/globalStorage/github.copilot-chat/ask-agent/Ask.agent.md”, “owner”: “prompts-diagnostics-provider”, “severity”: 4, “message”: “未知工具

别瞎改了!直接抄DeepSeek这5大降AIGC指令,搭配3款超有效工具,亲测98%暴降至5%!

别瞎改了!直接抄DeepSeek这5大降AIGC指令,搭配3款超有效工具,亲测98%暴降至5%!

毕业季最让人崩溃的瞬间,莫过于信心满满地把DeepSeek辅助写的论文传上去,结果查重报告一片红,AIGC检测率飙到90%以上。 别慌!作为过来人,学姐告诉大家:AI生成的痕迹其实是有解决办法的。 只要你懂得如何指挥DeepSeek自己净化自己,或者用对专业的辅助工具,把AI率降到5%以下真的不是梦。 今天这篇文章,直接上干货。前半部分是5条经过实测的DeepSeek专属降AI指令,后半部分推荐3款确实能把AI率降下来的工具。 建议先收藏,改论文时直接复制使用。 一、【硬核实操】DeepSeek五大深度降AI指令 这部分是核心干货。为了让DeepSeek更好地执行,我将所有复杂的降AI技巧整合成了一段完整、连续的指令。你只需要把论文分段,然后配合下面的指令发送即可,记得要开深度思考和联网搜索哦~ 💡 指令1:针对假大空特征 【原理解析】 AI生成内容最容易被判定为机器痕迹的原因,是大量使用高频、通俗的万能词。根据同义词替换策略,我们需要强制模型调用学术语料库。 📋 复制这段Prompt发送给DeepSeek: 请针对这段文字进行深度学术化重写,重点在于提升词汇的

大模型本地部署神器:llama.cpp使用介绍

大模型本地部署神器:llama.cpp使用介绍

介绍llama.cpp 本节主要介绍什么是llama.cpp,以及llama.cpp、llama、ollama的区别。同时说明一下GGUF这种模型文件格式。 什么是llama.cpp llama.cpp是一个由Georgi Gerganov开发的高性能C++库,主要目标是在各种硬件上(本地和云端)以最少的设置和最先进的性能实现大型语言模型推理。 主要特点: * 纯C/C++实现,没有任何依赖 * 对Apple Silicon(如M1/M2/M3芯片)提供一流支持 - 通过ARM NEON、Accelerate和Metal框架优化 * 支持x86架构的AVX、AVX2、AVX512和AMX指令集 * 支持1.5位、2位、3位、4位、5位、6位和8位整数量化,实现更快的推理和更低的内存使用 * 为NVIDIA GPU提供自定义CUDA内核(通过HIP支持AMD GPU,通过MUSA支持摩尔线程MTT GPU)