跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

7 款开源 LLM WebUI 工具推荐

7 款开源 LLM WebUI 工具,涵盖 Open WebUI、Text Generation WebUI、Anything LLM、LibreChat、Web LLM、OpenLLM 及 LoLLMs。这些工具支持私有化部署、多模型兼容、RAG 集成及本地推理,适用于企业自动化、个人学习及业务集成场景。

追风少年发布于 2026/4/6更新于 2026/5/2231 浏览
7 款开源 LLM WebUI 工具推荐

将大模型(LLM)私有化并创建 WebUI 系统,有助于保障数据安全、提升灵活度与可控性。以下推荐 7 个出色的开源 LLM WebUI 系统。

01. Open WebUI(Ollama WebUI)

https://github.com/open-webui/open-webui Star:45.7K 开发语言:Python、TypeScript、Svelte

文章配图

Open WebUI 是一个可扩展、功能丰富且用户友好的 WebUI,旨在完全离线操作。它支持包括 Ollama 和 OpenAI 在内的各种 LLM 运行容器或者 API。

文章配图

产品特点:
  • 直观的界面:受 ChatGPT 启发的用户友好型聊天
  • 响应式设计:在桌面和移动的上实现流畅的性能
  • 轻松安装:使用 Docker/Kubernetes 轻松安装
  • 主题定制:个性化与多个主题
  • 高亮:增强代码的可读性
  • Markdown LaTeX 支持:全面的格式选项
  • 本地 RAG 集成:使用#命令访问聊天文档
  • RAG 嵌入模型支持:选择嵌入模型(Ollama/OpenAI)
  • Web 浏览:使用#命令集成网站
  • 提示预设:使用/命令快速访问
  • RLHF 注释:人工反馈的速率消息
  • 会话标记:对聊天进行分类,以便于参考
  • 模型管理:下载、删除和更新模型
  • GGUF 文件上传:从 GGUF 文件创建 Ollama 模型
  • 多模型支持:切换模型以获得不同的响应
  • 多模式支持:包括图像交互
  • 模型文件生成器:自定义角色和代理
  • 多模型对话:同时利用多个模型
  • 协作聊天:使用@command 分组模型对话
  • 本地聊天共享:在用户之间共享聊天链接
  • Regeneration 聊天历史:访问所有过去的互动
  • 存档导入/导出聊天:组织和传输聊天数据
  • 语音输入:自动发送语音输入
  • 可配置的 TTS 端点:自定义文本到语音
  • 高级参数控制:调节温度,系统提示
  • 映像生成集成:本地 API 和 DALL-E 选项
  • OpenAI API 支持多种 API:灵活集成
  • API 密钥生成:简化 OpenAI 库使用
  • 外部 Ollama 服务器连接:连接远程实例
  • Ollama 负载平衡:分发请求以提高可靠性
  • 多用户管理:用于用户监督的管理面板
  • Webhook 集成:新注册的实时通知
  • 模型白名单:用户的受控访问
  • 可信电子邮件身份验证:增强的安全层
  • RBAC:基于角色的受限权限访问
  • 后端反向代理:安全的后端通信
  • 多语言支持:i18n 国际化
  • 持续更新:定期的新功能和改进

02. Text Generation Webui

https://github.com/oobabooga/text-generation-webui Star:40.5K 开发语言:Python

文章配图 文章配图 文章配图 文章配图

这是一个基于 Gradio 的 Web UI,用于大语言模型的 Web 层。

产品特性:

  • 在一个 UI 以及 API 中支持多个文本生成的后端,包括:Transformers、llama.cpp、ExLlamaV2、TensorRT-LLM、AutoGPTQ、AutoAWQ、HQQ、AQLM 等
  • 兼容 OpenAI 的 API。
  • 使用 Jinja2 模板自动提示格式化。
  • 三种聊天模式:instruct、chat-instruct、chat,其中 chat-instruct 有自动提示模板。
  • 可在'聊天记录'菜单之间的对话快速切换。
  • 在默认、笔记本选项卡中生成自由格式的文本,而不限于聊天回合。
  • 拥有多个采样参数和生成选项,用于支持复杂的文本生成控制。
  • 在 UI 中轻松切换不同型号,无需重新启动。
  • 简单的 LoRA 微调工具。
  • 安装在一个独立的 installer_files 目录中,不会影响系统环境。
  • 扩展支持,提供许多内置的或者用户贡献的扩展。

03. Anything LLM

https://github.com/Mintplex-Labs/anything-llm Star:26.5K 开发语言:JavaScript

文章配图

Anything LLM 是一个多功能的全栈 AI 应用程序,可以在与大型语言模型(LLM)聊天期间引用自己的文档或内容作为上下文数据。它专为易用性而设计,提供了一个高度可配置的多用户环境。用户可以选择集成商业的或者开源的 LLM,选择向量数据库,并管理访问权限。

该应用程序将文档组织到'工作区'中,这些工作区是容器化的单元,可以在不同的线程之间保持上下文的隔离。

工作区可以共享文档,但也能够为一些重点对话维护隔离的上下文。AnythingLLM 可运行在 Mac、Windows 或者 Linux 桌面系统上,支持本地或远程执行,使其成为构建自定义、私人 ChatGPT 的强大工具。

产品特征
  • 支持 AI Agent 定义
  • 支持多种模型(包括封闭和开源 LLM!)
  • 支持多用户实例和 Docker 版本
  • 可在工作空间内安装代理(浏览网页、运行代码等)
  • 提供适用于嵌入网站的聊天组件
  • 支持多种文档类型(PDF,TXT,DOCX 等)
  • 简单的聊天用户界面、拖放功能和明确的使用指南。
  • 支持 100% 云部署。
  • 可以与所有流行的闭源和开源 LLM 提供商对接。
  • 与其他聊天界面相比,可以用于管理非常大的文档。
  • 提供用于自定义集成的 API

04. LibreChat

https://github.com/danny-avila/LibreChat Star:18.9K 开发语言:TypeScript、JavaScript

文章配图

LibreChat 可以作为 ChatGPT 的私人替代品,在您自己的服务器上运行。

产品特征
  • 支持与 ChatGPT 匹配的 UI,包括 Dark 模式、Streaming 和最新更新
  • 智能选型:Anthropic(Claude),AWS Bedrock,OpenAI,Azure OpenAI,BingAI,ChatGPT,Google Vertex AI,插件,助手 API(包括 Azure 助手)
  • 两者兼容远程和本地 AI 服务:Groq、Ollama、Cohere、Mistral AI、Apple MLX、koboldcpp、OpenRouter、together.ai、Perplexity、ShuttleAI 等
  • 生成式 UI,代码工件:在聊天中创建 React、HTML 代码和 Mermaid 图表
  • 创建、保存和共享自定义预设
  • 在 AI 端点和预设之间切换,聊天中
  • 使用对话分支编辑、重新提交和继续消息
  • 用于高级上下文控制的会话
  • 多模式聊天:
  • 可通过 OpenAI Assistant API️
  • 非 OpenAI 代理在积极开发中
  • 使用 Claude 3、GPT-4(包括 gpt-4o 和 gpt-4o-mini)和 Gemini Vision 软件上传和分析图像
  • 使用自定义端点,OpenAI,Azure,Anthropic,Google 与文件聊天。🗃️
  • 具有文件、代码解释器、工具和 API 操作的高级代理🔦
  • 多语言用户界面:
  • English,中文,Deutsch,Español,Français,意大利语,Polski,巴西葡萄牙语,Русский, 日本語,Svenska, 한국어, Tiếng Việt, 繁體中文,العربية, Türkçe, Nederlands, עברית
  • 可定制的下拉界面:适应高级用户和新手
  • 验证您的电子邮件以确保安全访问
  • 语音到文本和文本到语音的魔术免提聊天
  • 自动发送和播放音频
  • 支持 OpenAI、Azure OpenAI 和 Elevenlabs
  • 从 LibreChat,ChatGPT,Chatbot UI 导入对话
  • 导出对话为截图,markdown,文本,json
  • 搜索所有消息/对话
  • 插件,包括 Web 访问、使用 DALL-E-3 生成图像等
  • 使用审核和令牌支出工具的多用户安全身份验证
  • ️配置代理,反向代理,Docker,和许多部署选项:完全本地使用或部署在云上

05. Web LLM

https://github.com/mlc-ai/web-llm Star:13.6K 开发语言:TypeScript

文章配图

WebLLM 是一个高性能的浏览器内 LLM 推理引擎,通过硬件加速将语言模型推理直接带到 Web 浏览器上。一切都在浏览器内运行,没有服务器支持,并通过 WebGPU 加速。WebLLM 完全兼容 OpenAI API。也就是说,可以在本地任何开源模型上使用相同的 OpenAI API,其功能包括流式传输,JSON 模式,函数调用(function-calling,简写)等。

产品特征:

  • 浏览器内推理:WebLLM 是一个高性能的浏览器内语言模型推理引擎,它利用 WebGPU 进行硬件加速,直接在 Web 浏览器内实现强大的 LLM 操作,而无需服务器端处理。
  • 兼容 OpenAI API:使用 OpenAI API 将您的应用与 WebLLM 无缝集成,并提供流、JSON 模式、logit 级别控制、种子等功能。
  • 结构化 JSON 生成:WebLLM 支持最先进的 JSON 模式结构化生成,在模型库的 WebAssembly 部分实现,以获得最佳性能。检查 HuggingFace 上的 WebLLM JSON Playground,尝试使用自定义 JSON 模式生成 JSON 输出。
  • 丰富的模型支持:WebLLM 支持一系列原生大模型,包括:Llama 3,Phi 3,Gemma,Mistral,Qwen(通义问)等,使其成为各种 AI 任务的通用工具。有关完整的支持型号列表,请选中模型。
  • 自定义模型集成:轻松集成和部署 MLC 格式的自定义模型,使您能够根据特定需求和场景调整 WebLLM,增强模型部署的灵活性。
  • 即插即用集成:使用 NPM 和 Yarn 等包管理器或直接通过 CDN 将 WebLLM 轻松集成到您的项目中,并提供全面的示例和用于连接 UI 组件的模块化设计。
  • 流式传输与实时交互:支持流式聊天完成,允许实时输出生成,增强了聊天机器人和虚拟助手等交互式应用程序。
  • 支持 Web Worker& Service Worker:通过将计算卸载到独立的工作线程或服务工作线程,优化 UI 性能并有效管理模型的生命周期。
  • 支持 Chrome 扩展:使用 WebLLM 通过自定义 Chrome 扩展程序扩展 Web 浏览器的功能,并提供构建基本和高级扩展程序的示例。

06. OpenLLM

https://github.com/bentoml/OpenLLM Star:10K 开发语言:Python

文章配图

OpenLLM 是一个可以在云中运行开源大语言模型(LLM)的工具,如:Llama,Qwen 和 Phi 等,也可以兼容 OpenAI 的 API 接入。它支持使用 Docker、Kubernetes 和 BentoCloud 简化模型的部署过程。

OpenLLM 支持多种模型,并提供友好的用户界面,提供内置的聊天 UI。它还可以与 BentoML 集成,用于企业级 AI 推理和部署。此外,用户可以将模型贡献到其存储库中,或者在自己的基础设施上部署自定义模型。

文章配图

使用以下命令进行安装:

pip install openllm # or pip3 install openllm openllm hello 

07. LoLLMs

https://github.com/ParisNeo/lollms-webui Star:4.3K 开发语言:JavaScript/Vue、Python

文章配图

LoLLMS WebUI(Lord of Large Language Multimodal Systems)是一个多功能一体化平台,可访问各种任务类型的 AI 模型,例如:写作、编码、图像生成、音乐创作等。它支持 500 多个专家模型和 2500 个跨不同领域的微调模型。

用户可以选择根据特定需求量身定制的模型,无论是编码帮助、医疗建议、法律的指导、创意故事还是娱乐。

该平台的设计考虑到了易用性,提供了一个友好的用户界面,具有明亮和暗黑模式。LoLLMS 可以用于实现增强电子邮件、代码调试、解决问题,甚至提供如笑声机器人、创意故事生成器、和个性化音乐生成之类的有趣功能。

它将生产力工具和娱乐结合在一个界面中,使其成为满足各种专业需求的多功能工具。

产品特征
  • 为您的任务选择您喜欢模型和个性化配置
  • 增强您的电子邮件、论文、代码调试、思想组织等
  • 探索各种功能,如:搜索、数据组织、图像生成和音乐生成
  • 易于使用的用户界面,具有亮暗模式选项
  • 与 GitHub 存储库集成,便于访问
  • 可自定义向导信息
  • 生成的答案的拇指向上/向下评级
  • 复制、编辑和删除邮件
  • 用于讨论的本地数据库存储
  • 搜索、导出和删除多个讨论
  • 支持基于稳定扩散的图像/视频生成
  • 支持基于 musicgen 的音乐生成
  • 通过 Lollms 节点和花瓣支持多代对等网络。
  • 支持 Docker、conda 和手动虚拟环境设置
  • 支持 LM Studio 作为后端
  • 支持 Ollama 作为后端
  • 支持 vllm 作为后端
  • 支持根据任务快速路由到对应的模型

目录

  1. 01. Open WebUI(Ollama WebUI)
  2. 产品特点:
  3. 02. Text Generation Webui
  4. 03. Anything LLM
  5. 产品特征
  6. 04. LibreChat
  7. 产品特征
  8. 05. Web LLM
  9. 06. OpenLLM
  10. 07. LoLLMs
  11. 产品特征
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • GitNexus 项目技术分析:构建代码库知识图谱方案
  • Python 数据分析入门:集中趋势与离散程度
  • OpenClaw 部署指南:Minimax/DeepSeek 模型与飞书机器人配置
  • Python Wheel 包 (.whl) 安装指南与常见问题处理
  • 宜搭低代码高级认证:待办列表自定义页面实战指南
  • OpenClaw WebSocket Channel 插件开发指南
  • 发那科机器人核心指令详解
  • 基于 Selenium 的 Python 图片爬虫实战
  • Protege 与 Neo4j 构建教育领域知识图谱及前端可视化实战
  • OpenClaw 配置指南:打造个性化 AI 助手
  • Cursor+Codex深度联动教程:用AI插件自动重构老旧前端代码(React 18案例)
  • ToDesk ToClaw 评测:基于 OpenClaw 的零门槛 AI 自动化方案
  • Temperature 与 Top-P 参数对 Prompt 结果的影响
  • 封装哈希表实现 unordered_set/unordered_map
  • ARINC 825 航电通信总线标准详解
  • 10 篇必读的大模型前沿论文
  • JESD204B 协议链路建立与 Xilinx IP 仿真详解
  • MySQL 8.0 在 Windows 上的安装与配置指南
  • Cursor 编辑器安装与 Unity-MCP 插件集成指南
  • 高频算法推理场景下的灵活计费与本地模型部署

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online