跳到主要内容 使用 Dify 搭建企业知识库聊天机器人 | 极客日志
编程语言 SaaS AI
使用 Dify 搭建企业知识库聊天机器人 本文详细介绍了如何使用 Dify 工具快速搭建企业知识库聊天机器人的完整流程。主要步骤包括准备格式规范的知识库文档(支持 Markdown 等多种格式)、在 Dify 中创建知识库并配置分段与索引策略、创建聊天助手应用并关联知识库、最后发布应用供集成使用。文章特别强调了知识库内容质量对 AI 回答准确性的影响,以及在复杂文档场景下如何进行自定义分段和手动编辑优化。此外,文中还分析了企业级 AI 客服的成本效益,指出虽然自建成本高,但掌握相关技术对个人职业发展具有积极意义。
链路追踪 发布于 2025/2/6 更新于 2026/4/21 2 浏览
简介 在当今数字化时代,企业知识库的建设和维护对于提升工作效率和服务质量至关重要。AI 聊天机器人作为知识库的交互界面,可以提供 24/7 的即时服务。
本文将介绍如何使用 Dify 这一工具快速搭建企业知识库聊天机器人。相比起传统的'智能客服',加入大语言模型后的 AI 客服能更清楚用户想问什么问题,在匹配你提供的知识库的内容进行回答,这样看上去会更懂用户。
动手实操
准备你的知识库内容
在 Dify 上传你的知识库
创建聊天机器人
发布
第 1 步:准备知识库 首先,你要有一份知识库文档。其实这步是在整个操作中最重要的。如果你的知识库太水,那 AI 的回答也会给你灌水。
为了演示,我先让 GPT 帮忙生成一份企业培训文档,我把这份文件命名为'客服知识问答语料库'。
### 如何创建新项目?
要创建新项目,请点击页面右上角的'新建项目'按钮,输入项目名称,选择项目模板(如有),然后点击'创建'。项目会出现在您的项目列表中。
### 如何为任务添加截止日期?
在任务详情页中,点击截止日期区域,选择一个日期并保存。任务的截止日期会显示在任务列表中。
### 如何与 Google Calendar 同步?
请进入'设置'页面,找到'集成'选项,选择'Google Calendar',然后按照提示进行授权和同步。同步后,所有项目任务的截止日期将显示在您的 Google Calendar 中。
### 我可以为任务设置优先级吗?
是的,您可以在任务详情页中设置任务的优先级。点击'优先级'下拉菜单,选择'高'、'中'或'低'。设置后的优先级会显示在任务列表中。
### 如何更改我的账户邮箱地址?
进入'账户设置'页面,在'个人信息'部分中,点击邮箱地址旁边的'编辑'按钮,输入新邮箱地址并保存。您需要通过新邮箱验证后才能完成更改。
### 我忘记了密码,该怎么办?
请在登录页面点击'忘记密码'链接,输入您的注册邮箱地址,我们会发送一个重置密码的链接到您的邮箱。通过该链接您可以设置一个新密码。
### 如何邀请团队成员加入项目?
在项目页面中,点击'邀请成员'按钮,输入要邀请的成员邮箱地址,并选择他们的角色(如管理员、编辑者等)。点击'发送邀请'后,对方会收到一封邀请邮件。
### 如何查看我的订阅计划?
请前往'账户设置'页面,在'订阅'部分,您可以查看当前的订阅计划、下一个计费日期以及费用明细。
### 如何升级我的订阅计划?
在'账户设置'的'订阅'部分,点击'升级计划'按钮,选择您想升级的计划并确认付款。升级会立即生效,并按比例计算费用。
### 我可以取消订阅吗?
是的,您可以随时取消订阅。在'账户设置'的'订阅'部分,点击'取消订阅'按钮,并按照提示完成取消操作。取消订阅后,您仍可以使用付费功能直到当前计费周期结束。
### 我的任务列表不见了怎么办?
请确认是否选择了正确的项目。您可以在左侧栏的项目列表中重新选择项目。如果问题仍然存在,请尝试刷新页面或退出并重新登录。
### 为什么我收不到通知邮件?
请检查您的通知设置,确认是否开启了相关的通知选项。如果已开启但仍未收到,请检查垃圾邮件文件夹,并将我们的邮件地址添加到您的联系人中。
### 系统提示'操作失败',怎么办?
这可能是网络问题导致的,请检查您的网络连接并重试。如果问题持续存在,请联系客服并提供相关的错误信息和截图。
### 系统更新后,我的部分数据丢失了,如何恢复?
如果您在系统更新后遇到数据丢失,请立即联系客服。我们会帮助您通过系统备份来恢复丢失的数据,但请尽量在问题发生后的 24 小时内联系我们。
### 如何报告一个软件漏洞?
如果您发现了一个软件漏洞,请进入'帮助中心',点击'报告问题',选择'安全漏洞',并填写相关信息。我们的技术团队会尽快处理。
### 我的项目无法加载,应该怎么办?
请首先检查您的网络连接,并尝试在其他设备上访问。如果问题仍然存在,请清除浏览器缓存或尝试使用不同的浏览器。如果问题未解决,请联系客服。
这份文档是以 markdown 语法生成的,其中 ### 表示三级标题,标题是问题的内容,后面跟着的那行是该问题的答案。
文档的格式也很重要,你不一定要按照这种文档格式,你可以一行问题一行答案,比如这样:
我可以取消订阅吗?
是的,您可以随时取消订阅。在'账户设置' 的'订阅' 部分,点击'取消订阅' 按钮,并按照提示完成取消操作。取消订阅后,您仍可以使用付费功能直到当前计费周期结束。
但一定要保证,你每个问题和答案的格式都要相同。这样才能让 AI 更好的理解你的内容。
这份知识库不一定要 .md 格式,dify 也支持其他格式的,比如:TXT、PDF、HTML、XLSX、XLS、DOCX、CSV。需要注意的是,上传的文档单个最大 15MB,单次最多上传 20 个文件。
第 2 步:在 Dify 创建知识库 在 Dify 中创建知识库很简单,运行 Ollama 和 Dify,然后在浏览器访问 http://localhost/,登录你的账号就可以开始操作了。
登录成功后,点击顶部导航栏的'知识库',然后点击'创建知识库'。
打开'创建知识库'页面后会看到下面这个页面,我们可以上传自己准备好的知识库文件,可以同步你 Notion 的内容,还可以同步你的 Web 站点。
选择刚刚准备好的'客服知识问答语料库.md'文件,点击'下一步'。
接下来这步就是文本分段和清洗,它的原理是将你上传的知识库文本切片分成一段段,在之后和用户的交流中,根据用户提的问题去匹配这些分好段的内容,哪段的匹配值高就拿哪段来回答用户。
先看'分段设置',Dify 提供了'自动分段与清洗'和'自定义'两个选项。如果是简单的知识库(比如本文准备的这个)就可以用'自动分段与清洗'。如果是比较复杂的、字数很多的知识库建议使用'自定义'。
'索引方式'也有 2 种选择,'高质量'的需要你到 OpenAI 那里购买服务并申请个 Key 回来 Dify 这里配置,而'经济'就没什么需要配置的,本文选择'经济'的方式来演示。
'索引设置'是用来指定数据的匹配方式,可以根据你的实际场景来配置。一般我们可以使用默认配置即可。
点击'前往文档',可以做一下'召回测试',看看你的知识库有没有问题,也就是做个测试。如果有问题的话就返回上一步修改配置。
第 3 步:创建聊天机器人 你也可以选择 Agent 或者工作流,但这些本文先不讲,先使用最简单的'聊天助手'。
在'上下文'选择刚刚创建好的知识库,然后在页面右上方选择大语言模型。
可以在右下方的输入框输入点内容,和它聊两句测试一下,没问题的话就可以点击页面右上角的'发布'按钮发布出去了。
发布成功后,回到'探索'页面就能看到刚刚创建好的客服机器人,可以和它开心的聊天了。
第 4 步:发布 如果你要将刚刚创建好的聊天机器人集成到你的网站中,可以在'工作室'中选择要分享的应用,然后点击页面右上角的'发布'按钮,选择'嵌入网站'或者'访问 API'。但前提是你的服务地址可访问。
自定义分段 如果你的知识库文档比较复杂,或者每一段的内容都很多,就需要你手动操作了。
### 如何创建新项目?
要创建一个新项目,您需要首先登录到您的项目管理平台并进入主界面。在右上角,通常会有一个'新建项目'或'创建项目'的按钮。点击这个按钮后,系统会引导您进入一个新的页面或弹出一个窗口,要求您填写项目的基本信息。
1. **项目名称** :首先,您需要为项目命名。项目名称应该简洁明了,同时具备描述性,以便您和团队成员能够轻松识别项目的目的或内容。
2. **项目描述** :一些平台可能要求您填写项目描述。这是对项目的简短概述,帮助团队成员理解项目的目标、范围和重要性。
3. **项目模板** :如果您的平台提供模板选项,您可以选择一个适合您项目类型的模板。
4. **开始日期和结束日期** :大部分项目管理工具允许您设置项目的开始和结束日期。
5. **项目成员** :您可以在创建项目时直接邀请团队成员参与项目。
6. **项目权限** :如果项目涉及敏感信息或需要限制访问,您可以设置项目的权限级别。
完成所有必填和选填的信息后,点击'创建'或'保存'按钮。此时,项目将正式创建,并显示在您的项目列表中。
如果在创建项目时遇到任何问题,例如无法添加成员、模板选项不可用或创建后无法找到项目,您可以尝试以下解决方法:
1. **刷新页面** :有时由于网络或浏览器问题,页面可能没有正确加载。
2. **检查权限** :确保您的账户具有创建项目的权限。
3. **联系客服** :如果问题仍然存在,建议联系平台的客服团队。
这份文档也是使用 md 语法的,通过 ### 开头为标题,接下来的几段都是该标题下的相关内容。直到下一个 ### 开始下一段标题和内容。
使用'自动分段与清洗'效果并不理想,它把一段完整的问答切成好几小段了。
按照这个规则,我将'分段标识符'设置为 ###,'分段最大长度'设置为 1000。'分段重叠长度'保持不变。
点击'确认并预览',选择'自定义'效果同样不理想,但比'自动分段与清洗'效果还是要好一点的。
先点击'保存并处理',然后来到下一个页面,点击刚刚保存的这个知识库文件名。
编辑完保存好,接下来的操作和前面讲解的步骤一样,这里就不在啰嗦了。
总结与思考 AI 这两年发展很快,大家也相信 AI 是有用的。但对于小企业来说,AI 的实际落地价值需要理性评估。
像本文介绍的这种 AI 客服,相比起传统智能客服来说确实有一定的能力提升,但运营成本也一样在提升。如果是自己搭建这种服务,AI 服务器价格不菲,小企业也不可能在自己公司搞个机房搭建面向 C 端的 AI 客服。要运行大模型并且是面向 C 端,处理好并发,硬件成本很高。性价比最高的方案还是对接大模型公司提供的 API,但这也是一笔持续的开支。
最后发现投入产出可能是不成正比。不过,对于个人开发者来说,能在自己电脑部署一个 AI 应用还是一件很酷的事情,而且它还能为你的简历赋能。
至于 AI 能如何落地到实际工作中还是要靠丰富的想象力,具体未来是什么情况还得看情况。掌握 AI 的人,将会比较有竞争优势,这与计算机、互联网发展的规律是一致的。
相关免费在线工具 RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
HTML转Markdown 将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online