Dify + Skill 本地部署大模型智能体：构建企业级 AI Agent 系统

Dify + Skill 本地部署大模型智能体：构建企业级 AI Agent 系统 | 极客日志

维度	Dify Skill	LangChain Tool
易用性	✅ 可视化配置，非程序员也能定义	❌ 需写 Python 代码
部署模式	✅ 原生支持分布式 Skill 服务	❌ 通常与主程序同进程
权限控制	✅ 支持按用户/角色授权 Skill	❌ 需自行实现
可观测性	✅ 自动记录调用日志、耗时、错误	❌ 需手动埋点

# 安装 Docker 和 Docker Compose
sudo apt update && sudo apt install -y docker.io docker-compose
# 克隆 Dify 源码（含本地模型支持）
git clone https://github.com/langgenius/dify.git
cd dify

# docker/docker-compose.override.yml
version: '3'
services:
  vllm:
    image: vllm/vllm-openai:latest
    ports:
      - "8000:8000"
    volumes:
      - ./models:/models # 挂载模型目录
    command: >
      --model /models/Llama-3-8B-Instruct 
      --tensor-parallel-size 4 # 4 卡并行 
      --max-model-len 8192 
      --dtype auto
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 4
              capabilities: [gpu]

# 使用 OpenAI 兼容 API 模式
MODEL_PROVIDER=openai
OPENAI_API_BASE=http://vllm:8000/v1
OPENAI_API_KEY=EMPTY # vLLM 不需要 key
DEFAULT_LLM_MODEL=meta-llama/Llama-3-8B-Instruct

# 构建并启动
docker-compose -f docker/docker-compose.yml -f docker/docker-compose.override.yml up -d
# 初始化（首次运行）
docker exec -it dify-api python manage.py init

# skill_server.py
from flask import Flask, request, jsonify
import requests

app = Flask(__name__)

@app.route('/search', methods=['POST'])
def search():
    query = request.json['query']
    user_role = request.json['user_role']
    # 从 Dify 透传
    # 调用 Dify Dataset API（需认证）
    resp = requests.post('http://dify-api/v1/datasets/<dataset_id>/query', json={'query': query}, headers={'Authorization':'Bearer <api_key>'})
    results = resp.json()['results']
    # 权限过滤：仅返回用户有权访问的片段
    filtered = [r for r in results if is_authorized(r['doc_id'], user_role)]
    return jsonify({'answer': filtered[0]['content'] if filtered else '无权限或未找到'})

def is_authorized(doc_id, role):
    # 实现 RBAC 逻辑
    pass

# 在自定义 Skill 中
def handle_query(query, user_id):
    # 1. 获取用户角色
    user_role = get_user_role(user_id)
    # 2. 检索知识库
    docs = vector_db.search(query)
    # 3. 过滤无权文档
    allowed_docs = []
    for doc in docs:
        if check_permission(doc.meta['acl'], user_role): # acl: ["hr", "finance"]
            allowed_docs.append(doc)
    # 4. 若无结果，返回无权限提示
    if not allowed_docs:
        return "您无权访问此信息。"
    return generate_answer(allowed_docs)

def verify_answer(question, retrieved_docs, answer):
    # 提取 answer 中的数值
    numbers_in_answer = extract_numbers(answer)
    # 检查是否在 retrieved_docs 中出现
    for num in numbers_in_answer:
        if not any(str(num) in doc.content for doc in retrieved_docs):
            return False, f"数字 {num} 未在文档中找到"
    return True, "OK"

指标	目标	监控方式
任务成功率	≥90%	人工抽样 + LLM-as-Judge
幻觉率	≤3%	校验模块统计
权限违规次数	0	审计日志告警
P95 延迟	<2s	Dify 内置监控
Skill 调用失败率	<1%	Skill 服务日志

# 启动 vLLM
docker run --gpus all -v ./models:/models -p 8000:8000 \ vllm/vllm-openai --model /models/Llama-3-8B-Instruct --tensor-parallel-size 4
# 启动 Dify
cd dify && docker-compose up -d

# .env
MODEL_PROVIDER=openai
OPENAI_API_BASE=http://host.docker.internal:8000/v1 # Docker 内访问宿主机
OPENAI_API_KEY=EMPTY
DEFAULT_LLM_MODEL=meta-llama/Llama-3-8B-Instruct
# Embedding 模型（本地）
EMBEDDING_MODEL=BAAI/bge-large-zh-v1.5
EMBEDDING_ENDPOINT=http://jina-embedder:8080/embeddings

# Skill 配置（Dify UI 中填写）
Name: query_hr_policy
Description: 查询人力资源政策
URL: http://skill-service:5000/hr
Method: POST
Parameters:
  - name: query
    type: string
    required: true
  - name: user_role
    type: string
    required: true

Dify + Skill 本地部署大模型智能体：构建企业级 AI Agent 系统

Dify + Skill 本地部署大模型智能体：构建企业级 AI Agent 系统

引言：为什么企业需要'本地部署的 Dify + 自定义 Skill'？

Dify 定位与本地部署价值

问题：Dify 是什么？为什么企业选择在本地部署 Dify？

1. 数据安全与合规

2. 模型可控与可审计

3. 能力深度定制

追问：Skill 是什么？和 LangChain Tool 有什么区别？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Skill 的核心特点：

与 LangChain Tool 的对比：

如何在本地部署 Dify 并接入开源大模型？

问题：假设有一台 4×A10 服务器，想部署 Dify 并接入 Llama-3-8B-Instruct。请给出具体步骤。

步骤 1：准备环境

步骤 2：配置本地模型服务（vLLM）

步骤 3：配置 Dify 连接本地模型

步骤 4：启动 Dify

步骤 5：验证

如何开发一个自定义 Skill 并集成到 Agent？

问题：如何实现一个'查询公司内部知识库'的 Skill？

第一步：准备知识库

第二步：开发 Skill（两种方式）

方式 A：使用 Dify 内置 Dataset Skill（推荐）

方式 B：自定义 HTTP Skill（更灵活）

第三步：创建 Agent 应用

第四步：测试与调试

如何确保本地部署的安全性与权限控制？

问题：普通员工无权查看薪资，系统如何拦截？

第一层：Dify 原生权限控制

第二层：Skill 级权限校验（关键！）

第三层：审计与监控

如何优化 RAG 效果与降低幻觉？

问题：模型仍可能基于检索结果'过度发挥'，怎么解决？

1. 提升召回精度

2. 强制引用与约束生成

3. 后处理校验（Post-hoc Verification）

4. 置信度阈值

如何监控与持续迭代这个系统？

问题：上线后，有哪些监控指标和迭代机制？

核心监控指标（通过 Dify 内置 + Prometheus）

迭代机制：

未来演进——从问答到自动化工作流

问题：基于 Dify 的 Agent 未来还能做什么？

1. 多 Skill 协同工作流

2. 主动 Agent（Proactive Agent）

3. 个性化记忆

4. 与现有系统深度集成

结语：本地化不是退步，而是企业 AI 落地的必经之路

附录：常用命令与配置速查

1. 启动本地 Dify + vLLM

2. Dify 环境变量关键配置

3. 自定义 Skill 示例（HTTP）

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具