为什么企业需要本地部署的 Dify + 自定义 Skill
当前企业落地大模型时,数据不出域、模型可审计、能力可定制是强烈的刚需。Dify 作为一个开源 LLM 应用开发平台,提供了可视化编排、本地部署支持、Skill 插件机制,让私有化 Agent 的构建变得可行。
下面,我们逐步看看怎么用 Dify + 本地大模型 + 自定义 Skill 搭建一个可落地的智能体系统。
认识 Dify 与 Skill
Dify 的核心价值在于降低 AI 应用开发门槛,同时保持企业级可控性。它提供聊天机器人、文本生成、Agent、RAG 知识库等功能。企业选择本地部署,通常出于三点:数据安全合规(金融、医疗等行业)、模型可控可审计(用开源模型)、能力深度定制(集成内部系统)。
而 Skill 是 Dify 中的插件接口,用于封装外部能力。它声明式定义(YAML/UI)、语言无关、自动注册、执行隔离。和 LangChain 的 Tool 相比,Dify Skill 更产品化:可视化配置、分布式部署、内置权限和观测。例如,要查询员工年假,LangChain 需要写 Python 函数,Dify 只需在 UI 里配置名称、参数、后端 URL,保存即可。
本地部署 Dify 并接入 Llama-3-8B
假设有 4×A10 服务器(160GB 显存),推荐用 Docker Compose + vLLM 方案。
步骤:
- 准备环境:安装 Docker 和 Docker Compose,克隆 Dify 仓库。
- 配置 vLLM 服务:在 docker-compose.override.yml 中定义 vLLM 容器,挂载模型目录,设置模型路径、并行度等。
version: '3'
services:
vllm:
image: vllm/vllm-openai:latest
ports:
- "8000:8000"
volumes:
- ./models:/models
command: >
--model /models/Llama-3-8B-Instruct
--tensor-parallel-size 4
--max-model-len 8192
--dtype auto
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 4
capabilities: [gpu]
- 配置 Dify 环境变量(.env):
MODEL_PROVIDER=openai
OPENAI_API_BASE=http://vllm:8000/v1
=EMPTY
=meta-llama/Llama--B-Instruct

