大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南 | 极客日志

PythonSaaSAI

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

综述由AI生成开源 LLM 工程化平台 Langfuse 支持完全本地化部署，适用于 LLM 应用的调试、分析与测试评估。文章详细演示了基于 Docker 的快速部署步骤，以及通过 SDK 与 LangChain 和普通 LLM 应用的集成方式，涵盖 Trace 跟踪、Prompt 管理、用户评分上报及监控仪表盘的使用，助力生产级 LLM 应用的稳定性与成本优化。

abccba发布于 2025/2/7更新于 2026/6/318 浏览

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

随着 LLM 应用的不断成熟，特别是在 B 端企业场景中的逐渐落地，其不再停留在原型与验证阶段，将面临着更高的工程化要求。无论是输出的稳定性、性能、以及成本控制等，都需要实现真正的'生产就绪'。但由于大量的应用基于 LangChain、LlamaIndex 等框架开发，更多的抽象与封装使得应用难以跟踪与调试。因此，借助一个独立且侵入性较小的工程化平台来捕获 LLM 应用内部细节，帮助排障、优化与测试是很有必要的。

本文将介绍如何使用开源的 LLM 应用工程化平台 Langfuse。与在线且收费的 LangSmith 不同，Langfuse 支持完全本地化部署与使用，与应用集成也很简单。

一、快速本地化部署

Langfuse 是一个开源的 LLM 应用的工程平台，可以帮助开发者及团队进行集中、在线、协作的 LLM 应用跟踪调试、分析与测试评估。主要功能包括：

跟踪调试：跟踪应用执行过程、上下文、LLM 调用与成本、用户反馈等。
提示管理：集中的 Prompt 模板创建、维护与版本管理。
监控分析：调用统计、模型使用、tokens 成本、响应延迟、评分统计等。
测试评估：基于 LLM 与用户反馈的评估，包括质量、风格、内容安全。

方法一：Docker Compose 快速启动

适合个人开发者、对数据保存要求不高的开发团队。这种模式下会自动启动 Postgres 的独立 Docker，只需三步：

# 下载代码
git clone https://github.com/langfuse/langfuse.git

# 进入代码目录
cd langfuse

# 一键获取并启动 docker 容器
docker compose up

方法二：独立数据库 + Docker Run

适合有更高数据保存要求的开发团队，或者有现成的 Postgres 数据库。这种模式下，需要首先自行安装并启动 Postgres 数据库。如果还没有 Postgres，可进入官网下载、安装并配置启动。记录下数据库的连接 URL。然后执行以下命令：

# 拉取最新镜像
docker pull langfuse/langfuse:latest

# 注意替换这里的 DATABASE_URL 为你的 postgres url
docker run --name langfuse \
-e DATABASE_URL=postgresql://hello \
-e NEXTAUTH_URL=http://localhost:3000 \
-e NEXTAUTH_SECRET=mysecret \
-e SALT=mysalt \
-p 3000:3000 \
-a STDOUT \
langfuse/langfuse

方法三：本地开发部署

除非你需要对 Langfuse 做个性化定制，或者使用 Langfuse 展开商业运营，否则不建议采用这种方式。具体请参考项目中 CONTRIBUTING.md 文件说明。

健康检查与测试

完成部署后，运行如下命令进行健康检查：

# 健康测试，在本机运行
curl http://localhost:3000/api/public/health

http://你的服务器地址:3000/

常见问题排查

容器启动失败：检查网络是否连通；3000 端口是否被占用；数据库是否正常。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

import os
os.environ["LANGFUSE_PUBLIC_KEY"] = "pk-***"
os.environ["LANGFUSE_SECRET_KEY"] = "sk-***"
os.environ["LANGFUSE_HOST"] = "http://localhost:3000"

pip install langfuse

from langfuse.callback import CallbackHandler
import uuid

# 初始化 Handler，生成 session_id 用于组织多次 trace
langfuse_handler = CallbackHandler(session_id=str(uuid.uuid4()))

# 模型
llm = Ollama(model="qwen:14b")
embed_model = OpenAIEmbeddings(model="text-embedding-3-small")

# 构建向量索引
documents = DirectoryLoader('./data/', glob="*.txt", loader_cls=TextLoader).load()
splits = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=0).split_documents(documents)
db = FAISS.from_documents(splits, embed_model)
retriever = db.as_retriever()

# Prompt
prompt = ChatPromptTemplate.from_template("基于如下上下文:\n\n{context}\n\n请回答以下问题：\n\n{question}")

# Chain
rag_chain = (
    {"context": retriever | (lambda docs: "\n\n".join(doc.page_content for doc in docs)), "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# 对话循环
while True:
    user_input = input("问题：")
    if user_input.lower() == "exit":
        break
    if user_input.lower() == "":
        continue
    # 在 invoke 时传入 callbacks
    response = rag_chain.invoke(user_input, config={"callbacks": [langfuse_handler]})
    print("AI：", response)

from langfuse import Langfuse
langfuse = Langfuse()
prompt_str = langfuse.get_prompt("RAG").get_langchain_prompt()
prompt = PromptTemplate(template=prompt_str, input_variables=["context", "question"])

from langfuse.decorators import langfuse_context, observe

@observe()
def invoke(query):
    langfuse_context.update_current_trace(session_id=session_id)
    langfuse_handler = langfuse_context.get_current_langchain_handler()
    response = chain.invoke(query, config={"callbacks": [langfuse_handler]})
    
    # 此处模拟搜集到用户评分，如 0.8
    langfuse_context.score_current_trace(
        name="feedback-on-trace",
        value=0.8,
        comment="用户反馈",
    )
    return response["result"]

import uuid
from langfuse.decorators import observe, langfuse_context

session_id = str(uuid.uuid4())

# LLM 调用采用 generation 的 type，不会产生新的 trace，只会产生 observation
@observe(as_type="generation")
def call_llm(query):
    response = ollama.chat(model='qwen:14b', messages=[
        {
            'role': 'user',
            'content': query,
        },
    ])
    return response['message']['content']

# 这里不指定 type，每次调用产生一个 trace；不直接放 llm 调用逻辑是为了把 LLM 调用的 observation 分离
@observe()
def invoke(query):
    # 用 session_id 把多次 trace 组织起来
    langfuse_context.update_current_trace(session_id=session_id)
    return call_llm(query)

def main():
    while True:
        user_input = input("问题：")
        if user_input.lower() == "exit":
            break
        if user_input.lower() == "":
            continue
        print("AI：", invoke(user_input))
    # 结束前 flush 缓存，防止漏上报
    langfuse_context.flush()

if __name__ == "__main__":
    main()

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

一、快速本地化部署

方法一：Docker Compose 快速启动

方法二：独立数据库 + Docker Run

方法三：本地开发部署

健康检查与测试

常见问题排查

更多推荐文章

相关免费在线工具

二、与 LangChain 应用集成

准备工作

给应用增加 Trace 功能

使用 Prompts 管理功能

使用评分功能

分析仪表盘

三、与普通 LLM 应用的集成

结语

更多推荐文章

相关免费在线工具

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

大型语言模型（LLM）应用调试：Langfuse 本地化部署与集成指南

一、快速本地化部署

方法一：Docker Compose 快速启动

方法二：独立数据库 + Docker Run

方法三：本地开发部署

健康检查与测试

常见问题排查

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、与 LangChain 应用集成

准备工作

给应用增加 Trace 功能

使用 Prompts 管理功能

使用评分功能

分析仪表盘

三、与普通 LLM 应用的集成

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具