本地化部署与使用免费的 LLM 应用工程化平台 Langfuse | 极客日志

PythonSaaSAI算法

本地化部署与使用免费的 LLM 应用工程化平台 Langfuse

综述由AI生成Langfuse 是一款开源的 LLM 应用工程化平台，支持完全本地化部署。其三种部署方式（Docker Compose、独立数据库、本地开发）及健康检查步骤。内容涵盖与 LangChain 框架的深度集成方法，包括通过 CallbackHandler 实现追踪调试、利用 Prompts 管理功能进行模板版本控制、以及通过 SDK 上报用户评分以优化模型表现。此外，还展示了基础 SDK 集成方案及仪表盘数据分析功能，帮助开发者构建生产就绪的 LLM 应用系统。

孤勇者发布于 2025/2/6更新于 2026/5/2925 浏览

随着大语言模型（LLM）应用的不断成熟，特别是在 B 端企业场景中的逐渐落地，其不再停留在原型与验证阶段，将面临着更高的工程化要求。无论是输出的稳定性、性能、以及成本控制等，都需要实现真正的'生产就绪'。但由于大量的应用基于 LangChain、LlamaIndex 等框架开发，更多的抽象与封装使得应用难以跟踪与调试。因此，借助一个独立且侵入性较小的工程化平台来捕获 LLM 应用内部细节，帮助排障、优化与测试是很有必要的。

本文将详细介绍开源的 LLM 应用工程化平台：Langfuse。与在线且收费的 LangSmith 不同，它支持完全本地化部署与使用，与应用集成也很简单。

Langfuse 首页界面

快速本地化部署

方法一：Docker Compose 快速启动

适合个人开发者、对数据保存要求不高的开发团队。这种模式下会自动启动 Postgres 的独立 Docker，只需三步：

# 下载代码
git clone https://github.com/langfuse/langfuse.git

# 进入代码目录
cd langfuse

# 一键获取并启动 docker 容器
docker compose up

Docker Compose 启动界面

方法二：独立数据库 + Docker Run

适合有更高数据保存要求的开发团队，或者有现成的 Postgres 数据库。这种模式下，需要首先自行安装并启动 Postgres 数据库。如果还没有 Postgres，可进入官网下载、安装并配置启动。记录下数据库的连接 URL。然后执行以下命令：

# 拉取最新镜像
docker pull langfuse/langfuse:latest

# 注意替换这里的 DATABASE_URL 为你的 postgres url
docker run --name langfuse \
-e DATABASE_URL=postgresql://hello \
-e NEXTAUTH_URL=http://localhost:3000 \
-e NEXTAUTH_SECRET=mysecret \
-e SALT=mysalt \
-p 3000:3000 \
-a STDOUT \
langfuse/langfuse

独立数据库部署界面

方法三：本地开发部署

除非你需要对 Langfuse 做个性化定制，或者使用 Langfuse 展开商业运营，否则不建议采用这种方式。具体请参考项目中 CONTRIBUTING.md 文件说明。

本地开发部署界面

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 健康测试，在本机运行
curl http://localhost:3000/api/public/health

import os
os.environ["LANGFUSE_PUBLIC_KEY"] = "pk-***"
os.environ["LANGFUSE_SECRET_KEY"] = "sk-***"
os.environ["LANGFUSE_HOST"] = "http://localhost:3000"

pip install langfuse

from langfuse.callback import CallbackHandler
import uuid

# 初始化 Handler，生成 session_id 用于组织多次 trace
langfuse_handler = CallbackHandler(session_id=str(uuid.uuid4()))

# 模型
llm = Ollama(model="qwen:14b")
embed_model = OpenAIEmbeddings(model="text-embedding-3-small")

# 构建向量索引
documents = DirectoryLoader('./data/', glob="*.txt", loader_cls=TextLoader).load()
splits = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=0).split_documents(documents)
db = FAISS.from_documents(splits, embed_model)
retriever = db.as_retriever()

# Prompt
prompt = ChatPromptTemplate.from_template("基于如下上下文:\n\n{context}\n\n请回答以下问题：\n\n{question}")

# Chain
rag_chain = (
    {"context": retriever | (lambda docs: "\n\n".join(doc.page_content for doc in docs)), "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# 对话循环
while True:
    user_input = input("问题：")
    if user_input.lower() == "exit":
        break
    if user_input.lower() == "":
        continue
    # 在 invoke 时传入 callbacks
    response = rag_chain.invoke(user_input, config={"callbacks": [langfuse_handler]})
    print("AI：", response)

from langfuse import Langfuse

langfuse = Langfuse()
prompt_str = langfuse.get_prompt("RAG").get_langchain_prompt()
prompt = PromptTemplate(template=prompt_str, input_variables=["context","question"])

from langfuse.decorators import langfuse_context, observe

session_id = str(uuid.uuid4())

@observe()
def invoke(query):
    langfuse_context.update_current_trace(session_id=session_id)
    langfuse_handler = langfuse_context.get_current_langchain_handler()
    response = chain.invoke(query, config={"callbacks": [langfuse_handler]})
    
    # 此处模拟搜集到用户评分，如 0.8
    langfuse_context.score_current_trace(
        name="feedback-on-trace",
        value=0.8,
        comment="用户反馈",
    )
    return response["result"]

import uuid
from langfuse.decorators import langfuse_context, observe

session_id = str(uuid.uuid4())

# LLM 调用采用 generation 的 type，不会产生新的 trace，只会产生 observation
@observe(as_type="generation")
def call_llm(query):
    response = ollama.chat(model='qwen:14b', messages=[
        {
            'role': 'user',
            'content': query,
        },
    ])
    return response['message']['content']

# 这里不指定 type，每次调用产生一个 trace；不直接放 llm 调用逻辑是为了把 LLM 调用的 observation 分离
@observe()
def invoke(query):
    # 用 session_id 把多次 trace 组织起来
    langfuse_context.update_current_trace(session_id=session_id)
    return call_llm(query)

def main():
    while True:
        user_input = input("问题：")
        if user_input.lower() == "exit":
            break
        if user_input.lower() == "":
            continue
        print("AI：", invoke(user_input))
    # 结束前 flush 缓存，防止漏上报
    langfuse_context.flush()

if __name__ == "__main__":
    main()

本地化部署与使用免费的 LLM 应用工程化平台 Langfuse

快速本地化部署

方法一：Docker Compose 快速启动

方法二：独立数据库 + Docker Run

方法三：本地开发部署

更多推荐文章

相关免费在线工具

健康检查与测试

可能的问题排查

与 LangChain 应用集成

准备工作

给应用增加 Trace 功能

使用 Prompts 管理功能

使用评分功能

分析仪表盘

与普通 LLM 应用的集成

最佳实践建议

更多推荐文章

相关免费在线工具

本地化部署与使用免费的 LLM 应用工程化平台 Langfuse

快速本地化部署

方法一：Docker Compose 快速启动

方法二：独立数据库 + Docker Run

方法三：本地开发部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

健康检查与测试

可能的问题排查

与 LangChain 应用集成

准备工作

给应用增加 Trace 功能

使用 Prompts 管理功能

使用评分功能

分析仪表盘

与普通 LLM 应用的集成

最佳实践建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具