SkyWalking Python 应用分布式追踪与埋点实践 | 极客日志

Pythonjava

SkyWalking Python 应用分布式追踪与埋点实践

SkyWalking Python 应用通过 skywalking-python 库实现分布式追踪。支持 Flask、Django 等框架自动埋点，可手动创建 Span 追踪自定义逻辑。集成跨语言上下文传播，兼容 Java 服务调用链。提供 gRPC/HTTP 上报协议，支持异步任务（Celery）追踪及日志关联。生产环境建议合理命名服务、使用环境变量配置并监控 Agent 状态。

无尘发布于 2026/3/16更新于 2026/6/1628 浏览

SkyWalking - Python 应用追踪：基于 skywalking-python 的埋点

在当今微服务架构盛行的时代，分布式系统的可观测性（Observability）已成为保障系统稳定性和性能优化的关键能力。Apache SkyWalking 作为一款开源的 APM（Application Performance Monitoring）系统，以其强大的分布式追踪、服务拓扑图、指标分析和告警能力，被广泛应用于生产环境。虽然 SkyWalking 最初以 Java 生态为主力支持对象，但随着社区的发展，Python 应用也可以通过 skywalking-python 实现无侵入或轻量级埋点，从而接入完整的观测体系。

本文将深入探讨如何在 Python 应用中集成 SkyWalking，并结合 Java 示例进行对比，帮助开发者理解跨语言追踪的核心机制。

🧭 什么是 SkyWalking？

Apache SkyWalking 是一个观测性平台，用于监控、追踪、诊断和可视化分布式系统的性能问题。它支持自动探针（Agent）和手动埋点（Manual Instrumentation），覆盖多种语言和框架：

✅ Java
✅ Python
✅ Node.js
✅ Go
✅ .NET
✅ PHP（实验性）
✅ Rust（实验性）

SkyWalking 的核心组件包括：

OAP Server：后端处理与存储。
UI：可视化仪表盘。
Agent / SDK：嵌入应用采集数据。

官方网站：https://skywalking.apache.org/
文档中心：https://skywalking.apache.org/docs/

🐍 Python 埋点基础：skywalking-python

skywalking-python 是 SkyWalking 官方提供的 Python 探针库，支持自动和手动两种方式采集追踪数据。其主要功能包括：

自动追踪 HTTP 请求（如 Flask、Django、FastAPI）
手动创建 Span（用于自定义业务逻辑）
上下文传播（Context Propagation）
支持 gRPC 和 HTTP 协议上报

🔧 安装与配置

首先安装 skywalking-python：

pip install apache-skywalking

然后，在你的 Python 应用入口处初始化 SkyWalking Agent：

from skywalking import agent, config

config.init(
    collector_address='127.0.0.1:11800',  # OAP 服务器地址
    service_name='my-python-service',
    protocol='grpc'  # 或 'http'
)
agent.start()

⚠️ 注意：必须在导入其他业务模块之前初始化 agent，否则无法正确拦截框架请求。

📡 示例一：Flask 应用自动追踪

我们先从最简单的 Flask 应用开始，展示自动埋点的能力：

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

# app.py
from flask import Flask
from skywalking import agent, config

# 初始化 SkyWalking
config.init(
    collector_address='127.0.0.1:11800',
    service_name='flask-demo',
    protocol='grpc'
)
agent.start()

app = Flask(__name__)

@app.route('/')
def hello():
    return "Hello, SkyWalking!"

@app.route('/user/<int:user_id>')
def get_user(user_id):
    # 模拟数据库查询
    import time
    time.sleep(0.1)
    return f"User {user_id} data"

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)

from skywalking import Component
from skywalking.trace.context import get_context
from skywalking.trace.tags import Tag

def call_external_api(user_id):
    context = get_context()
    with context.new_exit_span(
        op="ExternalAPI/call",
        peer="api.example.com",
        component=Component.Unknown
    ) as span:
        span.tag(Tag(key="user.id", val=str(user_id)))
        # 模拟网络延迟
        import time
        time.sleep(0.2)
    return {"status": "success", "data": f"User {user_id}"}

@app.route('/fetch/<int:user_id>')
def fetch_user(user_id):
    result = call_external_api(user_id)
    return result

// UserController.java
@RestController
@RequestMapping("/api/user")
public class UserController {
    @Autowired
    private UserService userService;

    @GetMapping("/{id}")
    public ResponseEntity<User> getUser(@PathVariable Long id) {
        User user = userService.findById(id);
        return ResponseEntity.ok(user);
    }
}

import requests
from skywalking import agent, config
from skywalking.trace.context import get_context
from skywalking.trace.carrier import Carrier

config.init(
    collector_address='127.0.0.1:11800',
    service_name='python-client',
    protocol='grpc'
)
agent.start()

def call_java_service(user_id):
    context = get_context()
    carrier = Carrier()
    with context.new_exit_span(
        op="HTTP/GET",
        peer="localhost:8080",
        component=Component.HttpClient
    ) as span:
        span.tag(TagHttpMethod("GET"))
        span.tag(TagHttpURL(f"http://localhost:8080/api/user/{user_id}"))
        # 注入上下文到 HTTP Header
        context.inject(carrier)
        headers = dict(carrier)
        response = requests.get(
            f"http://localhost:8080/api/user/{user_id}",
            headers=headers
        )
    return response.json()

@app.route('/proxy/user/<int:user_id>')
def proxy_user(user_id):
    data = call_java_service(user_id)
    return data

carrier = Carrier()
context.inject(carrier)  # 将当前上下文注入到 carrier
headers = dict(carrier)  # 转为字典，用于 HTTP 请求

@GetMapping("/trace")
public String trace(HttpServletRequest request) {
    String sw8 = request.getHeader("sw8"); // SkyWalking Agent 会自动解析并恢复上下文
    return "Traced!";
}

协议	优点	缺点
gRPC	高效、低延迟、支持流式传输	需要额外依赖，防火墙可能限制
HTTP	兼容性好，调试方便	性能略低，不支持双向流

config.init(
    collector_address='127.0.0.1:12800',  # HTTP Collector 默认端口
    service_name='my-service',
    protocol='http'
)

config.init(
    collector_address='127.0.0.1:11800',
    service_name='sampled-service',
    sample_rate=0.3  # 30% 采样
)

import skywalking.plugin
skywalking.plugin.install()  # 自动安装所有已知插件

from skywalking.plugin import plugin_flask, plugin_requests
plugin_flask.install()
plugin_requests.install()

sequenceDiagram
    participant Client
    participant Gateway as API Gateway (Python)
    participant Order as Order Service (Python)
    participant User as User Service (Java)
    participant DB as Database

    Client->>Gateway: GET /user/123/orders
    Gateway->>Order: HTTP GET /orders?user_id=123
    Order->>DB: SELECT * FROM orders WHERE user_id=123
    Order-->>Gateway: [{order_id: 1}, ...]
    Gateway->>User: HTTP GET /api/user/123
    User-->>Gateway: { "name": "Alice" }
    Gateway-->>Client: { "user": "...", "orders": [...] }

from celery import Celery
from skywalking import agent, config

config.init(
    collector_address='127.0.0.1:11800',
    service_name='celery-worker',
    protocol='grpc'
)
agent.start()

app = Celery('tasks', broker='redis://localhost:6379')

@app.task
def send_email(user_id, content):
    context = get_context()
    with context.new_local_span(op="Task/send_email") as span:
        span.tag(Tag(key="user.id", val=str(user_id)))
        # 模拟发送耗时
        import time
        time.sleep(1)
        print(f"Email sent to user {user_id}")

from tasks import send_email
send_email.delay(123, "Welcome!")

rules:
- name: service_resp_time_rule
  expression: service_resp_time > 500
  duration: 5
  message: "Service response time is too high"

import logging
logging.basicConfig(level=logging.DEBUG)

service_name = "order-management-api"

@app.route('/v1/orders/<int:order_id>')
def get_order(order_id):
    ...
    # 在 Span 中显式设置操作名
    span.operation_name = "OrderService.GetOrder"

import os
config.init(
    collector_address=os.getenv('SW_AGENT_COLLECTOR_BACKEND_SERVICES', '127.0.0.1:11800'),
    service_name=os.getenv('SW_AGENT_NAME', 'default-service'),
    sample_rate=float(os.getenv('SW_AGENT_SAMPLE_RATE', '1.0'))
)

import atexit
from skywalking import agent
atexit.register(agent.stop)

import logging
from skywalking.trace.context import get_context

class SkyWalkingFilter(logging.Filter):
    def filter(self, record):
        context = get_context()
        if context.segment:
            record.trace_id = context.segment.trace_id
        else:
            record.trace_id = "N/A"
        return True

logger = logging.getLogger(__name__)
logger.addFilter(SkyWalkingFilter())

handler.setFormatter(logging.Formatter('[%(asctime)s] [%(trace_id)s] %(levelname)s - %(message)s'))

from skywalking import config
config.sample_rate = 0.1  # 10%

# 或者根据条件采样
def should_sample(span):
    if span.operation_name.startswith("Payment"):
        return True  # 支付相关接口 100% 采样
    return False
config.sampling_policy = should_sample

# 如果请求头包含 X-SkyWalking-Sampled: true，则强制采样
if request.headers.get('X-SkyWalking-Sampled') == 'true':
    context.force_sampling()

import unittest
from skywalking.trace.context import get_context

class TestTracing(unittest.TestCase):
    def test_span_creation(self):
        context = get_context()
        with context.new_local_span(op="TestSpan") as span:
            span.tag(Tag(key="test.key", val="test.value"))
            self.assertIsNotNone(span.span_id)
            self.assertEqual(span.operation_name, "TestSpan")

    def test_context_propagation(self):
        context = get_context()
        carrier = Carrier()
        context.inject(carrier)
        self.assertIn("sw8", carrier.items)

# oap-server.yaml
cluster:
  selector: ${SW_CLUSTER:zookeeper}
  zookeeper:
    namespace: ${SW_NAMESPACE:""}
    hostPort: ${SW_CLUSTER_ZK_HOST_PORT:localhost:2181}

try:
    risky_operation()
except Exception as e:
    span.error_occurred = True
    span.log(e)

SkyWalking Python 应用分布式追踪与埋点实践

SkyWalking - Python 应用追踪：基于 skywalking-python 的埋点

🧭 什么是 SkyWalking？

🐍 Python 埋点基础：skywalking-python

🔧 安装与配置

📡 示例一：Flask 应用自动追踪

更多推荐文章

相关免费在线工具

🧵 示例二：手动埋点 —— 自定义 Span

🔗 跨服务追踪：Python 与 Java 交互

🔄 上下文传播机制详解

📊 数据上报协议：gRPC vs HTTP

🎯 性能影响评估

🧩 插件生态与框架支持

🧭 分布式追踪原理图解

🧪 示例三：异步任务追踪（Celery）

📈 指标与告警

🛠️ 故障排查技巧

1. 数据未上报？

2. 调用链断裂？

3. UI 无数据显示？

🌐 生产环境最佳实践

✅ 1. 合理命名服务与端点

✅ 2. 使用环境变量配置

✅ 3. 优雅关闭 Agent

✅ 4. 监控 Agent 自身状态

🧩 扩展功能：日志关联

🧠 高级特性：动态采样与条件追踪

📦 与 OpenTelemetry 的关系

🧪 示例四：集成测试中的追踪验证

🌍 多数据中心部署

💡 小贴士：提升可观测性体验

🏁 总结

📚 延伸阅读

更多推荐文章

相关免费在线工具

SkyWalking Python 应用分布式追踪与埋点实践

SkyWalking - Python 应用追踪：基于 skywalking-python 的埋点

🧭 什么是 SkyWalking？

🐍 Python 埋点基础：skywalking-python

🔧 安装与配置

📡 示例一：Flask 应用自动追踪

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

🧵 示例二：手动埋点 —— 自定义 Span

🔗 跨服务追踪：Python 与 Java 交互

🔄 上下文传播机制详解

📊 数据上报协议：gRPC vs HTTP

🎯 性能影响评估

🧩 插件生态与框架支持

🧭 分布式追踪原理图解

🧪 示例三：异步任务追踪（Celery）

📈 指标与告警

🛠️ 故障排查技巧

1. 数据未上报？

2. 调用链断裂？

3. UI 无数据显示？

🌐 生产环境最佳实践

✅ 1. 合理命名服务与端点

✅ 2. 使用环境变量配置

✅ 3. 优雅关闭 Agent

✅ 4. 监控 Agent 自身状态

🧩 扩展功能：日志关联

🧠 高级特性：动态采样与条件追踪

📦 与 OpenTelemetry 的关系

🧪 示例四：集成测试中的追踪验证

🌍 多数据中心部署

💡 小贴士：提升可观测性体验

🏁 总结

📚 延伸阅读

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具