YOLO26n-pose 在 LSP 数据集的姿势估计训练与推理流程（Python/C++）

综述由AI生成使用 YOLO26n-pose 模型在 LSP 姿态估计数据集上的完整训练与推理流程。首先通过 Python 环境配置、数据集准备及配置文件编写，完成模型的训练与导出为 ONNX 格式。随后展示了基于 C++ 和 OpenCV 的纯 CPU 推理代码实现，包括图像预处理、模型加载、后处理及结果可视化。测试结果显示模型在 LSP 测试集上 mAP50 达到 0.7502，推理速度约 49.6ms，实现了轻量化与高精度的平衡。

RefactorPro发布于 2026/3/29更新于 2026/5/2533 浏览

YOLO26n-pose 在 LSP 数据集的姿势估计训练与推理流程（Python/C++）

1. 模型训练测试（Python）

打开 Ultralytics 官方文档，选择模型下载，这里选择 yolo26n-pose.pt，下载后放到你创建的项目的 model 文件夹。

前期 Python 环境配置请参考 Ultralytics 官方文档。

如果需要数据集，可以自行网上找找。在项目创建 cfg 文件夹，放入配置文件 lsp-pose.yaml。

# cfg/lsp-pose.yaml
path: datasets/lsp-pose
train: train.txt
val: val.txt
test: test.txt
kpt_shape: [14, 3]
flip_idx: [0,1,2,10,11,12,3,4,5,6,7,8,9,13]
names:
  0: person
kpt_names:
  0: left_ankle
  1: left_knee
  2: left_hip
  3: right_hip
  4: right_knee
  5: right_ankle
  6: pelvis
  7: thorax
  8: upper_neck
  9: head_top

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

yolo # 项目根，根据你的项目改动
├── model # 放 *.pt 和 *.onnx 的地方
├── cfg # 专门放各种 yaml
│   └── lsp-pose.yaml
├── datasets # 专门放所有数据集
│   └── lsp-pose # 具体数据集
└── runs # 训练输出（自动生成）

yolo pose train \
  data=cfg/lsp-pose.yaml \
  model=model/yolo26n-pose.pt \
  epochs=40 \
  imgsz=640 \
  batch=16 \
  device=mps

yolo export model=runs/pose/train/weights/best.pt format=onnx imgsz=640 simplify=True nms=True

""" Evaluate YOLO26 Pose ONNX model on test set - overall P / R / F1 - optional visualization """
from ultralytics import YOLO
from pathlib import Path
import argparse

def main(args):
    model = YOLO(args.model)
    # =========================
    # 1. 官方 Pose 验证（核心）
    # =========================
    metrics = model.val(
        data=args.data,
        imgsz=args.imgsz,
        split="test",
        conf=args.conf,
        iou=args.iou,
        plots=args.vis,  # 是否生成可视化
        save_json=False,
        verbose=True
    )
    # =========================
    # 2. 输出整体指标
    # =========================
    print("\n===== Overall Pose Metrics =====")
    print(f"Precision: {metrics.box.mp:.4f}")
    print(f"Recall: {metrics.box.mr:.4f}")
    print(f"F1-score: {2 * metrics.box.mp * metrics.box.mr / (metrics.box.mp + metrics.box.mr + 1e-6):.4f}")
    print(f"mAP50: {metrics.box.map50:.4f}")
    print(f"mAP50-95: {metrics.box.map:.4f}")
    if args.vis:
        print(f"\nVisualization saved to: {metrics.save_dir}")

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--model", type=str, default=r'model/yolo26n-pose_best.onnx', help="best.onnx or best.pt")
    parser.add_argument("--data", type=str, default=r'cfg/lsp-pose.yaml')
    parser.add_argument("--imgsz", type=int, default=640)
    parser.add_argument("--conf", type=float, default=0.25)
    parser.add_argument("--iou", type=float, default=0.65)
    parser.add_argument("--vis", action="store_true", help="enable visualization")
    args = parser.parse_args()
    main(args)

/*******************************************************
 * YOLO26-Pose 单文件 C++ 推理（纯 CPU）
 * 功能：加载 ONNX 模型 → 读取图片 → 检测人体+14 个关键点 → 画框画骨架 → 保存结果
 * 依赖：OpenCV4 + ONNX Runtime（CPU 版）
 ******************************************************/
#include <onnxruntime_cxx_api.h>
#include <opencv2/opencv.hpp>
#include <iostream>
#include <vector>
#include <chrono>

/*=============== 1. 数据常量 ===============*/
const std::vector<std::pair<int, int>> SKELETON = {
    {0, 1}, {1, 2}, {2, 6}, {6, 3}, {3, 4}, {4, 5},
    {6, 7}, {7, 8}, {8, 9},
    {8, 12}, {12, 11}, {11, 10},
    {8, 13}, {13, 14}, {14, 15}
};
const cv::Scalar LINECOLOR(255, 255, 255);
const cv::Scalar KPTCOLOR(0, 255, 0);

struct BboxKpts {
    cv::Rect box;
    float score;
    std::vector<cv::Point2f> kpts;
    std::vector<float> conf;
};

/*=============== 2. 图像预处理 ===============*/
static cv::Mat letterbox(const cv::Mat& src, int target = 640) {
    int w = src.cols, h = src.rows;
    float scale = std::min(float(target) / w, float(target) / h);
    int nw = int(w * scale), nh = int(h * scale);
    cv::Mat resized;
    cv::resize(src, resized, cv::Size(nw, nh));
    cv::Mat dst = cv::Mat::zeros(target, target, CV_8UC3);
    resized.copyTo(dst(cv::Rect((target - nw) / 2, (target - nh) / 2, nw, nh)));
    return dst;
}

/*=============== 3. 后处理 ===============*/
static std::vector<BboxKpts> postprocess(const float* out, int rows, int cols, float confTh = 0.3f, float iouTh = 0.5f) {
    std::vector<cv::Rect> boxes;
    std::vector<float> objConf;
    std::vector<std::vector<cv::Point2f>> kpts;
    std::vector<std::vector<float>> kconf;

    for (int i = 0; i < rows; ++i) {
        const float* row = out + i * cols;
        float objectness = row[4];
        if (objectness < confTh) continue;

        float x = row[0], y = row[1], w = row[2], h = row[3];
        int x1 = int(x - w / 2), y1 = int(y - h / 2);
        boxes.emplace_back(x1, y1, int(w), int(h));
        objConf.push_back(objectness);

        std::vector<cv::Point2f> kp(14);
        std::vector<float> kc(14);
        for (int k = 0; k < 14; ++k) {
            kc[k] = row[5 + k * 3 + 2];
            kp[k].x = row[5 + k * 3];
            kp[k].y = row[5 + k * 3 + 1];
        }
        kpts.push_back(kp);
        kconf.push_back(kc);
    }

    std::vector<int> indices;
    cv::dnn::NMSBoxes(boxes, objConf, confTh, iouTh, indices);

    std::vector<BboxKpts> final;
    for (int idx : indices) {
        BboxKpts b;
        b.box = boxes[idx];
        b.score = objConf[idx];
        b.kpts = kpts[idx];
        b.conf = kconf[idx];
        final.push_back(b);
    }
    return final;
}

/*=============== 4. 主函数 ===============*/
int main(int argc, char** argv) {
    if (argc < 2) {
        std::cerr << "用法：./test_pose <图片路径>\n";
        return 1;
    }
    const std::string modelPath = "model/yolo26n-pose_best.onnx";
    const std::string imgPath = argv[1];

    Ort::Env env(ORT_LOGGING_LEVEL_WARNING, "yolo26");
    Ort::SessionOptions sessOpt;
    sessOpt.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL);
    Ort::Session session(env, modelPath.c_str(), sessOpt);

    Ort::AllocatorWithDefaultOptions alc;
    auto inputName = session.GetInputNameAllocated(0, alc);
    auto outputName = session.GetOutputNameAllocated(0, alc);
    const char* inputNames[] = {inputName.get()};
    const char* outputNames[] = {outputName.get()};

    cv::Mat raw = cv::imread(imgPath);
    if (raw.empty()) {
        std::cerr << "无法读取图片：" << imgPath << "\n";
        return 1;
    }
    cv::Mat img640 = letterbox(raw);
    cv::Mat blob;
    cv::dnn::blobFromImage(img640, blob, 1.0 / 255.0, cv::Size(640, 640), cv::Scalar(), true, false);

    std::vector<int64_t> inputDims{1, 3, 640, 640};
    auto memoryInfo = Ort::MemoryInfo::CreateCpu(OrtDeviceAllocator, OrtMemTypeDefault);
    Ort::Value inputTensor = Ort::Value::CreateTensor<float>(
        memoryInfo, blob.ptr<float>(), blob.total(), inputDims.data(), inputDims.size());

    auto t0 = std::chrono::steady_clock::now();
    auto outputTensors = session.Run(Ort::RunOptions{nullptr}, inputNames, &inputTensor, 1, outputNames, 1);
    auto t1 = std::chrono::steady_clock::now();
    float latency = std::chrono::duration<double, std::milli>(t1 - t0).count();
    std::cout << "[INFO] CPU 推理耗时：" << latency << " ms\n";

    float* outPtr = outputTensors[0].GetTensorMutableData<float>();
    std::vector<int64_t> outShape = outputTensors[0].GetTensorTypeAndShapeInfo().GetShape();
    int candidates = outShape[1], attr = outShape[2];
    auto dets = postprocess(outPtr, candidates, attr, 0.3f, 0.5f);

    float fx = float(raw.cols) / 640.f;
    float fy = float(raw.rows) / 640.f;
    for (const auto& d : dets) {
        cv::Rect realBox(d.box.x * fx, d.box.y * fy, d.box.width * fx, d.box.height * fx);
        cv::rectangle(raw, realBox, cv::Scalar(0, 255, 0), 2);

        for (int k = 0; k < 14; ++k) {
            if (d.conf[k] < 0.3f) continue;
            cv::Point2f p(d.kpts[k].x * fx, d.kpts[k].y * fy);
            cv::circle(raw, p, 3, KPTCOLOR, -1);
        }
        for (const auto& [s, t] : SKELETON) {
            if (d.conf[s] < 0.3f || d.conf[t] < 0.3f) continue;
            cv::Point2f ps(d.kpts[s].x * fx, d.kpts[s].y * fy);
            cv::Point2f pt(d.kpts[t].x * fx, d.kpts[t].y * fy);
            cv::line(raw, ps, pt, LINECOLOR, 2);
        }
    }

    cv::imwrite("result_lsp.jpg", raw);
    cv::imshow("YOLO26-Pose 结果", raw);
    cv::waitKey(0);
    return 0;
}

g++ test_pose.cpp -o test_pose \
  -Ionnxruntime-osx-arm64-1.23.1/include \
  -Lonnxruntime-osx-arm64-1.23.1/lib -lonnxruntime \
  `pkg-config --cflags --libs opencv4` \
  -std=c++17 -O3 \
  -Wl,-rpath,@executable_path/onnxruntime-osx-arm64-1.23.1/lib

YOLO26n-pose 在 LSP 数据集的姿势估计训练与推理流程（Python/C++）

1. 模型训练测试（Python）

更多推荐文章

相关免费在线工具

2. 模型预测展示（C++）

更多推荐文章

相关免费在线工具

YOLO26n-pose 在 LSP 数据集的姿势估计训练与推理流程（Python/C++）

1. 模型训练测试（Python）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 模型预测展示（C++）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具