YOLO26n-Pose 在 LSP 姿势估计数据集的训练预测流程（Python/C++）

1.模型训练测试（python）

打开 https://docs.ultralytics.com/zh/tasks/pose/#models，选择模型下载，这里选择 yolo26n-pose.pt，下载后放到你创建的项目的 model 文件夹。

前期 python 环境配置可参考相关文档。

在项目创建 cfg 文件夹，放入配置文件 lsp-pose.yaml。

# cfg/lsp-pose.yaml path: datasets/lsp-pose train: train.txt val: val.txt test: test.txt kpt_shape: [14, 3] flip_idx: [0,1,2,10,11,12,3,4,5,6,7,8,9,13] # 根据 LSP 对称关键点 names: 0: person kpt_names: 0: [left_ankle, left_knee, left_hip, right_hip, right_knee, right_ankle, pelvis, thorax, upper_neck, head_top, left_wrist, left_elbow, left_shoulder, right_shoulder, right_elbow, right_wrist]

预期目录结构如下：

yolo # 项目根，根据你的项目改动 ├── model # 放 *.pt 和*.onnx 的地方 ├── cfg # 专门放各种 yaml │ └── lsp-pose.yaml # 下面内容 ├── datasets # 专门放所有数据集 │ └── lsp-pose # 具体数据集 └── runs # 训练输出（自动生成）

通过终端在项目目录运行

yolo pose train \
 data=cfg/lsp-pose.yaml \
 model=model/yolo26n-pose.pt \
 epochs=40 \
 imgsz=640 \
 batch=16 \
 device=mps

epochs 是轮数，imgsz 是图片处理输入尺寸，batch 是每次输入图像的数量，device 是设备，没有 cuda 或 mps 的话用 cpu。

如果出现报错 AttributeError: Can't get attribute 'Pose26' on <module 'ultralytics.nn.modules.head' from '/Users/Zhuanz/Desktop/work/yolo/.venv/lib/python3.10/site-packages/ultralytics/nn/modules/head.py'>，可通过 uv pip install -U ultralytics 升级 ultralytics 到 ≥ 8.4.0。

训练结束。

查看训练情况，模型在训练过程学到了特征，逐渐收敛，也没有出现过拟合现象，仍有较小的提升空间，下次继续训练和提高数据增强的强度可能提升指标。

执行 yolo export model=runs/pose/train/weights/best.pt format=onnx imgsz=640 simplify=True nms=True 导出。

把 best.onnx 文件移到 model，并改名称为 yolo26n-pose_best.onnx。

编写代码 eval-yolo-pose.py，看看在测试集的表现。

""" Evaluate YOLO26 Pose ONNX model on test set - overall P / R / F1 - optional visualization """
from ultralytics import YOLO
from pathlib import Path
import argparse

def main(args):
    model = YOLO(args.model)
    
    
    
    metrics = model.val(
        data=args.data,
        imgsz=args.imgsz,
        split=,
        conf=args.conf,
        iou=args.iou,
        plots=args.vis, 
        save_json=,
        verbose=
    )
    
    
    
    ()
    ()
    ()
    ()
    ()
    ()
     args.vis:
        ()

 __name__ == :
    parser = argparse.ArgumentParser()
    parser.add_argument(, =, default=, =)
    parser.add_argument(, =, default=)
    parser.add_argument(, =, default=)
    parser.add_argument(, =, default=)
    parser.add_argument(, =, default=)
    parser.add_argument(, action=, =)
    args = parser.parse_args()
    main(args)

/******************************************************* * YOLO26-Pose 单文件 C++ 推理（纯 CPU） * 功能：加载 ONNX 模型 → 读取图片 → 检测人体+14 个关键点 → 画框画骨架 → 保存结果 * 依赖：OpenCV4 + ONNX Runtime（CPU 版） * 编译：见文末命令 ******************************************************/ #include <onnxruntime_cxx_api.h> // ONNX Runtime C++ API #include <opencv2/opencv.hpp> // OpenCV 用于读写/画图 #include <iostream> #include <vector> #include <chrono> // 测速 /*=============== 1. 数据常量 ===============*/ // LSP 数据集 14 个关键点的人体骨架连接（用序号表示） const std::vector<std::pair<int, int>> SKELETON = { {0, 1}, {1, 2}, {2, 6}, {6, 3}, {3, 4}, {4, 5}, // 左腿→骨盆→右腿 {6, 7}, {7, 8}, {8, 9}, // 脊柱→头 {8, 12}, {12, 11}, {11, 10}, // 左臂 {8, 13}, {13, 14}, {14, 15} // 右臂 }; // 每根骨架颜色（这里全部用白色，可随意改） const cv::Scalar LINECOLOR(255, 255, 255); // 关键点颜色（循环用绿色） const cv::Scalar KPTCOLOR(0, 255, 0); // 单个人体的检测结果 struct BboxKpts { cv::Rect box; // 人体框 (x,y,w,h) float score; // 框置信度 std::vector<cv::Point2f> kpts; // 14 个关键点坐标（原图尺度） std::vector<float> conf; // 14 个关键点置信度 }; /*=============== 2. 图像预处理 ===============*/ // 将任意尺寸图片缩放到 640×640，保持宽高比，剩余区域用黑边填充 // 返回：8UC3 彩色图，大小 640×640 static cv::Mat letterbox(const cv::Mat& src, int target = 640) { int w = src.cols, h = src.rows; float scale = std::min(float(target) / w, float(target) / h); int nw = int(w * scale), nh = int(h * scale); cv::Mat resized; cv::resize(src, resized, cv::Size(nw, nh)); // 等比缩放 cv::Mat dst = cv::Mat::zeros(target, target, CV_8UC3); // 黑底 resized.copyTo(dst(cv::Rect((target - nw) / 2, (target - nh) / 2, nw, nh))); return dst; } /*=============== 3. 后处理 ===============*/ // 输入：ONNX 输出张量 float[1][300][57] // 57 = 4(box) + 1(obj 置信度) + 14*3(关键点 x,y,conf) // 输出：NMS 后的多人检测结果 static std::vector<BboxKpts> postprocess(const float* out, int rows, int cols, float confTh = 0.3f, float iouTh = 0.5f) { std::vector<cv::Rect> boxes; std::vector<float> objConf; std::vector<std::vector<cv::Point2f>> kpts; std::vector<std::vector<float>> kconf; // 逐行解析 300 个候选框 for (int i = 0; i < rows; ++i) { const float* row = out + i * cols; float objectness = row[4]; if (objectness < confTh) continue; // 先过滤低置信度框 // 1. 解析框 float x = row[0], y = row[1], w = row[2], h = row[3]; int x1 = int(x - w / 2), y1 = int(y - h / 2); boxes.emplace_back(x1, y1, int(w), int(h)); objConf.push_back(objectness); // 2. 解析 14 个关键点 std::vector<cv::Point2f> kp(14); std::vector<float> kc(14); for (int k = 0; k < 14; ++k) { kc[k] = row[5 + k * 3 + 2]; // 置信度 kp[k].x = row[5 + k * 3]; // x kp[k].y = row[5 + k * 3 + 1]; // y } kpts.push_back(kp); kconf.push_back(kc); } // NMS 去掉重复框 std::vector<int> indices; cv::dnn::NMSBoxes(boxes, objConf, confTh, iouTh, indices); std::vector<BboxKpts> final; for (int idx : indices) { BboxKpts b; b.box = boxes[idx]; b.score = objConf[idx]; b.kpts = kpts[idx]; b.conf = kconf[idx]; final.push_back(b); } return final; } /*=============== 4. 主函数 ===============*/ int main(int argc, char** argv) { if (argc < 2) { std::cerr << "用法：./test_pose <图片路径>\n"; return 1; } const std::string modelPath = "model/yolo26n-pose_best.onnx"; const std::string imgPath = argv[1]; /* 4.1 创建 ONNX Runtime 会话（纯 CPU）*/ Ort::Env env(ORT_LOGGING_LEVEL_WARNING, "yolo26"); Ort::SessionOptions sessOpt; sessOpt.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL); Ort::Session session(env, modelPath.c_str(), sessOpt); /* 4.2 获取输入/输出名字 */ Ort::AllocatorWithDefaultOptions alc; auto inputName = session.GetInputNameAllocated(0, alc); auto outputName = session.GetOutputNameAllocated(0, alc); const char* inputNames[] = {inputName.get()}; const char* outputNames[] = {outputName.get()}; /* 4.3 读取并预处理图片 */ cv::Mat raw = cv::imread(imgPath); if (raw.empty()) { std::cerr << "无法读取图片：" << imgPath << "\n"; return 1; } cv::Mat img640 = letterbox(raw); // 640×640 黑边 cv::Mat blob; cv::dnn::blobFromImage(img640, blob, 1.0 / 255.0, cv::Size(640, 640), cv::Scalar(), true, false); // NCHW, float32 /* 4.4 组装输入张量 */ std::vector<int64_t> inputDims{1, 3, 640, 640}; auto memoryInfo = Ort::MemoryInfo::CreateCpu(OrtDeviceAllocator, OrtMemTypeDefault); Ort::Value inputTensor = Ort::Value::CreateTensor<float>( memoryInfo, blob.ptr<float>(), blob.total(), inputDims.data(), inputDims.size()); /* 4.5 推理 */ auto t0 = std::chrono::steady_clock::now(); auto outputTensors = session.Run(Ort::RunOptions{nullptr}, inputNames, &inputTensor, 1, outputNames, 1); auto t1 = std::chrono::steady_clock::now(); float latency = std::chrono::duration<double, std::milli>(t1 - t0).count(); std::cout << "[INFO] CPU 推理耗时：" << latency << " ms\n"; /* 4.6 后处理 */ float* outPtr = outputTensors[0].GetTensorMutableData<float>(); std::vector<int64_t> outShape = outputTensors[0].GetTensorTypeAndShapeInfo().GetShape(); int candidates = outShape[1], attr = outShape[2]; // [1,300,57] auto dets = postprocess(outPtr, candidates, attr, 0.3f, 0.5f); /* 4.7 把坐标映射回原图并画图 */ float fx = float(raw.cols) / 640.f; float fy = float(raw.rows) / 640.f; for (const auto& d : dets) { // 画框 cv::Rect realBox(d.box.x * fx, d.box.y * fy, d.box.width * fx, d.box.height * fy); cv::rectangle(raw, realBox, cv::Scalar(0, 255, 0), 2); // 画关键点和骨架 for (int k = 0; k < 14; ++k) { if (d.conf[k] < 0.3f) continue; // 低置信度跳过 cv::Point2f p(d.kpts[k].x * fx, d.kpts[k].y * fy); cv::circle(raw, p, 3, KPTCOLOR, -1); } for (const auto& [s, t] : SKELETON) { if (d.conf[s] < 0.3f || d.conf[t] < 0.3f) continue; cv::Point2f ps(d.kpts[s].x * fx, d.kpts[s].y * fy); cv::Point2f pt(d.kpts[t].x * fx, d.kpts[t].y * fy); cv::line(raw, ps, pt, LINECOLOR, 2); } } /* 4.8 保存 & 显示 */ cv::imwrite("result_lsp.jpg", raw); cv::imshow("YOLO26-Pose 结果", raw); cv::waitKey(0); return 0; } /*=============== 5. 编译命令 =============== g++ test_pose.cpp -o test_pose \ -Ionnxruntime-osx-arm64-1.23.1/include \ -Lonnxruntime-osx-arm64-1.23.1/lib -lonnxruntime \ `pkg-config --cflags --libs opencv4` \ -std=c++17 -O3 \ -Wl,-rpath,@executable_path/onnxruntime-osx-arm64-1.23.1/lib =======================================*/

YOLO26n-Pose 在 LSP 姿势估计数据集的训练预测流程（Python/C++）

1.模型训练测试（python）

更多推荐文章

相关免费在线工具

2.模型预测展示（c++）

更多推荐文章

相关免费在线工具

YOLO26n-Pose 在 LSP 姿势估计数据集的训练预测流程（Python/C++）

1.模型训练测试（python）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.模型预测展示（c++）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具