YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战

YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战 | 极客日志

# boxes: [N, 4] in x1y1x2y2
# scores: [N]
# thr_conf: 置信度阈值（如 0.25）
# thr_iou: NMS IoU 阈值（如 0.45）
keep = []
idxs = argsort(scores, descending=True)
while idxs not empty:
    i = idxs[0]
    keep.append(i)
    ious = IoU(boxes[i], boxes[idxs[1:]])
    idxs = idxs[1:][ious <= thr_iou]
return keep

idx	score	box(x1,y1,x2,y2)
0	0.90	(10,10,50,50)
1	0.85	(12,12,49,49)
2	0.60	(200,200,260,260)
3	0.40	(205,205,258,258)

from ultralytics import YOLO
m = YOLO(r"path/to/best.pt")  # 训练得到的 .pt 或 yolov8n.pt
m.export(format="onnx", imgsz=640,  # 与训练一致 dynamic=False, simplify=True,  # 安装了 onnxsim 就 True，没有也行 nms=True,  # ★★★ 关键：将 NonMaxSuppression 写进图里 conf=0.25,  # 内置置信阈 iou=0.45,  # 内置 NMS IoU opset=12  # 12/13/16 均可，保持一致即可)

import onnxruntime as ort
sess = ort.InferenceSession("best.onnx", providers=["CPUExecutionProvider"])
print([(o.name, o.shape) for o in sess.get_outputs()])  # 看到 [..., 6] / [..., 7] => 带 NMS
# 看到 84/85 出现在任一维 => 原始头（不带 NMS）

#include <onnxruntime_cxx_api.h>
#include <iostream>
#include <vector>
#include <filesystem>

static std::string Shape2Str(const std::vector<int64_t>& v){
  std::string s = "[";
  for(size_t i = 0; i < v.size(); ++i){
    s += std::to_string(v[i]);
    if(i + 1 < v.size()) s += ',';
  }
  return s += ']';
}

static bool LikeNMS(const std::vector<int64_t>& shp){
  return shp.size() >= 2 && (shp.back() == 6 || shp.back() == 7);
}

static bool LikeRaw(const std::vector<int64_t>& shp){
  for(auto d : shp)
    if(d == 84 || d == 85) return true;
  return false;
}

static void InspectOutputs(const Ort::Session& sess){
  const size_t n = sess.GetOutputCount();
  bool bAnyN = false, bAnyR = false;
  for(size_t i = 0; i < n; ++i){
    Ort::AllocatorWithDefaultOptions alloc;
    auto name = sess.GetOutputNameAllocated(i, alloc);
    auto shp = sess.GetOutputTypeInfo(i).GetTensorTypeAndShapeInfo().GetShape();
    std::cout << "out[" << i << "] " << (name ? name.get() : "(null)") << " shape=" << Shape2Str(shp) << "\n";
    bAnyN |= LikeNMS(shp);
    bAnyR |= LikeRaw(shp);
  }
  if(bAnyN) std::cout << "[detect] ✅ 带 NMS 的 end2end 输出\n";
  else if(bAnyR) std::cout << "[detect] ⚠️ 原始头（不带 NMS）\n";
  else std::cout << "[detect] ℹ️ 非常见形状，建议用 Netron 检查是否含 NonMaxSuppression\n";
}

int main(int argc, char** argv){
  if(argc < 2){
    std::cout << "Usage:\n " << argv[0] << " <onnx_model>\n";
    return 0;
  }
  std::filesystem::path strOnnxPath = argv[1];
  if(!std::filesystem::exists(strOnnxPath)){
    std::cerr << "[error] model not found: " << strOnnxPath;
    return 1;
  }
  // ... truncated
}

YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战

YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战

1. 现象与本质

2. NMS 是什么？为什么一定要做？

2.1 NMS 是怎么做的（硬 NMS 伪代码）

2.2 一个极小数值例子

3. 最佳做法：导出'带 NMS'的 ONNX

4. 如何判断是否'带 NMS'

4.1 Python（最快）

4.2 C++（不依赖 Python）

5. 输出张量的物理含义

6. 最小 C++ 示例（带 NMS 的 ONNX）

7. 如果手上只有'原始头'ONNX（84/85）怎么办？

8. vcpkg 无 ORT Config.cmake：CMake 兜底

9. 常见坑位与速查

10. Checklist

附录：NMS 变体与阈值选择

更多推荐文章

相关免费在线工具

YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战

YOLO11 模型 C++ 部署：ONNX 导出、NMS 判别与推理实战

1. 现象与本质

2. NMS 是什么？为什么一定要做？

2.1 NMS 是怎么做的（硬 NMS 伪代码）

2.2 一个极小数值例子

3. 最佳做法：导出'带 NMS'的 ONNX

4. 如何判断是否'带 NMS'

4.1 Python（最快）

4.2 C++（不依赖 Python）

5. 输出张量的物理含义

6. 最小 C++ 示例（带 NMS 的 ONNX）

7. 如果手上只有'原始头'ONNX（84/85）怎么办？

8. vcpkg 无 ORT Config.cmake：CMake 兜底

9. 常见坑位与速查

10. Checklist

附录：NMS 变体与阈值选择

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具