C++ 调用 OCR 服务：使用 libcurl 发送 POST 请求获取识别结果

技术背景与问题提出

在现代信息处理系统中，光学字符识别（OCR）已成为连接物理世界与数字世界的桥梁。无论是文档数字化、发票识别，还是智能客服中的图像理解，OCR 都扮演着关键角色。然而，许多轻量级 OCR 模型在面对复杂背景、模糊字体或中文手写体时表现不佳，导致识别准确率下降。

为解决这一问题，基于 CRNN（Convolutional Recurrent Neural Network）的通用 OCR 服务应运而生。该服务采用经典的卷积 + 循环网络结构，在保持 CPU 可运行的前提下，显著提升了对中文文本的识别能力。同时，服务通过 Flask 提供了 RESTful API 接口，使得外部程序如 C++ 应用可以轻松集成。

本文将重点讲解如何在 C++ 环境下，利用 libcurl 库向该 OCR 服务发起 POST 请求，上传图片并获取结构化识别结果，实现高效、低延迟的文字提取功能。

核心价值与技术选型动机

为什么选择 libcurl？

跨平台支持（Windows/Linux/macOS）
支持 HTTPS 和表单数据上传
成熟稳定，广泛用于工业级项目
可精细控制 HTTP 头部、超时、代理等参数

结合 CRNN OCR 服务提供的标准接口，我们可以通过构造 multipart/form-data 类型的 POST 请求，直接上传本地图像文件，并以 JSON 格式接收识别结果。

本方案优势总结：

无需依赖 Python 环境，纯 C++ 实现调用
利用 CPU 推理服务，部署成本低
响应时间 <1s，适合高并发场景
易于嵌入到桌面应用、边缘设备或后台服务中

工作原理深度拆解

1. OCR 服务 API 设计解析

该 OCR 服务暴露了一个简洁的 REST 接口：

POST http://<host>:<port>/ocr

支持字段：

image：待识别的图像文件（JPEG/PNG/BMP）

返回 JSON 示例：

{
 "code": 0,
 "msg": "success",
 "data": [
  {
   "text": "你好，世界",
   "box": [10

#include <iostream> #include <string> #include <vector> #include <curl/curl.h> #include <nlohmann/json.hpp> using json = nlohmann::json; // 回调函数：接收 HTTP 响应数据 static size_t WriteCallback(void* contents, size_t size, size_t nmemb, std::string* output) { size_t total_size = size * nmemb; output->append((char*)contents, total_size); return total_size; } // 发起 OCR 请求 bool CallOCRService(const std::string& image_path, const std::string& server_url) { CURL* curl; CURLcode res; struct curl_httppost* formpost = nullptr; struct curl_httppost* lastptr = nullptr; std::string response_string; curl_global_init(CURL_GLOBAL_ALL); curl = curl_easy_init(); if (!curl) { std::cerr << "cURL 初始化失败" << std::endl; return false; } // 1. 添加文件字段 curl_formadd(&formpost, &lastptr, CURLFORM_COPYNAME, "image", CURLFORM_FILE, image_path.c_str(), CURLFORM_CONTENTTYPE, "image/jpeg", CURLFORM_END); // 2. 设置请求选项 curl_easy_setopt(curl, CURLOPT_URL, server_url.c_str()); curl_easy_setopt(curl, CURLOPT_HTTPPOST, formpost); curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteCallback); curl_easy_setopt(curl, CURLOPT_WRITEDATA, &response_string); curl_easy_setopt(curl, CURLOPT_TIMEOUT, 30L); // 超时 30 秒 curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L); // 3. 执行请求 res = curl_easy_perform(curl); if (res != CURLE_OK) { std::cerr << "请求失败：" << curl_easy_strerror(res) << std::endl; curl_easy_cleanup(curl); curl_formfree(formpost); curl_global_cleanup(); return false; } // 4. 解析响应 try { json response = json::parse(response_string); int code = response.value("code", -1); if (code == 0 && response.contains("data")) { std::cout << "识别成功，共检测到 " << response["data"].size() << " 行文字：" << std::endl; for (const auto& item : response["data"]) { std::cout << " \"" << item["text"].get<std::string>() << "\"" << " [Box: "; if (item.contains("box")) { auto box = item["box"].get<std::vector<int>>(); for (size_t i = 0; i < box.size(); ++i) { std::cout << box[i] << (i < box.size() - 1 ? "," : ""); } } std::cout << "]" << std::endl; } } else { std::cerr << "服务返回错误：" << response.value("msg", "unknown") << std::endl; } } catch (const std::exception& e) { std::cerr << "JSON 解析失败：" << e.what() << std::endl; std::cerr << "原始响应：" << response_string << std::endl; } // 5. 清理资源 curl_easy_cleanup(curl); curl_formfree(formpost); curl_global_cleanup(); return true; } int main() { std::string image_path = "./test.jpg"; // 替换为你的测试图片路径 std::string server_url = "http://localhost:7860/ocr"; // OCR 服务地址 std::cout << "正在向 " << server_url << " 发送图片..." << std::endl; if (CallOCRService(image_path, server_url)) { std::cout << "调用完成" << std::endl; } else { std::cout << "调用失败" << std::endl; return 1; } return 0; }

问题	原因	解决方法
CURLE_COULDNT_CONNECT	服务未启动或端口错误	检查 Docker 是否运行，确认端口映射
图像上传后无响应	文件路径无效或格式不支持	确保图片存在且为 JPEG/PNG/BMP
JSON 解析失败	返回非 JSON 或网络中断	增加异常捕获和日志输出
内存泄漏	未调用 curl_formfree()	务必清理 form 和 curl 句柄

C++ 调用 OCR 服务：使用 libcurl 发送 POST 请求获取识别结果