Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

深入探讨了 C++ 网络编程中的核心概念，涵盖序列化技术、JSON 数据格式解析以及 HTTP 协议原理。通过从零构建一个简单的 Web 计算器服务器，详细展示了如何使用 Socket 进行 TCP 通信，利用线程池处理并发请求，并实现了基于 GET 和 POST 方法的静态资源服务与动态业务逻辑处理。文章结合 nlohmann/json 库的使用与底层数据结构设计，提供了完整的代码实现与调试思路，适合希望掌握 Linux 下高性能 Web 服务开发的开发者参考。

追风少年发布于 2026/3/24更新于 2026/7/635 浏览

Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

引言

在之前的探讨中，我们深入分析了序列化与反序列化的概念。对于使用 TCP 协议进行通信的双方，由于 TCP 是面向字节流的，在发送数据之前，通常需要定义一种结构化的数据来描述传输内容。在 C++ 中，这种结构化数据通常表现为对象或结构体。然而，我们不能直接将结构体内存中对应的字节原样发送到另一端，因为直接传递内存字节会引发字节序和结构体内存对齐的问题。不同平台、不同编译器所遵循的内存对齐规则可能不同，这可能导致接收方在解析结构体字段时出现错误。

因此，我们需要借助序列化。序列化是指将结构化的数据按照预定的规则转换为连续的字节流。其主要目的是屏蔽平台差异，使得位于不同平台的进程能够以统一的方式解析该字节流。序列化通常分为两种形式：文本序列化与二进制序列化。

文本序列化将结构化的数据转换为一个完整的字符串。字符串本身是以字符为单位的连续序列，每个字符通常占用一个字节，因此字符串本质上也是一个连续的字节流。由于字符串以字符为单位解析，不存在字节序问题。通信双方只需约定字符串的格式与编码方式，即可正确解析该字符序列，最终将连续的字节流还原为结构化的数据。

二进制序列化则直接发送数据在内存中的原始二进制序列，无需额外转换。这两种方式各有优劣：文本序列化直观、可读性高、便于调试；而二进制序列化发送的是二进制数据，人类难以直接阅读。文本序列化会将数据转换为字符形式，可能导致传输体积增大——例如整数 100000 在文本序列化中会被转换为 "100000" 占 6 个字节，而作为 int 类型的二进制序列化仅需 4 个字节。因此，二进制序列化在传输体积上通常更小。此外，文本序列化还需要对字符串进行解析以恢复原始数据，而二进制序列化的解析开销通常更低，因为它直接对应数据的原始二进制表示。

特性	文本序列化 (JSON/XML)	二进制序列化 (Protobuf/Thrift)
可读性	极高（肉眼可读）	低（十六进制乱码）
传输体积	较大（数字变字符，带大量引号）	极小（紧凑编码）
解析速度	较慢（需字符串扫描、词法解析）	极快（直接偏移寻址或位运算）
跨语言	完美（天然支持）	优秀（需编译 IDL 文件）

在上一篇博客中，我们手动实现了文本序列化，即将结构体各字段按一定格式拼接为完整字符串。我之所以手动实现，是为了帮助大家理解序列化的基本原理，并为本文内容做铺垫。

然而在实际开发中，我们通常不需要从头实现序列化，可以使用成熟的第三方库来完成这项工作。这些库的实现通常更完善、更高效。本文将介绍的第一个主题——JSON，就是一种广泛应用的文本序列化格式。

JSON 详解

首先，介绍一下什么是 JSON。JSON（JavaScript Object Notation）是一种轻量级、基于文本、人类可读的数据交换格式。JSON 源于 JavaScript，借鉴了其对象和数组的表示方法。但由于 JSON 本身是文本格式，且所表示的基本数据类型（如整型、布尔值等）在绝大多数编程语言中都得到支持，因此 JSON 并不局限于 JavaScript，而是能够被多种编程语言解析与生成。正因如此，JSON 不仅具备跨平台能力，还能实现跨语言的数据交换。

了解 JSON 的基本定义后，我们进一步探讨其本质。如上所述，JSON 实质上是一种文本序列化的方式。在此之前，我们曾手动实现过文本序列化，其核心原理是将结构体的各个字段按照特定格式拼接为一个完整的字符串。因此，JSON 的本质其实就是符合 JSON 规范（风格）的字符串。

理论上，只要我们清楚 JSON 格式的规范，就可以利用字符串操作函数手动拼接出符合 JSON 风格的字符串，而无需借助第三方库。字符串拼接本身并不复杂，因此自然引出一个疑问：相比手动实现，第三方库的优势究竟在哪里？如果仅实现序列化（即转换为 JSON 字符串），那么使用第三方库似乎并未显著减轻负担，因为序列化这一步本身并不困难。要回答这个问题，我们首先需要明确 JSON 风格字符串的具体形式，进而理解第三方库所承担的工作。这一点我们稍后再展开。

JSON 支持若干基本数据类型，例如整型、浮点型和布尔型，也支持字符串、对象等复杂类型：

JSON 类型	C++ 对应类型	描述
Number	, ,

码点范围 (十六进制)	字节数	字节模板 (二进制)
`0000 0000` - `0000 007F`	1	`0xxxxxxx` (完全兼容 ASCII)
`0000 0080` - `0000 07FF`	2	`110xxxxx 10xxxxxx`
`0000 0800` - `0000 FFFF`	3	`1110xxxx 10xxxxxx 10xxxxxx` (大部分汉字在这)
`0001 0000` - `0010 FFFF`	4	`11110xxx 10xxxxxx 10xxxxxx 10xxxxxx`

组成部分	示例内容	专业术语
协议	`https://`	Scheme
域名	`www.example.com`	Domain/Host
端口	`:443`	Port
路径	`/music/list`	Path
参数	`?id=1024&type=pop`	Query String
锚点	`#comment`	Fragment

域名后缀	代表含义	适用对象
.com	Commercial	最初限企业，现已演变成全球通用的商业标识。
.org	Organization	各种非营利性机构、开源项目。
.net	Network	最初为网络基础设施（ISP）设计。
.edu	Education	主要是美国高等教育，中国则对应二级域名 `.edu.cn`。
.gov	Government	仅限政府机构使用，具有极高权威性。

请求方法	语义 (Action)	数据位置	是否有 Body	幂等性*	安全性**	典型应用场景
GET	获取资源	URL 查询参数	否	是	是	浏览网页、搜索图片、查询余额
POST	新增或处理资源	请求体 (Body)	是	否	否	注册账号、发表评论、上传文件
PUT	更新（全量覆盖）	请求体 (Body)	是	是	否	修改用户完整档案、上传同名覆盖文件
PATCH	更新（局部修改）	请求体 (Body)	是	否	否	只修改用户的头像或改个密码
DELETE	删除资源	URL 路径	否	是	否	注销账户、删除一条朋友圈
HEAD	获取头部信息	N/A	否	是	是	检查链接有效性、获取文件大小
OPTIONS	查询支持的方法	N/A	否	是	是	跨域 (CORS) 前询问服务器允许哪些操作
TRACE	回显服务器收到的请求	N/A	否	是	是	用于诊断或测试网络路径中的代理

原始字符	特殊含义	编码后 (Hex)
空格	分隔符（旧标准变 `+`）	`%20`
/	路径分隔符	`%2F`
?	查询参数起始符	`%3F`
&	键值对分隔符	`%26`
=	键值对连接符	`%3D`
%	编码引导符本身	`%25`

提交方式	数据藏在哪？	报文里的样子	有无正文？
GET	请求行 (URL)	`GET /path?name=tom&age=20 HTTP/1.1`	无
POST	请求正文	`Content-Type: multipart/form-data...`	有

类别	含义	场景比喻	常见例子
1xx	信息性状态码	'收到了，别急，处理中…'	101 Switching Protocols：升级到 WebSocket 协议。
2xx	成功状态码	'没问题，你要的东西在这。'	200 OK：请求成功；201 Created：上传文件成功。
3xx	重定向状态码	'你要的东西搬家了，去那取。'	301：永久搬家；302：临时出差；304：你本地有缓存，直接看缓存。
4xx	客户端错误	'你的请求有误，我没法办。'	400：参数写错了；403：我有但不给你看；404：我这没这东西。
5xx	服务器错误	'我出故障了，稍后再试。'	500：后台程序崩溃；502：网关坏了；504：后台超时了。

字符 (Character)	转义序列 (Escape)	ASCII 值 (Hex/Dec)	描述 (Description)
空格	`' '`	`0x20 / 32`	最常见的单词分隔符
换行符	`'
'`	`0x0A / 10`	Line Feed，Unix/Linux 系统下的换行
回车符	`'
'`	`0x0D / 13`	Carriage Return，Windows 换行符（\r\n）的一部分
水平制表符	`' '`	`0x09 / 9`	Tab 键，通常对应 4 或 8 个空格
垂直制表符	`'
'`	`0x0B / 11`	Vertical Tab，现代编程中较少使用
换页符	`''`	`0x0C / 12`	Form Feed，常用于控制打印机换页

std::string Http_Post_Handler(Http_Request& hr){ std::string res; std::unordered_map<std::string, std::string> val; size_t start = 0; if(hr.url == "/calc"){ std::string body = hr.text; size_t pos1 = body.find("&"); if(pos1 == std::string::npos){ return process_bad_request(); } std::string expression = body.substr(start, pos1); size_t pos2 = expression.find("="); if(pos2 == std::string::npos){ return process_bad_request(); } std::string result_key_str = expression.substr(start, pos2); std::string result_value_str = expression.substr(pos2 + 1); val[result_key_str] = result_value_str; start = pos1 + 1; pos1 = body.find("&", start); if(pos1 == std::string::npos){ return process_bad_request(); } pos2 = body.find("=", start); if(pos2 == std::string::npos || pos2 > pos1){ return process_bad_request(); } result_key_str = body.substr(start, pos2 - start); result_value_str = body.substr(pos2 + 1, pos1 - pos2 - 1); val[result_key_str] = result_value_str; start = pos1 + 1; pos2 = body.find("=", start); if(pos2 == std::string::npos){ return process_bad_request(); } result_key_str = body.substr(start, pos2 - start); result_value_str = body.substr(pos2 + 1); val[result_key_str] = result_value_str; int calc_result; if(process_calculation(val, calc_result) == false){ return process_bad_request(); } std::string headler_line = "HTTP/1.0 200 OK\r\n"; std::string header = "Connection: close\r\n"; header += "Content-Type: text/html\r\n"; std::string content = "<html><head><meta charset='UTF-8'></head><body>"; content += "<h2>计算结果展示</h2>"; content += "<p>结果为：" + std::to_string(calc_result) + "</p>"; content += "<a href='/'>返回首页</a>"; content += "</body></html>"; header += "Content-Length: " + std::to_string(content.size()) + "\r\n"; header += "\r\n"; res = headler_line + header + content; return res; } else { lg.logmessage(Fatal, "unsupported post url: %s", hr.url.c_str()); return process_bad_request(); } }

#include <arpa/inet.h> #include <netinet/in.h> #include <unistd.h> #include <string> #include <cstring> #include <cstdlib> #include "log.hpp" extern log lg; enum { Socket_Error = 1, Bind_Error, Listen_Error, Accept_Error, Connect_Error, Usage_Error, }; class sock { public: sock(): socketfd(-1) {} ~sock(){ if(socketfd >= 0){ ::close(socketfd); } } /** * 创建并配置 socket * 该函数用于创建一个 TCP 套接字，并设置地址和端口重用选项 */ void socket(){ // 使用系统调用 socket 创建 TCP 套接字 // AF_INET 表示使用 IPv4 地址 // SOCK_STREAM 表示使用 TCP 协议 // 0 表示自动选择合适的协议 socketfd = ::socket(AF_INET, SOCK_STREAM, 0); // 检查 socket 创建是否成功 if(socketfd < 0){ // 如果创建失败，记录错误日志并退出程序 lg.logmessage(Fatal, "socket error"); socketfd = -1; exit(Socket_Error); } // 设置 socket 选项，允许地址和端口重用 // opt 为 1，表示启用 SO_REUSEADDR 和 SO_REUSEPORT 选项 // 这样可以避免在服务器重启时出现地址已被占用的错误 int opt = 1; setsockopt(socketfd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT, &opt, sizeof(opt)); // 记录 socket 创建成功的日志 lg.logmessage(info, "socket successfully"); } /** * 绑定 IP 地址和端口号到套接字 * ip 要绑定的 IP 地址，字符串形式 * port 要绑定的端口号，16 位无符号整数 */ void bind(std::string ip, uint16_t port){ // 检查套接字是否有效 if(socketfd < 0) // 如果套接字描述符无效（小于 0） { lg.logmessage(Fatal, "socket not created"); // 记录致命错误：套接字未创建 exit(Socket_Error); // 退出程序，套接字错误码 } // 创建并清空服务器地址结构体 struct sockaddr_in server; // 定义 IPv4 地址结构体 memset(&server, 0, sizeof(server)); // 将 server 结构体清零，确保所有字段初始化为 0 // 设置地址族为 IPv4 server.sin_family = AF_INET; // 设置地址族为 IPv4 // 将端口号从主机字节序转换为网络字节序 server.sin_port = htons(port); // 使用 htons 函数将端口号转换为网络字节序 // 处理 IP 地址 if(ip == "0.0.0.0") // 检查是否为通配地址 { // 如果 IP 是 0.0.0.0，绑定到所有可用的网络接口 server.sin_addr.s_addr = INADDR_ANY; // 绑定到所有可用的网络接口 } else if(inet_pton(AF_INET, ip.c_str(), &server.sin_addr) <= 0) // 尝试将 IP 字符串转换为网络地址格式 { // 尝试将 IP 字符串转换为网络地址格式，如果失败则记录错误 lg.logmessage(Fatal, "inet_pton fail"); // 记录致命错误：IP 地址转换失败 ::close(socketfd); // 关闭套接字 socketfd = -1; // 将套接字描述符设置为无效值 exit(Bind_Error); // 退出程序，绑定错误码 } socklen_t serverlen = sizeof(server); // 获取服务器地址结构体的大小 int n = ::bind(socketfd, (struct sockaddr*)&server, serverlen); // 调用 bind 函数绑定地址 if(n < 0) // 检查 bind 函数是否执行成功 { lg.logmessage(Fatal, "bind error"); // 记录致命错误：绑定失败 ::close(socketfd); // 关闭套接字 socketfd = -1; // 将套接字描述符设置为无效值 exit(Bind_Error); // 退出程序，绑定错误码 } lg.logmessage(info, "bind successfully"); // 记录信息：绑定成功 } /** * 监听函数，用于开始监听客户端连接请求 * 该函数首先检查 socket 是否已创建，然后调用 listen 函数开始监听 * 如果监听失败，会进行错误处理并退出程序 */ void listen(){ // 检查 socket 是否已创建，如果 socketfd 小于 0 表示 socket 未创建 if(socketfd < 0){ // 记录致命错误日志：socket 未创建 lg.logmessage(Fatal, "socket not created"); // 退出程序，退出码为 Socket_Error exit(Socket_Error); } // 调用系统 listen 函数开始监听，第二个参数 5 表示最大连接队列长度 int n = ::listen(socketfd, 5); // 检查 listen 函数是否成功执行 if(n < 0){ // 记录致命错误日志：监听失败 lg.logmessage(Fatal, "listen error"); // 关闭 socket 文件描述符 ::close(socketfd); // 将 socketfd 重置为 -1，表示 socket 未创建 socketfd = -1; // 退出程序，退出码为 Listen_Error exit(Listen_Error); } // 记录信息日志：监听成功 lg.logmessage(info, "listen successfully"); } /** 接受一个客户端的连接请求*/ int accept(struct sockaddr_in* client, socklen_t* clientlen){ // 检查监听套接字 socketfd 是否有效 // 如果无效，说明服务器套接字未被正确初始化，这是一个致命错误 if(socketfd < 0){ // 记录一条致命级别的日志信息 lg.logmessage(Fatal, "socket not created"); // 终止程序，并返回一个特定的错误码 Socket_Error exit(Socket_Error); } // 调用系统提供的 accept 函数，阻塞等待客户端连接 // socketfd: 监听套接字描述符 // (struct sockaddr*)client: 将客户端地址信息存入 client 指向的结构体 // clientlen: 传入 client 结构体的大小，并接收实际地址结构的大小 int client_fd = ::accept(socketfd, (struct sockaddr*)client, clientlen); // 检查 accept 是否成功 if(client_fd < 0){ // 如果 accept 失败，记录一条致命错误日志 lg.logmessage(Fatal, "accept error"); // 返回 -1 表示接受连接失败 return -1; } // 如果 accept 成功，记录一条信息日志 lg.logmessage(info, "accept successfully"); // 返回新创建的、用于与该客户端通信的套接字描述符 return client_fd; } /** * 连接到服务器的函数 */ void connect(struct sockaddr_in* server, socklen_t serverlen){ // 检查 socket 是否已创建 if(socketfd < 0){ // 记录 socket 未创建的致命错误日志 lg.logmessage(Fatal, "socket not created"); // 退出程序，错误码为 Socket_Error exit(Socket_Error); } // 尝试连接到服务器 int n = ::connect(socketfd, (struct sockaddr*)server, serverlen); // 检查连接是否成功 if(n < 0){ // 记录连接失败的致命错误日志 lg.logmessage(Fatal, "connect error"); // 关闭 socket ::close(socketfd); // 重置 socket 文件描述符 socketfd = -1; // 退出程序，错误码为 Connect_Error exit(Connect_Error); } // 记录连接成功的信息日志 lg.logmessage(info, "connect successfully"); } void close(){ if(socketfd >= 0){ ::close(socketfd); socketfd = -1; } } sock(const sock&) = delete; sock& operator=(const sock&) = delete; private: int socketfd; };

#pragma once #include <pthread.h> #include <semaphore.h> #include <string> #include <vector> #include <sys/types.h> #include "Task.hpp" #define max_size 10 class threadpool { public: static threadpool& getinstance(){ static threadpool instance; return instance; } /** * 启动函数，用于创建多个线程执行任务 * 该函数会创建 Max_size 个线程，每个线程都执行 handler task 函数 */ void start(){ // 循环创建 Max_size 个线程 for(int i = 0; i < Max_size; i++){ // 声明线程标识符 tid pthread_t tid; // 创建线程，执行 handler task 函数，并将当前对象指针作为参数传递 // 第一个参数：线程标识符指针 // 第二个参数：线程属性，设为 NULL 表示使用默认属性 // 第三个参数：线程处理函数，即 handler task // 第四个参数：传递给线程处理函数的参数，这里传递当前对象的 this 指针 pthread_create(&tid, NULL, handler_task, this); } } /** * 从队列中弹出一个任务 */ Task pop(){ // 从队列中弹出任务的函数 sem_wait(&element); // 等待有元素可用，信号量 element 减 1 pthread_mutex_lock(&mutex); // 加锁，确保线程安全 Task data = q[c_index]; // 获取当前索引处的任务 c_index = (c_index + 1) % Max_task_size; // 更新消费者索引，实现循环队列 pthread_mutex_unlock(&mutex); // 解锁 sem_post(&space); // 释放空间，信号量 space 加 1 return data; // 返回获取的任务 } // 向任务队列中添加一个任务 void push(const Task& T){ sem_wait(&space); // 等待空间信号量，表示队列中有空闲位置 q[p_index] = T; // 将任务 T 存入队列的当前位置 p_index = (p_index + 1) % Max_task_size; // 更新写入位置，使用模运算实现循环队列 sem_post(&element); // 发送元素信号量，表示队列中新增了一个元素 } ~threadpool(){ pthread_mutex_destroy(&mutex); sem_destroy(&element); sem_destroy(&space); } threadpool(const threadpool&) = delete; threadpool& operator=(const threadpool&) = delete; private: /** * 线程池的构造函数，用于初始化线程池 */ threadpool(int max_num = max_size, int max_task_size = max_size) : Max_size(max_num), c_index(0), p_index(0), Max_task_size(max_task_size) { q.resize(Max_task_size); // 调整任务队列的大小为最大容量 // 初始化互斥锁，用于保护共享资源的访问 pthread_mutex_init(&mutex, NULL); // 初始化信号量 element，表示队列中的任务数量，初始为 0 sem_init(&element, 0, 0); // 初始化信号量 space，表示队列中的可用空间，初始为 Max_task_size sem_init(&space, 0, Max_task_size); } /** * 线程池中工作线程的任务处理函数 */ static void* handler_task(void* args){ // 将传入的参数转换为线程池对象指针 threadpool* tp = (threadpool*)args; // 无限循环，持续从任务队列中获取并执行任务 while(1){ // 从线程池的任务队列中弹出一个任务 Task task = tp->pop(); // 执行获取到的任务 task.run(); } // 理论上不会执行到这里，因为 while(1) 是无限循环 return NULL; } std::vector<Task> q; int Max_size; pthread_mutex_t mutex; int Max_task_size; int c_index; int p_index; sem_t element; sem_t space; };

#pragma once #include <functional> #include <string> #include <sys/types.h> #include <unistd.h> #include <fstream> #include <unordered_map> #include "protocol.hpp" #include "log.hpp" #define BUFFER_SIZE 1024 extern log lg; std::string path = "./wwwroot"; /** * 从指定的套接字接收完整的 HTTP 请求，并将其解析到 Http_Request 对象中 * * 如果成功接收并解析了 HTTP 请求头（无论是否有正文），返回 true。 * 如果在接收数据时发生错误（如 recv 失败），返回 false。 * * 此函数处理了两种情况： * 1. 没有正文的请求（如 GET 请求）。 * 2. 有正文的请求（如 POST 请求），它会根据 `Content-Length` 头确保接收完整的正文。 * 函数会阻塞，直到接收到完整的 HTTP 头（以 "\r\n\r\n" 为标志）和完整的正文（如果存在）。 */ bool Get_HttpRequest(size_t socketfd, Http_Request& hr){ // 用于存储从套接字接收到的所有原始 HTTP 请求数据 std::string data; // 临时缓冲区，用于每次 recv 调用 char buffer[BUFFER_SIZE]; // --- 第一阶段：循环接收数据，直到收到完整的 HTTP 请求头 --- // HTTP 请求头以 "\r\n\r\n" 结尾，这是一个明确的分界符 while(true){ // 从套接字读取数据，最多读取 BUFFER_SIZE-1 字节，为 '\0' 预留一个位置 ssize_t read_bytes = recv(socketfd, buffer, BUFFER_SIZE - 1, 0); // recv 的返回值 <= 0 表示错误或连接被对端关闭 if(read_bytes <= 0){ // 记录一条致命错误日志 lg.logmessage(Fatal, "recv error"); // 接收失败，返回 false return false; } // 将本次读取到的数据追加到总数据字符串 data 中 data.append(buffer, read_bytes); // 检查 data 中是否已包含完整的 HTTP 请求头结束符 if(data.find("\r\n\r\n") != std::string::npos){ // 找到了，说明请求头已完整，跳出循环 break; } } // 从完整的数据中提取出 HTTP 请求头部分（包括结束符 "\r\n\r\n"） std::string head = data.substr(0, data.find("\r\n\r\n") + 4); // --- 第二阶段：检查是否有请求正文，并处理 --- // 在请求头中查找 "Content-Length:" 字段，这是判断是否有正文以及正文长度的关键 size_t pos = data.find("Content-Length:"); if(pos != std::string::npos){ // 找到了 Content-Length 字段，说明这是一个带有正文的请求（通常是 POST） // 1. 解析 Content-Length 的值 // 找到该字段所在行的行尾 ssize_t endpos = head.find("\r\n", pos); // 提取 "Content-Length:" 后面的数字字符串 std::string content_length_str = head.substr(pos + 15, endpos - pos - 15); // "Content-Length:" 长度为 15 // 将字符串转换为整数，得到正文的期望长度 size_t content_length = std::stoi(content_length_str); // 2. 检查当前已接收的数据中是否包含了完整的正文 // 计算当前已接收的正文部分的长度 size_t remaining = data.size() - head.size(); if(remaining < content_length){ // 情况 A：正文不完整，需要继续从套接字读取剩余的正文数据 // 提取已接收的部分正文 std::string body = data.substr(data.find("\r\n\r\n") + 4, remaining); // 计算还需要读取的字节数 int to_read = content_length - remaining; char body_buffer[BUFFER_SIZE]; // 循环读取，直到读完所有剩余的正文数据 while(to_read > 0){ // 计算本次最多能读取多少字节（防止读取超过需求） ssize_t bytes_to_recv = std::min(BUFFER_SIZE - 1, to_read); ssize_t read_bytes = recv(socketfd, body_buffer, bytes_to_recv, 0); if(read_bytes <= 0){ lg.logmessage(Fatal, "recv error"); return false; } // 将新读取的数据追加到正文字符串中 body.append(body_buffer, read_bytes); // 更新还需要读取的字节数 to_read -= read_bytes; } // 将完整的正文存入 hr 对象 hr.text = body; } else { // 情况 B：正文已经完整地包含在第一次接收的数据中 // 直接从 data 中提取指定长度的正文 hr.text = data.substr(data.find("\r\n\r\n") + 4, content_length); } } // 如果没有找到 "Content-Length"，则认为请求没有正文，hr.text 保持为空 // --- 第三阶段：解析请求头 --- // 调用 Http_Request 对象的 Deserialization 方法来解析请求头字符串 bool res = hr.Deserialization(head); // 调试打印：输出解析后的 Http_Request 对象的内容 hr.debugprint(); // 返回请求头的解析结果 return res; } /** * 从指定路径读取文件内容 * * 返回文件内容字符串，如果文件打开失败则返回空字符串 */ std::string read_file(std::string file_path){ // 以二进制模式打开文件 std::ifstream file(file_path, std::ios::binary); // 检查文件是否成功打开 if(!file.is_open()){ // 记录文件未找到的日志 lg.logmessage(info, "file not found:%s", file_path.c_str()); return ""; } // 获取文件开始位置 std::streampos start = file.tellg(); // 移动文件指针到末尾 file.seekg(0, std::ios::end); // 获取文件结束位置 std::streampos end = file.tellg(); // 计算文件大小 size_t file_size = end - start; // 创建并调整字符串大小以容纳文件内容 std::string content; content.resize(file_size); // 将文件指针移回开始位置 file.seekg(0, std::ios::beg); // 读取文件内容到字符串 file.read(&content[0], file_size); // 关闭文件 file.close(); // 返回读取的文件内容 return content; } std::string Http_Get_Handler(Http_Request& hr); /** * 处理错误的 HTTP 请求，返回 400 Bad Request 响应 * * std::string 包含 HTTP 响应头的完整 HTTP 响应消息 */ std::string process_bad_request(){ // 记录错误日志，级别为 Fatal lg.logmessage(Fatal, "bad request body"); // 构建 HTTP 状态行 std::string headler_line = "HTTP/1.0 400 Bad Request\r\n"; // 构建 HTTP 头部字段 std::string header = "Connection: close\r\n"; // 设置响应内容 std::string content = "Bad Request"; // 添加内容长度和内容类型头部 header += "Content-Length: " + std::to_string(content.size()) + "\r\n"; header += "Content-Type: text/plain\r\n"; // 添加空行表示头部结束 header += "\r\n"; // 返回完整的 HTTP 响应 return headler_line + header + content; } /** * 根据输入的操作数和运算符执行基本的算术计算 * * 如果计算成功执行，返回 true。 * 如果遇到不支持的运算符或除零错误，返回 false。 * * 此函数会处理运算符的 URL 编码形式，例如 "%2B" 会被解码为 "+"。 * 它会检查除零错误，但不会检查其他潜在的整数溢出问题。 */ bool process_calculation(std::unordered_map<std::string, std::string>& val, int& result){ // 从映射中提取操作数 "a" 和 "b"，并将它们从字符串转换为整数 int a = std::stoi(val["a"]); int b = std::stoi(val["b"]); // 从映射中提取运算符 "op" std::string op = val["op"]; // --- 运算符规范化 --- // 将 URL 编码的运算符或不同大小写的表示统一为标准的单字符运算符 if(op == "+" || op == "%2B" || op == "%2b") // 检查加号 { op = "+"; } else if(op == "-" || op == "%2D" || op == "%2d") // 检查减号 { op = "-"; } else if(op == "*" || op == "%2A" || op == "%2a") // 检查乘号 { op = "*"; } else if(op == "/" || op == "%2F" || op == "%2f") // 检查除号 { op = "/"; } else { // 如果运算符不是以上任何一种，则记录一条致命错误日志并返回失败 lg.logmessage(Fatal, "unsupported operator:%s", op.c_str()); return false; } // --- 执行计算 --- // 使用 switch 语句根据规范化后的运算符执行相应的计算 switch(op[0]) // 使用 op[0] 进行比较，因为此时 op 已是单字符 { case '+': // 加法 result = a + b; break; case '-': // 减法 result = a - b; break; case '*': // 乘法 result = a * b; break; case '/': // 除法 // 安全检查：防止除以零 if(b == 0){ // 如果除数为 0，记录一条警告日志并返回失败 lg.logmessage(warning, "division by zero"); return false; } // 执行整数除法 result = a / b; break; // 为 switch 语句添加了缺失的 break } // 所有操作成功完成，返回 true return true; } /** * 处理 HTTP POST 请求，目前主要支持一个计算器功能 * * 此函数专门处理发往 `/calc` URL 的 POST 请求。它期望请求体中包含三个 URL 编码的 * 键值对（例如 "a=10&op=+&b=20"），分别代表第一个操作数、运算符和第二个操作数。 * 它会解析这些参数，执行计算，并将结果嵌入到一个 HTML 页面中返回给客户端。 * 对于任何其他 URL 或不合法的请求格式，它会返回一个 400 Bad Request 错误。 * * 此函数依赖于 `process_calculation` 函数来执行实际的数学运算， * 和 `process_bad_request` 函数来生成错误响应。 * 请求体的解析逻辑较为硬编码，期望固定的三个键值对格式。 */ std::string Http_Post_Handler(Http_Request& hr){ // --- 1. 初始化 --- std::string res; // 存储最终要返回的 HTTP 响应字符串 std::unordered_map<std::string, std::string> val; // 用于存储从请求体解析出的键值对 size_t start = 0; // 辅助变量，用于在解析请求体时标记当前处理的起始位置 // --- 2. 检查并处理特定的 POST URL --- // 检查请求的 URL 路径是否为 "/calc" if(hr.url == "/calc"){ // --- 2a. 获取并解析请求体 --- // 从 Http_Request 对象中获取 POST 请求的原始请求体 std::string body = hr.text; // 手动解析请求体，期望格式为 "key1=value1&key2=value2&key3=value3" // 这是一个硬编码的解析过程，假设有三个键值对 // --- 解析第一个键值对 --- size_t pos1 = body.find("&"); // 查找第一个键值对的结束符 if(pos1 == std::string::npos){ // 如果没有找到，说明格式错误，返回 400 Bad Request return process_bad_request(); } std::string expression = body.substr(start, pos1); // 提取第一个键值对字符串 size_t pos2 = expression.find("="); // 在键值对中查找 "=" if(pos2 == std::string::npos){ // 没找到 "="，格式错误 return process_bad_request(); } // 提取键和值，并存入 map std::string result_key_str = expression.substr(start, pos2); std::string result_value_str = expression.substr(pos2 + 1); val[result_key_str] = result_value_str; // --- 解析第二个键值对 --- start = pos1 + 1; // 更新起始位置到第二个键值对的开头 pos1 = body.find("&", start); // 查找第二个键值对的结束符 if(pos1 == std::string::npos){ return process_bad_request(); } pos2 = body.find("=", start); // 查找 "=" // 检查 "=" 是否存在且在正确的范围内（在当前 "&" 之前） if(pos2 == std::string::npos || pos2 > pos1){ return process_bad_request(); } // 提取键和值 result_key_str = body.substr(start, pos2 - start); result_value_str = body.substr(pos2 + 1, pos1 - pos2 - 1); val[result_key_str] = result_value_str; // --- 解析第三个键值对 --- start = pos1 + 1; // 更新起始位置 pos2 = body.find("=", start); // 查找 "=" if(pos2 == std::string::npos){ return process_bad_request(); } // 提取键和值，直到字符串末尾 result_key_str = body.substr(start, pos2 - start); result_value_str = body.substr(pos2 + 1); val[result_key_str] = result_value_str; // --- 2b. 执行计算 --- int calc_result; // 调用辅助函数进行计算，传入解析出的键值对 map if(process_calculation(val, calc_result) == false){ // 如果计算失败（例如不支持的运算符或除零），返回错误响应 return process_bad_request(); } // --- 2c. 构建成功的 HTTP 响应 --- // 构建 HTTP 状态行 std::string headler_line = "HTTP/1.0 200 OK\r\n"; // 构建 HTTP 响应头 std::string header = "Connection: close\r\n"; header += "Content-Type: text/html\r\n"; // 动态生成 HTML 响应体，用于展示计算结果 std::string content = "<html><head><meta charset='UTF-8'></head><body>"; content += "<h2>计算结果展示</h2>"; content += "<p>结果为：" + std::to_string(calc_result) + "</p>"; content += "<a href='/'>返回首页</a>"; content += "</body></html>"; // 完成响应头，添加内容长度和结束符 header += "Content-Length: " + std::to_string(content.size()) + "\r\n"; header += "\r\n"; // 空行，标志 HTTP 头部结束 // 拼接完整的 HTTP 响应 res = headler_line + header + content; return res; } else { // --- 3. 处理不支持的 POST URL --- // 如果 URL 不是 "/calc"，记录一条致命错误日志 lg.logmessage(Fatal, "unsupported post url:%s", hr.url.c_str()); // 并返回一个通用的错误响应 return process_bad_request(); } } class Task { public: Task(): socketfd(-1) {} Task(int _socketfd): socketfd(_socketfd) {} /** * 处理文件后缀名，返回对应的 MIME 类型 * 返回对应的 MIME 类型字符串，如果找不到则返回默认的 html 类型 */ static std::string suffix_handler(std::string suffix){ // 在 map 中查找对应的后缀名 auto pos = map.find(suffix); // 如果找不到对应的后缀名 if(pos == map.end()){ // 返回默认的 html 类型 return map[".html"]; } // 返回找到的对应 MIME 类型 return map[suffix]; } /** * 运行 HTTP 请求处理函数 * 该函数负责接收 HTTP 请求、根据请求类型 (GET/POST) 调用相应的处理函数， * 并将处理结果发送回客户端，最后关闭 socket 连接 */ void run(){ // 创建 HTTP 请求对象 Http_Request hr; // 获取 HTTP 请求 bool get_result = Get_HttpRequest(socketfd, hr); // 如果获取请求失败，记录错误日志并关闭 socket 连接 if(get_result == false){ lg.logmessage(Fatal, "get http request error"); close(socketfd); return; } std::string res; // 用于存储 HTTP 响应结果 // 根据 HTTP 方法类型调用相应的处理函数 if(hr.method == "GET"){ res = Http_Get_Handler(hr); // 处理 GET 请求 } else if(hr.method == "POST"){ res = Http_Post_Handler(hr); // 处理 POST 请求 } else { // 如果是不支持的 HTTP 方法，记录警告日志并关闭 socket 连接 lg.logmessage(warning, "unsupported method:%s", hr.method.c_str()); close(socketfd); return; } // 发送 HTTP 响应 int send_bytes = send(socketfd, res.c_str(), res.size(), 0); // 如果发送失败，记录错误日志并关闭 socket 连接 if(send_bytes < 0){ lg.logmessage(Fatal, "send error"); close(socketfd); return; } // 正常处理完成后关闭 socket 连接 close(socketfd); } private: int socketfd; static std::unordered_map<std::string, std::string> map; }; std::unordered_map<std::string, std::string> Task::map = { {".html", "text/html"}, {".css", "text/css"}, {".png", "image/png"}, {".jpg", "image/jpeg"} }; /** * 处理 HTTP GET 请求并生成相应的 HTTP 响应 * * 该函数根据请求的 URL 路径，从服务器文件系统中读取对应的静态文件， * 构建并返回一个完整的 HTTP 响应字符串。它能处理首页请求，也能处理其他 * 类型的静态资源（如 CSS、JavaScript、图片等），并自动设置正确的 * Content-Type。如果请求的文件不存在，它会返回一个 404 Not Found 错误页面。 * */ std::string Http_Get_Handler(Http_Request& hr){ // --- 1. 初始化变量 --- // 定义用于构建响应的关键变量 std::string file_path; // 存储请求文件的完整服务器路径 std::string content_type; // 存储文件的 MIME 类型（如 "text/html"） std::string res; // 存储最终构建好的完整 HTTP 响应字符串 // --- 2. 确定文件路径和内容类型 --- // 检查请求的 URL 是否为根目录 "/" 或首页 "/index.html" if(hr.url == "/" || hr.url == "/index.html"){ // 如果是首页请求，则拼接出首页的完整路径 file_path = path + "/index.html"; // 假设 `path` 是服务器根目录 // 首页的内容类型明确为 HTML content_type = "text/html"; } else { // 如果是其他文件请求，直接将 URL 拼接到根目录后 file_path = path + hr.url; // --- 2a. 根据文件后缀确定 MIME 类型 --- // 查找文件路径中最后一个 '.' 的位置，以提取文件扩展名 ssize_t pos = file_path.rfind("."); if(pos == std::string::npos){ // 如果找不到后缀（如请求一个没有扩展名的文件），则默认按 HTML 处理 content_type = "text/html"; } else { // 提取文件后缀（包括点，如 ".html"） std::string suffix = file_path.substr(pos); // 调用辅助函数根据后缀获取正确的 MIME 类型 content_type = Task::suffix_handler(suffix); } } // --- 3. 尝试读取请求的文件 --- // 调用 `read_file` 函数读取文件内容到 `body` 字符串中 std::string body = read_file(file_path); // --- 4. 构建 HTTP 响应 --- // 初始化状态行和头部字段 std::string headler_line; // HTTP 响应状态行（如 "HTTP/1.0 200 OK"） std::string header; // HTTP 响应头部字段 // 检查文件是否成功读取（`body` 是否为空） if(body.empty()){ // --- 4a. 文件不存在，构建 404 Not Found 响应 --- // 设置 404 状态行 headler_line = "HTTP/1.0 404 Not Found\r\n"; // 添加连接关闭头部，告知客户端此响应后连接将关闭 header += "Connection: close\r\n"; // 读取自定义的 404 错误页面内容 std::string content = read_file(path + "/404.html"); // 添加 Content-Length 头部，指明响应体大小 header += "Content-Length: " + std::to_string(content.size()) + "\r\n"; // 添加 Content-Type 头部，指明响应体是 HTML header += "Content-Type: text/html\r\n"; // 头部结束标志 header += "\r\n"; // 拼接完整的 404 响应：状态行 + 头部 + 错误页面内容 res = headler_line + header + content; } else { // --- 4b. 文件存在，构建 200 OK 响应 --- // 设置 200 成功状态行 headler_line = "HTTP/1.0 200 OK\r\n"; // 添加 Content-Length 头部 header += "Content-Length: " + std::to_string(body.size()) + "\r\n"; // 添加 Connection 头部 header += "Connection: close\r\n"; // 添加 Content-Type 头部，使用之前确定的 MIME 类型 header += "Content-Type: " + content_type + "\r\n"; // 头部结束标志 header += "\r\n"; // 拼接完整的成功响应：状态行 + 头部 + 文件内容 res = headler_line + header + body; } // --- 5. 返回构建好的 HTTP 响应 --- return res; }

#pragma once #include "log.hpp" #include <iostream> #include <vector> #include <string> #include <sstream> #include <unordered_map> extern log lg; class Http_Request { public: /** * 反序列化 HTTP 请求头 * 反序列化成功返回 true，失败返回 false */ bool Deserialization(std::string& head){ // 记录当前处理的起始位置 size_t start = 0; // 存储解析出的 HTTP 头信息 std::vector<std::string>_header; // 循环解析 HTTP 头，直到遇到空行 while(true){ std::string line; // 存储当前行 // 查找行结束符的位置 size_t end = head.find("\r\n", start); // 如果找不到行结束符，说明格式错误 if(end == std::string::npos){ return false; } // 提取当前行内容 line = head.substr(start, end - start); // 如果遇到空行，结束头信息解析 if(line.empty()){ break; } // 更新起始位置到下一行 start = end + 2; // 将解析出的行加入头信息列表 _header.push_back(line); } // 如果头信息为空，返回错误 if(_header.size() < 1){ return false; } // 解析具体的头信息字段 for(size_t i = 1; i < _header.size(); i++){ std::string line = _header[i]; // 当前头信息行 // 查找键值分隔符的位置 ssize_t pos = line.find(":"); // 如果找不到分隔符，格式错误 if(pos == std::string::npos){ return false; } // 提取键 std::string key = line.substr(0, pos); // 计算值的起始位置（跳过分隔符后的空格） size_t val_start = pos + 1; while(val_start < line.size() && std::isspace(line[val_start])){ val_start++; } // 提取值并存储到 headers 映射中 std::string value = line.substr(val_start); headers[key] = value; } // 解析请求行（第一行） std::string first_line = _header[0]; std::stringstream ss(first_line); // 提取方法、URL 和 HTTP 版本 ss >> method >> url >> http_version; return true; } /** * 调试打印函数，用于输出 HTTP 请求的详细信息 * 该函数会打印请求方法、URL、HTTP 版本、头部字段和请求体内容 */ void debugprint(){ // 输出一个空行，用于分隔不同部分的输出 std::cout << std::endl; // 打印 HTTP 请求的方法、URL 和 HTTP 版本 std::cout << method << " " << url << " " << http_version << std::endl; // 遍历并打印所有的 HTTP 头部字段 for(auto it = headers.begin(); it != headers.end(); it++){ // 打印每个头部字段的键值对 std::cout << it->first << ": " << it->second << std::endl; } // 输出一个空行，用于分隔头部和请求体 std::cout << std::endl; // 打印 HTTP 请求的文本内容（请求体） std::cout << text << std::endl; // 输出一个空行，用于结束本次调试输出 std::cout << std::endl; } public: std::unordered_map<std::string, std::string> headers; std::string text; std::string method; std::string url; std::string http_version; };

#pragma once #include <iostream> #include <string> #include <time.h> #include <unistd.h> #include <stdarg.h> #include <fcntl.h> #define SIZE 1024 #define screen 0 #define File 1 #define ClassFile 2 enum { info, debug, warning, Fatal, }; class log { private: std::string memssage; int method; public: log(int _method = screen): method(_method) {} void logmessage(int leval, const char* format, ...){ const char* _leval; switch(leval){ case info: _leval = "info"; break; case debug: _leval = "debug"; break; case warning: _leval = "warning"; break; case Fatal: _leval = "Fatal"; break; default: _leval = "unknow"; break; } char timebuffer[SIZE]; time_t t = time(NULL); struct tm* localTime = localtime(&t); snprintf(timebuffer, SIZE, "[%d-%d-%d-%d:%d]", localTime->tm_year + 1900, localTime->tm_mon + 1, localTime->tm_mday, localTime->tm_hour, localTime->tm_min); char rightbuffer[SIZE]; va_list arg; va_start(arg, format); vsnprintf(rightbuffer, SIZE, format, arg); va_end(arg); char finalbuffer[2 * SIZE]; int len = snprintf(finalbuffer, sizeof(finalbuffer), "[%s]%s:%s\n", _leval, timebuffer, rightbuffer); int fd = -1; switch(method){ case screen: std::cout << finalbuffer; break; case File: fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); if(fd >= 0){ write(fd, finalbuffer, len); close(fd); } break; case ClassFile: switch(leval){ case info: fd = open("log/info.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); break; case debug: fd = open("log/debug.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); break; case warning: fd = open("log/Warning.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); break; case Fatal: fd = open("log/Fatal.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); break; } if(fd >= 0){ write(fd, finalbuffer, len); close(fd); } break; } } }; log lg;

Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

引言

JSON 详解

原理剖析

补充说明

HTTP 协议基础

引入

原理

域名

HTTP 协议

GET 请求

POST 请求

响应报文

HTTP 服务器实现

源码参考

Httpserver.hpp

Socket.hpp

Threadpool.h

Task.hpp

protocol.hpp

httpserver.cpp

log.hpp

更多推荐文章

相关免费在线工具

Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

Linux 网络编程实战：基于 C++ 实现 JSON 与 HTTP Web 服务器

引言

JSON 详解

原理剖析

补充说明

HTTP 协议基础

引入

原理

域名

HTTP 协议

GET 请求

POST 请求

响应报文

HTTP 服务器实现

源码参考

Httpserver.hpp

Socket.hpp

Threadpool.h

Task.hpp

protocol.hpp

httpserver.cpp

log.hpp

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具