C++ Windows 开发 UTF-8 与 GBK 编码混乱问题及解决 | 极客日志

C++

C++ Windows 开发 UTF-8 与 GBK 编码混乱问题及解决

Windows C++ 开发常遇 UTF-8 与 GBK 编码冲突，导致控制台乱码或 JSON 库报错。核心原因是系统默认 GBK 而程序内部需 UTF-8。解决方案推荐工程全面 UTF-8 化（VS 保存设置、CMake 编译选项、控制台代码页切换），老项目则需运行时转码。nlohmann::json 要求输入必须是合法 UTF-8，否则抛出异常。

日志猎手发布于 2026/3/23更新于 2026/6/2412K 浏览

C++/Windows 开发中 UTF-8 与 GBK 编码混乱问题及解决

在 Windows 上做 C++/Qt/工具开发的同学，几乎所有人都遇到过以下问题：

控制台中文输出乱码
JSON 文件中出现 "\\u4e2d\\u6587" 或奇怪的乱码
API 处理中文失败、路径乱码、输出文件乱码
明明 Qt 软件显示正常，换到命令行工具就乱了

nlohmann::json 报错：

[json.exception.type_error.316] invalid UTF-8 byte at index ...

这些问题都指向一个核心矛盾：

Windows 默认编码（GBK）与程序内部编码（UTF-8）不一致。

本文将从原理、现象、原因、解决方案，带你彻底搞清楚 UTF-8/GBK 混乱的本质，并给出可直接复用的代码模板。

1. 为什么会出现 UTF-8 / GBK 混乱？

1.1 Windows 的默认编码是 GBK（代码页 936）

中国大陆环境中：

cmd / PowerShell 默认编码 = GBK
Windows API（ANSI）默认编码 = GBK
VC++ 编译器默认解析源文件编码 = 当前系统代码页（GBK）

这意味着：

你在 .cpp 里写 "中文" → 会按 GBK 字节序列存入可执行文件
控制台能显示 GBK 文字，但不能显示 UTF-8
一旦库要求 UTF-8（如 JSON 库），GBK 字符就成为'非法字节'

导致乱码、报错、无法解析。

1.2 现代开发中的 UTF-8 越来越普及

UTF-8 是现在几乎所有系统的标准编码：

Linux / macOS 默认 UTF-8
Qt 的内部字符串 QString → UTF-16 → 转换到 UTF-8
JSON 标准要求 UTF-8
Python/JS/Go/Java 默认 UTF-8

当 UTF-8 文本经过 GBK 控制台输出，就一定乱码。

2. 常见错误案例

2.1 JSON 报错：invalid UTF-8 byte at index

[json.exception.type_error.316] invalid UTF-8 byte at index 3: 0xC4

原因：

你的 .cpp 文件保存为 GBK
编译器按 GBK 解析 "中文 (简体)" 这样的字符串
生成的字符串不是合法 UTF-8，被 JSON 库拒绝

2.2 JSON 中出现多余的 `\`

例如：

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

中文测试

涓枃娴嬭瘯

文件 → 高级保存选项 → UTF-8（带或不带 BOM 均可）

if (MSVC)
    target_compile_options(JsonFilegenerate PRIVATE /utf-8)
endif()

chcp 65001

#ifdef _WIN32
#include <windows.h>
SetConsoleOutputCP(CP_UTF8);
SetConsoleCP(CP_UTF8);
#endif

std::string GbkToUtf8(const std::string& gbkStr){
    int lenW = MultiByteToWideChar(CP_ACP, 0, gbkStr.c_str(), -1, NULL, 0);
    std::wstring wstr(lenW, L'\0');
    MultiByteToWideChar(CP_ACP, 0, gbkStr.c_str(), -1, &wstr[0], lenW);
    int lenU8 = WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, NULL, 0, NULL, NULL);
    std::string utf8Str(lenU8, '\0');
    WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, &utf8Str[0], lenU8, NULL, NULL);
    return utf8Str;
}

json trans = json::array({{"entry_id", 1}, {"language", GbkToUtf8("中文 (简体)")}, {"translation_info", GbkToUtf8(values[i])}, {"status", 1}});

#ifdef _WIN32
#include <windows.h>
SetConsoleOutputCP(CP_UTF8);
SetConsoleCP(CP_UTF8);
#endif

std::cout << "中文测试\n";

中文测试

json obj = {{"language", "中文 (简体)"}, {"entry", "ImageWnd"}};

C++ Windows 开发 UTF-8 与 GBK 编码混乱问题及解决

C++/Windows 开发中 UTF-8 与 GBK 编码混乱问题及解决

1. 为什么会出现 UTF-8 / GBK 混乱？

1.1 Windows 的默认编码是 GBK（代码页 936）

1.2 现代开发中的 UTF-8 越来越普及

2. 常见错误案例

2.1 JSON 报错：invalid UTF-8 byte at index

2.2 JSON 中出现多余的 `\`

更多推荐文章

相关免费在线工具

2.3 控制台输出乱码

3. 解决 UTF-8 / GBK 的根本思路

方案 A：工程完全使用 UTF-8（最佳实践）

这是现代 C++/Qt 项目最推荐的做法。

1）把源文件保存为 UTF-8

2）在 CMake 中强制 MSVC 按 UTF-8 编译

3）控制台切换为 UTF-8

📌 优点

方案 B：保留 GBK 源码，但运行时转码（兼容老工程）

1）写一个 GBK → UTF-8 转换器

2）在将字符串放入 JSON 前转 UTF-8

📌 缺点

4. 控制台乱码最终解决方案

推荐写在 main() 里：

5. nlohmann::json 使用时必须注意的编码规则

📌 正确写法（推荐 UTF-8）

6. 最佳实践总结

如果你是现代 C++ 项目（强烈推荐）：

如果你是兼容性/老项目：

7. 最终建议

更多推荐文章

相关免费在线工具

C++ Windows 开发 UTF-8 与 GBK 编码混乱问题及解决

C++/Windows 开发中 UTF-8 与 GBK 编码混乱问题及解决

1. 为什么会出现 UTF-8 / GBK 混乱？

1.1 Windows 的默认编码是 GBK（代码页 936）

1.2 现代开发中的 UTF-8 越来越普及

2. 常见错误案例

2.1 JSON 报错：invalid UTF-8 byte at index

2.2 JSON 中出现多余的 \

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3 控制台输出乱码

3. 解决 UTF-8 / GBK 的根本思路

方案 A：工程完全使用 UTF-8（最佳实践）

这是现代 C++/Qt 项目最推荐的做法。

1）把源文件保存为 UTF-8

2）在 CMake 中强制 MSVC 按 UTF-8 编译

3）控制台切换为 UTF-8

📌 优点

方案 B：保留 GBK 源码，但运行时转码（兼容老工程）

1）写一个 GBK → UTF-8 转换器

2）在将字符串放入 JSON 前转 UTF-8

📌 缺点

4. 控制台乱码最终解决方案

推荐写在 main() 里：

5. nlohmann::json 使用时必须注意的编码规则

📌 正确写法（推荐 UTF-8）

6. 最佳实践总结

如果你是现代 C++ 项目（强烈推荐）：

如果你是兼容性/老项目：

7. 最终建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 JSON 中出现多余的 `\`