C++ 实现 UTF-8 与 GBK 字符编码转换及源码示例 | 极客日志

C++

C++ 实现 UTF-8 与 GBK 字符编码转换及源码示例

在 C++ 中使用 iconv 库实现 UTF-8 与 GBK 字符编码转换的方法。涵盖了常见编码概念、iconv API 使用、完整代码实现及常见问题解答。适用于 Linux/Unix 环境下的跨平台开发、网络通信及文件处理场景，帮助解决中文乱码问题。

念念不忘发布于 2026/3/23更新于 2026/7/224K 浏览

项目背景

在实际软件开发过程中，字符编码问题几乎是所有 C/C++ 程序员绕不开的难题。

尤其在以下场景中，编码问题尤为突出：

Linux / Windows 跨平台开发
网络通信（HTTP、Socket）
旧系统（GBK）与新系统（UTF-8）交互
数据库读写
日志系统、配置文件解析

在中文环境下，最常见的两种编码就是：

UTF-8：国际通用 Unicode 编码，Linux / 网络默认
GBK：Windows 中文系统历史主流编码

如果处理不当，就会出现：

中文乱码
字符长度计算错误
字符串截断
程序逻辑异常

因此，掌握 UTF-8 与 GBK 的相互转换，是 C++ 工程实践中的一项必备技能。

本项目目标是使用 C++ 实现一个完整、稳定、可复用的 UTF-8 ⇄ GBK 编码转换工具。

功能需求

支持 UTF-8 → GBK 转换
支持 GBK → UTF-8 转换
能正确处理中文字符
能处理任意长度字符串

技术要求

基于 Linux / Unix 环境
使用系统提供的 iconv 编码转换库
封装为独立函数，便于复用
错误处理清晰
代码教学友好、注释详细

设计要求

使用 C++ 封装 C 接口
所有代码集中在一个代码块
用注释模拟多文件结构
不依赖第三方库（iconv 属于系统库）

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

/****************************************************
 * 文件名：CharsetConvert.cpp
 * 描述：C++ UTF-8 / GBK 编码转换工具
 ****************************************************/
#include <iostream>
#include <string>
#include <iconv.h>
#include <cstring>
using namespace std;

/****************************************************
 * 函数名：convertEncoding
 * 描述：通用字符编码转换函数
 * 参数：
 *   fromCharset - 原编码
 *   toCharset - 目标编码
 *   input - 输入字符串
 * 返回值：
 *   转换后的字符串
 ****************************************************/
string convertEncoding(const string& input, const string& fromCharset, const string& toCharset) {
    // 创建 iconv 转换描述符
    iconv_t cd = iconv_open(toCharset.c_str(), fromCharset.c_str());
    if (cd == (iconv_t)-1) {
        perror("iconv_open");
        return "";
    }

    // 准备输入缓冲区
    size_t inLen = input.size();
    char* inBuf = const_cast<char*>(input.c_str());

    // 输出缓冲区大小一般设置为输入的 2~4 倍
    size_t outLen = inLen * 4;
    char* outBuf = new char[outLen];
    memset(outBuf, 0, outLen);
    char* outPtr = outBuf;

    // 执行转换
    if (iconv(cd, &inBuf, &inLen, &outPtr, &outLen) == (size_t)-1) {
        perror("iconv");
        iconv_close(cd);
        delete[] outBuf;
        return "";
    }

    // 构造返回字符串
    string result(outBuf);

    // 释放资源
    iconv_close(cd);
    delete[] outBuf;
    return result;
}

/****************************************************
 * UTF-8 转 GBK
 ****************************************************/
string utf8ToGbk(const string& utf8Str) {
    return convertEncoding(utf8Str, "UTF-8", "GBK");
}

/****************************************************
 * GBK 转 UTF-8
 ****************************************************/
string gbkToUtf8(const string& gbkStr) {
    return convertEncoding(gbkStr, "GBK", "UTF-8");
}

/****************************************************
 * 主函数：测试编码转换
 ****************************************************/
int main() {
    // UTF-8 中文字符串（Linux 默认）
    string utf8Str = "你好，世界";

    // UTF-8 -> GBK
    string gbkStr = utf8ToGbk(utf8Str);
    cout << "UTF-8 转 GBK 完成" << endl;

    // GBK -> UTF-8
    string utf8Result = gbkToUtf8(gbkStr);
    cout << "GBK 转 UTF-8 结果：" << utf8Result << endl;

    return 0;
}

C++ 实现 UTF-8 与 GBK 字符编码转换及源码示例

项目背景

功能需求

技术要求

设计要求

相关技术

常见字符编码概念

ASCII

GBK

UTF-8

为什么需要编码转换

iconv 编码转换库

iconv 是什么？

核心 API

更多推荐文章

相关免费在线工具

实现思路

整体设计思路

关键实现要点

封装设计

完整实现代码

代码解读

总结

常见问题

扩展方向

更多推荐文章

相关免费在线工具

C++ 实现 UTF-8 与 GBK 字符编码转换及源码示例

项目背景

功能需求

技术要求

设计要求

相关技术

常见字符编码概念

ASCII

GBK

UTF-8

为什么需要编码转换

iconv 编码转换库

iconv 是什么？

核心 API

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

实现思路

整体设计思路

关键实现要点

封装设计

完整实现代码

代码解读

总结

常见问题

扩展方向

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具