IM 系统核心模块实战：传输与存储检索全链路设计 | 极客日志

C++SaaS算法

IM 系统核心模块实战：传输与存储检索全链路设计

IM 系统架构涉及消息传输、存储检索等核心环节。基于 C++ 微服务实践，解析 brpc、MySQL、Elasticsearch 等技术选型与协同方案。重点阐述消息封装流程、异步队列解耦策略及混合存储设计，同时涵盖服务治理与性能优化方向，为构建高可靠即时通讯系统提供参考。

利刃发布于 2026/3/21更新于 2026/6/1618 浏览

IM 系统核心模块实现：从消息传输到存储检索的全链路设计

即时通讯（IM）系统如今已是日常沟通与工作协作的基石。一个高性能、高可靠的 IM 系统需要妥善解决消息的实时传输、持久化存储、快速检索等核心问题。这次我们结合一套实际生产环境的代码，拆解 IM 系统中消息传输服务与存储检索服务的设计思路、技术选型与具体实现，带你深入理解 IM 系统的核心工作原理。

一、系统架构概览：核心模块与技术栈

在展开具体实现前，我们先梳理这套 IM 系统的核心模块与技术选型。从代码来看，该系统采用微服务架构，将核心功能拆分为消息传输服务与消息存储检索服务，通过标准化接口实现模块间通信。

1.1 核心业务流程

IM 系统的核心业务流程其实就这几步：

消息发送：用户发送消息后，由消息传输服务负责验证、封装并转发给目标用户
消息存储：传输服务将消息同步到消息队列，由存储服务消费并持久化到数据库
消息检索：用户查询历史消息或关键词搜索时，存储服务从数据库 / 搜索引擎中获取数据并返回

1.2 技术栈选型

为满足高并发、低延迟、可扩展的需求，系统选用了以下技术组件：

RPC 框架：brpc（百度开源的高性能 RPC 框架，支持高并发场景）
关系型数据库：MySQL（存储消息元数据、用户会话关系等结构化数据）
搜索引擎：Elasticsearch（简称 ES，用于消息全文检索，支持中文分词）
消息队列：RabbitMQ（实现消息异步传输，解耦服务间依赖）
服务治理：etcd（提供服务注册与发现，支持动态扩缩容）
数据序列化：Protobuf（高效的结构化数据序列化协议）
日志系统：自定义 logger（记录系统运行状态与错误信息）

1.3 模块交互关系

各模块通过'服务注册 - 发现'机制动态感知对方地址，通过 RPC 接口通信：

消息传输服务依赖用户服务获取发送者信息，依赖 MySQL 获取会话成员列表
消息存储服务依赖文件服务存储图片 / 语音等二进制数据，依赖用户服务获取发送者信息
所有服务通过 etcd 注册自身地址，通过服务发现机制找到依赖服务的地址

二、数据存储层设计：ES 与 MySQL 的协同方案

消息数据的存储是 IM 系统的基础，需要同时满足'可靠存储'与'高效检索'的需求。系统采用'MySQL+ES'的混合存储方案：MySQL 存储消息完整元数据，ES 存储消息索引与文本内容用于检索。

2.1 Elasticsearch 封装：索引设计与操作抽象

ES 作为全文搜索引擎，其核心是索引设计与查询语法。代码里用 ESIndex、ESInsert、ESRemove、ESSearch 等类把 ES 操作给封装了，上层调用就简单多了。

2.1.1 ES 索引设计：字段类型与分词策略

索引是 ES 中数据的组织形式，类似 MySQL 的表结构。在 IM 系统中，需要为'用户'和'消息'分别创建索引，其中消息索引需要支持中文分词检索。

// 用户索引创建示例（ESUser 类）
bool createIndex() {
    bool ret = zrt::(_es_client, )
        .(, , , ) 
        .() 
        .(, , , ) 
        .(, , , ) 
        .(, , , ) 
        .(); 
}

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

// 数据插入封装（ESInsert 类）
template<typename T>
ESInsert &append(const std::string &key, const T &val){
    _item[key] = val; // 用 Json::Value 暂存数据
    return *this;
}
bool insert(const std::string id) {
    std::string body;
    Serialize(_item, body); // 序列化为 JSON
    try {
        auto rsp = _client->index(_name, _type, id, body); // 调用 ES 客户端 API
        // 状态码检查与异常处理
    }
}

// 消息搜索示例（ESMessage 类）
std::vector<zrt::Message> search(const std::string &key, const std::string &ssid) {
    Json::Value json_user = ESSearch(_es_client, "message")
        .append_must_term("chat_session_id.keyword", ssid) // 必须匹配会话 ID
        .append_must_match("content", key) // 必须匹配关键词
        .search(); // 结果解析与转换
}

// 消息存储示例（MessageServiceImpl 类）
ret = _mysql_message->insert(msg); // 插入消息到 MySQL
// 历史消息查询（基于时间范围）
auto msg_lists = _mysql_message->range(chat_ssid, stime, etime);
// 最近消息查询（按时间倒序取前 N 条）
auto msg_lists = _mysql_message->recent(chat_ssid, msg_count);

// transmit.proto
service MsgTransmitService {
    rpc GetTransmitTarget(NewMessageReq) returns (GetTransmitTargetRsp);
}
message NewMessageReq {
    string request_id = 1; // 请求唯一标识
    string user_id = 2; // 发送者 ID
    string chat_session_id = 3; // 会话 ID
    MessageContent message = 4; // 消息内容
}
message GetTransmitTargetRsp {
    string request_id = 1;
    bool success = 2;
    string errmsg = 3;
    MessageInfo message = 4; // 封装后的消息
    repeated string target_id_list = 5; // 目标用户列表
}

// TransmiteServiceImpl::GetTransmitTarget
MessageInfo message;
message.set_message_id(uuid()); // 生成唯一消息 ID
message.set_chat_session_id(chat_ssid); // 关联会话
message.set_timestamp(time(nullptr)); // 记录发送时间
message.mutable_sender()->CopyFrom(rsp.user_info()); // 填充发送者信息（从用户服务获取）
message.mutable_message()->CopyFrom(content); // 填充消息内容

// 获取会话成员列表
auto target_list = _mysql_session_member_table->members(chat_ssid);

// 发布消息到 RabbitMQ
bool ret = _mq_client->publish(_exchange_name, message.SerializeAsString(), _routing_key);

// 消息存储处理（MessageServiceImpl::onMessage）
switch(message.message().message_type()) {
    case MessageType::STRING: // 文本消息：直接存储内容
        content = message.message().string_message().content();
        _es_message->appendData(...); // 同步到 ES
        break;
    case MessageType::IMAGE: // 图片消息：上传文件到文件服务，存储文件 ID
        ret = _PutFile("", msg.image_content(), ..., file_id);
        break;
    // 其他类型消息处理类似
}
// 统一存储元数据到 MySQL
zrt::Message msg(...);
msg.file_id(file_id); // 关联文件 ID
_mysql_message->insert(msg);

// GetHistoryMsg 接口实现
// 1. 从 MySQL 查询时间范围内的消息元数据
auto msg_lists = _mysql_message->range(chat_ssid, stime, etime);
// 2. 批量获取消息中的文件数据（如图片、语音）
std::unordered_set<std::string> file_id_lists;
for (const auto &msg : msg_lists) {
    if (!msg.file_id().empty()) file_id_lists.insert(msg.file_id());
}
std::unordered_map<std::string, std::string> file_data_lists;
_GetFile(rid, file_id_lists, file_data_lists); // 调用文件服务批量下载
// 3. 批量获取发送者用户信息
std::unordered_set<std::string> user_id_lists;
for (const auto &msg : msg_lists) {
    user_id_lists.insert(msg.user_id());
}
std::unordered_map<std::string, UserInfo> user_lists;
_GetUser(rid, user_id_lists, user_lists); // 调用用户服务批量获取
// 4. 组装响应数据
for (const auto &msg : msg_lists) {
    auto message_info = response->add_msg_list(); // 填充消息元数据、用户信息、文件数据
}

// MsgSearch 接口实现
// 1. 调用 ES 搜索会话内包含关键词的消息
auto msg_lists = _es_message->search(skey, chat_ssid);
// 2. 获取发送者用户信息（同历史消息查询）
std::unordered_set<std::string> user_id_lists;
for (const auto &msg : msg_lists) {
    user_id_lists.insert(msg.user_id());
}
std::unordered_map<std::string, UserInfo> user_lists;
_GetUser(rid, user_id_lists, user_lists);
// 3. 组装响应
for (const auto &msg : msg_lists) {
    auto message_info = response->add_msg_list(); // 填充消息与用户信息
}

// 会话内关键词搜索条件
ESSearch(_es_client, "message")
    .append_must_term("chat_session_id.keyword", ssid) // 限定会话
    .append_must_match("content", key) // 匹配关键词

// TransmiteServerBuilder::make_registry_object
_registry_client = std::make_shared<Registry>(reg_host);
_registry_client->registry(service_name, access_host); // 注册服务名与地址

// MessageServerBuilder::make_discovery_object
auto put_cb = std::bind(&ServiceManager::onServiceOnline, _mm_channels.get(), ...);
auto del_cb = std::bind(&ServiceManager::onServiceOffline, _mm_channels.get(), ...);
_service_discoverer = std::make_shared<Discovery>(reg_host, base_service_name, put_cb, del_cb);

// 选择用户服务节点
auto channel = _mm_channels->choose(_user_service_name);
if (!channel) {
    LOG_ERROR("没有可用的用户服务节点");
    return false;
}
UserService_Stub stub(channel.get()); // 创建 RPC 客户端

// 消息存储服务构建示例
MessageServerBuilder builder;
// 1. 构建 ES 客户端
builder.make_es_object({"http://es-node1:9200", "http://es-node2:9200"});
// 2. 构建 MySQL 客户端
builder.make_mysql_object("user", "pass", "mysql-host", "im_db", "utf8", 3306, 10);
// 3. 构建服务发现
builder.make_discovery_object("etcd-host:2379", "/services", "file-service", "user-service");
// 4. 构建消息队列
builder.make_mq_object("rabbit", "pass", "mq-host", "msg-exchange", "store-queue", "store-key");
// 5. 构建 RPC 服务器
builder.make_rpc_server(8002, 60, 16);
// 6. 生成服务器实例
auto server = builder.build();
server->start();

// 异常处理示例
try {
    auto rsp = _client->index(_name, _type, index_id, body);
    if (rsp.status_code < 200 || rsp.status_code >= 300) {
        LOG_ERROR("创建 ES 索引失败，状态码：{}", rsp.status_code);
        return false;
    }
} catch(std::exception &e) {
    LOG_ERROR("创建 ES 索引失败：{}", e.what());
    return false;
}

IM 系统核心模块实战：传输与存储检索全链路设计

IM 系统核心模块实现：从消息传输到存储检索的全链路设计

一、系统架构概览：核心模块与技术栈

1.1 核心业务流程

1.2 技术栈选型

1.3 模块交互关系

二、数据存储层设计：ES 与 MySQL 的协同方案

2.1 Elasticsearch 封装：索引设计与操作抽象

2.1.1 ES 索引设计：字段类型与分词策略

更多推荐文章

相关免费在线工具

2.1.2 ES 操作封装：CRUD 接口抽象

2.2 MySQL 消息存储：结构化数据的可靠持久化

2.3 存储协同策略：MySQL 与 ES 的分工

三、消息传输服务：从发送到转发的全流程

3.1 RPC 接口设计：定义消息传输契约

3.2 消息封装流程：从原始内容到完整消息

3.3 目标用户获取：从会话成员表查询

3.4 消息队列集成：异步存储解耦

四、消息存储检索服务：从持久化到高效查询

4.1 多类型消息处理：文本、图片、文件与语音

4.2 历史消息查询：时间范围与分页

4.3 关键词搜索：基于 ES 的全文检索

五、服务治理：注册、发现与连接管理

5.1 服务注册：向 etcd 登记服务地址

5.2 服务发现：监听 etcd 节点变化

5.3 连接管理：负载均衡与故障转移

六、代码设计亮点：可复用与可扩展的实现

6.1 Builder 模式：复杂对象的分步构建

6.2 接口封装：隔离底层依赖

6.3 异常处理与日志：问题排查的关键

七、优化与扩展：从可用到高性能

7.1 性能优化方向

7.2 功能扩展建议

八、总结

更多推荐文章

相关免费在线工具

IM 系统核心模块实战：传输与存储检索全链路设计

IM 系统核心模块实现：从消息传输到存储检索的全链路设计

一、系统架构概览：核心模块与技术栈

1.1 核心业务流程

1.2 技术栈选型

1.3 模块交互关系

二、数据存储层设计：ES 与 MySQL 的协同方案

2.1 Elasticsearch 封装：索引设计与操作抽象

2.1.1 ES 索引设计：字段类型与分词策略

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.1.2 ES 操作封装：CRUD 接口抽象

2.2 MySQL 消息存储：结构化数据的可靠持久化

2.3 存储协同策略：MySQL 与 ES 的分工

三、消息传输服务：从发送到转发的全流程

3.1 RPC 接口设计：定义消息传输契约

3.2 消息封装流程：从原始内容到完整消息

3.3 目标用户获取：从会话成员表查询

3.4 消息队列集成：异步存储解耦

四、消息存储检索服务：从持久化到高效查询

4.1 多类型消息处理：文本、图片、文件与语音

4.2 历史消息查询：时间范围与分页

4.3 关键词搜索：基于 ES 的全文检索

五、服务治理：注册、发现与连接管理

5.1 服务注册：向 etcd 登记服务地址

5.2 服务发现：监听 etcd 节点变化

5.3 连接管理：负载均衡与故障转移

六、代码设计亮点：可复用与可扩展的实现

6.1 Builder 模式：复杂对象的分步构建

6.2 接口封装：隔离底层依赖

6.3 异常处理与日志：问题排查的关键

七、优化与扩展：从可用到高性能

7.1 性能优化方向

7.2 功能扩展建议

八、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具