C++SaaSWeChat算法

即时通讯系统核心模块：从传输到存储的全链路设计

即时通讯系统需解决消息实时传输、持久化存储及快速检索问题。结合生产级代码，解析基于 brpc、MySQL、Elasticsearch 及 RabbitMQ 的架构方案。重点阐述 MySQL 与 ES 混合存储策略、消息传输服务封装流程、以及基于 etcd 的服务治理机制。通过 Builder 模式简化初始化，利用消息队列解耦存储，保障高并发下的可靠性与扩展性。涵盖文本、图片等多类型消息处理，并提供缓存优化与功能扩展建议，为构建高性能 IM 系统提供参考。

RustyLab发布于 2026/3/23更新于 2026/7/2329 浏览

即时通讯系统核心模块：从传输到存储的全链路设计

即时通讯（IM）系统如今已是日常沟通与工作协作的基石。一个高性能、高可靠的 IM 系统需要妥善解决消息的实时传输、持久化存储、快速检索等核心问题。本文结合一套生产级代码，拆解 IM 系统中消息传输与存储检索的核心逻辑。

系统架构概览：核心模块与技术栈

在展开具体实现前，我们先梳理这套 IM 系统的核心模块与技术选型。从代码来看，该系统采用微服务架构，将核心功能拆分为消息传输服务与消息存储检索服务，通过标准化接口实现模块间通信。

核心业务流程

IM 系统的核心业务流程可概括为：

消息发送：用户发送消息后，由消息传输服务负责验证、封装并转发给目标用户
消息存储：传输服务将消息同步到消息队列，由存储服务消费并持久化到数据库
消息检索：用户查询历史消息或关键词搜索时，存储服务从数据库 / 搜索引擎中获取数据并返回

技术栈选型

为满足高并发、低延迟、可扩展的需求，系统选用了以下技术组件：

RPC 框架：brpc（百度开源的高性能 RPC 框架，支持高并发场景）
关系型数据库：MySQL（存储消息元数据、用户会话关系等结构化数据）
搜索引擎：Elasticsearch（简称 ES，用于消息全文检索，支持中文分词）
消息队列：RabbitMQ（实现消息异步传输，解耦服务间依赖）
服务治理：etcd（提供服务注册与发现，支持动态扩缩容）
数据序列化：Protobuf（高效的结构化数据序列化协议）
日志系统：自定义 logger（记录系统运行状态与错误信息）

模块交互关系

各模块通过'服务注册 - 发现'机制动态感知对方地址，通过 RPC 接口通信：

消息传输服务依赖用户服务获取发送者信息，依赖 MySQL 获取会话成员列表
消息存储服务依赖文件服务存储图片 / 语音等二进制数据，依赖用户服务获取发送者信息
所有服务通过 etcd 注册自身地址，通过服务发现机制找到依赖服务的地址

数据存储层设计：ES 与 MySQL 的协同方案

消息数据的存储是 IM 系统的基础，需要同时满足'可靠存储'与'高效检索'的需求。系统采用'MySQL+ES'的混合存储方案：MySQL 存储消息完整元数据，ES 存储消息索引与文本内容用于检索。

Elasticsearch 封装：索引设计与操作抽象

ES 作为全文搜索引擎，其核心是索引设计与查询语法。代码中通过 ESIndex、ESInsert、ESRemove、ESSearch 等类对 ES 操作进行封装，简化上层调用。

ES 索引设计：字段类型与分词策略

索引是 ES 中数据的组织形式，类似 MySQL 的表结构。在 IM 系统中，需要为'用户'和'消息'分别创建索引，其中消息索引需要支持中文分词检索。

// 用户索引创建示例（ESUser 类） 
bool createIndex() { 
    bool ret = zrt::ESIndex(_es_client, ) 
        .(, , , ) 
        .() 
        .(, , , ) 
        .(, , , ) 
        .(, , , ) 
        .(); 
}

// 数据插入封装（ESInsert 类） 
template<typename T> 
ESInsert &append(const std::string &key, const T &val){ 
    _item[key] = val; // 用 Json::Value 暂存数据 
    return *this; 
} 
bool insert(const std::string) { 
    std::string body; 
    Serialize(_item, body); // 序列化为 JSON 
    try { 
        auto rsp = _client->index(_name, _type, id, body); // 调用 ES 客户端 API 
        // 状态码检查与异常处理 
    } 
}

// 消息搜索示例（ESMessage 类） 
std::vector<zrt::Message> search(const std::string &key, const std::string &ssid) { 
    Json::Value json_user = ESSearch(_es_client, "message") 
        .append_must_term("chat_session_id.keyword", ssid) // 必须匹配会话 ID 
        .append_must_match("content", key) // 必须匹配关键词 
        .search(); // 结果解析与转换 
}

// 消息存储示例（MessageServiceImpl 类） 
ret = _mysql_message->insert(msg); // 插入消息到 MySQL 
// 历史消息查询（基于时间范围） 
auto msg_lists = _mysql_message->range(chat_ssid, stime, etime); 
// 最近消息查询（按时间倒序取前 N 条） 
auto msg_lists = _mysql_message->recent(chat_ssid, msg_count);

// transmit.proto 
service MsgTransmitService { 
    rpc GetTransmitTarget(NewMessageReq) returns (GetTransmitTargetRsp); 
} 
message NewMessageReq { 
    string request_id = 1; // 请求唯一标识 
    string user_id = 2; // 发送者 ID 
    string chat_session_id = 3; // 会话 ID 
    MessageContent message = 4; // 消息内容 
} 
message GetTransmitTargetRsp { 
    string request_id = 1; 
    bool success = 2; 
    string errmsg = 3; 
    MessageInfo message = 4; // 封装后的消息 
    repeated string target_id_list = 5; // 目标用户列表 
}

// TransmiteServiceImpl::GetTransmitTarget 
MessageInfo message; 
message.set_message_id(uuid()); // 生成唯一消息 ID 
message.set_chat_session_id(chat_ssid); // 关联会话 
message.set_timestamp(time(nullptr)); // 记录发送时间 
message.mutable_sender()->CopyFrom(rsp.user_info()); // 填充发送者信息（从用户服务获取） 
message.mutable_message()->CopyFrom(content); // 填充消息内容

// 获取会话成员列表 
auto target_list = _mysql_session_member_table->members(chat_ssid);

// 发布消息到 RabbitMQ 
bool ret = _mq_client->publish(_exchange_name, message.SerializeAsString(), _routing_key);

// 消息存储处理（MessageServiceImpl::onMessage） 
switch(message.message().message_type()) { 
    case MessageType::STRING: // 文本消息：直接存储内容 
        content = message.message().string_message().content(); 
        _es_message->appendData(...); // 同步到 ES 
        break; 
    case MessageType::IMAGE: // 图片消息：上传文件到文件服务，存储文件 ID 
        ret = _PutFile("", msg.image_content(), ..., file_id); 
        break; // 其他类型消息处理类似 
} 
// 统一存储元数据到 MySQL 
zrt::Message msg(...); 
msg.file_id(file_id); // 关联文件 ID 
_mysql_message->insert(msg);

// GetHistoryMsg 接口实现 
// 1. 从 MySQL 查询时间范围内的消息元数据 
auto msg_lists = _mysql_message->range(chat_ssid, stime, etime); 
// 2. 批量获取消息中的文件数据（如图片、语音） 
std::unordered_set<std::string> file_id_lists; 
for (const auto &msg : msg_lists) { 
    if (!msg.file_id().empty()) file_id_lists.insert(msg.file_id()); 
} 
std::unordered_map<std::string, std::string> file_data_lists; 
_GetFile(rid, file_id_lists, file_data_lists); // 调用文件服务批量下载 
// 3. 批量获取发送者用户信息 
std::unordered_set<std::string> user_id_lists; 
for (const auto &msg : msg_lists) { 
    user_id_lists.insert(msg.user_id()); 
} 
std::unordered_map<std::string, UserInfo> user_lists; 
_GetUser(rid, user_id_lists, user_lists); // 调用用户服务批量获取 
// 4. 组装响应数据 
for (const auto &msg : msg_lists) { 
    auto message_info = response->add_msg_list(); // 填充消息元数据、用户信息、文件数据 
}

// MsgSearch 接口实现 
// 1. 调用 ES 搜索会话内包含关键词的消息 
auto msg_lists = _es_message->search(skey, chat_ssid); 
// 2. 获取发送者用户信息（同历史消息查询） 
std::unordered_set<std::string> user_id_lists; 
for (const auto &msg : msg_lists) { 
    user_id_lists.insert(msg.user_id()); 
} 
std::unordered_map<std::string, UserInfo> user_lists; 
_GetUser(rid, user_id_lists, user_lists); 
// 3. 组装响应 
for (const auto &msg : msg_lists) { 
    auto message_info = response->add_msg_list(); // 填充消息与用户信息 
}

// 会话内关键词搜索条件 
ESSearch(_es_client, "message") 
    .append_must_term("chat_session_id.keyword", ssid) // 限定会话 
    .append_must_match("content", key); // 匹配关键词

// TransmiteServerBuilder::make_registry_object 
_registry_client = std::make_shared<Registry>(reg_host); 
_registry_client->registry(service_name, access_host); // 注册服务名与地址

// MessageServerBuilder::make_discovery_object 
auto put_cb = std::bind(&ServiceManager::onServiceOnline, _mm_channels.get(), ...); 
auto del_cb = std::bind(&ServiceManager::onServiceOffline, _mm_channels.get(), ...); 
_service_discoverer = std::make_shared<Discovery>(reg_host, base_service_name, put_cb, del_cb);

// 选择用户服务节点 
auto channel = _mm_channels->choose(_user_service_name); 
if (!channel) { 
    LOG_ERROR("没有可用的用户服务节点"); 
    return false; 
} 
UserService_Stub stub(channel.get()); // 创建 RPC 客户端

// 消息存储服务构建示例 
MessageServerBuilder builder; 
// 1. 构建 ES 客户端 
builder.make_es_object({"http://es-node1:9200", "http://es-node2:9200"}); 
// 2. 构建 MySQL 客户端 
builder.make_mysql_object("user", "pass", "mysql-host", "im_db", "utf8", 3306, 10); 
// 3. 构建服务发现 
builder.make_discovery_object("etcd-host:2379", "/services", "file-service", "user-service"); 
// 4. 构建消息队列 
builder.make_mq_object("rabbit", "pass", "mq-host", "msg-exchange", "store-queue", "store-key"); 
// 5. 构建 RPC 服务器 
builder.make_rpc_server(8002, 60, 16); 
// 6. 生成服务器实例 
auto server = builder.build(); 
server->start();

// 异常处理示例 
try { 
    auto rsp = _client->index(_name, _type, index_id, body); 
    if (rsp.status_code < 200 || rsp.status_code >= 300) { 
        LOG_ERROR("创建 ES 索引失败，状态码：{}", rsp.status_code); 
        return false; 
    } 
} catch(std::exception &e) { 
    LOG_ERROR("创建 ES 索引失败：{}", e.what()); 
    return false; 
}

即时通讯系统核心模块：从传输到存储的全链路设计

即时通讯系统核心模块：从传输到存储的全链路设计

系统架构概览：核心模块与技术栈

核心业务流程

技术栈选型

模块交互关系

数据存储层设计：ES 与 MySQL 的协同方案

Elasticsearch 封装：索引设计与操作抽象

ES 索引设计：字段类型与分词策略

即时通讯系统核心模块：从传输到存储的全链路设计

即时通讯系统核心模块：从传输到存储的全链路设计

系统架构概览：核心模块与技术栈

核心业务流程

技术栈选型

模块交互关系

数据存储层设计：ES 与 MySQL 的协同方案

Elasticsearch 封装：索引设计与操作抽象

ES 索引设计：字段类型与分词策略

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

ES 操作封装：CRUD 接口抽象

MySQL 消息存储：结构化数据的可靠持久化

存储协同策略：MySQL 与 ES 的分工

消息传输服务：从发送到转发的全流程

RPC 接口设计：定义消息传输契约

消息封装流程：从原始内容到完整消息

目标用户获取：从会话成员表查询

消息队列集成：异步存储解耦

消息存储检索服务：从持久化到高效查询

多类型消息处理：文本、图片、文件与语音

历史消息查询：时间范围与分页

关键词搜索：基于 ES 的全文检索

服务治理：注册、发现与连接管理

服务注册：向 etcd 登记服务地址

服务发现：监听 etcd 节点变化

连接管理：负载均衡与故障转移

代码设计亮点：可复用与可扩展的实现

Builder 模式：复杂对象的分步构建

接口封装：隔离底层依赖

异常处理与日志：问题排查的关键

优化与扩展：从可用到高性能

性能优化方向

功能扩展建议

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具