基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

基于 C++ 构建 DeepSeek 大模型推理 SDK 涉及云端鉴权配置、核心数据结构设计、策略模式抽象接口层、适配器实现、单元测试体系及 CMake 构建系统。文章详细阐述了如何利用面向对象编程实现高内聚低耦合架构，支持流式与非流式响应，并通过环境变量管理敏感凭证，确保 SDK 在生产环境的稳定运行与可维护性。

CloudNative发布于 2026/3/22更新于 2026/7/1832 浏览

前言

在高性能计算与大模型（LLM）应用开发的浪潮中，C++ 凭借其卓越的内存管理能力和运行时效率，成为了构建底层推理 SDK 的首选语言。本文将深入剖析如何从零开始，设计并实现一个能够调用 DeepSeek 模型的 C++ SDK。全过程涵盖了云端鉴权、面向对象架构设计、多态接口封装、单元测试体系构建以及 CMake 编译系统的配置。

一、云端环境配置与鉴权机制

大模型的调用始于服务提供商的鉴权流程。鉴权体系通常采用基于 OAuth2 或 API Key 的机制，确保服务调用的安全性与计费准确性。

访问控制台注册页面，完成账户初始化。

注册完成后进入模型广场。在众多大语言模型中，选择 DeepSeek-V3.2 版本。模型 ID（Model ID）是 API 调用中路由请求的关键标识符，系统后端依据此 ID 将请求分发至加载了特定权重的推理集群。此处记录模型 ID 为 /maas/deepseek-ai/DeepSeek-V3.2。

紧接着，在安全设置中生成 API Key。API Key 本质上是一个加密的凭证，通常包含用户标识和签名信息。在 HTTP 请求头中，它通常以 Bearer Token 的形式存在（Authorization: Bearer <API_KEY>）。该密钥必须严格保密，防止泄露导致额度被盗用。

查阅 API 文档是集成的核心步骤。文档定义了通信协议（HTTP/HTTPS）、请求方法（POST）、数据格式（JSON）以及服务端点（Endpoint）。文档显示 Base URL 为 https://api.example.com/v1/chat/completions。这表明该服务遵循 OpenAI 兼容的 API 规范，/v1/chat/completions 是标准的对话补全路由。这也决定了后续 C++ 代码中 HTTP 客户端需要支持 SSL/TLS 加密（即 HTTPS），因此引入 OpenSSL 库是架构设计的必要条件。

二、C++ SDK 核心数据结构设计

SDK 的健壮性取决于底层数据结构的设计。在 SDK/include/common.h 中，通过结构体（Struct）对业务实体进行抽象，利用 C++ 标准模板库（STL）管理内存资源。

1. 消息与配置实体

Message 结构体用于封装对话上下文。

_id：消息唯一标识，用于分布式追踪。
_role：区分 user（用户）、assistant（模型）或 system（系统指令）。
_content：实际文本载荷。
_timestamp：使用 std::time_t 记录时间，便于会话排序与审计。

Config 结构体定义了推理参数。

_temperature：双精度浮点数，控制采样随机性。0.7 是一个平衡创造性与准确性的典型值。
_maxTokens：限制输出长度，防止显存溢出或超长生成。

APIConfig 继承自 Config，体现了面向对象设计的'扩展性'。它在基础配置之上增加了 _apiKey，专门用于云端推理场景。这种设计允许未来扩展本地模型配置（如本地模型路径）而不污染基础配置结构。

2. 模型信息与会话管理

ModelInfo 结构体存储元数据，包括提供方（Provider）、服务端点（Endpoint）及可用性状态。布尔值 _isAvailable 是连接池健康检查的关键指标。

Session 结构体管理多轮对话的上下文。通过 std::vector<Message> 存储历史消息序列。在发送请求时，通常需要将此向量中的历史记录序列化为 JSON 数组，连同新问题一并发送，以维持 LLM 的'记忆'能力。

#pragma once
#include <string>
#include <ctime>
#include <vector>

namespace ai_chat_sdk {
    // 消息结构
    struct Message {
        std::string _id;      // 消息 id
        std::string _role;    // 消息角色
        std::string _content; // 消息内容
        std::time_t _timestamp; // 消息时间戳

        // 构造函数
        Message(const std::string& role, const std::string& content) : _role(role), _content(content) {}
    };

    // 模型的公共配置信息
    struct Config {
        std::string _modelName;     // 模型名称
        double _temperature = 0.7;  // 温度参数，用来控制模型的生成随机性，默认值为 0.7
        int _maxTokens = 2048;      // 最大 token 数，用来控制模型的生成长度，默认值为 2048
    };

    // 通过 API 方式接入云端模型
    struct APIConfig : public Config { // 继承 Config
        std::string _apiKey; // api key
    };

    // 通过 ollama 接入本地模型 --- 不需要 apikey

    // LLM 模型信息
    struct ModelInfo {
        std::string _modelName;     // 模型名称
        std::string _modelDesc;     // 模型描述信息
        std::string _provider;      // 模型提供方
        std::string _endpoint;      // 模型访问地址 base url
        bool _isAvailable = false;  // 模型是否可用，默认值为 false

        ModelInfo(const std::string& modelName = "", const std::string& modelDesc = "", const std::string& provider = "", const std::string& endpoint = "")
            : _modelName(modelName), _modelDesc(modelDesc), _provider(provider), _endpoint(endpoint) {}
    };

    // 会话结构
    struct Session {
        std::string _sessionId;     // 会话 id
        std::string _modelName;     // 模型名称
        std::vector<Message> _messages; // 会话消息列表
        std::time_t _createAt;      // 会话创建时间戳
        std::time_t _updateAt;      // 会话更新时间戳

        // 构造函数
        Session(const std::string& modelName = "") : _modelName(modelName) {}
    };
} // end ai_chat_sdk

三、抽象接口层设计：策略模式的应用

为了支持多种后端（如 DeepSeek、ChatGPT、本地 Ollama），在 SDK/include/LLMProvider.h 中定义了抽象基类 LLMProvider。这是'依赖倒置原则'的典型应用，上层业务逻辑依赖于抽象接口，而非具体实现。

LLMProvider 声明了纯虚函数（Pure Virtual Functions），强制派生类必须实现这些行为：

initModel：接收 std::map 类型的配置参数，具有极高的灵活性，无需硬编码配置项。
sendMessage：同步阻塞式调用，适用于短文本生成。
sendMessageStream：流式响应接口。利用 std::function 回调机制，实现 Token 逐个返回。这对于提升用户体验至关重要，用户无需等待完整生成即可看到首字。

值得注意的是，代码中原有的 projected: 访问修饰符应修正为 protected:。这是 C++ 中用于限制成员变量仅对派生类可见的关键字。将 _apiKey 和 _endpoint 设为受保护成员，既保证了封装性，又允许子类直接访问这些基础资源。

#include <string.h>
#include <map>
#include <vector>
#include "common.h"
#include <functional>

namespace ai_chat_sdk {
    // LLMProvider 类
    class LLMProvider {
    public:
        // 初始化模型
        virtual bool initModel(const std::map<std::string, std::string>& modelConfig) = 0;
        // 初始化模型，传入模型配置参数：模型名称、模型路径、模型参数等

        // 检查模型是否可用
        virtual bool isAvailable() const = 0;

        // 获取模型名称
        virtual std::string getModelName() const = 0;

        // 获取模型描述
        virtual std::string getModelDesc() const = 0;

        // 发送消息 --- 全量返回 非流式响应
        virtual std::string sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam) = 0;
        // 第一个参数为消息列表，第二个参数为请求参数

        // 发送消息 --- 全量返回 流式响应
        virtual std::string sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback) = 0;
        // 第三个参数为回调函数，这个回调函数第一个参数是模型返回的数据，第二个参数是否为最后一个响应
        // callback: 增量返回的每一个 token，以及是否是最好一个 token

    protected:
        bool _isAvailable = false; // 模型是否可用
        std::string _apiKey;       // 模型 API 密钥
        std::string _endpoint;     // 模型 API 地址
    };
}

四、DeepSeek 适配器实现

DeepSeekProvider 类继承自 LLMProvider，具体实现了针对 DeepSeek 模型的业务逻辑。

1. 初始化逻辑

在 src/DeepSeekProvider.cpp 中，initModel 函数执行了防御性编程。它首先在传入的 modelConfig 映射中查找 apiKey 和 endpoint。若关键参数缺失，通过宏 ERR 记录错误日志并返回 false，防止系统在配置无效的状态下启动。只有当所有必要参数校验通过后， _isAvailable 标志位才会被置为 true。

2. 信息查询接口

getModelName 与 getModelDesc 提供了模型的自描述能力。

虽然提供的代码片段中省略了 sendMessage 的具体 HTTP 实现（通常涉及 libcurl 或 httplib 的调用、JSON 序列化与反序列化），但架构框架已经明确：接收 Message 向量，构建 JSON Payload，发起 HTTPS POST 请求，解析响应中的 choices[0].message.content，并处理可能的网络异常。

在 include 目录中创建一个 DeepSeekProvider.h 文件：

#include "LLMProvider.h"
#include <string.h>
#include <map>
#include <vector>
#include "common.h"

namespace ai_chat_sdk {
    // DeepSeekProvider 类
    class DeepSeekProvider : public LLMProvider {
    public:
        // 初始化模型
        virtual void initModel(const std::map<std::string, std::string>& modelConfig);
        // 初始化模型，传入模型配置参数：模型名称、模型路径、模型参数等

        // 检查模型是否可用
        virtual bool isAvailable() const;

        // 获取模型名称
        virtual std::string getModelName() const;

        // 获取模型描述
        virtual std::string getModelDesc() const;

        // 发送消息 --- 全量返回 非流式响应
        std::string sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam);
        // 第一个参数为消息列表，第二个参数为请求参数

        // 发送消息 --- 全量返回 流式响应
        virtual std::string sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback);
        // 第三个参数为回调函数，这个回调函数第一个参数是模型返回的数据，第二个参数是否为最后一个响应
        // callback: 增量返回的每一个 token，以及是否是最好一个 token
    };
}

直接集成 LLMProvider 这个类，然后在 src 中创建一个 DeepSeekProvider.cpp 文件：

#include "../include/DeepSeekProvider.h"
#include "../include/util/myLog.h"

namespace ai_chat_sdk {
    // 初始化模型
    bool DeepSeekProvider::initModel(const std::map<std::string, std::string>& modelConfig) {
        // 初始化 API key
        auto it = modelConfig.find("apiKey");
        if (it == modelConfig.end()) { // 没找到 apikey 的话
            ERR("DeepSeekProvider initModel:apiKey not found"); // 打印一个错误日志
            return false;
        }
        _apiKey = it->second; // 找到了的话就给 apikey 进行一个赋值操作

        // 初始化 endpoint
        it = modelConfig.find("endpoint");
        if (it == modelConfig.end()) { // 没找到 endpoint 的话
            ERR("DeepSeekProvider initModel:endpoint not found"); // 打印一个错误日志
            return false;
        }
        _endpoint = it->second; // 找到了的话就给 endpoint 进行一个赋值操作

        _isAvailable = true; // 模型可用

        // 初始化成功，打印日志
        INFO("DeepSeekProvider initModel:success,apiKey:%s,endpoint:%s", _apiKey.c_str(), _endpoint.c_str());
        return true;
    }

    // 检测模型是否可用
    bool DeepSeekProvider::isAvailable() const {
        return _isAvailable;
    }

    // 获取模型名称
    std::string DeepSeekProvider::getModelName() const {
        return "deepseek-v3.2";
    }

    // 获取模型的描述信息
    std::string DeepSeekProvider::getModelDesc() const {
        return "deepseek-chat 模型是一个基于 Transformer 架构的对话模型，由 DeepSeek 公司开发。它可以用于生成自然语言对话，支持多轮对话。";
    }

    // 发送消息 --- 全量返回 非流式响应
    std::string DeepSeekProvider::sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam) {
        // 实现 HTTP 请求逻辑
        return "";
    }

    // 发送消息 --- 全量返回 流式响应
    std::string DeepSeekProvider::sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback) {
        // 实现 HTTP 流式请求逻辑
        return "";
    }
}

五、单元测试与质量保证

软件工程中，未经测试的代码不具备交付价值。本项目引入 Google Test (gtest) 框架进行单元测试。

1. 测试环境构建

在 testLLM.cpp 中，测试用例 TEST(DeepSeekProviderTest, sendMessage) 模拟了完整的调用流程。

智能指针管理：使用 std::make_shared 创建实例，自动管理生命周期，避免内存泄漏。
安全凭证注入：通过 std::getenv("deepseek_apikey") 从环境变量读取密钥。这是 DevOps 的最佳实践，严禁将敏感密钥硬编码在源码中。
断言机制：ASSERT_TRUE 验证对象指针有效性及初始化结果。若断言失败，测试立即终止，便于快速定位崩溃点。

#include <gtest/gtest.h>
#include "../SDK/include/DeepSeekProvider.h"
#include "../SDK/include/util/myLog.h"

// 测试 DeepSeekProvider 的 initModel 方法
TEST(DeepSeekProviderTest, sendMessage) {
    auto Provider = std::make_shared<ai_chat_sdk::DeepSeekProvider>(); // 创建一个 DeepSeekProvider 对象的智能指针
    ASSERT_TRUE(Provider != nullptr); // 断言 Provider 对象不为空指针

    std::map<std::string, std::string> modelParam;
    const char* env_apikey = std::getenv("deepseek_apikey");
    modelParam["apiKey"] = env_apikey ? env_apikey : "sk-xxxxxxxxxxxxxxxxxxxxxxxxxx";
    modelParam["endpoint"] = "https://api.example.com/v1/chat/completions";

    // 实例化 DeepSeekProvider 对象
    Provider->initModel(modelParam); // 初始化模型，传入模型配置映射
    ASSERT_TRUE(Provider->isAvailable()); // 断言 Provider 对象不为空指针

    std::map<std::string, std::string> requestParam = { // 创建一个模型配置映射，包含 temperature 和 max_tokens
        {"temperature", "0.5"},
        {"max_tokens", "2048"}
    };

    std::vector<ai_chat_sdk::Message> messages;
    messages.push_back({"user", "你是谁？"}); // 添加一个用户消息

    // 调用 sendMessage 方法
    std::string response = Provider->sendMessage(messages, requestParam); // 传入消息列表和请求参数，返回模型的响应
    ASSERT_TRUE(!response.empty()); // 断言响应字符串不为空
}

int main(int argc, char** argv) {
    // 初始化 spdlog 日志库
    ai_chat_sdk::Logger::initLogger("testLLM", "stdout", spdlog::level::debug); // 初始化日志库，参数为日志名称、日志文件名、日志级别
    INFO("Test log message with value: {}", 42);
    INFO("Test log message with two values: {} and {}", 10, 20);

    // 初始化 gtest 库
    testing::InitGoogleTest(&argc, argv); // 调用初始化 Google Test 框架，将命令行参数传递给它

    // 执行所有的测试用例
    return RUN_ALL_TESTS();
}

2. 日志系统

测试入口 main 函数中初始化了 spdlog 日志库。ai_chat_sdk::Logger::initLogger 设置了日志级别为 debug，确保在开发阶段能捕获所有交互细节。testing::InitGoogleTest 负责解析命令行参数，驱动测试执行。

#pragma once
#include <spdlog/spdlog.h>

namespace ai_chat_sdk {
    // 单例模式
    class Logger {
    public:
        // 获取单例实例
        static void initLogger(const std::string &loggerName, const std::string &loggerFile, spdlog::level::level_enum logLevel = spdlog::level::info);
        // 日志名称，日志文件路径，日志级别

        // 获取日志实例
        static std::shared_ptr<spdlog::logger> getLogger();

    private:
        // 构造函数
        Logger();
        // 删除拷贝构造函数和赋值运算符
        Logger(const Logger&) = delete;
        Logger& operator=(const Logger&) = delete;

    private:
        static std::shared_ptr<spdlog::logger> _logger; // 静态日志实例对象
        static std::mutex _mutex;                       // 静态互斥锁
    };

    // 调试日志宏
    // format: 日志格式
    // ...: 可变参数
    // __FILE__: 当前文件名
    // __LINE__: 当前行号
    // 将文件名和行号格式化为 [文件名：行号] 的形式
    // __VA_ARGS__: 可变参数
    // 将格式化后的字符串和可变参数传递给日志器的 debug 方法
    // 09:04:03 [aiChat] [DEBUG] [/home/ubuntu/ai_-model_-sdk/SDK/src/util/myLog.cpp:123] 这是一条调试日志
    // DBG("这是一条调试日志":{}:{}, dbName, dbType)
    #define DBG(format, ...) \
        ai_chat_sdk::Logger::getLogger()->debug("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)

    // 定义其他日志级别宏
    #define TRACE(format, ...) \
        ai_chat_sdk::Logger::getLogger()->log(spdlog::level::trace, "[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)
    #define INFO(format, ...) \
        ai_chat_sdk::Logger::getLogger()->info("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)
    #define WARN(format, ...) \
        ai_chat_sdk::Logger::getLogger()->warn("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)
    #define ERR(format, ...) \
        ai_chat_sdk::Logger::getLogger()->error("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)
    #define CRIT(format, ...) \
        ai_chat_sdk::Logger::getLogger()->critical("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__)
} // end ai_chat_sdk

六、CMake 构建系统配置

C++ 项目的构建复杂性通过 CMake 进行管理。CMakeLists.txt 文件定义了编译规则与依赖关系。

1. 依赖管理

项目依赖 OpenSSL 进行 HTTPS 通信，依赖 spdlog 进行日志记录，依赖 gtest 进行测试，依赖 jsoncpp 处理数据格式。 find_package(OpenSSL REQUIRED) 指令在系统中查找 OpenSSL 库的头文件与二进制文件。若未安装，CMake 配置阶段将直接报错阻断。

# 设置 Cmake 的最小版本为 3.10
cmake_minimum_required(VERSION 3.10)

# 设置项目名称为 testLLM
project(testLLM)

# 设置 C++ 标准为 C++17
set(CMAKE_CXX_STANDARD 17)
set(CMAKE_CXX_STANDARD_REQUIRED ON) # 不支持就报错

# 设置构建类型
set(CMAKE_BUILD_TYPE Debug)

# 添加可执行文件
add_executable(testLLM testKKLLM.cpp ../SDK/src/DeepSeekProvider.cpp ../SDK/src/util/myLog.cpp)

# 设置输出目录
set(EXECUTABLE_OUTPUT_PATH ${CMAKE_SOURCE_DIR})

# 添加头文件
include_directories(${CMAKE_PROJECT_INCLUDE_DIR}/ ../sdk/include)

find_package(OpenSSL REQUIRED) # 找这个库，没找到就报错
include_directories(${OPENSSL_INCLUDE_DIR})

# 添加 CPPHTTPLIB_OPENSSL_SUPPORT 宏定义
target_compile_definitions(testLLM PRIVATE CPPHTTPLIB_OPENSSL_SUPPORT)

# 链接库
target_link_libraries(testLLM spdlog gtest jsoncpp fmt OpenSSL::Crypto OpenSSL::SSL)

2. 编译目标与链接

add_executable 指令将源文件 DeepSeekProvider.cpp、myLog.cpp 和测试文件 testKKLLM.cpp 编译为可执行文件 testLLM。 target_link_libraries 将具体的第三方库链接至目标文件。特别注意 OpenSSL::Crypto 和 OpenSSL::SSL 的显式链接，这是实现安全套接层通信的基础。

项目目录结构清晰，遵循了 include (头文件) 与 src (源文件) 分离的标准布局，有利于大型项目的模块化管理。

七、编译与调试过程

在 build 目录下执行 cmake ..，CMake 读取上一级目录的配置，生成 Makefile。此步骤成功意味着环境依赖和路径配置均无误。

生成的构建工件包括 Makefile、CMakeCache.txt 等，实现了'外部构建'（Out-of-source build），保持源码目录整洁。

执行 make 命令触发实际编译。在初次尝试中，可能会遇到链接错误或头文件缺失，这通常表现为大量的编译器输出信息。

上图反映了典型的编译期错误。解决此类问题通常需要检查：

头文件路径是否通过 include_directories 正确包含。
命名空间是否匹配。
虚函数是否完全实现。
链接库顺序是否正确。

经过调试修正后，再次编译通过。运行 ./testLLM 执行测试程序。

控制台输出显示的绿色 [ PASSED ] 标志表明测试用例执行成功。日志中记录了初始化过程和测试值的输出，验证了 DeepSeekProvider 已正确加载配置，并且能够通过 HTTP 协议与云端 API 建立连接，完成了一次模拟的消息发送流程。

综上所述，构建一个生产级的 C++ LLM SDK 需要跨越网络协议、内存管理、设计模式与自动化测试等多个技术领域。通过严谨的架构设计与详尽的测试验证，能够确保 SDK 在复杂的生产环境中稳定运行。

基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

CloudNative发布于 2026/3/22更新于 2026/7/1832 浏览

#pragma once #include <string> #include <ctime> #include <vector> namespace ai_chat_sdk { // 消息结构 struct Message { std::string _id; // 消息 id std::string _role; // 消息角色 std::string _content; // 消息内容 std::time_t _timestamp; // 消息时间戳 // 构造函数 Message(const std::string& role, const std::string& content) : _role(role), _content(content) {} }; // 模型的公共配置信息 struct Config { std::string _modelName; // 模型名称 double _temperature = 0.7; // 温度参数，用来控制模型的生成随机性，默认值为 0.7 int _maxTokens = 2048; // 最大 token 数，用来控制模型的生成长度，默认值为 2048 }; // 通过 API 方式接入云端模型 struct APIConfig : public Config { // 继承 Config std::string _apiKey; // api key }; // 通过 ollama 接入本地模型 --- 不需要 apikey // LLM 模型信息 struct ModelInfo { std::string _modelName; // 模型名称 std::string _modelDesc; // 模型描述信息 std::string _provider; // 模型提供方 std::string _endpoint; // 模型访问地址 base url bool _isAvailable = false; // 模型是否可用，默认值为 false ModelInfo(const std::string& modelName = "", const std::string& modelDesc = "", const std::string& provider = "", const std::string& endpoint = "") : _modelName(modelName), _modelDesc(modelDesc), _provider(provider), _endpoint(endpoint) {} }; // 会话结构 struct Session { std::string _sessionId; // 会话 id std::string _modelName; // 模型名称 std::vector<Message> _messages; // 会话消息列表 std::time_t _createAt; // 会话创建时间戳 std::time_t _updateAt; // 会话更新时间戳 // 构造函数 Session(const std::string& modelName = "") : _modelName(modelName) {} }; } // end ai_chat_sdk

#include <string.h> #include <map> #include <vector> #include "common.h" #include <functional> namespace ai_chat_sdk { // LLMProvider 类 class LLMProvider { public: // 初始化模型 virtual bool initModel(const std::map<std::string, std::string>& modelConfig) = 0; // 初始化模型，传入模型配置参数：模型名称、模型路径、模型参数等 // 检查模型是否可用 virtual bool isAvailable() const = 0; // 获取模型名称 virtual std::string getModelName() const = 0; // 获取模型描述 virtual std::string getModelDesc() const = 0; // 发送消息 --- 全量返回非流式响应 virtual std::string sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam) = 0; // 第一个参数为消息列表，第二个参数为请求参数 // 发送消息 --- 全量返回流式响应 virtual std::string sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback) = 0; // 第三个参数为回调函数，这个回调函数第一个参数是模型返回的数据，第二个参数是否为最后一个响应 // callback: 增量返回的每一个 token，以及是否是最好一个 token protected: bool _isAvailable = false; // 模型是否可用 std::string _apiKey; // 模型 API 密钥 std::string _endpoint; // 模型 API 地址 }; }

#include "LLMProvider.h" #include <string.h> #include <map> #include <vector> #include "common.h" namespace ai_chat_sdk { // DeepSeekProvider 类 class DeepSeekProvider : public LLMProvider { public: // 初始化模型 virtual void initModel(const std::map<std::string, std::string>& modelConfig); // 初始化模型，传入模型配置参数：模型名称、模型路径、模型参数等 // 检查模型是否可用 virtual bool isAvailable() const; // 获取模型名称 virtual std::string getModelName() const; // 获取模型描述 virtual std::string getModelDesc() const; // 发送消息 --- 全量返回非流式响应 std::string sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam); // 第一个参数为消息列表，第二个参数为请求参数 // 发送消息 --- 全量返回流式响应 virtual std::string sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback); // 第三个参数为回调函数，这个回调函数第一个参数是模型返回的数据，第二个参数是否为最后一个响应 // callback: 增量返回的每一个 token，以及是否是最好一个 token }; }

#include "../include/DeepSeekProvider.h" #include "../include/util/myLog.h" namespace ai_chat_sdk { // 初始化模型 bool DeepSeekProvider::initModel(const std::map<std::string, std::string>& modelConfig) { // 初始化 API key auto it = modelConfig.find("apiKey"); if (it == modelConfig.end()) { // 没找到 apikey 的话 ERR("DeepSeekProvider initModel:apiKey not found"); // 打印一个错误日志 return false; } _apiKey = it->second; // 找到了的话就给 apikey 进行一个赋值操作 // 初始化 endpoint it = modelConfig.find("endpoint"); if (it == modelConfig.end()) { // 没找到 endpoint 的话 ERR("DeepSeekProvider initModel:endpoint not found"); // 打印一个错误日志 return false; } _endpoint = it->second; // 找到了的话就给 endpoint 进行一个赋值操作 _isAvailable = true; // 模型可用 // 初始化成功，打印日志 INFO("DeepSeekProvider initModel:success,apiKey:%s,endpoint:%s", _apiKey.c_str(), _endpoint.c_str()); return true; } // 检测模型是否可用 bool DeepSeekProvider::isAvailable() const { return _isAvailable; } // 获取模型名称 std::string DeepSeekProvider::getModelName() const { return "deepseek-v3.2"; } // 获取模型的描述信息 std::string DeepSeekProvider::getModelDesc() const { return "deepseek-chat 模型是一个基于 Transformer 架构的对话模型，由 DeepSeek 公司开发。它可以用于生成自然语言对话，支持多轮对话。"; } // 发送消息 --- 全量返回非流式响应 std::string DeepSeekProvider::sendMessage(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam) { // 实现 HTTP 请求逻辑 return ""; } // 发送消息 --- 全量返回流式响应 std::string DeepSeekProvider::sendMessageStream(const std::vector<Message>& messages, const std::map<std::string, std::string>& requestParam, std::function<void(const std::string&, bool)> callback) { // 实现 HTTP 流式请求逻辑 return ""; } }

#include <gtest/gtest.h> #include "../SDK/include/DeepSeekProvider.h" #include "../SDK/include/util/myLog.h" // 测试 DeepSeekProvider 的 initModel 方法 TEST(DeepSeekProviderTest, sendMessage) { auto Provider = std::make_shared<ai_chat_sdk::DeepSeekProvider>(); // 创建一个 DeepSeekProvider 对象的智能指针 ASSERT_TRUE(Provider != nullptr); // 断言 Provider 对象不为空指针 std::map<std::string, std::string> modelParam; const char* env_apikey = std::getenv("deepseek_apikey"); modelParam["apiKey"] = env_apikey ? env_apikey : "sk-xxxxxxxxxxxxxxxxxxxxxxxxxx"; modelParam["endpoint"] = "https://api.example.com/v1/chat/completions"; // 实例化 DeepSeekProvider 对象 Provider->initModel(modelParam); // 初始化模型，传入模型配置映射 ASSERT_TRUE(Provider->isAvailable()); // 断言 Provider 对象不为空指针 std::map<std::string, std::string> requestParam = { // 创建一个模型配置映射，包含 temperature 和 max_tokens {"temperature", "0.5"}, {"max_tokens", "2048"} }; std::vector<ai_chat_sdk::Message> messages; messages.push_back({"user", "你是谁？"}); // 添加一个用户消息 // 调用 sendMessage 方法 std::string response = Provider->sendMessage(messages, requestParam); // 传入消息列表和请求参数，返回模型的响应 ASSERT_TRUE(!response.empty()); // 断言响应字符串不为空 } int main(int argc, char** argv) { // 初始化 spdlog 日志库 ai_chat_sdk::Logger::initLogger("testLLM", "stdout", spdlog::level::debug); // 初始化日志库，参数为日志名称、日志文件名、日志级别 INFO("Test log message with value: {}", 42); INFO("Test log message with two values: {} and {}", 10, 20); // 初始化 gtest 库 testing::InitGoogleTest(&argc, argv); // 调用初始化 Google Test 框架，将命令行参数传递给它 // 执行所有的测试用例 return RUN_ALL_TESTS(); }

#pragma once #include <spdlog/spdlog.h> namespace ai_chat_sdk { // 单例模式 class Logger { public: // 获取单例实例 static void initLogger(const std::string &loggerName, const std::string &loggerFile, spdlog::level::level_enum logLevel = spdlog::level::info); // 日志名称，日志文件路径，日志级别 // 获取日志实例 static std::shared_ptr<spdlog::logger> getLogger(); private: // 构造函数 Logger(); // 删除拷贝构造函数和赋值运算符 Logger(const Logger&) = delete; Logger& operator=(const Logger&) = delete; private: static std::shared_ptr<spdlog::logger> _logger; // 静态日志实例对象 static std::mutex _mutex; // 静态互斥锁 }; // 调试日志宏 // format: 日志格式 // ...: 可变参数 // __FILE__: 当前文件名 // __LINE__: 当前行号 // 将文件名和行号格式化为 [文件名：行号] 的形式 // __VA_ARGS__: 可变参数 // 将格式化后的字符串和可变参数传递给日志器的 debug 方法 // 09:04:03 [aiChat] [DEBUG] [/home/ubuntu/ai_-model_-sdk/SDK/src/util/myLog.cpp:123] 这是一条调试日志 // DBG("这是一条调试日志":{}:{}, dbName, dbType) #define DBG(format, ...) \ ai_chat_sdk::Logger::getLogger()->debug("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) // 定义其他日志级别宏 #define TRACE(format, ...) \ ai_chat_sdk::Logger::getLogger()->log(spdlog::level::trace, "[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) #define INFO(format, ...) \ ai_chat_sdk::Logger::getLogger()->info("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) #define WARN(format, ...) \ ai_chat_sdk::Logger::getLogger()->warn("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) #define ERR(format, ...) \ ai_chat_sdk::Logger::getLogger()->error("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) #define CRIT(format, ...) \ ai_chat_sdk::Logger::getLogger()->critical("[{:>10s}:{:<4d}] " format, __FILE__, __LINE__, ##__VA_ARGS__) } // end ai_chat_sdk

# 设置 Cmake 的最小版本为 3.10 cmake_minimum_required(VERSION 3.10) # 设置项目名称为 testLLM project(testLLM) # 设置 C++ 标准为 C++17 set(CMAKE_CXX_STANDARD 17) set(CMAKE_CXX_STANDARD_REQUIRED ON) # 不支持就报错 # 设置构建类型 set(CMAKE_BUILD_TYPE Debug) # 添加可执行文件 add_executable(testLLM testKKLLM.cpp ../SDK/src/DeepSeekProvider.cpp ../SDK/src/util/myLog.cpp) # 设置输出目录 set(EXECUTABLE_OUTPUT_PATH ${CMAKE_SOURCE_DIR}) # 添加头文件 include_directories(${CMAKE_PROJECT_INCLUDE_DIR}/ ../sdk/include) find_package(OpenSSL REQUIRED) # 找这个库，没找到就报错 include_directories(${OPENSSL_INCLUDE_DIR}) # 添加 CPPHTTPLIB_OPENSSL_SUPPORT 宏定义 target_compile_definitions(testLLM PRIVATE CPPHTTPLIB_OPENSSL_SUPPORT) # 链接库 target_link_libraries(testLLM spdlog gtest jsoncpp fmt OpenSSL::Crypto OpenSSL::SSL)

基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

前言

一、云端环境配置与鉴权机制

二、C++ SDK 核心数据结构设计

1. 消息与配置实体

2. 模型信息与会话管理

三、抽象接口层设计：策略模式的应用

四、DeepSeek 适配器实现

1. 初始化逻辑

2. 信息查询接口

五、单元测试与质量保证

1. 测试环境构建

2. 日志系统

六、CMake 构建系统配置

1. 依赖管理

2. 编译目标与链接

七、编译与调试过程

基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

前言

一、云端环境配置与鉴权机制

二、C++ SDK 核心数据结构设计

1. 消息与配置实体

2. 模型信息与会话管理

三、抽象接口层设计：策略模式的应用

四、DeepSeek 适配器实现

1. 初始化逻辑

2. 信息查询接口

五、单元测试与质量保证

1. 测试环境构建

2. 日志系统

六、CMake 构建系统配置

1. 依赖管理

2. 编译目标与链接

七、编译与调试过程

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

前言

一、云端环境配置与鉴权机制

二、C++ SDK 核心数据结构设计

1. 消息与配置实体

2. 模型信息与会话管理

三、抽象接口层设计：策略模式的应用

四、DeepSeek 适配器实现

1. 初始化逻辑

2. 信息查询接口

五、单元测试与质量保证

1. 测试环境构建

2. 日志系统

六、CMake 构建系统配置

1. 依赖管理

2. 编译目标与链接

七、编译与调试过程

基于 C++ 构建 DeepSeek 大模型推理 SDK 的架构设计与实现

前言

一、云端环境配置与鉴权机制

二、C++ SDK 核心数据结构设计

1. 消息与配置实体

2. 模型信息与会话管理

三、抽象接口层设计：策略模式的应用

四、DeepSeek 适配器实现

1. 初始化逻辑

2. 信息查询接口

五、单元测试与质量保证

1. 测试环境构建

2. 日志系统

六、CMake 构建系统配置

1. 依赖管理

2. 编译目标与链接

七、编译与调试过程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具