如何把 AI 大语言模型接入个人项目 | 极客日志

PythonAI

如何把 AI 大语言模型接入个人项目

Python 调用 AI 大语言模型主要基于 OpenAI 兼容 API 实现。通过安装 openai 库构造客户端，设置 base_url 和 api_key，即可对接各类模型服务。支持流式与非流式请求，利用迭代器处理 chunk 数据实现逐字输出。核心参数包括 model、messages、temperature 等，用于控制生成行为。消息格式遵循 system/user/assistant 角色定义，支持多轮对话。错误处理需捕获连接异常与状态码错误，生产环境建议增加重试机制。结合分层架构设计，可构建包含 UI、业务逻辑与基础设施的完整应用，实现本地历史存储与多模型切换。

BackendPro发布于 2026/3/21更新于 2026/6/1523 浏览

通过 Python 把 AI 大语言模型接入自己的项目

本文以开源项目 HuluAiChat 为例，说明如何用 Python 将任意「OpenAI 兼容」的 AI 聊天模型接入到自己的应用里。

一、为什么要自己接入 AI 聊天

现成产品（如 ChatGPT 网页、各类 App）已经很好用，但在这些场景里你会希望把大模型能力嵌进自己的项目：

桌面/Web 应用：在自有产品里提供对话能力，数据与界面完全可控。
多模型与私有化：同时使用 OpenAI、国产大模型、自建或代理 API，统一一套界面与逻辑。
流式体验：回复逐字输出，而不是等整段生成再显示。
本地历史：会话与消息存本地，方便检索、导出或合规。

用 Python + OpenAI 兼容 API 可以很低成本地实现上述目标。下面以 「如何用 Python 调用 AI 聊天」 为核心，详解 openai 库的用法与参数，再简要结合 HuluChat 说明如何接到完整项目里。

二、用 Python 调用 AI 聊天：参数、函数与用法详解（核心）

只要你的 API 是 OpenAI 兼容 的（提供 POST /v1/chat/completions，请求/响应格式一致），用官方 openai Python 库即可，无需区分具体厂商。本节是全文重点：把客户端构造、create() 参数、消息格式、流式/非流式、错误处理等讲清楚，方便你直接用到自己的项目。

2.1 安装与客户端构造

安装依赖：

pip install openai>=1.0.0

最小示例：构造客户端并发起一次流式请求。

from openai import OpenAI

client = OpenAI(
    base_url="https://api.openai.com/v1",  # 或你的 API 地址
    api_key="your-api-key",
)
stream = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "用一句话介绍 Python。"}],
    stream=True,
)
for chunk in stream:
    if chunk.choices and chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")
print()

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

参数	类型	说明
`base_url`	`str`	API 根地址，如 `https://api.openai.com/v1`。国内/自建可填 `https://api.deepseek.com/v1`、`https://openai.xxx.com/v1` 等。不填则默认官方 OpenAI。
`api_key`	`str`	对应服务的密钥。部分兼容服务允许占位符（如 `dummy`），但生产环境必须填有效 key。
`timeout`	`float	None`
`max_retries`	`int`	失败时最大重试次数，默认 2。设为 0 可关闭自动重试。
`http_client`	自定义 HTTP 客户端	可注入自己的 `httpx.Client`，用于代理、自定义 header 等。

client = OpenAI(
    base_url="https://api.openai.com/v1",
    api_key="your-api-key",
    timeout=120.0,
    max_retries=2,
)

stream = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "用三句话介绍 Python。"}],
    stream=True,
)
full = []
for chunk in stream:
    if chunk.choices and len(chunk.choices) > 0:
        delta = chunk.choices[0].delta
        if getattr(delta, "content", None):
            full.append(delta.content)
            print(delta.content, end="")
print()
reply = "".join(full)

参数	类型	说明
`model`	`str`	模型 ID，如 `gpt-4o-mini`、`deepseek-chat`、`qwen-plus` 等，由服务方规定。
`messages`	`list[dict]`	对话历史，见 2.6 节。必填。
`stream`	`bool`	是否流式返回。`True` 时返回迭代器；`False` 时返回一个完整 `ChatCompletion` 对象。
`temperature`	`float`	采样随机度，范围一般 0～2。越高越随机，越低越确定。做代码/翻译时可设 0.2～0.3。
`top_p`	`float`	核采样：只从概率质量前 `top_p` 的 token 中采样。与 `temperature` 二选一调即可。
`max_tokens`	`int`	回复最大 token 数（部分服务用 `max_completion_tokens`）。不设则用模型默认上限。
`stop`	`str	list[str]`
`frequency_penalty`	`float`	-2～2，正值减少重复，让模型少重复已出现过的词。
`presence_penalty`	`float`	-2～2，正值鼓励谈论新话题。
`n`	`int`	同一条请求生成几条回复，默认 1。大于 1 时 `choices` 有多条，按需取用。
`response_format`	`dict`	约束输出格式，如 `{"type": "json_object"}` 要求返回合法 JSON。
`tools`	`list`	函数/工具列表，用于 Function Calling；与 `tool_choice` 配合。
`seed`	`int`	固定随机种子，便于复现（部分模型支持）。

resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "写一首四句诗，关于编程。"}],
    stream=False,
    temperature=0.8,
    max_tokens=200,
    stop=["。", "\n\n"],
)
text = resp.choices[0].message.content

completion = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "1+1=?"}],
    stream=False,
)
msg = completion.choices[0].message
print(msg.content)  # 助手回复文本
print(msg.role)     # "assistant"
print(completion.choices[0].finish_reason)  # "stop" 等
if completion.usage:
    print(completion.usage.total_tokens)  # 总 token 数

role	说明
`system`	系统提示，设定助手身份、风格、规则。可选，多数放在第一条。
`user`	用户说的话。
`assistant`	助手之前的回复，用于多轮对话时把历史带上。

messages = [
    {"role": "system", "content": "你是一个简洁的技术助手，只回答一句话。"},
    {"role": "user", "content": "Python 的 GIL 是什么？"},
    {"role": "assistant", "content": "GIL 是全局解释器锁，同一时刻只允许一个线程执行 Python 字节码。"},
    {"role": "user", "content": "怎么规避？"},
]
completion = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages,
    stream=False,
)
print(completion.choices[0].message.content)

from openai import OpenAI, APIConnectionError, APIStatusError

client = OpenAI(base_url="...", api_key="...")
try:
    stream = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "user", "content": "Hi"}],
        stream=True,
    )
    for chunk in stream:
        if chunk.choices and chunk.choices[0].delta.content:
            print(chunk.choices[0].delta.content, end="")
except APIConnectionError as e:
    print("连接失败，可重试:", e)
except APIStatusError as e:
    print("API 错误:", e.status_code, e.message)
    if e.status_code and 500 <= e.status_code < 600:
        print("服务端错误，可稍后重试")

类别	技术
语言	Python 3.10+
界面	CustomTkinter
聊天 API	`openai` 库（OpenAI 兼容）
持久化	SQLite
配置	用户目录 `config.json`
打包	PyInstaller（Windows exe）

如何把 AI 大语言模型接入个人项目

通过 Python 把 AI 大语言模型接入自己的项目

一、为什么要自己接入 AI 聊天

二、用 Python 调用 AI 聊天：参数、函数与用法详解（核心）

2.1 安装与客户端构造

更多推荐文章

相关免费在线工具

2.2 客户端 `OpenAI()` 参数说明

2.3 流式对话：`chat.completions.create(..., stream=True)`

2.4 `create()` 常用参数详解

2.5 非流式调用与响应结构

2.6 消息格式 `messages` 与多轮对话

2.7 其他常用能力与函数

2.8 错误处理与重试

三、HuluAiChat 项目简介

四、整体架构：分层与职责

五、流式发送消息的完整流程

六、核心代码解析：Chat 抽象与 OpenAI 实现

七、如何接入到你自己的项目

八、扩展方向

九、小结

更多推荐文章

相关免费在线工具

如何把 AI 大语言模型接入个人项目

通过 Python 把 AI 大语言模型接入自己的项目

一、为什么要自己接入 AI 聊天

二、用 Python 调用 AI 聊天：参数、函数与用法详解（核心）

2.1 安装与客户端构造

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 客户端 OpenAI() 参数说明

2.3 流式对话：chat.completions.create(..., stream=True)

2.4 create() 常用参数详解

2.5 非流式调用与响应结构

2.6 消息格式 messages 与多轮对话

2.7 其他常用能力与函数

2.8 错误处理与重试

三、HuluAiChat 项目简介

四、整体架构：分层与职责

五、流式发送消息的完整流程

六、核心代码解析：Chat 抽象与 OpenAI 实现

七、如何接入到你自己的项目

八、扩展方向

九、小结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 客户端 `OpenAI()` 参数说明

2.3 流式对话：`chat.completions.create(..., stream=True)`

2.4 `create()` 常用参数详解

2.6 消息格式 `messages` 与多轮对话