GLM-4.7 与 MiniMax M2.1 工程级 Agent 模型接入指南

GLM-4.7 与 MiniMax M2.1 工程级 Agent 模型接入指南 | 极客日志

from openai import OpenAI
openai_client = OpenAI(
    base_url="https://www.aiping.cn/api/v1",
    api_key="YOUR_API_KEY"
)
response = openai_client.chat.completions.create(
    model="GLM-4.7",
    stream=True,
    extra_body={
        "provider": {
            "only": [],
            "order": [],
            "sort": None,
            "input_price_range": [],
            "output_price_range": [],
            "input_length_range": [],
            "throughput_range": [],
            "latency_range": []
        }
    },
    messages=[{"role": "user", "content": "Hello"}]
)
for chunk in response:
    if not getattr(chunk, "choices", None):
        continue
    reasoning_content = getattr(chunk.choices[0].delta, "reasoning_content", None)
    if reasoning_content:
        print(reasoning_content, flush=True)
    content = getattr(chunk.choices[0].delta, "content", None)
    if content:
        print(content, flush=True)

from openai import OpenAI
# 初始化客户端
openai_client = OpenAI(
    base_url="https://www.aiping.cn/api/v1",
    api_key="YOUR_API_KEY"
)
# 维护对话上下文（多轮交互关键）
messages = []
print("GLM-4.7 对话助手（输入 exit 退出）：")
while True:
    # 接收用户输入
    user_input = input("\n你：")
    if user_input.lower() == "exit":
        print("对话结束～")
        break
    # 把用户输入加入上下文
    messages.append({"role": "user", "content": user_input})
    try:
        # 发起流式调用
        response = openai_client.chat.completions.create(
            model="GLM-4.7",
            stream=True,
            extra_body={"provider": {"only": [], "order": [], "sort": None}},
            messages=messages
        )
        print("GLM-4.7：", flush=True)
        # 接收并打印流式返回
        for chunk in response:
            if not getattr(chunk, "choices", None):
                continue
            # 打印思考过程（可选）
            reasoning = getattr(chunk.choices[0].delta, "reasoning_content", None)
            if reasoning:
                print(reasoning, flush=True)
            # 打印核心回复
            content = getattr(chunk.choices[0].delta, "content", None)
            if content:
                print(content, flush=True)
            # 把模型回复加入上下文（多轮交互关键）
            # 注：流式调用需拼接所有 content 后再加入，这里简化处理（实际需优化）
            messages.append({"role": "assistant", "content": "（上述流式返回的完整内容）"})
    except Exception as e:
        print(f"\n调用出错：{e}")
        # 出错时清空本轮输入，避免上下文污染
        messages.pop()

from openai import OpenAI
openai_client = OpenAI(
    base_url="https://www.aiping.cn/api/v1",
    api_key="YOUR_API_KEY"
)
response = openai_client.chat.completions.create(
    model="MiniMax-M2.1",
    stream=True,
    extra_body={
        "provider": {
            "only": [],
            "order": [],
            "sort": None,
            "input_price_range": [],
            "output_price_range": [],
            "input_length_range": [],
            "throughput_range": [],
            "latency_range": []
        }
    },
    messages=[{"role": "user", "content": "Hello"}]
)
for chunk in response:
    if not getattr(chunk, "choices", None):
        continue
    reasoning_content = getattr(chunk.choices[0].delta, "reasoning_content", None)
    if reasoning_content:
        print(reasoning_content, flush=True)
    content = getattr(chunk.choices[0].delta, "content", None)
    if content:
        print(content, flush=True)

GLM-4.7 与 MiniMax M2.1 工程级 Agent 模型接入指南

前言：从能生成到能长期跑的工程级大模型

模型定位对比：GLM-4.7 vs MiniMax M2.1，工程路线有何不同？

GLM-4.7：面向复杂任务与 Agentic Coding 的旗舰模型

多供应商实测数据：吞吐、延迟与可靠性对比

统一 API 与智能路由：自动选择最优供应商

更多推荐文章

相关免费在线工具

MiniMax-M2.1：高吞吐 MoE 架构下的多语言工程利器

多云供应商实测：上下文、吞吐与延迟表现

统一 OpenAI 兼容接口：低成本完成模型接入

VSCode Cline 中接入集成平台：模型直连开发流程

总结：国产大模型工程化落地的两种成熟路径

更多推荐文章

相关免费在线工具

GLM-4.7 与 MiniMax M2.1 工程级 Agent 模型接入指南

前言：从能生成到能长期跑的工程级大模型

模型定位对比：GLM-4.7 vs MiniMax M2.1，工程路线有何不同？

GLM-4.7：面向复杂任务与 Agentic Coding 的旗舰模型

多供应商实测数据：吞吐、延迟与可靠性对比

统一 API 与智能路由：自动选择最优供应商

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

MiniMax-M2.1：高吞吐 MoE 架构下的多语言工程利器

多云供应商实测：上下文、吞吐与延迟表现

统一 OpenAI 兼容接口：低成本完成模型接入

VSCode Cline 中接入集成平台：模型直连开发流程

总结：国产大模型工程化落地的两种成熟路径

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具