Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南 | 极客日志

PythonNode.jsAI大前端

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

综述由AI生成了如何在本地通过 Clawdbot 集成 Qwen3-32B 大模型。主要解决了 Clawdbot 无法直接调用 Ollama API 导致的跨域和协议不匹配问题。方案核心是构建一个轻量级 Python 代理脚本（监听 8080 端口）进行 OpenAI 格式与 Ollama 格式的转换，配合 Clawdbot 前端服务（监听 18789 端口）。文章涵盖了环境检查、Ollama 启动、代理脚本编写、配置文件修改、端口调试及日志分析等完整流程，并提供了开机自启和安全加固建议，帮助用户快速搭建私有大模型聊天平台。

DataScient发布于 2026/4/5更新于 2026/5/2330 浏览

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

1. 为什么需要这个整合方案

你是不是也遇到过这样的问题：想用本地部署的大模型做聊天机器人，但发现直接调用 Ollama 的 API 在 Web 前端里跨域报错？或者 Clawdbot 配置完后一直连不上模型，控制台疯狂刷 404？又或者好不容易跑起来了，发个消息却卡在'正在思考'半天没反应？

这正是我们搭建这套环境时踩过的坑。Clawdbot 本身不直接对接 Ollama，它需要一个中间层来处理协议转换、请求转发和端口映射。而 18789 这个端口，就是整个链路里最关键的'通关密码'——它不是随便选的，而是 Clawdbot 默认监听的 Web 网关入口。

整套方案的核心逻辑其实很朴素：

你在浏览器里访问 http://localhost:18789，看到的是 Clawdbot 的聊天界面
Clawdbot 收到你的消息后，不自己去算答案，而是把请求转给内部代理
代理再把请求发到 http://localhost:8080（Ollama API 地址）
Ollama 调用本地的 Qwen3-32B 模型生成回复，原路返回

整个过程对用户完全透明，你只管打字，剩下的交给这三层接力。

我们不用 Docker Compose 写一堆 yaml，也不搞 Kubernetes 集群，就用最轻量、最可控的方式——纯命令行 + 配置文件，每一步都能看见、能改、能查。

2. 环境准备与基础服务启动

2.1 确认系统前提条件

请先在终端里运行这几条命令，确认基础环境已就绪：

# 检查 Node.js 版本（Clawdbot 需要 18.x 或更高）
node --version
# 检查 Ollama 是否已安装并运行
ollama list
curl -s http://localhost:11434/api/tags | jq '.models[] | select(.name | contains("qwen3"))'
# 检查 Python 是否可用（部分代理脚本依赖）
python3 --version

如果 ollama list 没显示 qwen3:32B，先拉取模型：

ollama pull qwen3:32B

注意：Qwen3-32B 是大模型，首次拉取可能需要 30 分钟以上，请确保磁盘空间充足（建议预留 25GB 以上）。不要用 qwen3:latest，必须明确指定 :32B 标签，否则可能加载错版本导致后续报错。

2.2 启动 Ollama 服务并验证 API

Ollama 默认监听 127.0.0.1:11434，但 Clawdbot 需要的是标准 HTTP API 格式。我们先手动测试一下原始接口是否通：

curl -X POST http://localhost:11434/api/chat \
-H "Content-Type: application/json" \
-d '{ "model": "qwen3:32B", "messages": [{"role": "user", "content": "你好"}], "stream": false }' | jq '.message.content'

如果返回'你好！很高兴见到你'，说明 Ollama 工作正常。如果报错 Connection refused，请检查 Ollama 服务是否真的在后台运行（ps aux | grep ollama）。

2.3 创建轻量代理层（关键步骤）

Clawdbot 不能直连 Ollama 的 11434 端口，因为它的前端代码硬编码了 /v1/chat/completions 路径，而 Ollama 用的是。我们需要一个'翻译官'。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

/api/chat

#!/usr/bin/env python3
import asyncio
import json
from aiohttp import web, ClientSession

OLLAMA_URL = "http://localhost:11434/api/chat"
TIMEOUT = 300

async def handle_chat(request):
    try:
        data = await request.json()
        # 将 OpenAI 格式转为 Ollama 格式
        ollama_data = {
            "model": data.get("model", "qwen3:32B"),
            "messages": [{"role": m["role"], "content": m["content"]} for m in data.get("messages", [])],
            "stream": data.get("stream", False),
        }
        async with ClientSession() as session:
            async with session.post(
                OLLAMA_URL,
                json=ollama_data,
                timeout=asyncio.Timeout(TIMEOUT)
            ) as resp:
                if resp.status == 200:
                    response_data = await resp.json()
                    # 转回 OpenAI 兼容格式
                    openai_resp = {
                        "id": "chat-" + str(hash(json.dumps(data)))[:8],
                        "object": "chat.completion",
                        "created": int(__import__('time').time()),
                        "model": ollama_data["model"],
                        "choices": [{
                            "index": 0,
                            "message": {"role": "assistant", "content": response_data.get("message", {}).get("content", "")},
                            "finish_reason": "stop"
                        }]
                    }
                    return web.json_response(openai_resp)
                else:
                    return web.Response(text=await resp.text(), status=resp.status)
    except Exception as e:
        return web.json_response({"error": str(e)}, status=500)

app = web.Application()
app.router.add_post("/v1/chat/completions", handle_chat)
web.run_app(app, host="127.0.0.1", port=8080, print=False)

chmod +x proxy_8080.py
nohup python3 proxy_8080.py > proxy.log 2>&1 &

curl -X POST http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "qwen3:32B", "messages": [{"role": "user", "content": "用一句话介绍你自己"}] }' | jq '.choices[0].message.content'

wget https://github.com/clawdbot/clawdbot/releases/download/v0.8.2/clawdbot-v0.8.2.zip
unzip clawdbot-v0.8.2.zip -d clawdbot
cd clawdbot

{
  "apiUrl": "http://localhost:8080/v1",
  "model": "qwen3:32B",
  "baseUrl": "http://localhost:18789"
}

npx http-server -p 18789 -c-1

Starting up http-server, serving ./
Available on:
  http://127.0.0.1:18789
  http://192.168.1.100:18789
Hit CTRL-C to stop the server

# 1. 模拟 Clawdbot 向代理发请求（等效于前端 AJAX）
curl -X POST http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "qwen3:32B", "messages": [{"role": "user", "content": "今天天气怎么样？"}] }'

# 2. 模拟代理向 Ollama 发请求（等效于 proxy_8080.py 内部调用）
curl -X POST http://localhost:11434/api/chat \
-H "Content-Type: application/json" \
-d '{ "model": "qwen3:32B", "messages": [{"role": "user", "content": "今天天气怎么样？"}], "stream": false }'

日志位置	查看命令	关键线索
`proxy.log`	`tail -f proxy.log`	看是否有 `500 Internal Server Error` 或超时记录
`http-server` 终端输出	直接看启动终端	看是否有 `404 Not Found` 或 CORS 警告
浏览器 Console	F12 → Console	看是否有 `Uncaught (in promise)` 错误

[Unit]
Description=Ollama to OpenAI API Proxy
After=ollama.service

[Service]
Type=simple
User=$USER
WorkingDirectory=/path/to/your/proxy
ExecStart=/usr/bin/python3 /path/to/your/proxy_8080.py
Restart=always
RestartSec=10

[Install]
WantedBy=multi-user.target

sudo systemctl daemon-reload
sudo systemctl enable ollama-proxy
sudo systemctl start ollama-proxy

# 实时查看 Ollama 内存占用
ollama serve &
# 确保服务在前台运行，便于观察日志
# 在另一个终端运行
watch -n 1 'nvidia-smi --query-gpu=memory.used --format=csv,noheader,nounits | head -1'

"stream": true

# 安装带认证的 http-server
npm install -g http-server-auth
# 启动时加用户名密码
http-server-auth -p 18789 -u admin -p your_secure_password

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

1. 为什么需要这个整合方案

2. 环境准备与基础服务启动

2.1 确认系统前提条件

2.2 启动 Ollama 服务并验证 API

2.3 创建轻量代理层（关键步骤）

更多推荐文章

相关免费在线工具

3. Clawdbot 部署与 18789 端口配置

3.1 下载并解压 Clawdbot

3.2 修改 config.json 适配本地环境

3.3 启动 Clawdbot Web 服务

4. 18789 端口调试全流程实录

4.1 常见连接失败的三种典型场景

4.2 抓包验证完整链路（推荐用 curl 模拟）

4.3 日志定位法：三日志联动分析

5. 进阶优化与稳定性加固

5.1 让服务开机自启（Linux/macOS）

5.2 内存与显存监控（Qwen3-32B 专属）

5.3 安全加固：限制本地访问

6. 总结：从连不上到丝滑对话的六个关键点

更多推荐文章

相关免费在线工具

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

Clawdbot 整合 Qwen3-32B 本地部署及 18789 端口调试指南

1. 为什么需要这个整合方案

2. 环境准备与基础服务启动

2.1 确认系统前提条件

2.2 启动 Ollama 服务并验证 API

2.3 创建轻量代理层（关键步骤）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. Clawdbot 部署与 18789 端口配置

3.1 下载并解压 Clawdbot

3.2 修改 config.json 适配本地环境

3.3 启动 Clawdbot Web 服务

4. 18789 端口调试全流程实录

4.1 常见连接失败的三种典型场景

4.2 抓包验证完整链路（推荐用 curl 模拟）

4.3 日志定位法：三日志联动分析

5. 进阶优化与稳定性加固

5.1 让服务开机自启（Linux/macOS）

5.2 内存与显存监控（Qwen3-32B 专属）

5.3 安全加固：限制本地访问

6. 总结：从连不上到丝滑对话的六个关键点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具