跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

GLM-4.6V-Flash-WEB 开源视觉模型部署与 API 调用实践

GLM-4.6V-Flash-WEB 开源视觉模型的部署流程。首先通过 Docker 拉取镜像并启动容器,映射 Web 和 API 端口。接着在 Jupyter 环境中执行一键启动脚本激活服务。用户可通过浏览器访问 Web 界面进行图文对话测试,或使用 Python 代码调用 API 接口实现程序化集成。整个过程涵盖环境准备、服务启动、界面交互及 API 开发,适合希望快速搭建视觉问答应用的开发者参考。

BigDataPan发布于 2026/4/6更新于 2026/5/2325 浏览

GLM-4.6V-Flash-WEB 开源视觉模型部署与 API 调用实践

智谱最新开源的 GLM-4.6V-Flash-WEB 模型功能强大且部署简单。它支持通过网页界面直接对话,并提供 API 接口供开发者集成。

1. 环境准备与镜像部署

部署 GLM-4.6V-Flash-WEB 需要运行 Docker 的环境。以下以 Linux 环境为例。

1.1 获取部署镜像

从镜像仓库拉取包含所有依赖的镜像。

# 拉取镜像 # 请将 `your_image_repo/glm-4.6v-flash-web:latest` 替换为实际地址
docker pull your_image_repo/glm-4.6v-flash-web:latest

注意:your_image_repo 需替换为真实镜像地址,例如 registry.cn-hangzhou.aliyuncs.com/namespace/glm-4.6v-flash-web。

1.2 启动容器实例

映射端口:7860(Web 界面)和 8000(API 服务)。

docker run -d \
  --name glm-4v-web \
  -p 7860:7860 \
  -p 8000:8000 \
  your_image_repo/glm-4.6v-flash-web:latest

执行成功后,使用 docker ps 查看状态。

2. 一键启动推理服务

容器运行后,需进入内部执行启动脚本。

2.1 进入 Jupyter 环境
  1. 浏览器访问服务器 IP:8888。
  2. 输入登录 token。
  3. 导航至 /root 目录。
2.2 执行一键启动脚本

在 /root 目录下找到 1 键推理.sh 脚本。

cd /root
chmod +x 1 键推理.sh
./1 键推理.sh

等待日志输出 "Running on local URL: http://0.0.0.0:7860" 表示 Web 服务启动成功。

3. 访问 Web 界面与初步体验

3.1 打开 Web 推理界面

访问 http://你的服务器 IP 地址:7860。

3.2 图文对话测试
  1. 上传图片。
  2. 针对图片提问。
  3. 发送并等待回复。

可尝试上传表格截图总结数据或商品图生成描述。

4. 使用 API 接口进行调用

API 服务运行在 8000 端口。

4.1 API 调用基础

使用 curl 命令示例:

curl -X POST http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{ "model": "glm-4v-flash", "messages": [ { "role": "user", "content": [ {"type": "text", "text": "描述一下这张图片"}, { "type": "image_url", "image_url": { "url": "data:image/jpeg;base64,你的图片 base64 编码" } } ] } ] }'
4.2 使用 Python 调用 API

安装 openai 库。

import base64
import requests
import json

def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

image_path = "你的图片路径.jpg"
base64_image = encode_image(image_path)
headers = { "Content-Type": "application/json" }
payload = {
    "model": "glm-4v-flash",
    "messages": [
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "请详细描述这张图片的内容。"},
                {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}}
            ]
        }
    ],
    "max_tokens": 300
}
response = requests.post("http://localhost:8000/v1/chat/completions", headers=headers, data=json.dumps(payload))
if response.status_code == 200:
    print(response.json()['choices'][0]['message']['content'])
else:
    print(f"请求失败,状态码:{response.status_code}")

5. 总结与后续探索

完成流程包括:部署镜像、启动服务、网页体验、API 调用。

后续可探索多轮对话、复杂图片识别、API 集成及参数调整。

目录

  1. GLM-4.6V-Flash-WEB 开源视觉模型部署与 API 调用实践
  2. 1. 环境准备与镜像部署
  3. 1.1 获取部署镜像
  4. 拉取镜像 # 请将 yourimagerepo/glm-4.6v-flash-web:latest 替换为实际地址
  5. 1.2 启动容器实例
  6. 2. 一键启动推理服务
  7. 2.1 进入 Jupyter 环境
  8. 2.2 执行一键启动脚本
  9. 3. 访问 Web 界面与初步体验
  10. 3.1 打开 Web 推理界面
  11. 3.2 图文对话测试
  12. 4. 使用 API 接口进行调用
  13. 4.1 API 调用基础
  14. 4.2 使用 Python 调用 API
  15. 5. 总结与后续探索
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 基于 n8n 与 Web Unlocker 的自动化资讯抓取与推送系统
  • CoPaw 个人助理部署、激活与飞书接入指南
  • ms-swift 大模型工程实践与 GitHub 项目管理
  • Java 直播商城架构规划与常见营销模式解析
  • Python 数据分析入门:集中趋势与离散程度
  • Spring AI 实战:Spring Boot + OpenAI 集成 Chroma 向量数据库
  • YOLO11 无人机航拍小目标检测系统实战与优化
  • JavaScript 韦恩图绘制指南:venn.js 库使用详解
  • 基于飞算 JavaAI 的智能在线考试系统设计与实现
  • AGI 通识与应用开发入门指南
  • WebGoat 环境搭建及漏洞实战完全指南
  • 本地 AI 电话机器人:通过 UDP 传输手机通话声音的 Python 脚本
  • VSCode + GitHub Copilot 从安装到 Agent 实战详解
  • GitHub 浏览器插件实现界面中文翻译
  • GitHub 学生开发者认证操作指南
  • 圣光艺苑:基于 Stable Diffusion 的鎏金画框艺术生成工具
  • 利用 AI Ping 实现大模型统一调用与成本优化实践
  • C++ string 类模拟实现
  • 基于 DeepFace 和 OpenCV 的实时情绪分析器实现
  • 基于腾讯云轻量应用服务器部署 OpenClaw 并接入 QQ 飞书机器人

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online