Qwen VL 本地部署 llama.cpp 和webui 兼容多种视觉多模态理解模型

优质文章学习记录

08 Apr 2026 — 3 min read

1.准备：

操作系统：WIN10 ，i7-4750M，16GRAM。

框架：llama.cpp(下载地址：Releases · ggml-org/llama.cpp · GitHub)下载版本：b5342以上，文章采用“llama-b5342-bin-win-cpu-x64.zip”。

模型文件：Qwen2.5-VL-3B-Instruct-Q8_0.gguf和mmproj-model-f16.gguf（下载地址：魔搭社区），注意模型包括基础模型文件和mmproj型文件两个文件。

浏览器：chrome内核浏览器，旧版本会导致webui乱码。

2.常用模型下载：

根据电脑配置属性进行模型下载，登录（魔搭社区），点击左侧，视觉多模态理解模型，输入GGUF过滤大模型格式。

常用视觉多模态模型：

Qwen2 VL

Qwen2.5 VL

glm-edge

gemma3

Llama

llava

mistral

minicpmv

moondream

上述均可以下载到。

3.大模型服务运行

STEP1.解压llama-b5342-bin-win-cpu-x64.zip。

STEP2.按键win+R输入cmd，回车，进入llama-b5342-bin-win-cpu-x64解压路径。

STEP3.将Qwen2.5-VL-3B-Instruct-Q8_0.gguf和mmproj-model-f16.gguf拷贝到入llama-b5342-bin-win-cpu-x64解压路径。

STEP4.输入指令命令（注意模型文件的拷贝目录）。

llama-server.exe -m Qwen2.5-VL-3B-Instruct-Q8_0.gguf --mmproj mmproj-model-f16.gguf

回车后等待加载完成。

4.大模型访问

浏览器输入：http://127.0.0.1:8080/，进行访问。

点击右下角图标，上传图片文件，点击发送，OK。

5.大模型效果

当前环境配置输出大概3.5token/S左右，效果供参考。

具体的llama.cpp加速方式，请移步互联网自行搜索。

Read more

Flutter 三方库 eip55 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、符合 Web3 标准的以太坊地址校验与防串改引擎

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 eip55 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、符合 Web3 标准的以太坊地址校验与防串改引擎在鸿蒙（OpenHarmony）系统的区块链钱包应用、数字资产管理工具（如鸿蒙版 NFT 浏览器）或需要处理加密货币转账的场景中，如何确保用户输入的以太坊（Ethereum）地址既符合基本格式，又通过了大小写混合的校验和（Checksum）验证，防止因为单个字符手误导致的资产永久丢失？eip55 为开发者提供了一套工业级的、基于 EIP-55 提案的地址转换与验证方案。本文将深入实战其在鸿蒙 Web3 安全基座中的应用。前言什么是 EIP-55？它是由以太坊创始人 Vitalik Buterin 提出的地址校验和提案。通过在地址字符串中引入特定的。大小写混合模式（基于 Keccak-256 哈希）

Stable Diffusion 秋叶大神2025最新整合一键安装包

Stable Diffusion 秋叶大神2025最新整合一键安装包

这段时间我在折腾 Stable Diffusion，期间试过很多安装方式。有手动安装的，也有别人做好的整合包。手动安装的方式对环境要求高，步骤也多，系统要装 Python，要装依赖，还要配好运行库，哪一步出错都要重新查资料，挺消耗时间。后来了解到秋叶大神做的整合一键安装包，这个版本省掉了很多折腾，对新手比较友好。我自己把安装流程整理了一遍，又结合网上的信息，把一些需要注意的地方写下来，希望能帮到想尝试 Stable Diffusion 的人。这里完整下载链接秋叶整合包是什么这个整合包属于别人已经帮你配好的版本，里面把 Stable Diffusion WebUI、模型管理、插件、运行环境都准备好了。下载之后按照提示解压，点一下启动脚本就能跑起来，不需要另外去折腾环境。整合包里放的 WebUI 是常见的 AUTOMATIC1111 版本，所以大部分教程都能直接用。适合想直接出图、想先体验一下模型效果的人。系统环境方面我现在用的是 Windows 电脑，所以下面写的内容主要基于

【正点原子FPGA学习日记】DAY1：FPGA简介及开发流程

使用正点原子的达芬奇板作为学习使用，文章内容是对正点原子开发指南的整理，仅做回顾学习使用，侵删。 FPGA简介 1，FPGA中文名：现场可编程门阵列其中现场指其可重复写入，门阵列指其根据查找表输出，可编程则是FPGA与CPU之间最主要的区别，能够改变逻辑门单元之间的硬件逻辑。 2，FPGA内部结构 FPGA 由许多“可配置逻辑模块”（Configurable Logic Block，CLB）、输入/输出单元（I/O Block，IOB）和分布式的可编程互联矩阵（Programmable Interconnection Matrix，PIM）组成。 3，CPU、DSP 和 FPGA 的区别 CPU 具有比较强的事务管理功能，可以用来跑 UI 以及应用程序，CPU 优点主要在于擅长控制。DSP 主要是来做计算，例如加解密算法，调制解调等，

【ZYNQ必学】PS-PL架构完全解析：从零理解ARM+FPGA融合设计(附实战案例)

【ZYNQ必学】PS-PL架构完全解析：从零理解ARM+FPGA融合设计(附实战案例) 📚 目录导航文章目录 * 【ZYNQ必学】PS-PL架构完全解析：从零理解ARM+FPGA融合设计(附实战案例) * 📚 目录导航 * 概述 * 一、PS-PL架构基础概念 * 1.1 什么是PS和PL * 1.1.1 PS(处理系统)定义 * 1.1.2 PL(可编程逻辑)定义 * 1.1.3 PS vs PL对比 * 1.2 ZYNQ基本结构 * 1.2.1 ZYNQ-7000系列架构 * 1.2.2 ZYNQ-7000的整体架构 * 1.3