Qwen VL 本地部署 llama.cpp 和webui 兼容多种视觉多模态理解模型

Qwen VL 本地部署 llama.cpp 和webui 兼容多种视觉多模态理解模型

1.准备:

        操作系统:WIN10 ,i7-4750M,16GRAM。

        框架:llama.cpp(下载地址:Releases · ggml-org/llama.cpp · GitHub)下载版本:b5342以上,文章采用“llama-b5342-bin-win-cpu-x64.zip”。

        模型文件:Qwen2.5-VL-3B-Instruct-Q8_0.gguf和mmproj-model-f16.gguf(下载地址:魔搭社区),注意模型包括基础模型文件和mmproj型文件两个文件。

        浏览器:chrome内核浏览器,旧版本会导致webui乱码。

2.常用模型下载:

        根据电脑配置属性进行模型下载,登录(魔搭社区),点击左侧,视觉多模态理解模型,输入GGUF过滤大模型格式。

        常用视觉多模态模型:

        Qwen2 VL

        Qwen2.5 VL

        glm-edge

        gemma3

        Llama

        llava

        mistral

        minicpmv

        moondream

        上述均可以下载到。

3.大模型服务运行

        STEP1.解压llama-b5342-bin-win-cpu-x64.zip。

        STEP2.按键win+R输入cmd,回车,进入llama-b5342-bin-win-cpu-x64解压路径。

        STEP3.将Qwen2.5-VL-3B-Instruct-Q8_0.gguf和mmproj-model-f16.gguf拷贝到入llama-b5342-bin-win-cpu-x64解压路径。

        STEP4.输入指令命令(注意模型文件的拷贝目录)。

llama-server.exe -m Qwen2.5-VL-3B-Instruct-Q8_0.gguf --mmproj mmproj-model-f16.gguf

        回车后等待加载完成。

4.大模型访问

        浏览器输入:http://127.0.0.1:8080/,进行访问。

        点击右下角图标,上传图片文件,点击发送,OK。

5.大模型效果

        当前环境配置输出大概3.5token/S左右,效果供参考。

        具体的llama.cpp加速方式,请移步互联网自行搜索。

Read more

Flutter 三方库 eip55 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、符合 Web3 标准的以太坊地址校验与防串改引擎

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 eip55 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、符合 Web3 标准的以太坊地址校验与防串改引擎 在鸿蒙(OpenHarmony)系统的区块链钱包应用、数字资产管理工具(如鸿蒙版 NFT 浏览器)或需要处理加密货币转账的场景中,如何确保用户输入的以太坊(Ethereum)地址既符合基本格式,又通过了大小写混合的校验和(Checksum)验证,防止因为单个字符手误导致的资产永久丢失?eip55 为开发者提供了一套工业级的、基于 EIP-55 提案的地址转换与验证方案。本文将深入实战其在鸿蒙 Web3 安全基座中的应用。 前言 什么是 EIP-55?它是由以太坊创始人 Vitalik Buterin 提出的地址校验和提案。通过在地址字符串中引入特定的。大小写混合模式(基于 Keccak-256 哈希)

Stable Diffusion 秋叶大神2025最新整合一键安装包

Stable Diffusion 秋叶大神2025最新整合一键安装包

这段时间我在折腾 Stable Diffusion,期间试过很多安装方式。有手动安装的,也有别人做好的整合包。手动安装的方式对环境要求高,步骤也多,系统要装 Python,要装依赖,还要配好运行库,哪一步出错都要重新查资料,挺消耗时间。后来了解到秋叶大神做的整合一键安装包,这个版本省掉了很多折腾,对新手比较友好。 我自己把安装流程整理了一遍,又结合网上的信息,把一些需要注意的地方写下来,希望能帮到想尝试 Stable Diffusion 的人。 这里完整下载链接 秋叶整合包是什么 这个整合包属于别人已经帮你配好的版本,里面把 Stable Diffusion WebUI、模型管理、插件、运行环境都准备好了。下载之后按照提示解压,点一下启动脚本就能跑起来,不需要另外去折腾环境。 整合包里放的 WebUI 是常见的 AUTOMATIC1111 版本,所以大部分教程都能直接用。适合想直接出图、想先体验一下模型效果的人。 系统环境方面 我现在用的是 Windows 电脑,所以下面写的内容主要基于

【正点原子FPGA学习日记】DAY1:FPGA简介及开发流程

使用正点原子的达芬奇板作为学习使用,文章内容是对正点原子开发指南的整理,仅做回顾学习使用,侵删。 FPGA简介 1,FPGA中文名:现场可编程门阵列         其中现场指其可重复写入,门阵列指其根据查找表输出,可编程则是FPGA与CPU之间最主要的区别,能够改变逻辑门单元之间的硬件逻辑。 2,FPGA内部结构         FPGA 由许多“可配置逻辑模块”(Configurable Logic Block,CLB)、输入/输出单元(I/O Block,IOB)和分布式的可编程互联矩阵(Programmable Interconnection Matrix,PIM)组成。 3,CPU、DSP 和 FPGA 的区别 CPU 具有比较强的事务管理功能,可以用来跑 UI 以及应用程序,CPU 优点主要在于擅长控制。DSP 主要是来做计算,例如加解密算法,调制解调等,

【ZYNQ必学】PS-PL架构完全解析:从零理解ARM+FPGA融合设计(附实战案例)

【ZYNQ必学】PS-PL架构完全解析:从零理解ARM+FPGA融合设计(附实战案例) 📚 目录导航 文章目录 * 【ZYNQ必学】PS-PL架构完全解析:从零理解ARM+FPGA融合设计(附实战案例) * 📚 目录导航 * 概述 * 一、PS-PL架构基础概念 * 1.1 什么是PS和PL * 1.1.1 PS(处理系统)定义 * 1.1.2 PL(可编程逻辑)定义 * 1.1.3 PS vs PL对比 * 1.2 ZYNQ基本结构 * 1.2.1 ZYNQ-7000系列架构 * 1.2.2 ZYNQ-7000的整体架构 * 1.3