跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
C++AI算法

使用 llama.cpp 合并 GGUF 模型分片

介绍如何使用 llama.cpp 工具包中的 llama-gguf-split 命令,将下载自开源社区的分片 GGUF 模型文件合并为单个完整文件。流程包括环境准备、工具获取、执行合并命令、完整性校验及加载测试。该方法适用于需要统一模型文件进行推理或分发的用户,操作过程无损且高效。

樱花落尽发布于 2026/3/29更新于 2026/5/3027 浏览

GGUF(GPT-Generated Unified Format)是一种专为大规模语言模型设计的二进制文件格式,支持将模型分割成多个分片(*-of-*.gguf)。当从开源社区(如 HuggingFace 或 ModelScope)下载量化模型时,常会遇到分片存储的情况。本教程将引导你使用 llama.cpp 工具包中的 llama-gguf-split,将这些分片合并为一个完整的 GGUF 模型文件。

适用场景

  • 适用对象:已下载多分片的 GGUF 量化模型用户;
  • 使用工具:llama-gguf-split(合并)及 llama-gguf-hash(校验);
  • 关键收益:快速、无损地将切分后的模型恢复为单一文件,便于后续推理调用或二次分发。

提示:以下所有 文件路径、版本号、模型名称 等均可根据实际情况替换,请务必自行确认再执行。

环境准备

  1. 操作系统:Ubuntu 20.04 / 22.04 LTS
  2. Python 版本:3.8 及以上
sudo apt update && sudo apt install -y unzip

工具获取

1. 安装 ModelScope(可选)

如果你尚未下载分片模型,可先安装并使用 ModelScope 客户端:

pip install modelscope
2. 从官方仓库下载 llama.cpp 预编译工具
  1. 访问 llama.cpp Releases,找到最新版本(示例:b5162)。
  2. 执行以下命令:
# 示例版本 b5162,请替换为最新版本号
wget https://github.com/ggerganov/llama.cpp/releases/download/b5162/llama-b5162-bin-ubuntu-vulkan-x64.zip
mkdir -p ~/llama_tools
unzip -j llama-b5162-bin-ubuntu-vulkan-x64.zip 'build/bin/*' -d ~/llama_tools
chmod +x ~/llama_tools/*

说明:-j 选项可将所有二进制文件直接解压到目标文件夹;确保对解压后的文件赋予可执行权限(chmod +x)。

合并模型分片

切换到工具目录:

cd ~/llama_tools

执行合并命令:

./llama-gguf-split --merge \
  ~/models/DeepSeek-V3-Q3/DeepSeek-V3-0324-Q3_K_M-00001-of-00007.gguf \
  ~/models/DeepSeek-V3-Q3/DeepSeek-V3-Q3_Merged.gguf

参数说明:--merge:合并模式;第一个参数:任意一个分片文件路径;第二个参数:合并后完整 GGUF 文件的输出路径。

合并验证

1. 完整性校验
# 使用内置的哈希校验,确保文件无损
./llama-gguf-hash ~/models/DeepSeek-V3-Q3/DeepSeek-V3-Q3_Merged.gguf
  • 校验成功后,会输出对应哈希值;
  • 若不匹配,请重新下载或检查分片完整性。
2. 简单加载测试
# 使用 llama.cpp 提供的命令行工具进行推理测试
./llama-cli -m ~/models/DeepSeek-V3-Q3/DeepSeek-V3-Q3_Merged.gguf -p "Hello"

如果出现合理的响应,即代表合并及校验成功,可以正常用于下游任务。

存储空间清理

1. 删除压缩包,仅保留可执行文件
rm ~/llama-b5162-bin-ubuntu-vulkan-x64.zip
ls -lh ~/llama_tools
2. 移除原始分片(确认无误后执行)
# 确保合并模型已通过校验与测试
rm ~/models/DeepSeek-V3-Q3/DeepSeek-V3-0324-Q3_K_M-*.gguf
ls -lh ~/models/DeepSeek-V3-Q3/*Merged.gguf

注意:删除分片前,请务必确认单文件模型运行正常。否则会导致不可逆的数据丢失。

总结

至此,你已成功合并并验证 GGUF 模型分片,接下来即可在任何支持 llama.cpp 的环境中使用该完整模型进行高效推理。若有其他疑问或需批量处理不同模型,请参考 llama-gguf-split --help 查看更多参数选项。

目录

  1. 适用场景
  2. 环境准备
  3. 工具获取
  4. 1. 安装 ModelScope(可选)
  5. 2. 从官方仓库下载 llama.cpp 预编译工具
  6. 示例版本 b5162,请替换为最新版本号
  7. 合并模型分片
  8. 合并验证
  9. 1. 完整性校验
  10. 使用内置的哈希校验,确保文件无损
  11. 2. 简单加载测试
  12. 使用 llama.cpp 提供的命令行工具进行推理测试
  13. 存储空间清理
  14. 1. 删除压缩包,仅保留可执行文件
  15. 2. 移除原始分片(确认无误后执行)
  16. 确保合并模型已通过校验与测试
  17. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 鸿蒙 AI 开发:Skill 与 MCP 概念及 Trae 部署实战
  • 鸿蒙金融理财全栈:生态合作与数据变现实践
  • Slack 机器人集成:基于 InstructPix2Pix 的快速修图协作方案
  • AI 编程助手深度对比:OpenCode vs Claude Code vs Kimi Code CLI
  • 数据结构:栈的概念与 C 语言实现
  • 前端网页开发基础教程:HTML、CSS 与 JavaScript
  • Windows 11 系统配置 Intel RealSense D435i 深度相机与 Python
  • KingbaseES 内核级 SQL 防火墙:白名单防护与零误报实践
  • OpenClaw 飞书机器人配置指南:多渠道 AI 助手集成
  • YOLO 算法进阶提升:骨干网络、特征融合与损失函数改进
  • 银河麒麟 V10 服务器版 Docker 部署 .NET 8 WebAPI 指南
  • 优先级队列算法实战:LeetCode 经典题解
  • Qwen3-Embedding-4B 本地部署实战:llama.cpp 与 vLLM 方案
  • Java 连接电科金仓数据库(KingbaseES)实战指南
  • 基于 SpringBoot+Vue3+MyBatis 的 MES 生产制造执行系统设计
  • AskGo:集成多模型的一站式 AI 工具平台
  • AnyRouter 入门指南:从零搭建智能网络
  • Stable Diffusion 视觉提示词注入攻击原理与实现分析
  • Ubuntu 22.04 基于 ROS2 Humble 搭建 PX4 无人机仿真环境 (含 Micro XRCE-DDS)
  • Java 实现百度地图 SN 权限签名:搜索 2.0 接口实战

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online