LLaMA Factory操作界面微调时报disable multiprocessing.

优质文章学习记录

07 Apr 2026 — 4 min read

LLaMA Factory操作界面微调时报disable multiprocessing

陈述问题

由于显卡性能不强，微调模型时会报以下下错误，GPU内存或系统内存不足，尤其在处理大规模数据或大模型时，子进程因内存溢出崩溃。

 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "G:\project\LLaMA-Factory\src\llamafactory\data\converter.py", line 420, in align_dataset return dataset.map( ^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 557, in wrapper out: Union["Dataset", "DatasetDict"] = func(self, *args, **kwargs) ^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 3166, in map for rank, done, content in iflatmap_unordered( File "C:\Python312\Lib\site-packages\datasets\utils\py_utils.py", line 713, in iflatmap_unordered raise RuntimeError( RuntimeError: One of the subprocesses has abruptly died during map operation.To debug the error, disable multiprocessing.

解决思路

我们可以调整LlamaFactory 训练命令中 --preprocessing_num_workers

–preprocessing_num_workers 是 LlamaFactoryLlamaFactory（以及基于 Hugging Face 生态的大模型训练框架）中用于数据预处理阶段的核心参数，具体作用如下：核心定义
这个参数指定了数据预处理时使用的进程 / 线程数量（这里设置为 16），用于并行处理训练数据（比如加载数据集、分词、格式化、生成
attention mask 等操作）。具体工作机制默认情况下，preprocessing_num_workers 为
0，意味着所有数据预处理工作都在主线程中串行执行；设置为 16 时，框架会启动 16 个独立的 worker 进程 /
线程，同时对不同批次的数据集进行预处理，充分利用 CPU 多核资源。实际效果 ✅ 加速数据预处理：对于大尺寸数据集（比如几万 /
几十万条样本），多 worker 并行处理能显著减少数据加载和预处理的耗时，避免训练过程中出现 “GPU 等数据” 的空闲情况； ⚠️
资源占用注意：worker 数量并非越多越好：如果设置的数值超过你的 CPU 核心数（比如你的 CPU 只有 8 核却设为
16），会导致进程切换开销增大，反而变慢；过多的 worker 还会占用更多内存，可能引发 OOM（内存溢出）。适用场景
这个参数仅作用于训练前的数据预处理阶段（比如分词、数据格式化），训练过程中的计算（如前向 / 反向传播）仍由 GPU
负责，不会影响训练阶段的并行逻辑。实用建议推荐设置值：通常设为你的 CPU 物理核心数（比如 8 核 CPU 设为 8，16 核设为
16），或核心数的 1-2 倍；调试阶段：如果出现数据加载报错（如 BrokenPipeError），可以先将该值设为
0（单线程）排查问题；内存敏感场景：如果数据集样本长、内存紧张，适当降低该值（比如 8 或 4）。总结
–preprocessing_num_workers 16 表示启用 16 个并行进程处理训练数据的预处理（分词、格式化等）；核心作用是利用多核 CPU 加速数据加载，避免 GPU 训练时等待数据；取值需匹配 CPU
核心数，并非越大越好，否则会增加开销或导致内存不足。

解决办法

点击‘预览命令’查看命令，可以看到命令中 --preprocessing_num_workers 16 `

先把之前运行网页的llamafactory-cli webui的进程停了⚠️⚠️⚠️
再把命令复制到cmd执行，执行前把–preprocessing_num_workers 改小

看到以下界面说明已经在跑了

跑完之后再运行网页的llamafactory-cli webui的进程
再进到网页查看刚才的训练参数可以选择导出了

Linux网络 | 理解Web路径以及实现一个简单的helloworld网页

前言：本节内容承接上节课的http相关的概念，主要是实现一个简单的接收http协议请求的服务。这个程序对于我们理解后面的http协议的格式，报头以及网络上的资源的理解，以及本节web路径等等都有着重要作用。可以说我们就用代码来理解这些东西。那么废话不多说，现在开始我们的学习吧。 ps：本节内容建议先看一下上一篇文章http的相关概念哦：linux网络 | 深度学习http的相关概念-ZEEKLOG博客目录准备文件 makefile HttpServer.hpp 类内成员封装sockfd start ThreadRun 全部代码运行结果响应书写 Web路径准备文件首先准备文件：这里面Httpserver.cc用来运行接收http请求的服务。 HttpServer.hpp用来定义http请求。Log.hpp就是一个打印日志的小组件， Socket.hpp同样是套接字的组件。到使用直接调用相关接口即可。（Log.hpp和Socket.hpp如何实现不讲解，如果想要知道

前端八股文面经大全：字节前端一面（2026-2-1）·面经深度解析

前言大家好，我是木斯佳。在这个春节假期，当大家都在谈论返乡、团圆与休息时，作为一名技术人，我的思考却不由自主地转向了行业的「冬」与「春」。相信很多人都感受到了，在AI浪潮的席卷之下，前端领域的门槛在变高，纯粹的“增删改查”岗位正在肉眼可见地减少。曾经热闹非凡的面经分享，如今也沉寂了许多。但我们都知道，市场的潮水退去，留下的才是真正在踏实准备、努力沉淀的人。学习的需求，从未消失，只是变得更加务实和深入。正值春节，也是复盘与规划的好时机。结合ZEEKLOG这次「春节代码贺新年」活动所提倡的“用技术视角记录春节、复盘成长”，我决定在这个假期持续更新专栏，帮助年后参加春招的同学。这个专栏的初衷很简单：拒绝过时的、流水线式的PDF引流贴，专注于收集和整理当下最新、最真实的前端面试资料。我会在每一份面经和八股文的基础上，尝试从面试官的角度去拆解问题背后的逻辑，而不仅仅是提供一份静态的背诵答案。无论你是校招还是社招，目标是中大厂还是新兴团队，只要是真实发生、有价值的面试经历，我都会在这个专栏里为你沉淀下来。温馨提示：市面上的面经鱼龙混杂，

无需编程！Fun-ASR WebUI界面手把手操作教程

无需编程！Fun-ASR WebUI界面手把手操作教程你是不是也遇到过这些情况：会议录音堆在文件夹里没时间听，客户语音留言转文字总出错，培训音频想整理成笔记却要花半天？别再复制粘贴到网页版工具、别再折腾Python环境、更别担心“CUDA out of memory”报错——今天这篇教程，专为完全不写代码的人准备。 Fun-ASR WebUI 是钉钉联合通义实验室推出的语音识别系统，由开发者“科哥”深度优化并封装成开箱即用的图形界面。它不是命令行里的冰冷指令，也不是需要配置10个参数才能跑起来的实验项目，而是一个像微信一样点点就能用的本地语音转文字工具。全程不需要安装Python包、不用改配置文件、不用查GPU型号——只要你会打开浏览器，就能把一段30分钟的采访音频，5分钟内变成带标点、分段清晰、数字自动规整的可编辑文本。下面我将带你从零开始，像教朋友一样，一步步操作每一个按钮、解释每一处设置、避开所有新手踩坑点。你不需要懂“VAD”是什么，也不用知道“ITN”怎么拼，只需要跟着做，就能立刻上手。 1. 启动与访问：两步打开你的语音助手

ollama v0.17.0 更新：OpenClaw 一键自动安装、Web 搜索支持、全新 Context 动态分配与 Tokenizer 性能大幅优化！

2026 年 2 月 24 日，Ollama 发布了全新的 v0.17.0 版本。这一次更新可谓意义重大，不仅引入了全新的 OpenClaw 自动化集成与安装能力，还针对核心 Tokenizer 性能、VRAM 动态上下文分配、系统配置迁移逻辑、Web 搜索插件等功能进行了深层次优化。这是一次面向 AI 模型本地化与云端融合、性能与易用性双提升的版本升级。本文将全面解析 Ollama v0.17.0 的更新亮点、底层代码变化及其背后的设计逻辑，帮助开发者和高级用户快速理解这一版本的重要意义。一、版本概览版本号： v0.17.0 发布日期： 2026 年 2 月 24 日