跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

LLaMA-Factory 微调 InternVL3 报错 Processor was not found 解决方案

LLaMA-Factory 微调 InternVL3 模型时出现 Processor was not found 错误,通常因模型与预处理器定义不匹配导致。解决方法是选用适配 LLaMA-Factory 的 HuggingFace 模型版本,而非直接使用官方原始模型链接。确保模型包含完整的 Processor 配置文件,即可正常加载并启动 SFT 或 LoRA 训练流程。

热情发布于 2026/4/9更新于 2026/5/2216 浏览
LLaMA-Factory 微调 InternVL3 报错 Processor was not found 解决方案

如何解决 LLaMA-Factory 微调 InternVL3 报错 Processor was not found

在使用 LLaMA-Factory 对 InternVL3 模型进行微调时,可能会遇到以下报错:

Processor was not found

这个错误的出现主要是由于模型与 LLaMA-Factory 的预处理器(Processor)定义不匹配,导致在加载模型时无法正确找到对应的处理器。

1. 环境准备

首先,需要正确安装 LLaMA-Factory 及其依赖:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]" --no-build-isolation

确保 Python 版本 ≥ 3.9,并且已经安装了 PyTorch + CUDA 的 GPU 环境。

2. 问题复现

直接使用 HuggingFace 官方给出的 InternVL3 模型链接,例如 OpenGVLab/InternVL3-1B,在使用 LLaMA-Factory 进行加载和微调时,会不断出现上述报错。

排查过程中可尝试手动安装 transformers 的不同版本,或替换 AutoProcessor 为 AutoTokenizer + AutoImageProcessor,但最稳定的方案如下。

3. 解决方案

不要使用官方给出的 HF 模型地址,而是要使用适配 LLaMA-Factory 的模型版本。

也就是说,你需要找到在 HuggingFace 上提供的带有完整 Processor 配置的版本,而不是直接拉取官方原始模型。这样,LLaMA-Factory 在加载模型时就能自动找到 processor_config.json,避免报错。

4. 示例:微调 InternVL3

当正确使用支持的 HuggingFace 模型后,微调就能顺利进行了。

下面以 InternVL3 的自我认知微调为例,模型可以正常加载 Processor 并开始训练。

5. 总结

  • 出现 Processor was not found 报错,本质原因是模型与 LLaMA-Factory 的依赖不兼容。
  • 解决方法是换用 HuggingFace 上与 LLaMA-Factory 匹配的模型版本,而不是使用官方原始模型。
  • 一旦模型能正常加载 Processor,后续的 SFT(微调)、LoRA 等流程就能顺利跑通。

目录

  1. 如何解决 LLaMA-Factory 微调 InternVL3 报错 Processor was not found
  2. 1. 环境准备
  3. 2. 问题复现
  4. 3. 解决方案
  5. 4. 示例:微调 InternVL3
  6. 5. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 浏览器端图像格式转换实战:PNG 转 WebP 与 JPEG 优化
  • 算法优选技巧:位运算实战解析
  • GitHub Copilot 进阶指南:Awesome GitHub Copilot 定制方案解析
  • Linux/Debian 系统时间校准方法简记
  • LLaMA 大模型本地化稳定部署指南:基于 Ollama 与 NextChat
  • 数学建模实战:基于遗传算法的无人机烟幕遮蔽时间优化
  • Linux 匿名管道通信:原理深挖与代码实战
  • 基于遗传算法的无人机烟幕遮蔽时间优化方案
  • Python 简介与入门
  • Microsoft Word 的 5 种视图详解:页面、阅读、Web 版式、大纲与草稿
  • 数据库 SQL 防火墙构建主动防御机制
  • 通义万相 2.1 文生视频模型评测与部署指南
  • 数据库 SQL 防火墙:内核级防护 SQL 注入安全防线
  • Llama-3.2-3B 开箱体验:Ollama 部署与多语言对话实测
  • 数据结构:归并排序算法详解
  • 基于 C++ 与 SFML 的 2026 新春烟花模拟程序
  • 流式输出技术解析:后端生成与前端渲染
  • 智能家居系统接入谷歌 Home 与 Assistant 集成指南
  • 解决 VS Code 远程连接服务器后 GitHub Copilot 无法使用问题
  • GitLens 使用指南:VS Code 中完整的 Git 可视化开发体验

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online