大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表

优质文章学习记录

11 Apr 2026 — 5 min read

Firefly vs LLaMA Factory 全方位对比表 + 生物医药垂类微调选型建议

一、核心维度对比表格

对比维度	Firefly（流萤）	LLaMA Factory
开发主体	个人开源：杨建新（YeungNLP），前Shopee NLP工程师，中山大学硕士	社区开源：hiyouga核心维护，全球开源社区协同迭代
项目定位	聚焦中文大模型的轻量化训练框架+配套中文优化模型	通用型全栈大模型微调框架，无语言/模型偏向，极致兼容
支持基座模型	以中文友好模型为主（Llama系列、Qwen、ChatGLM、Firefly自训模型），覆盖有限但深度适配	全主流开源模型全覆盖（Llama、Qwen、Mistral、DeepSeek、GLM、Yi、Firefly等），几乎无适配成本
支持微调方式	基础SFT、LoRA/QLoRA、增量预训练，进阶对齐方法较少	SFT、DPO/IPO/KTO、RLHF、预训练、多模态微调，全流程对齐方案完整
中文优化	原生深度优化：中文分词、语料、表达逻辑专项适配，中文生成质感最优	通用框架无原生中文特化，依赖基座模型本身中文能力，可通过数据弥补
使用门槛	配置简洁、脚本轻量化，中文新手教程充足，上手快	UI/命令行双模式，模板化YAML配置，零代码WebUI，新手友好度拉满
硬件显存优化	支持4/8bit量化、QLoRA，单卡消费级显卡可跑7B~13B模型	量化、LoRA、梯度检查点、多卡并行等优化更全面，大参数模型适配性更强
文档&社区	中文文档完善，作者公众号/知乎答疑，社区规模中等，问题响应较快	国内外社区双活跃，Issue/教程/二次开发案例极多，复杂问题解决方案丰富
部署导出	支持基础量化导出、本地推理，生产级部署工具链简易	多格式导出（LoRA合并、GGUF、GPTQ、AWQ），对接主流推理框架，生产部署完整
扩展性	聚焦中文SFT场景，自定义扩展、多任务适配能力一般	插件化架构，可自定义数据集格式、训练策略、新增模型，扩展性极强
维护频率	稳定迭代，更新节奏偏个人开源节奏	高频更新，新模型、新算法第一时间集成
适用核心人群	中文垂类开发者、个人科研、轻量化中文对话任务	全场景开发者、多模型测试、进阶对齐、复杂垂类、工程化落地

二、核心差异一句话总结

Firefly：专精中文场景，小而精，配置简单，中文生成效果上限高，适合纯中文垂类快速微调。
LLaMA Factory：全能通用框架，大而全，兼容所有模型与微调方法，社区生态无敌，适合试错、多模型对比、进阶训练。

三、通用场景快速选型规则

纯中文对话/文案/国内垂类任务 → 优先 Firefly
多模型轮换测试、需DPO/RLHF进阶对齐、多模态微调 → 必选 LLaMA Factory
新手零基础、追求一键运行、不想处理代码适配 → 优先 LLaMA Factory（WebUI）
追求极致中文流畅度、轻量化脚本、极简部署 → 优先 Firefly
企业生产落地、多格式导出、分布式训练 → 优先 LLaMA Factory

四、结合你的「小分子药物筛选/生物医药垂类」专属建议

结合你做AI生物医药、小分子药物筛选、论文相关垂类微调的需求，给出针对性结论：

1. 优先推荐方案：LLaMA Factory

核心适配理由：

生物医药场景会用到Llama、DeepSeek、Qwen、Yi等多类基座模型，LLaMA Factory无适配成本，可快速对比不同基座在医药数据上的效果。
垂类微调常需要迭代数据、尝试LoRA/量化参数，甚至后续做DPO对齐优化回答准确性，LLaMA Factory全流程支持。
本地消费级显卡训练、低显存环境下，其量化与显存优化比Firefly更细致，大参数模型训练稳定性更好。
生物医药文献多为中英混合，LLaMA Factory不绑定中文特化，可灵活适配双语垂类数据，通用性更强。
社区海量医药/科研垂类微调案例、踩坑文档，遇到训练报错、参数不合理问题更容易找到解决方案。

2. 可选备选方案：Firefly

仅适用于：

你的训练数据100%为中文医药文献、中文问答，极致追求中文表达流畅度。
仅固定使用1~2款中文基座（Qwen/ChatGLM），不做多模型对比，只需要快速完成基础SFT。

3. 最优折中实操方案（兼顾两者优势，最推荐你使用）

采用 LLaMA Factory 框架 + Firefly系列基座模型 组合：

用LLaMA Factory的易用UI、参数优化、全格式支持，降低训练与部署成本。
加载Hugging Face上的Firefly预训练模型（Firefly-Llama、Firefly-Qwen），保留中文深度优化的基础能力。
注入你的小分子药物筛选、DrugBank、ZINC20相关垂类数据做LoRA微调，兼顾通用框架兼容性与中文生成质量。
训练完成后通过LLaMA Factory导出量化模型，本地推理或后续部署都更灵活。

五、极简最终结论

做小分子药物筛选这类科研垂类、多模型测试、双语数据、长期迭代 → 直接用 LLaMA Factory
仅做纯中文医药对话、极简快速微调、不折腾框架 → 用 Firefly
想要兼顾中文效果与框架易用性 → LLaMA Factory 微调 Firefly 基座模型（最适合你的场景）

需要我进一步给出适配生物医药数据格式的LLaMA Factory训练YAML模板、LoRA参数推荐，以及本地显卡（3090/4090）的显存优化配置吗？

前端防范 XSS（跨站脚本攻击）

目录一、防范措施 1.layui util 核心转义的特殊字符示例 2.js-xss.js库安装 1. Node.js 环境（npm/yarn） 2. 浏览器环境核心 API 基础使用 1. 基础过滤（默认规则） 2. 自定义过滤规则（1）允许特定标签（2）允许特定属性（3）自定义标签处理（4）自定义属性处理（5）转义特定字符常见场景示例 1. 过滤用户输入的评论内容 2. 允许特定富文本标签（如富文本编辑器内容）注意事项更多配置 XSS（跨站脚本攻击）是一种常见的网络攻击手段，它允许攻击者将恶意脚本注入到其他用户的浏览器中。

详细教程：如何从前端查看调用接口、传参及返回结果（附带图片案例）

目录 1. 打开浏览器开发者工具 2. 使用 Network 面板 3. 查看具体的API请求 a. Headers b. Payload c. Response d. Preview e. Timing 4. 实际操作步骤 5. 常见问题及解决方法 a. 无法看到API请求 b. 请求失败 c. 跨域问题（CORS）作为一名后端工程师，理解前端如何调用接口、传递参数以及接收返回值是非常重要的。下面将详细介绍如何通过浏览器开发者工具（F12）查看和分析这些信息，并附带图片案例帮助你更好地理解。 1. 打开浏览器开发者工具按下 F12 或右键点击页面选择“检查”可以打开浏览器的开发者工具。常用的浏览器如Chrome、Firefox等都内置了开发者工具。下面是我选择我的一篇文章，打开开发者工具进行演示。 2. 使用

Cursor+Codex隐藏技巧：用截图秒修前端Bug的保姆级教程（React/Chakra UI案例）

Cursor+Codex隐藏技巧：用截图秒修前端Bug的保姆级教程（React/Chakra UI案例）前端开发中最令人头疼的莫过于那些难以定位的UI问题——元素错位、样式冲突、响应式失效...传统调试方式往往需要反复修改代码、刷新页面、检查元素。现在，通过Cursor编辑器集成的Codex功能，你可以直接用截图交互快速定位和修复这些问题。本文将带你从零开始，掌握这套革命性的调试工作流。 1. 环境准备与基础配置在开始之前，确保你已经具备以下环境： * Cursor编辑器最新版（v2.5+） * Node.js 18.x及以上版本 * React 18项目（本文以Chakra UI 2.x为例）首先在Cursor中安装Codex插件： 1. 点击左侧扩展图标 2. 搜索"Codex"并安装 3. 登录你的OpenAI账户（需要ChatGPT Plus订阅）关键配置项： // 在项目根目录创建.

Ubuntu 搭建前端环境&Vue实战

文章目录 * 前言 * 1. 系统更新和基础依赖 * 2. 安装 nvm (Node Version Manager) * 方法一：使用官方脚本安装（推荐） * 方法二：手动安装 * 激活 nvm * 3. 使用 nvm 安装和管理 Node.js * 4. 安装 pnpm * 方法一：使用 npm 安装（推荐） * 方法二：使用独立脚本安装 * 配置 pnpm * 5. 安装 Vue 开发环境 * 安装 Vue CLI（传统方式） * 使用 create-vue（Vue 官方推荐） * 6. 用 vite