跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

LLM 混合低秩微调方法 MiLoRA

MiLoRA 是一种针对大语言模型的高效参数微调方法,结合低秩自适应(LoRA)与混合专家(MoE)机制。该方法引入提示感知路由策略,在生成首个令牌前计算一次路由结果并复用,显著降低多租户场景下的延迟。实验表明,MiLoRA 在可调参数预算下优于现有 PEFT 基线,并在常识推理、数学推理等任务上表现良好,同时支持不同深度路由器学习激活函数以提升性能。

星星泡饭发布于 2024/11/29更新于 2026/6/918 浏览
LLM 混合低秩微调方法 MiLoRA

摘要

低秩自适应(LoRA)及其混合专家(MOE)变体是高效的参数高效微调(PEFT)方法。然而,由于在 Transformer 层的多个线性模块中添加了 LoRA 模块和 MOE 路由器,它们在多租户设置中引入了显著的延迟。

为了解决这个问题,我们提出了低秩自适应混合(MiLoRA),这是一种新颖有效的 LoRA 变体。MiLoRA 与之前的 MOE 风格的 LoRA 方法不同,它将每个 LoRA 模块视为专家,并采用提示感知路由机制。此机制在生成第一个新令牌之前计算一次专家路由结果,并将这些结果用于后续令牌,从而减少延迟。

对常识推理任务、数学推理任务和广泛使用的 LLM 评估基准的广泛实验和分析表明,MiLoRA 在可调参数预算方面始终优于强大的 PEFT 基线。此外,与之前基于 LoRA 的方法相比,MiLoRA 显著降低了多租户设置中的延迟。

文章简介

  • 研究问题:在大语言模型微调过程中,如何高效地使用低秩适应(LoRA)方法来提升模型性能和效率?
  • 主要贡献:论文提出了一种名为 MiLoRA 的新方法,通过引入提示感知的路由机制,实现了在 Transformer 层级上激活不同的 LoRA 模块,从而在多任务学习中显著提升了模型性能和推理效率。

重点思路

相关工作

  • 许多工作致力于改进 LoRA,AdaLoRA 研究了 LoRA 模块的参数分配,VERA 研究是否可以冻结随机初始化的 LoRA 矩阵并仅学习一组缩放向量。
  • 最近,一系列工作在研究将专家混合(MoE)和 LoRA 相结合,LLaVA-MoLE 有效地将令牌路由到特定领域的 LoRA 专家,MOELoRA 证明使用 MOE 路由器微调 LoRA 模块可以使 LLM 在多任务学习环境中表现良好。
  • 尽管在微调方面表现良好,但这些方法会引入较高的额外延迟,并没有减少 LoRA 模块的数量。

论文方案

  • 提示感知 LoRA 路由器:该机制在 Transformer 层之前使用一个路由器网络,根据输入提示的隐藏状态来决定激活哪个 LoRA 模块。
  • 激活函数学习:在微调过程中,为不同深度的 LoRA 路由器学习不同的激活函数,以提升框架的下游性能。
  • 多任务设置:在多任务学习环境中进行实验,比较了 MiLoRA 框架与当前最先进的 PEFT 基线方法的性能。
  • 实验设置:使用了包括常识推理、数学推理和 LLM 评估基准在内的多种挑战性任务进行实验,并详细描述了数据集、评估指标和实验设置。

分析总结

  • 性能提升:在多个挑战性任务中,MiLoRA 方法能够持续优于强大的 PEFT 基线方法,特别是在与可调参数预算相当的情况下。
  • 效率提升:在多租户设置下,MiLoRA 方法的延迟显著低于之前的基于 LoRA 的方法,同时保持了相当的参数可调性。
  • 广泛适用性:通过在不同的预训练模型(如 LlaMA-2 7B、LlaMA-2 13B 和 Gemma 2B)上进行实验,证明了 MiLoRA 方法的广泛适用性。
  • 激活函数的影响:实验结果表明,为不同深度的 LoRA 路由器学习不同的激活函数可以显著提升模型的下游性能。

总结

论文的核心就是在 Transformer 层级上引入门控机制激活不同的 LoRA 模块。

目录

  1. 摘要
  2. 文章简介
  3. 重点思路
  4. 相关工作
  5. 论文方案
  6. 分析总结
  7. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Stable Diffusion v1.5 WebUI 高可用架构:双实例 + 负载均衡 + 健康检查
  • AIGC 音频平台强制水印策略与 AudioSeal 实现方案
  • Fast-GitHub 浏览器插件安装与配置指南
  • 密码爆破漏洞详解
  • Spring 国际化核心原理详解:4 大组件实现企业级多语言开发
  • AIED 2025 论文解读:AIBAT 教师驱动的语言模型评估工具
  • 微软发布 SPREADSHEETLLM:大模型精准理解与推理 Excel
  • 六款高实用性 C# 开源项目推荐
  • 宇树 G1 人形机器人强化学习训练配置与奖励函数解析
  • SD-Trainer 快速上手:AI 绘画模型微调实战
  • 2026 年高校 AIGC 检测新规解读:AI 率合格标准分析
  • Virt-A-Mate (VAM) 虚拟现实交互软件技术特性介绍
  • Python 爬虫实战:使用 Selenium 模拟登录与反爬策略
  • AI 绘画人物动作提示词核心逻辑与实战框架
  • 算法题讲解:位运算解决两数之和与缺失数字问题
  • 基于深度学习的智能害虫识别系统
  • 从三年前端到韩国 CS 硕士:我的留学复盘与回归
  • Java 随机数实战:从范围字符串解析到动态区间生成
  • Python Modbus-RTU 主站:仓库温度监控系统实战
  • Java 架构师面试核心考点与能力标准梳理

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online