DoRA：权重分解低秩适应技术解析与实验验证 | 极客日志

PythonAI算法

DoRA：权重分解低秩适应技术解析与实验验证

DoRA 提出一种新的参数高效微调方法，通过权重分解将预训练权重拆分为幅度和方向两个组件。相比 LoRA，DoRA 能更灵活地独立调整幅度与方向，学习模式更接近全量微调（FT），同时保持推理零开销。实验表明，在常识推理、多模态及视觉指令微调等任务中，DoRA 性能持续优于 LoRA，且兼容量化微调（QDoRA）。该方法有效解决了 LoRA 在精细调整上的局限性，为大规模模型微调提供了更优方案。

Elasticer发布于 2026/4/8更新于 2026/7/1930 浏览

DoRA：权重分解低秩适应技术解析与实验验证

论文基本信息

论文：OpenReview
代码：GitHub
会议：ICML 2024
年份：2024

摘要与核心贡献

DoRA（Weight-Decomposed Low-Rank Adaptation）是一种新型参数高效微调（PEFT）方法，旨在缩小 LoRA 与全微调（FT）之间的性能差距，同时保持无额外推理开销的优势。

核心贡献

提出权重分解分析：揭示了 LoRA 与全微调的学习模式差异。
设计 DoRA 方法：在不增加推理开销的前提下实现接近全微调的学习能力。
广泛验证：在 NLP、视觉 - 语言等多任务及 LLM、LVLM 等模型上验证了 DoRA 的优越性与兼容性。

引言与背景

LoRA 和 FT 展现出了明显不同的更新模式。现有 LoRA 及其变体因无需额外推理成本而广泛应用，但与全微调相比仍存在精度差距。此前研究多将其归因于可训练参数有限，但本文基于权重归一化思想，提出新颖的权重分解分析。

我们将模型权重拆解为幅度（magnitude）和方向（direction）两个组件，揭示了 LoRA 与全微调的本质差异：LoRA 的幅度和方向更新呈正相关的比例关系，缺乏精细调整能力；而全微调的更新模式更灵活，二者呈负相关，可实现独立的幅度或方向优化。

DoRA 核心操作逻辑

该方法将预训练权重分解为幅度（magnitude）和方向（direction）两个组件进行微调。具体通过 DoRA 对方向组件进行高效更新，'幅度'描述权重的'数值大小'，'方向'描述权重在向量空间中的'指向'。

分解（初始化）阶段：把预训练好的权重拆分成幅度（工具的规格）和方向（工具的样式），其中方向部分初始为冻结状态，幅度部分是可以调整的可训练状态。
适配阶段：对'方向'部分进行调整，引入了新的可训练的增量，此时方向部分整体变为可训练状态，通过梯度下降等优化方法更新其参数以适配目标任务。
合并阶段：把调整后的幅度与方向重新结合到新的权重，用于模型在目标任务上的前向推理与后续训练。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

W' = m · (V + ΔV) / ||V + ΔV||_F = m · (W_0 + BΔA) / ||W_0 + BΔA||_F

class Linear(nn.Linear, LoraLayer):
    """Lora implemented in a dense layer with DoRA support."""
    def __init__(self,
                 in_features: int,
                 out_features: int,
                 r: int = 0,
                 lora_alpha: int = 1,
                 lora_dropout: float = 0.0,
                 fan_in_fan_out: bool = False,
                 merge_weights: bool = True,
                 Wdecompose: bool = False,
                 dora_simple: bool = True,
                 **kwargs):
        nn.Linear.__init__(self, in_features, out_features, **kwargs)
        LoraLayer.__init__(self, r=r, lora_alpha=lora_alpha,
                           lora_dropout=lora_dropout, merge_weights=merge_weights)
        
        # 定义可学习的幅度向量 m，形状为 (out_features, 1)
        self.weight_m_wdecomp = nn.Linear(1, out_features, bias=False)
        self.fan_in_fan_out = fan_in_fan_out
        self.Wdecompose = Wdecompose
        self.dora_simple = dora_simple

        if self.Wdecompose == False:
            # Wdecompose=False 时创建 LoRA 矩阵用于方向更新
            if r > 0:
                self.lora_A = nn.Linear(in_features, r, bias=False)
                self.lora_B = nn.Linear(r, out_features, bias=False)
            self.scaling = self.lora_alpha / self.r
            # Freezing the pre-trained weight matrix
            self.weight.requires_grad = False
            self.reset_parameters()
            if fan_in_fan_out:
                self.weight.data = self.weight.data.T

    def reset_parameters(self):
        nn.Linear.reset_parameters(self)
        if hasattr(self, "lora_A"):
            # initialize A the same way as the default for nn.Linear and B to zero
            nn.init.kaiming_uniform_(self.lora_A.weight, a=math.sqrt(5))
            nn.init.zeros_(self.lora_B.weight)

    def train(self, mode: bool = True):
        nn.Linear.train(self, mode)
        if self.Wdecompose == False:
            self.lora_A.train(mode)
            self.lora_B.train(mode)
            self.weight_m_wdecomp.train(mode)

    def forward(self, x: torch.Tensor):
        previous_dtype = self.weight.dtype
        if self.disable_adapters:
            raise NotImplementedError
        elif self.Wdecompose and not self.merged:
            # 仅幅度模式
            norm_scale = self.weight_m_wdecomp.weight.view(-1) / (torch.linalg.norm(self.weight, dim=1))
            org_result = F.linear(x, transpose(self.weight, self.fan_in_fan_out))
            result = org_result + (norm_scale - 1) * (F.linear(self.lora_dropout(x), transpose(self.weight, self.fan_in_fan_out)))
            if not self.bias is None:
                result += self.bias.view(1, -1).expand_as(result)
        elif self.r > 0 and not self.merged:
            # 完整 DoRA 模式
            new_weight_v = self.weight + (self.lora_B.weight @ self.lora_A.weight) * self.scaling
            if self.dora_simple:
                norm_scale = self.weight_m_wdecomp.weight.view(-1) / (torch.linalg.norm(new_weight_v, dim=1)).detach()
            else:
                norm_scale = self.weight_m_wdecomp.weight.view(-1) / (torch.linalg.norm(new_weight_v, dim=1))
            
            org_result = F.linear(x, transpose(self.weight, self.fan_in_fan_out))
            dropout_x = self.lora_dropout(x)
            # 幅度调整项
            result = org_result + (norm_scale - 1) * (F.linear(dropout_x, transpose(self.weight, self.fan_in_fan_out)))
            if not self.bias is None:
                result += self.bias.view(1, -1).expand_as(result)
            # 方向更新项
            result += (norm_scale * (self.lora_B(self.lora_A(dropout_x.to(self.lora_A.weight.dtype)))) * self.scaling)
        else:
            result = F.linear(x, transpose(self.weight, self.fan_in_fan_out), bias=self.bias)

        if result.dtype != previous_dtype:
            result = result.to(previous_dtype)
        return result

DoRA：权重分解低秩适应技术解析与实验验证

DoRA：权重分解低秩适应技术解析与实验验证

论文基本信息

摘要与核心贡献

核心贡献

引言与背景

DoRA 核心操作逻辑

相关工作与方法论

权重分解分析

更多推荐文章

相关免费在线工具

方法设计

梯度分析与训练开销

梯度分析

训练开销的降低

实验结果

常识推理任务

图像/视频 - 文本理解

视觉指令微调

兼容性与鲁棒性

更广泛的影响

QDoRA：对 QLoRA 的增强

文本到图像生成

结论

代码实现分析

更多推荐文章

相关免费在线工具

DoRA：权重分解低秩适应技术解析与实验验证

DoRA：权重分解低秩适应技术解析与实验验证

论文基本信息

摘要与核心贡献

核心贡献

引言与背景

DoRA 核心操作逻辑

相关工作与方法论

权重分解分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

方法设计

梯度分析与训练开销

梯度分析

训练开销的降低

实验结果

常识推理任务

图像/视频 - 文本理解

视觉指令微调

兼容性与鲁棒性

更广泛的影响

QDoRA：对 QLoRA 的增强

文本到图像生成

结论

代码实现分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具