从零开始编写 LoRA 代码：原理与实战指南 | 极客日志

PythonAI算法

从零开始编写 LoRA 代码：原理与实战指南

LoRA（Low-Rank Adaptation）是一种用于大语言模型微调的高效技术，通过更新低秩矩阵减少计算量。基于 Sebastian Raschka 的研究，详细讲解了从零构建 LoRA 层的 PyTorch 实现方法。实验使用 DistilBERT 模型在 IMDb 数据集上进行文本分类，结果显示 LoRA 测试准确率达 92.39%，优于仅微调最后两层的传统方法（86.22%）。文章涵盖了 LoRA 层设计、权重冻结策略、超参数优化及与传统微调的性能对比，为开发者提供了完整的实践参考。

BigDataPan发布于 2025/2/7更新于 2026/7/2754 浏览

从零开始编写 LoRA 代码：原理与实战指南

LoRA（Low-Rank Adaptation）作为一种用于微调大语言模型（LLM）的流行技术，最初由微软研究团队在论文《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS》中提出。不同于全量微调，LoRA 不调整神经网络的所有参数，而是专注于更新一小部分低秩矩阵，从而大幅减少了训练所需的计算量和显存。

由于 LoRA 的微调质量与全模型微调相当，它被视为微调神器。本文基于知名机器学习研究者 Sebastian Raschka 的实践教程，从头构建 LoRA 实现，帮助开发者深入理解其底层逻辑。

LoRA 层的设计原理

用代码表述一个 LoRA 层，核心在于将原始线性层的权重分解为两个低秩矩阵 A 和 B。设输入维度为 in_dim，输出维度为 out_dim，秩为 r。缩放因子 alpha 控制对模型行为的调整幅度。

初始化策略如下：

矩阵 A：使用随机分布中的较小值初始化。
矩阵 B：使用零初始化。

这使得初始状态下 LoRA 分支的输出为零，不影响预训练模型的原始行为。

PyTorch 实现示例

以下是结合原始线性层和 LoRA 层的 LinearWithLoRA 类实现：

import torch
import torch.nn as nn

class LinearWithLoRA(nn.Module):
    def __init__(self, in_features, out_features, r=8, alpha=1.0, dropout=0.0):
        super().__init__()
        self.r = r
        self.alpha = alpha
        self.scaling_factor = alpha / r
        
        # 冻结原始权重
        self.original_layer = nn.Linear(in_features, out_features)
        for param in self.original_layer.parameters():
            param.requires_grad = False
            
        # 初始化 LoRA 矩阵
        self.lora_A = nn.Parameter(torch.zeros(r, in_features))
        self.lora_B = nn.Parameter(torch.zeros(out_features, r))
        nn.init.kaiming_uniform_(self.lora_A, a=math.sqrt(5))
        
        self.dropout = nn.Dropout(dropout)

     ():
        original_output = .original_layer(x)
        lora_output = (.lora_B @ .lora_A) @ x.T
         original_output + (lora_output * .scaling_factor).T

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

for name, param in model.named_parameters():
    if "lora" not in name:
        param.requires_grad = False

从零开始编写 LoRA 代码：原理与实战指南

从零开始编写 LoRA 代码：原理与实战指南

LoRA 层的设计原理

PyTorch 实现示例

更多推荐文章

相关免费在线工具

如何上手使用 LoRA 进行微调

1. 冻结模型参数

2. 检查模型结构

3. 选择性启用 LoRA

实验结果与对比

LoRA 默认配置性能

与传统微调方法的比较

优化 LoRA 配置

推荐配置

总结

更多推荐文章

相关免费在线工具

从零开始编写 LoRA 代码：原理与实战指南

从零开始编写 LoRA 代码：原理与实战指南

LoRA 层的设计原理

PyTorch 实现示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

如何上手使用 LoRA 进行微调

1. 冻结模型参数

2. 检查模型结构

3. 选择性启用 LoRA

实验结果与对比

LoRA 默认配置性能

与传统微调方法的比较

优化 LoRA 配置

推荐配置

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具