跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
|注册
博客列表

目录

  1. 1.引言
  2. 2.背景
  3. 2.1 大型语言模型
  4. 2.2 大型语言模型的训练
  5. 2.3 联邦微调
  6. 3.挑战
  7. 3.1 通信开销
  8. 3.2 数据异质性
  9. 3.3 内存墙
  10. 3.4 计算开销
  11. 4.大语言模型与时序图像的融合
  12. 4.1 基于低秩适应(LoRA)的微调
  13. 4.1.1 基础原理
  14. 4.1.2 联邦应用
  15. 4.2 基于提示的微调
  16. 4.2.1 基础原理
  17. 4.2.2 联邦应用
  18. 4.3 基于适配器(Adapter)的微调
  19. 4.3.1 基础原理
  20. 4.3.2 联邦应用
  21. 4.4 基于选择(Selective)的微调
  22. 4.4.1 基础原理
  23. 4.4.2 关键方法
  24. 4.5 其他微调方法
  25. 5.数据集与基准测试
  26. 6.应用场景
  27. 6.1 联邦大语言模型在推荐系统中的应用
  28. 6.2 联邦大语言模型在生物医学研究中的应用
  29. 6.3 联邦大语言模型在金融领域中的应用
  30. 7 开放挑战与未来方向
  31. 7.1 联邦大语言模型的模型安全
  32. 7.2 大语言模型与小语言模型的协作
  33. 7.3 多模态联邦大语言模型
  34. 7.4 联邦大语言模型的持续学习
  35. 7.5 内存高效的联邦大语言模型
PythonAI算法

大语言模型联邦微调综述:挑战、方法与未来方向

综述了大型语言模型(LLM)的联邦微调技术。针对通信开销、数据异质性、内存墙及计算开销四大挑战,介绍了基于 LoRA、提示、适配器、选择性及其他参数高效微调方法。探讨了在推荐系统、生物医学及金融领域的应用,并展望了模型安全、大小模型协作、多模态、持续学习及内存优化等未来方向。旨在填补 LLM 联邦微调专项分析与基准的空白。

战神发布于 2026/4/6更新于 2026/4/131 浏览
大语言模型联邦微调综述:挑战、方法与未来方向

1.引言

大型语言模型(LLMs,如 GPT-4o、DeepSeek-R1、Qwen3)在下游任务中表现卓越,但需经适配才能落地,且直接训练存在计算开销大、数据稀缺易过拟合的问题(如训练 LLaMA2-65B 需处理 1.4 万亿 token、2048 块 A100 GPU 耗时 21 天),因此预训练 LLM 微调成为主流范式。

当前主流 LLM 微调分三类:

  1. 集中式微调:聚合客户端数据至中央服务器,效果好但隐私风险高、受法律限制(如 GDPR)图(a);
  2. 本地微调:客户端本地用私有数据训练,保护隐私但数据规模/多样性不足,MMLU 基准性能较联邦微调下降达 7% 图(b);

联邦微调:客户端本地训练仅传模型更新,服务器聚合构建全局模型,兼顾隐私与数据多样性,是适配 LLM 的优质范式 图(c)。

文章配图

联邦微调(FedLLM)面临四大核心挑战:

  • 通信开销:LLM 参数规模大(如 LLaMA2-7B),每轮训练传参导致延迟与带宽压力;
  • 数据异构性:客户端数据非独立同分布(Non-IID),引发模型偏差、收敛慢、性能受损;
  • 内存壁垒:边缘设备内存有限(4-12GB),难以支撑 LLM 微调(如 LLaMA2-7B 需 51.85GB);
  • 计算开销:客户端硬件能力不足,本地训练耗时久、能耗高,影响参与度。

研究人员将参数高效微调(PEFT)方法应用于联邦学习,分五类:基于 LoRA、提示、适配器、选择性的微调及其他方法,核心是通过小规模任务适配减少可训练参数,降低开销并保性能。

现有综述或局限于传统小模型联邦学习,或聚焦 PEFT 的集中式场景,缺乏 LLM 联邦微调的专项分析与基准。本综述首次系统性探讨该领域,剖析其发展、挑战与方法,提供标准化评估基准,填补研究空白。


2.背景

2.1 大型语言模型

大型语言模型(LLMs)在机器翻译、文本生成、情感分析、问答等自然语言处理任务中表现突出,核心源于其编码复杂语言模式、捕捉长距离上下文依赖的能力,还推动了对话 AI、医疗决策支持等实际应用发展。

架构上,现代 LLMs 由数十至数百层 Transformer 堆叠而成(如 LLaMA2-7B 含 32 层),每层含多头注意力(MHA)和前馈网络(FFN)。第 l 层计算为:
h_{i}'=MHA\left(LN\left(h_{i-1}\right)\right)+h_{i-1}
h_{i}=FFN\left(LN\left(h_{i}'\right)\right)+h_{i}'
( h_{l-1} \in \mathbb{R}^{n ×d} 为输入, n 为序列长度, d 为隐藏维度, LN(·) 为层归一化)

文章配图

2.2 大型语言模型的训练

LLM 训练分两阶段:

  1. 预训练:在数十亿至数万亿 token 的无标签语料(学术论文、网站等)上自回归建模,习得基础语义到跨领域推理能力,构建可迁移表示;

微调:用监督学习在任务特定数据集上适配模型,但传统方法需集中数据,引发隐私安全问题,推动隐私保护型微调发展。

文章配图

2.3 联邦微调

联邦微调让客户端在本地私有数据上适配 LLM,仅传模型更新给服务器,兼顾隐私与数据保护要求,但面临参数规模大、数据异构、内存不足、计算开销高的挑战。

对应解决方案为五类参数高效微调(PEFT)方法:

  • 基于 LoRA:分解权重更新为低秩矩阵,减参数;
  • 基于提示:优化输入提示,冻结模型权重;
  • 基于适配器:插入轻量模块,仅更新模块参数;
  • 基于选择性:微调任务相关层/参数;
  • 其他:含零阶优化、拆分学习、模型压缩等。

3.挑战

3.1 通信开销

联邦微调需客户端与服务器迭代传输模型参数至收敛,LLM(如 LLaMA 系列)参数规模为传统模型(如 BERT)的 10-118 倍,导致数据传输量激增;实际中30% 边缘设备依赖带宽不足 10 Mb/s 的 2G/3G 网络,5G 覆盖率仅 10%,且'掉队者效应'(训练时长由最慢设备决定)会延缓收敛,降低通信开销是 FedLLM 落地关键。

文章配图

3.2 数据异质性

客户端数据在分布、质量、数量上差异显著,会导致模型更新冲突、收敛慢、泛化差;传统 FL 的正则化、聚合优化等缓解策略在 FedLLM 中应用不足,且 PEFT 对数据分布偏移更敏感,数据异质性越高,PEFT 与全参数微调(FFT)的性能差距越大。

文章配图

3.3 内存墙

本地微调需存储模型参数、中间激活值与梯度,边缘设备内存通常仅 4-12 GB;微调 LLaMA2-7B 需 51.85 GB GPU 内存(BERT 的 7.68 倍),LLaMA2-13B 需 98.56 GB,硬件内存与 LLM 需求不匹配形成'内存墙',限制设备参与,降低数据多样性与模型性能。

文章配图

3.4 计算开销

LLM 微调的前向/反向传播计算密集,批量为16时,TinyLLaMA 微调的 FLOPs 是 BERT 的 8.6 倍,LLaMA2-13B 是 103.07 倍;会导致训练时间延长、电池设备能耗过高、硬件性能衰减,需适配设备异质性的计算高效策略。

文章配图


4.大语言模型与时序图像的融合

文章配图

4.1 基于低秩适应(LoRA)的微调

4.1.1 基础原理

LoRA 通过低秩矩阵分解减少可训练参数:将预训练权重矩阵 W_0 ∈ R^{\bar{U} × V} 分解为 A ∈ R^{r × V}(低维投影)与 B ∈ R^{U × r}(回映射),其中 r ≪ min(U,V) 为低秩维度。微调时仅更新 A 和 B,原始权重 W_0 冻结,核心计算式为:
h=W_0 X+B A X (3)
式中, W_0 X 为预训练模型初始预测, B A X 为任务特定适配,二者元素-wise 相加得最终输出,兼顾效率与泛化。

在这里插入图片描述

4.1.2 联邦应用

按秩配置分为三类:

  • 同构 LoRA:客户端用相同秩(如 FedSA-LoRA 仅传 A 矩阵降通信开销);

同构 LoRA 指所有客户端为其 LoRA 模块采用相同低秩维度 r 的场景。这种统一配置简化了客户端间的聚合与模型同步过程。表 2 总结了该类别中的代表性方法及其应对的具体挑战。

  • 异构 LoRA:客户端按需选秩(如 HETLoRA 结合秩自剪枝应对数据异质性);

异构 LoRA 允许各客户端根据自身数据特征或资源约束,为其 LoRA 模块采用不同的秩 r。这种异构性既可以体现在客户端间(模型间异构),也可以体现在同一模型的不同层间(层内异构)。通过允许客户端选择最适配自身能力与本地数据的秩,该方法为联邦微调过程引入了更高的灵活性和资源感知能力。表 3 总结了该类别中的代表性方法及其应对的具体挑战。

  • 个性化 LoRA:适配本地数据(如 FDLoRA 用双 LoRA 模块分捕全局/个性化知识)。

个性化 LoRA 允许每个参与者通过个性化低秩适配矩阵微调自身模型,使其能更好地与本地数据特征对齐。该方法在保留客户端特定差异的同时,提升了全局模型在客户端间的泛化能力。表 4 总结了该类别中的代表性方法及其旨在应对的具体挑战。

维度同构 LoRA异构 LoRA个性化 LoRA
秩(Rank)配置所有客户端使用相同秩(如 r=16)客户端自选秩(如 r=8/16/32)秩可异,但重点在本地数据适配
核心目标简化聚合,降低通信开销适配资源/数据异构,提升参与率捕捉本地数据特性,减少全局偏差
聚合策略直接平均(如 FedSA-LoRA 仅传 A 矩阵)堆叠/加权聚合(如 HETLoRA 秩自剪枝)全局 + 本地模块分离(如 FDLoRA 双模块)
解决的挑战通信开销(参数传输量)资源异构(内存/算力差异)、数据异质性数据异质性(本地数据分布独特)
典型案例FedSA-LoRA(仅传 A 降通信)HETLoRA(秩自剪枝 + 稀疏聚合)FDLoRA(全局 LoRA+ 本地 LoRA)
适用场景客户端资源相近、数据分布相似(如医院联合调医疗模型)边缘设备混合(手机 + 服务器)、数据差异大(如跨行业联邦)数据高度个性化(如个性化推荐、医疗问诊)

4.2 基于提示的微调

4.2.1 基础原理

将可训练提示嵌入 P ∈ R^{l_p × d} ( l_p 为提示长度, d 为模型隐藏维度)前置到原始输入 X ∈ R^{l_x × d}( l_x 为输入长度),拼接后输入冻结参数 θ 的预训练模型,核心式为:
Z=f([P ; X] ; θ)
式中, [P ; X] 为提示与输入的拼接, f(·;θ) 为冻结模型函数,仅优化 P 即可实现任务适配,大幅降低资源开销。

文章配图

4.2.2 联邦应用

按提示适配范围分为三类:

  • 通用提示微调:共享提示(如 FedPepTAO 用部分提示微调降通信成本);

通用提示微调指所有参与客户端学习并采用同一组共享提示嵌入的方法。在这种设置下,相同的提示会被前置到每个客户端的输入序列中,为模型提供一致的任务特定引导,使全局模型能在多样化数据源上实现泛化。表 5 总结了该类别中的代表性方法及其旨在应对的具体挑战。

  • 个性化提示微调:客户端定制提示(如 pFedPG 生成客户端特定视觉提示);

个性化提示微调允许每个客户端根据本地数据分布和任务需求,定制专属提示嵌入。通过为每个客户端优化独特的提示,模型能更好地捕捉本地数据的特有特征 —— 这一过程直接应对了数据异质性挑战,同时仍可通过全局模型共享通用知识。表 6 总结了该类别中的代表性方法及其针对的具体挑战。

  • 多领域提示微调:适配跨域场景(如 Fed-DPT 结合视觉 - 文本双提示)。

多领域提示微调将基于提示的方法扩展到联邦客户端跨不同领域或应用场景的场景。在此类场景中,每个客户端配备领域特定提示嵌入,使共享的全局模型能适配多样化的上下文与数据分布条件。该方法提升了模型在异构领域间的泛化能力,同时保持共享全局基础的一致性,在跨行业、多场景的实际部署中极具价值。表 7 总结了该类别中的代表性方法及其应对的具体挑战。

维度通用提示微调个性化提示微调多领域提示微调
提示数量1 套(全客户端共享)N 套(N 个客户端 N 套)K 套(K 个领域 K 套)
解决的核心问题降低通信/聚合成本应对客户端数据异质性应对跨领域任务差异
适用场景同领域、任务相似同领域、数据差异大跨领域、任务不相关
服务器聚合难度低(仅聚合 1 套提示)中(聚合 N 套提示)高(聚合 K 套领域提示)

4.3 基于适配器(Adapter)的微调

4.3.1 基础原理

插入轻量级适配器模块,通过'下投影→非线性→上投影 + 残差连接'转换中间表示,仅更新适配器参数 (W_DP、W_UP),核心公式如下:

  1. 下投影(高维→低维): h_i'=h_i W_DP (4) 其中 h_i ∈ R^{n × d} 为激活值, W_DP ∈ R^{d × r}( r ≪ d 为瓶颈维度);
  2. 非线性激活: h_i''=σ(h_i') (5) σ(·) 为 ReLU/GELU 等激活函数;
  3. 上投影(低维→高维): h_i'''=h_i'' W_UP (6) W_UP ∈ R^{r × d};

残差连接: Z=h_i+h_i''' (7) Z 为适配后隐藏表示,保留预训练知识。

文章配图

4.3.2 联邦应用

按适配器适配范围分为三类:

  • 通用适配器微调:统一适配器(如 FedAdapter 动态优化配置);

通用适配器微调指所有客户端采用相同结构与初始参数的适配器模块的场景。在此设置下,相同的适配器模块被插入到每个客户端模型的 Transformer 层中,使联邦训练中的适配机制保持一致,便于稳定聚合与协同更新。这种方法在客户端任务相似、数据分布相对均一的场景中尤为有效 —— 全局优化的适配器能在参与者间良好泛化。表 8 总结了该类别中的代表性方法及其旨在应对的具体挑战。

  • 个性化适配器微调:客户端定制(如 C2A 用超网络生成客户端特定适配器);

个性化适配器微调允许每个客户端根据本地数据分布与任务需求,独立微调其适配器模块。与通用适配器微调不同,该方法不强制客户端间的适配器统一性,而是允许保留个性化适配器参数,以更好捕捉客户端特定知识。这种策略在数据异质性高的联邦场景中优势显著 —— 通过个性化适配器,客户端能提升本地任务性能,同时仍可通过全局模型共享通用知识。表 8 总结了该类别中的代表性方法及其应对的具体挑战。

  • 多领域适配器微调:适配跨域(如 Fed-MNMT 用于多语言翻译降通信开销)。

多领域适配器微调将联邦微调范式扩展到跨不同领域运行的客户端,实现对领域特定任务的高效适配。在此场景中,每个客户端维护自身的领域特定适配器,同时为共享全局模型贡献更新;全局模型聚合跨领域的适配器更新,捕捉领域不变表示以支持泛化。该方法在跨域场景(如多语言自然语言处理)中效果显著 —— 通过将领域特定学习与共享骨干网络解耦,实现个性化与协同学习的平衡。表 8 总结了该类别中的代表性方法及其应对的挑战。

4.4 基于选择(Selective)的微调

4.4.1 基础原理

仅更新模型特定参数(如偏置项、层归一化参数),无需全参数微调,平衡效率与性能,代表策略为偏置微调(仅更偏置项)与部分层微调(仅更关键层)。

偏置微调:仅更新模型的偏置项(bias term),冻结所有其他参数。尽管方法简单,但该策略在多种任务中展现出优异性能,且仅需极低资源开销。

部分微调:将偏置微调的思路泛化,允许更新模型中精心选择的参数子集(如层归一化参数、前馈网络偏置、特定注意力块等)。通过聚焦更新与下游任务最相关的参数,部分微调在提升训练效率、缓解灾难性遗忘的同时,实现模型的快速适配 —— 即使在数据与资源有限的场景中也能有效工作。

4.4.2 关键方法

如 DP-BiTFiT 用差分隐私偏置微调保隐私,FedPEFT 仅共享偏置等小参数降通信开销。

4.5 其他微调方法

  • 零阶优化:如 FedKSeed 用随机种子实现无中间激活存储,降通信开销;
  • 拆分学习:如 FedBERT 结合 FL 与拆分学习预训 BERT;
  • 模型压缩:如 FedBiOT 在服务器压缩 LLM,客户端微调轻量适配器;
  • 数据选择:如 FedHDS 用分层选数据减冗余,提升训练效率。

5.数据集与基准测试

文章配图

文章配图


6.应用场景

6.1 联邦大语言模型在推荐系统中的应用

传统推荐系统依赖集中式数据收集,存在隐私风险。联邦微调可在保护隐私的同时协同优化推荐效果,核心方案包括:

  • FELLRec:通过动态参数聚合与自适应学习速率平衡客户端性能,将敏感大语言模型层保留在客户端、其余层卸载至服务器,兼顾隐私与资源效率;
  • FELLAS:利用大语言模型增强物品嵌入表示,通过 dₓ隐私兼容的序列扰动保障隐私,提升序列推荐效果;
  • 联邦 RLHF 框架(FedBis/FedBiscuit):FedBis 协同训练二元选择器过滤敏感偏好数据,FedBiscuit 通过客户端聚类训练多选择器,实现隐私保护与人类偏好对齐;
  • GPT-FedRec:融合 ChatGPT 与混合检索增强生成(RAG),缓解数据稀疏性与模型幻觉问题,提升推荐质量。

6.2 联邦大语言模型在生物医学研究中的应用

生物医学数据敏感且分散,联邦微调可在保护隐私的前提下实现模型协同优化,典型应用包括:

  • 生理信号分析:Ali 等人采用联邦学习微调时序大语言模型,处理心电图、阻抗心动图数据,实现隐私保护的生理信号分析;
  • 医疗信息检索:Puppala 提出基于联邦学习的 GPT 聊天机器人,聚合多源医疗信息,通过去中心化训练保障隐私;
  • 心理健康分析:Sarwar 提出 FedMentalCare 框架,结合联邦学习与 LoRA 微调大语言模型,探索客户端数据量与模型架构对训练效果的影响;
  • 医学图像分割:Liu 的 FedFMS 框架、Wang 的 FEDKIM 知识注入框架、Dai 的 FedATA 自监督分割框架,均通过联邦训练避免数据集中共享,提升模型泛化性与跨机构知识迁移能力。

6.3 联邦大语言模型在金融领域中的应用

金融数据敏感且受监管,联邦微调可解决集中式训练的隐私与合规问题,关键进展包括:

  • OpenFedLLM:Ye 等人提出的联邦微调框架,在去中心化私有数据上训练大语言模型,性能超本地训练模型,甚至优于 GPT-4;
  • 高效训练优化:Shabani 通过联邦学习微调金融大语言模型,在降低计算成本与训练时间的同时,性能接近集中式训练;
  • 边缘部署:Zeng 等人采用 LoRA 微调金融大语言模型并部署于边缘设备,提升模型推理能力与成本效益,适配垂直领域隐私需求。

7 开放挑战与未来方向

7.1 联邦大语言模型的模型安全

  • 挑战:
  1. 知识产权泄露风险:预训练大语言模型(如 Gemini Ultra、GPT-4)训练成本极高(分别约 1.91 亿美元、7800 万美元),联邦场景下常以白盒方式向客户端共享完整模型,易被恶意参与者逆向工程或克隆,损害开发者竞争力。
  2. 开源模型安全漏洞:开源大语言模型(如 DeepSeek、Qwen)因易用性被广泛采用,但客户端(尤其缺乏技术能力者)易因配置不当(如 Ollama 默认配置漏洞)导致数据泄露、未授权资源占用,单个受攻击客户端还可能向全局模型植入对抗性后门,在医疗、金融等敏感领域危害严重。
  • 未来方向:
    开发模型水印、加密模型传输、推理混淆协议,防止模型架构与参数泄露;将机密计算、运行时访问控制等技术融入联邦微调流程,保障模型部署安全。

7.2 大语言模型与小语言模型的协作

  • 挑战:
    大语言模型(LLMs)推理与多模态能力强,但资源需求高,不适配边缘设备;小语言模型(SLMs,如 Gemini Nano、Phi-3)轻量易部署,但泛化与任务迁移能力弱,难以应对复杂任务。
  • 未来方向:
    构建'边缘 SLM-云端 LLM'混合架构:边缘 SLM 处理隐私敏感推理(如本地文本生成),云端 LLM 负责复杂推理(如工具选择、跨域对齐);需设计去中心化协同协议,解决 SLM-LLM 交互延迟、输出一致性及动态任务分配问题,并通过隐私保护元数据交换保护工具使用日志。

7.3 多模态联邦大语言模型

  • 挑战:
    现有研究多聚焦文本任务,多模态联邦大语言模型(LMMs,如 GPT-4V、LLaVA)面临三大问题:
  1. 模态异质性:客户端数据类型差异大(如部分仅含文本、部分含图文对),导致模态分布失衡;
  2. 跨模态对齐难:联邦场景下无法集中共享配对数据(如图文对),模型难以关联不同模态信息;
  3. 计算负担重:多模态模型对边缘设备内存与算力要求极高。
  • 未来方向:
    开发模块化微调框架,支持各模态在客户端独立微调;设计模态感知聚合协议,根据模态类型、数据质量加权客户端贡献;探索联邦跨模态对比学习,提升模态对齐效果;通过知识蒸馏、动态子网络激活构建轻量化多模态架构,适配边缘应用(如智能医疗、穿戴设备)。

7.4 联邦大语言模型的持续学习

  • 挑战:
    动态联邦环境中,客户端数据分布与任务目标随时间变化,需模型增量学习新知识,但大语言模型存在:
  1. 灾难性遗忘:增量更新易覆盖旧知识;
  2. 训练成本高:重复训练对边缘设备不友好;
  3. 客户端参与不稳定:稀疏/不规则参与加剧模型波动。
  • 未来方向:
    研发参数高效持续学习策略(如弹性权重巩固(EWC)、基于 PEFT 的模块化更新、压缩内存缓存重放),缓解遗忘并降低开销;设计终身个性化协议,适配客户端动态任务分布与非独立同分布(Non-IID)数据场景,平衡通信效率、隐私保护与模型稳定性。

7.5 内存高效的联邦大语言模型

  • 挑战
    内存约束是联邦大语言模型规模化部署的核心瓶颈:边缘设备内存通常仅 4-12GB,而即使采用低秩适应(LoRA)微调 LLaMA2-13B,仍需超 50GB 峰值内存,大量设备因内存不足无法参与训练。
  • 未来方向
    从算法与系统层面协同优化:
  • 算法层面:探索动态层适配、量化感知 PEFT(如 QLoRA)、结构化模型剪枝;
  • 系统层面:采用梯度 checkpointing 与累积、内存感知调度器、云边混合训练架构(选择性计算卸载);
  • 构建'算法 - 系统'协同框架,实时平衡内存、计算与通信开销,让低内存边缘设备(如手机、物联网设备)参与联邦训练。

极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog

更多推荐文章

查看全部
  • Dify 单独启动前端 Docker 容器
  • FPGA 验证环境构建:Testbench 编写与 Quartus II+ModelSim 联合仿真
  • OpenClaw 配置飞书机器人完整指南
  • AI 辅助 FPGA 开发:Vivado 配置与智能编程实践
  • 使用 cpolar 内网穿透实现 OpenClaw 公网远程访问
  • Whisper 语音转文字本地化使用指南
  • Vivado 2020.2 安装教程:FPGA 开发环境搭建指南
  • 煎蛋侠:开箱即用的 AI 桌面助手,支持 Skills 和 MCP 扩展
  • VR 虚拟实验室构建:学生与 AI 协同探索科学规律
  • Windows 11 安卓与 Linux 子系统技术解析
  • 手机端运行 Stable Diffusion 的开源 AI 绘画工具
  • 无人机遥感航拍巡检数据集 无人机遥感图像识别 无人机视角山区泥石流和滑坡图像识别数据集-数据集第10067期
  • 无人机智能航线规划系统构建指南
  • OpenClaw 智能体框架实战:从零搭建第一个 AI 员工
  • VS Code GitHub Copilot 不支持自定义模型 API 配置
  • 扩散模型详解:从 DDPM 到 Stable Diffusion 再到 DiT 的技术演进
  • iOS 26 系统兼容适配:UITabBar 液态玻璃效果与网络权限处理
  • JavaScript 中 var、let、const 的核心区别与实战应用
  • Win11 本地部署 OpenClaw:集成 Telegram 机器人与网页搜索功能
  • AI 安全:Stable Diffusion 视觉提示词注入攻击原理与实现

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online