大模型入门教程：llm-action 资源汇总与实战指南 | 极客日志

PythonAI算法

大模型入门教程：llm-action 资源汇总与实战指南

llm-action 大模型入门项目的核心资源，涵盖训练、微调、分布式并行、推理加速、模型压缩及国产化适配等关键技术领域。内容包括 Alpaca、ChatGLM、LLaMA 等模型的微调实战，LoRA、QLoRA 等高效参数技术原理，以及 DeepSpeed、Megatron-LM 等分布式框架应用。此外还涉及向量数据库、LangChain 应用开发及昇腾等国产算力适配方案，旨在为开发者提供从理论到实践的系统化学习路径。

古灵精怪发布于 2025/2/7更新于 2026/6/224 浏览

大模型入门教程：llm-action 资源汇总与实战指南

本教程旨在为大模型开发者提供系统化的学习路径，涵盖从基础训练、高效微调、分布式并行到推理加速及模型压缩的全流程技术。内容基于 llm-action 项目整理，适合希望深入理解大语言模型（LLM）原理与实践的工程师。

LLM 训练

LLM 训练实战

在大模型实践中，训练是核心环节。从预训练到监督微调（SFT），再到基于人类反馈的强化学习（RLHF），不同阶段对应不同的模型规模与目标。以下汇总了主流模型的训练方案：

LLM	预训练/SFT/RLHF…	参数	教程	代码
Alpaca	full fine-turning	7B	从 0 到 1 复现斯坦福羊驼（Stanford Alpaca 7B）	配套代码
Alpaca(LLaMA)	LoRA	7B~65B	使用 LoRA 技术对 LLaMA 进行微调及推理	配套代码
BELLE(LLaMA/Bloom)	full fine-turning	7B	基于 LLaMA-7B/Bloomz-7B1-mt 复现开源中文对话大模型 BELLE	N/A
ChatGLM	LoRA	6B	从 0 到 1 基于 ChatGLM-6B 使用 LoRA 进行参数高效微调	配套代码
ChatGLM	full fine-turning/P-Tuning v2	6B	使用 DeepSpeed/P-Tuning v2 对 ChatGLM-6B 进行微调	配套代码
Vicuna(LLaMA)	full fine-turning	7B	大模型也内卷，Vicuna 训练及推理指南	N/A
OPT	RLHF	0.1B~66B	一键式 RLHF 训练 DeepSpeed Chat（理论篇与实践篇）	配套代码
MiniGPT-4(LLaMA)	full fine-turning	7B	多模态大模型 MiniGPT-4 入坑指南	N/A
Chinese-LLaMA-Alpaca(LLaMA)	LoRA（预训练 + 微调）	7B	中文 LLaMA&Alpaca 大语言模型词表扩充 + 预训练 + 指令精调	配套代码
LLaMA	QLoRA	7B/65B	高效微调技术 QLoRA 实战，基于 LLaMA-65B 微调仅需 48G 显存	配套代码

LLM 微调技术原理

对于普通开发者而言，全量微调大模型成本高昂且硬件要求极高。参数高效微调（PEFT）技术应运而生，它允许在冻结大部分参数的情况下更新少量参数，从而大幅降低计算与存储需求。本系列将深入解析以下核心技术：

背景与简介：介绍 PEFT 的基本概念及其在工业界的应用价值。
BitFit、Prefix Tuning、Prompt Tuning：早期轻量级微调方法，通过调整偏置或前缀向量实现适配。
P-Tuning、P-Tuning v2：引入可学习的连续提示向量，显著提升下游任务表现。
：在 Transformer 层间插入小型网络模块，保持原模型权重不变。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

教程	代码	框架
大模型参数高效微调技术实战（一）-PEFT 概述及环境搭建	N/A	HuggingFace PEFT
大模型参数高效微调技术实战（二）-Prompt Tuning	配套代码	HuggingFace PEFT
大模型参数高效微调技术实战（三）-P-Tuning	配套代码	HuggingFace PEFT
大模型参数高效微调技术实战（四）-Prefix Tuning / P-Tuning v2	配套代码	HuggingFace PEFT
大模型参数高效微调技术实战（五）-LoRA	配套代码	HuggingFace PEFT
大模型参数高效微调技术实战（六）-IA3	配套代码	HuggingFace PEFT

大模型入门教程：llm-action 资源汇总与实战指南

大模型入门教程：llm-action 资源汇总与实战指南

LLM 训练

LLM 训练实战

LLM 微调技术原理

更多推荐文章

相关免费在线工具

LLM 微调实战

LLM 分布式训练并行技术

分布式 AI 框架

分布式训练网络通信

LLM 推理

模型推理加速

模型推理服务化

LLM 压缩

LLM 量化

LLM 剪枝

LLM 知识蒸馏

低秩分解

LLM 算法架构

LLM 国产化适配

LLM 应用开发

LLM 生态相关技术

服务器基础环境安装及常用工具

基础环境安装

常用工具

更多推荐文章

相关免费在线工具

大模型入门教程：llm-action 资源汇总与实战指南

大模型入门教程：llm-action 资源汇总与实战指南

LLM 训练

LLM 训练实战

LLM 微调技术原理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

LLM 微调实战

LLM 分布式训练并行技术

分布式 AI 框架

分布式训练网络通信

LLM 推理

模型推理加速

模型推理服务化

LLM 压缩

LLM 量化

LLM 剪枝

LLM 知识蒸馏

低秩分解

LLM 算法架构

LLM 国产化适配

LLM 应用开发

LLM 生态相关技术

服务器基础环境安装及常用工具

基础环境安装

常用工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具