GitHub 热门 LLM 公开资料与大模型入门教程

本文整理了大型语言模型（LLM）领域的核心学习资料，涵盖基础数学与 Python、架构原理、微调技术、量化方法及工程化部署。内容分为 LLM 基础、科学家视角及工程师视角三部分，包含预训练、指令微调、RLHF、RAG 管道构建等关键知识点，并推荐了相关工具库与评估基准，适合希望系统掌握大模型技术的开发者参考。

0. 一些有用的 Notebook

与大型语言模型相关的笔记本和文章列表。

工具

RunPod：使用 RunPod 自动评估大语言模型（LLMs）。
LazyMergekit：轻松使用 MergeKit 一键合并模型。
AutoGGUF：一键将大语言模型（LLMs）量化为 GGUF 格式。
Model Family Tree：可视化被合并模型的家族树。

Fine-tuning

Colab Llama2：使用 Colab 对 Llama2 进行 fine-tuning。
Axolotl：使用 Axolotl 对 LLMs 进行 fine-tuning。
DPO Mistral-7b：使用 DPO 对 Mistral-7b 进行 fine-tuning。

Quantization

8-bit 量化：使用 8-bit 量化优化大语言模型。
GPTQ：使用 GPTQ 进行 4-bit 量化。
GGUF 和 llama.cpp：使用 GGUF 和 llama.cpp 进行量化。
ExLlamaV2：LLMs 运行最快的库。

其它

解码策略：大语言模型 LLMs 中的解码策略。
损失函数可视化：GPT-2 的损失函数值可视化。
知识图谱：使用知识图谱提升 chatGPT。
Mergekit：使用 mergekit 合并 LLMs。

1. LLM 基础

1.1 机器学习 ML 的数学基础

在学习机器学习之前，了解这些算法背后的基本数学概念非常重要。

线性代数：这对于理解许多算法至关重要，尤其是那些用于深度学习的算法。关键概念包括向量、矩阵、行列式、特征值和特征向量、向量空间以及线性变换。
微积分：许多机器学习算法涉及连续函数的优化，这需要理解导数、积分、极限和级数。多变量微积分和梯度概念也很重要。
概率与统计：这些对于理解模型如何从数据中学习并进行预测至关重要。关键概念包括概率论、随机变量、概率分布、期望、方差、协方差、相关性、假设检验、置信区间、最大似然估计和贝叶斯推断。

资源推荐：

一系列视频，为这些概念提供了几何直觉。
为许多统计概念提供了简单明了的解释。
一系列 Medium 文章，提供了每个概率分布背后的直觉。
另一种线性代数的视觉解释。
非常适合初学者，以非常直观的方式解释概念。
一个互动课程，涵盖了微积分的所有基础知识。
以易于理解的格式呈现材料。

1.2 ML 中的 Python

Python 是一种功能强大且灵活的编程语言，由于其可读性、一致性以及数据科学库的强大生态系统，特别适合用于机器学习。

：Python 编程需要对基本语法、数据类型、错误处理和面向对象编程有良好的理解。

GitHub 热门 LLM 公开资料与大模型入门教程

GitHub 热门 LLM 公开资料与大模型入门教程

0. 一些有用的 Notebook

工具

Fine-tuning

Quantization

其它

1. LLM 基础

1.1 机器学习 ML 的数学基础

1.2 ML 中的 Python

更多推荐文章

相关免费在线工具

1.3 神经网络

1.4 自然语言处理（NLP）

2. LLM Scientist

2.1 LLM 架构

2.2 构建指令数据集

2.3 预训练

2.4 微调

2.5 RLHF（基于人类反馈的强化学习）

2.6 评估

2.7 量化

2.8 新趋势

3. LLM 工程师

3.1 运行 LLMs

3.2 构建 RAG

3.3 检索增强生成（RAG）

3.4 高级 RAG

3.5 推理优化

3.6 部署 LLMs

3.7 LLMs 安全

更多推荐文章

相关免费在线工具

GitHub 热门 LLM 公开资料与大模型入门教程

GitHub 热门 LLM 公开资料与大模型入门教程

0. 一些有用的 Notebook

工具

Fine-tuning

Quantization

其它

1. LLM 基础

1.1 机器学习 ML 的数学基础

1.2 ML 中的 Python

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 神经网络

1.4 自然语言处理（NLP）

2. LLM Scientist

2.1 LLM 架构

2.2 构建指令数据集

2.3 预训练

2.4 微调

2.5 RLHF（基于人类反馈的强化学习）

2.6 评估

2.7 量化

2.8 新趋势

3. LLM 工程师

3.1 运行 LLMs

3.2 构建 RAG

3.3 检索增强生成（RAG）

3.4 高级 RAG

3.5 推理优化

3.6 部署 LLMs

3.7 LLMs 安全

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具