GitHub 热门 LLM 学习资源整理
0. 📝 一些有用的 Notebook
与大型语言模型相关的笔记本和文章列表。
工具:
- LLM AutoEval:使用 RunPod 自动评估大语言模型(LLMs),Colab
- LazyMergekit:轻松使用 MergeKit 一键合并模型,Colab
- AutoGGUF:一键将大语言模型(LLMs)量化为 GGUF 格式,Colab
- Model Family Tree:可视化被合并模型的家族树,Colab
Fine-tuning:
- 使用 Colab 对 Llama2 进行 fine-tuning:文章,Colab
- 使用 Axolotl 对 LLMs 进行 fine-tuning:文章,Colab
- 使用 DPO 对 Mistral-7b 进行 fine-tuning:文章,Colab
Quantization
- 使用 8-bit 量化优化大语言模型:文章,Colab
- 使用 GPTQ 进行 4-bit 量化:文章,Colab
- 使用 GGUF 和 llama.cpp 进行量化:文章,Colab
- ExLlamaV2:LLMs 运行最快的库,文章,Colab
其它
- 大语言模型 LLMs 中的解码策略:文章,Colab
- GPT-2 的损失函数值可视化:文章,Colab
- 使用知识图谱提升 chatGPT:文章,Colab
- 使用 mergekit 合并 LLMs:文章,Colab
1. 🧩 LLM 基础
1.1 机器学习 ML 的数学基础
在学习机器学习之前,了解这些算法背后的基本数学概念非常重要。
- 线性代数:这对于理解许多算法至关重要,尤其是那些用于深度学习的算法。关键概念包括向量、矩阵、行列式、特征值和特征向量、向量空间以及线性变换。
- 微积分:许多机器学习算法涉及连续函数的优化,这需要理解导数、积分、极限和级数。多变量微积分和梯度概念也很重要。
- 概率与统计:这些对于理解模型如何从数据中学习并进行预测至关重要。关键概念包括概率论、随机变量、概率分布、期望、方差、协方差、相关性、假设检验、置信区间、最大似然估计和贝叶斯推断。
📚 资源:
- 3Blue1Brown - 线性代数的本质:一系列视频,为这些概念提供了几何直觉。
- StatQuest with Josh Starmer - 统计学基础:为许多统计概念提供了简单明了的解释。
- AP 统计直觉 by Ms Aerin:一系列 Medium 文章,提供了每个概率分布背后的直觉。
- 沉浸式线性代数:另一种线性代数的视觉解释。
- Khan Academy - 线性代数:非常适合初学者,以非常直观的方式解释概念。
- Khan Academy - 微积分:一个互动课程,涵盖了微积分的所有基础知识。
- Khan Academy - 概率与统计:以易于理解的格式呈现材料。
1.2 ML 中的 Python
Python 是一种功能强大且灵活的编程语言,由于其可读性、一致性以及数据科学库的强大生态系统,特别适合用于机器学习。
- Python 基础:Python 编程需要对基本语法、数据类型、错误处理和面向对象编程有良好的理解。
- 数据科学库:包括熟悉用于数值运算的 NumPy,用于数据操作和分析的 Pandas,以及用于数据可视化的 Matplotlib 和 Seaborn。
- 数据预处理:这涉及特征缩放和归一化、处理缺失数据、异常值检测、分类数据编码以及将数据分割为训练集、验证集和测试集。


