人工智能与大语言模型学习指南

想学习人工智能吗？但不知道如何开始？要熟练掌握人工智能相关的技术，光学习很多课程是不够的。

为了摆脱只是跟着教程学习，你需要亲自动手，从头开始编写算法，动手实践，并通过使用人工智能解决问题来做一些有趣的边项目。这篇文章试图创建一份免费的学习路径，希望对大家学习有帮助。（注意：有大量教程、书籍、论文和资源都是英文的，请配合 AI 翻译工具来阅读吧。）

自上而下的学习方法

这份课程采用自上而下的方法——先编码，后理论。

建议大家在必要时才进行学习。即，如果我需要解决某个问题或制作一个原型，我会四处寻找所需的信息，学习、理解然后进行实践。

例如，我目标是成为一个从根本上理解大型语言模型（LLM）的 AI 工程师，这包括从头编码变换器的技能和在 GPU 上微调 LLM 等。我现在还做不到，因为我的知识有缺口，我希望填补这些缺口。

在我给你推荐一堆链接之前，还有两个学习过程中的建议：不要闷头自学。

学无止境，尤其是在人工智能领域，每个月都有前沿的论文发布。

最大的错误是自己闷头学习。除了能完成了某些事之外，你没有任何成果可展示。这样你会错失很多机会。更重要的是你如何处理这些信息，如何将其转化为可以与公众分享的知识，以及从这些信息中产生了什么新颖的想法和解决方案。

因此，你应该在公开你的学习进展，学习经验，甚至是一些成果。

这意味着要养成创造的习惯。这可能意味着，你尝试做这些事情：

写博客和教程
参加黑客马拉松并与他人合作
在社区中提问和回答问题
做你感兴趣的项目
在一些社交媒体上发表你新发现的有趣的事

现在我们开始吧。

算法与数学基础

机器学习严重依赖三大数学支柱：线性代数、微积分、概率与统计。每个都在算法有效运行中扮演着独特的角色。

线性代数：数据表示和操作的数学工具箱，矩阵和向量构成算法解释和处理信息的语言。在神经网络中，权重通常以矩阵形式存储，输入数据被转换为向量进行处理。
微积分：机器学习中优化的引擎，通过理解梯度和变化率，使算法能够学习和改进。反向传播算法的核心就是链式法则的应用。
概率与统计：在不确定性下做决策的基础，允许算法通过随机性和可变性的模型预测结果并从数据中学习。贝叶斯推断和假设检验是许多高级算法的理论基础。

这是一套从程序员视角出发的机器学习数学系列：由 Weights & Biases 提供的《机器学习的数学》。

如果你想从代码角度学习线性代数，可以学习 fast.ai 创造者的《计算线性代数》。

同时阅读《Python 应用机器学习线性代数入门》。

如果你想要更传统的内容，可以看伦敦帝国学院的讲座——线性代数与多变量微积分为例。（这两个视频，在国内视频网站中没有搜到，大家可以自己跳转去看）

观看 3Blue1Brown 的《线性代数的本质》和《微积分的本质》。

为了学习统计学，观看 StatQuest 的《统计学基础》。

补充资料：

书籍：《机器学习的数学》
论文：《深度学习所需的矩阵微积分》

开发工具

Python

初学者从这里开始：实用 Python 编程。当然，在线视频平台也有清华北大整理的 Python 教程，也不错，大家可以自己搜索。

如果你已经熟悉 Python，可以学习这个高级 Python 精通课程。

这两个课程都是由 David Beazley（《Python Cookbook》的作者）提供的。

阅读《Python 设计模式》。

补充资料

书籍：《流畅的 Python，第二版》
播客：Real Python & Talk Python

PyTorch

PyTorch 官网是一个很好的资源。

PyTorch 示例
通过一些谜题测试你的知识：提升你的 PyTorch 技能。

补充资料

书籍：官方文档与社区教程

机器学习

阅读经典教材。

从头编写

在阅读时，从头开始编写算法。

查看下面的代码库：

人工智能与大语言模型学习指南

自上而下的学习方法

算法与数学基础

开发工具

Python

PyTorch

机器学习

从头编写

更多推荐文章

相关免费在线工具

参加比赛

做一些小项目

部署它们

深度学习

计算机视觉

强化学习

自然语言处理（NLP）

大型语言模型

从头编写变换器

学习如何运行开源模型

提示工程

微调 LLM

RAG（检索增强生成）

上手实践

如何保持知识更新

补充技术细节

关于 Transformer 架构

关于微调策略

关于 RAG 系统

关于评估指标

关于算力优化

关于伦理与安全

更多推荐文章

相关免费在线工具

人工智能与大语言模型学习指南

自上而下的学习方法

算法与数学基础

开发工具

Python

PyTorch

机器学习

从头编写

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

参加比赛

做一些小项目

部署它们

深度学习

计算机视觉

强化学习

自然语言处理（NLP）

大型语言模型

从头编写变换器

学习如何运行开源模型

提示工程

微调 LLM

RAG（检索增强生成）

上手实践

如何保持知识更新

补充技术细节

关于 Transformer 架构

关于微调策略

关于 RAG 系统

关于评估指标

关于算力优化

关于伦理与安全

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具