LLM 大模型技术实战 1:机器学习入门基础
机器学习的基本概念、三要素(数据、模型、算法)及核心技术。详细对比了数学建模与机器学习的异同,阐述了监督学习、非监督学习、强化学习和半监督学习的区别与应用场景。列举了线性回归、SVM、K-Means、PCA、CNN、RNN 等常见算法的特点与优缺点。同时提供了 Python 线性回归实战代码示例,帮助读者快速理解机器学习落地流程。文章旨在为初学者提供清晰的技术入门指南,涵盖理论定义、评估指标及实践方法。

机器学习的基本概念、三要素(数据、模型、算法)及核心技术。详细对比了数学建模与机器学习的异同,阐述了监督学习、非监督学习、强化学习和半监督学习的区别与应用场景。列举了线性回归、SVM、K-Means、PCA、CNN、RNN 等常见算法的特点与优缺点。同时提供了 Python 线性回归实战代码示例,帮助读者快速理解机器学习落地流程。文章旨在为初学者提供清晰的技术入门指南,涵盖理论定义、评估指标及实践方法。

**机器学习(Machine Learning)**是人工智能的子集,是实现人工智能的一种主要途径。它是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。
**深度学习(Deep Learning)**是机器学习的子集,灵感来自人脑,由人工神经网络(ANN)组成。在深度学习中,学习是通过相互关联的「神经元」的一个深层的、多层的「网络」来进行的。「深度」一词通常指的是神经网络中隐藏层的数量。
我们可以从传统数学和机器学习对比来了解两者的异同:
相同点
不同点
总的来说,数学建模和机器学习都是理解、解释和预测现象的工具,但它们的关注点、方法和应用有所不同。
机器学习三要素包括数据、模型、算法。这三要素之间的关系紧密相连:
数据驱动:数据驱动指的是我们基于客观的量化数据,通过主动数据的采集分析以支持决策。与之相对的是经验驱动,比如我们常说的「拍脑袋」。高质量的数据是机器学习成功的基础。
输入(未处理的数据 + 标签)→ 处理过程(特征处理 + 幅度缩放、特征选择、维度约减、采样)→ 输出(测试集 + 训练集)。
(TP+TN) / (TP+TN+FN+FP)。R = TP / (TP+FN)。P = TP/(TP+FP)。机器学习主要分为三大类:监督学习、非监督学习、强化学习,而监督学习和非监督学习中又衍生出半监督学习。
监督学习是机器学习的一种方法,其模型是通过输入 - 输出(有标签的数据)对进行训练,目标是从给定的数据中学习一个映射函数,以便在给定新的输入时,模型可以预测相应的输出。训练过程涉及到输入数据和其相应的标签,并尝试找到这两者之间的关系。一旦模型被训练,它可以用来预测新、未标签数据的输出。
非监督学习模型被训练在没有标签的数据上。它的目的是学习数据的底层结构、分布或表示,而不是预测标签。与监督学习不同,非监督学习的目标并不是预测一个输出。相反,它试图通过某种方式学习数据的结构,这可以是通过聚类、降维或生成模型等方式来实现的。
无监督学习要解决的基本问题:
强化学习是通过与环境交互来学习如何行动,从而最大化某种定义的长期回报。与传统的监督学习不同,强化学习通常涉及决策问题,其中每个行动都会影响未来的回报。
半监督学习是介于两个极端之间(监督式是指整个数据集被标记,而非监督式是指没有标记)。半监督学习任务具有一个标记和一个未标记的数据集。它使用未标记的数据来获得对数据结构的更多理解。通常,SSL 使用小的带标签数据集和较大的未带标签数据集来进行学习。
为什么要用半监督学习?
总之,半监督学习提供了一种在有限标记数据的情况下利用未标记数据的方法,这对于许多实际应用来说是非常有价值的。
**线性回归(Linear Regression):**对数值型连续随机变量进行预测和建模的监督学习算法(即最后输出的特征向量的标签是连续值),即找拟合函数。
**支持向量机 (SVM):**目标在于在空间中寻找一个超平面,使得数据集可以被超平面分开,从而完成分类任务。
**K-均值(K-Means):**算法接受参数 k;然后将事先输入的 n 个数据对象划分为 k 个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较小。
**主成分分析 (PCA):**一种统计方法,通过正交变换将数据转换到新的坐标系统,使得最大方差位于第一个坐标(主成分)。
**卷积神经网络 (CNNs):**一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
循环神经网络 (RNNs):
为了更直观地理解机器学习,以下提供一个简单的 Python 代码示例,展示如何使用 Scikit-learn 库进行线性回归。
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 1. 准备数据
# 假设我们有一组数据,x 是房间面积,y 是房价
X = np.array([[10], [20], [30], [40], [50]]) # 面积
y = np.array([100, 200, 300, 400, 500]) # 房价
# 2. 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 3. 创建模型
model = LinearRegression()
# 4. 训练模型
model.fit(X_train, y_train)
# 5. 预测
predictions = model.predict(X_test)
print(f"预测结果:{predictions}")
print(f"系数:{model.coef_}")
print(f"截距:{model.intercept_}")
机器学习作为人工智能的核心分支,正在深刻改变着各行各业。从基础的数学建模到复杂的深度学习,理解其核心概念、分类及常用算法是入门的关键。在实际应用中,选择合适的算法、处理高质量的数据以及合理评估模型性能,是构建有效机器学习系统的重要步骤。随着技术的不断发展,掌握这些基础知识将为进一步探索大模型和前沿 AI 技术奠定坚实的基础。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online