引言:AI 与 ML 的演进历程
人工智能(AI)作为计算机科学的重要分支,旨在创造能够模拟人类智能行为的系统。而机器学习(ML)则是实现这一目标的核心方法,它使计算机能够从数据中学习而无需显式编程。这一概念最早可追溯到 1959 年,当时 IBM 的 Arthur Samuel 开发了首个能够通过经验改进棋艺的西洋跳棋程序。
机器学习基础概念
机器学习是'通过算法使计算机系统能够从数据中学习并做出决策或预测,而无需明确编程'的技术。其核心在于:
- 数据转换:大多数 ML 涉及将输入数据转换为有意义的输出,如从照片预测笑脸或从传感器数据判断异常
- 模型训练:通过大量数据训练算法,使其能够识别模式并做出预测
- 持续优化:模型会随着新数据的输入不断改进性能
主要学习范式
| 学习类型 | 特点 | 典型应用 | 所需数据量 |
|---|---|---|---|
| 监督学习 | 有标签数据 | 图像分类、房价预测 | 中到大 |
| 无监督学习 | 无标签数据 | 客户分群、异常检测 | 大 |
| 强化学习 | 奖励反馈 | 游戏 AI、机器人控制 | 极大 |
机器学习技术栈
现代机器学习已形成完整的技术体系:
# 简单的线性回归示例
import numpy as np
from sklearn.linear_model import LinearRegression
# 训练数据
X = np.array([[1],[2],[3],[4]])
# 特征
y = np.array([2,4,6,8])
# 标签
# 创建并训练模型
model = LinearRegression()
model.fit(X, y)
# 预测
print(model.predict([[5]])) # 输出约 10
深度学习革命
深度学习作为 ML 的子领域,通过多层神经网络实现了突破性进展:
- 计算机视觉:图像分类、目标检测
- 自然语言处理:机器翻译、文本生成
- 生成式 AI:如 ChatGPT、DALL-E 等
深度学习应用领域占比:


