1. 变量 (Variables):给数据贴标签
在 Python 中,变量不需要'声明类型'(不像 C++ 或 Java 需要写 int a = 1)。你直接赋值,Python 会自动识别。
命名规范(ML 领域的潜规则)
虽然 Python 推荐用全小写加下划线(如 my_variable),但在机器学习的数学公式实现中,我们经常打破这个规则以匹配数学符号:
- 常规变量:
learning_rate,batch_size,model_path(使用 snake_case) - 矩阵/数据集:
X(通常大写,代表特征矩阵),y(通常小写,代表标签) - 参数:
w(权重 weights),b(偏置 bias)
# 定义变量非常简单,左边是名字,右边是值
epoch = 10 # 训练轮数
learning_rate = 0.001 # 学习率
is_training = True # 是否正在训练
model_name = "ResNet50" # 模型名称
# 变量的值是可以随时修改的
epoch = epoch + 1 # 现在 epoch 变成了 11
2. 四大核心数据类型 (The Core Types)
Python 有很多类型,但做算法模型时,你 95% 的时间只在和下面这四种打交道。
A. Float (浮点数) —— ML 的绝对主角
机器学习的核心是微积分和矩阵运算,结果几乎永远是小数。
- 场景: 模型的准确率 (0.985)、损失函数值 (0.0023)、权重参数。
- 注意: 哪怕是
1.0,在计算机眼里它也是浮点数,而不是整数。
B. Int (整数) —— 计数器
- 场景: 数据集的索引(第 5 张图)、训练的轮数(第 10 轮)、分类的类别 ID(0 代表猫,1 代表狗)。
C. Bool (布尔值) —— 逻辑开关
只有两个值:True 和 False(注意首字母大写)。
- 场景:
shuffle=True(打乱数据),use_gpu=False(使用 CPU),pretrained=True(使用预训练模型)。
D. String (字符串) —— 文本与路径
用单引号 ' ' 或双引号 " " 包裹。
- 场景: 文件路径
'./data/train.csv',自然语言处理中的原始文本 。


