机器学习核心算法与实战项目笔记
一、前言
本课程涵盖机器学习基础理论、经典算法及实战项目。内容涉及数学推导、环境搭建、模型构建与评估。
二、机器学习概述
1. 机器学习大纲介绍
课程主要内容包括机器学习概述、KNN 算法、线性回归、逻辑回归、决策树、集成学习、聚类算法及数据挖掘实战项目。
2. 机器学习相关概述目录
涵盖 AI、ML、DL 概念区分,基于规则与模型的对比,应用领域与发展史。
3. AI、ML、DL 介绍
人工智能(AI)、机器学习(ML)、深度学习(DL)的概念层级关系及定义。
4. 基于规则和模型的介绍
传统规则系统与数据驱动模型的区别与应用场景。
5. 应用领域和发展史
机器学习在各行业的应用案例及技术发展脉络。
6. 名词介绍
监督学习、无监督学习、强化学习等基本概念。
7. 算法分类
分类任务示例:通过邻近投票预测类型。
8. 建模流程
数据收集、预处理、特征工程、模型训练、评估与部署的标准流程。
9. 特征工程介绍
特征选择、构造与转换的重要性。
10. 上午内容回顾
关键知识点复习。
11. 模型拟合问题
欠拟合、过拟合与理想拟合的区分。
12. 环境搭建
开发环境配置指南。
三、KNN 算法
1. 常用的距离度量方式
欧氏距离、曼哈顿距离等计算方式。
2. 特征预处理_归一化
适用于小数据集,受最大值最小值影响较大。
3. 特征预处理_标准化
适用于大数据集,更常用。
4. 鸢尾花案例_查看数据集
加载并查看 Iris 数据集结构。
5. 鸢尾花案例_数据集可视化
使用图表展示数据分布。
6. 鸢尾花案例_切分训练集和测试集
划分训练集与验证集。
7. 鸢尾花案例_模型的评估和预测
模型性能评估指标。
8. 交叉验证和网格搜索_介绍
超参数调优方法。
9. 交叉验证和网格搜索_代码实现
GridSearchCV 等工具的使用。
10. 手写数字识别_数据集介绍
MNIST 数据集简介。
11. 手写数字识别_绘制数字
图像可视化处理。
12. 手写数字识别_训练和保存模型
模型训练与持久化。
13. 手写数字识别_加载和使用模型
模型推理流程。
14. 解决预测错误的 Bug
修正随机种子设置以确保结果一致性。


