机器学习核心算法与实战项目笔记
记录了机器学习课程的核心知识点,涵盖 KNN 算法、线性回归、逻辑回归、决策树(ID3/C4.5/CART)、集成学习(随机森林/AdaBoost/GBDT/XGBoost)及聚类算法。包含特征工程、模型评估指标(SSE/轮廓系数/混淆矩阵)、正则化方法及电力负荷预测实战项目。修正了部分数学公式错误,并补充了缺失的特征工程与模型训练代码细节。

记录了机器学习课程的核心知识点,涵盖 KNN 算法、线性回归、逻辑回归、决策树(ID3/C4.5/CART)、集成学习(随机森林/AdaBoost/GBDT/XGBoost)及聚类算法。包含特征工程、模型评估指标(SSE/轮廓系数/混淆矩阵)、正则化方法及电力负荷预测实战项目。修正了部分数学公式错误,并补充了缺失的特征工程与模型训练代码细节。

本课程涵盖机器学习基础理论、经典算法及实战项目。内容涉及数学推导、环境搭建、模型构建与评估。
课程主要内容包括机器学习概述、KNN 算法、线性回归、逻辑回归、决策树、集成学习、聚类算法及数据挖掘实战项目。
涵盖 AI、ML、DL 概念区分,基于规则与模型的对比,应用领域与发展史。
人工智能(AI)、机器学习(ML)、深度学习(DL)的概念层级关系及定义。
传统规则系统与数据驱动模型的区别与应用场景。
机器学习在各行业的应用案例及技术发展脉络。
监督学习、无监督学习、强化学习等基本概念。
分类任务示例:通过邻近投票预测类型。
数据收集、预处理、特征工程、模型训练、评估与部署的标准流程。
特征选择、构造与转换的重要性。
关键知识点复习。
欠拟合、过拟合与理想拟合的区分。
开发环境配置指南。
欧氏距离、曼哈顿距离等计算方式。
适用于小数据集,受最大值最小值影响较大。
适用于大数据集,更常用。
加载并查看 Iris 数据集结构。
使用图表展示数据分布。
划分训练集与验证集。
模型性能评估指标。
超参数调优方法。
GridSearchCV 等工具的使用。
MNIST 数据集简介。
图像可视化处理。
模型训练与持久化。
模型推理流程。
修正随机种子设置以确保结果一致性。
线性回归原理与实现。
一元与多元线性回归概念。
Scikit-learn 库的基本用法。
均方误差(MSE)等损失函数。
微积分基础回顾。
多元函数求导。
知识点总结。
矩阵运算基础。
解析解求解方法。
矩阵形式推导。
逆矩阵存在性讨论。
矩阵乘法维度说明。
迭代优化算法。
向量化梯度下降实现。
实际业务场景应用。
批量、随机、小批量梯度下降。
R²、RMSE 等指标。
API 参数详解。
SGDRegressor 等类的使用。
低复杂度模型表现。
匹配数据分布的模型。
高复杂度模型表现。
防止过拟合的正则项。
分类算法基础。
Sigmoid 函数与概率输出。
条件概率公式修正:P(B | A) = P(AB) / P(A)。
决策边界与分类原理。
二分类问题实战。
分类评估指标定义。
指标计算实现。
指标权衡分析。
模型综合性能评估。
ROC 绘图与分析。
缺失值处理与编码。
特征分布分析。
完整流程演示。
树结构节点定义。
衡量数据混乱程度。
特征选择标准。
基于信息增益的构建。
复习重点。
解决信息增益偏向性问题。
基尼指数与二叉树分裂。
ID3、C4.5、CART 对比。
生存预测数据。
决策树应用。
回归树构建。
非线性拟合能力对比。
预剪枝与后剪枝。
Bagging 与 Boosting。
组合多个弱学习器。
并行与串行训练策略。
随机森林原理。
RandomForestClassifier 使用。
AdaBoost 机制。
权重更新公式。
分类实战。
残差拟合思想。
负梯度作为目标值。
GBDT 应用。
XGBoost 优势。
二阶泰勒展开优化。
XGBClassifier 参数。
数据清洗。
模型构建。
性能验证。
特征独立性假设。
文本分类流程。
分词与向量化。
Naive Bayes 应用。
无监督学习。
KMeans 初始化。
迭代优化过程。
误差平方和。
手动计算 SSE。
内部聚类有效性指标。
轮廓系数计算。
肘部法则。
KMeans 分群。
时间序列特性。
分类任务。
预测模型选择。
项目需求。
工程结构。
日志记录。
缺失值与异常值处理。
封装预测逻辑。
可视化分析。
时间特征提取与 shift 操作。
网格搜索与模型持久化。
路径配置与依赖导入。
预测逻辑实现。
结果对比与可视化。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online