机器学习入门:基本概念、分类与核心算法详解
一、机器学习基本概念
1. 什么是机器学习
**机器学习(Machine Learning)**是人工智能的子集,是实现人工智能的一种主要途径。它是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。
**深度学习(Deep Learning)**是机器学习的子集,灵感来自人脑,由人工神经网络(ANN)组成。在深度学习中,学习是通过相互关联的「神经元」的一个深层的、多层的「网络」来进行的。「深度」一词通常指的是神经网络中隐藏层的数量。

2. 传统数学 VS 机器学习
我们可以从传统数学和机器学习对比来了解两者的区别:
相同点
- 数据驱动: 两者都利用数据来构建和验证模型。
- 预测和推断: 数学建模和机器学习都可以用于预测未知的输出或解释数据中的模式。
- 优化问题: 在某些情况下,两者都可能涉及到优化问题,例如寻找最小化误差的参数。
不同点
| 维度 | 数学建模 | 机器学习 |
|---|---|---|
| 目的 | 旨在用数学形式描述现实世界现象,理解背后机制 | 关注预测和泛化,关心未知数据上的性能 |
| 模型构建 | 基于物理、生物或经济学理解 | 主要基于数据,可能无明确现实意义 |
| 验证 | 基于是否符合现实观察及提供洞察力 | 基于独立测试集上的性能 |
| 解释性 | 往往更具解释性,基于已知原理 | 复杂模型(如深度神经网络)难以解释 |
| 应用 | 工程、物理学、经济学等领域 | 计算机视觉、NLP、推荐系统等领域 |
| 复杂性 | 倾向于简单模型 | 可能使用非常复杂的模型 |
总的来说,数学建模和机器学习都是理解、解释和预测现象的工具,但它们的关注点、方法和应用有所不同。
二、机器学习三要素
机器学习三要素包括数据、模型、算法。这三要素之间的关系如下:
1. 数据
数据驱动:指我们基于客观的量化数据,通过主动数据的采集分析以支持决策。与之相对的是经验驱动(如'拍脑袋')。





