机器学习常见名词汇总
机器学习
机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习并提高性能,而无需进行明确的编程。机器学习算法使用统计技术来识别数据中的模式,然后使计算机能够做出预测或决策,无需人类直接指示。
主要特点:
- 数据驱动:机器学习模型的性能很大程度上依赖于提供给它的数据。
- 模式识别:机器学习算法能够识别数据中的模式,并用这些模式来预测新数据的结果。
- 自适应:随着时间的推移,机器学习模型可以通过积累更多的数据来改进其性能。
- 多种算法:包括监督学习、无监督学习、强化学习等多种算法。
应用领域:
- 语音识别
- 图像识别
- 推荐系统
- 自然语言处理
- 预测分析
学习方式
- 监督学习(Supervised Learning):使用带标签的数据进行训练。
- 无监督学习(Unsupervised Learning):使用未标记的数据发现隐藏结构。
- 区别:传统机器学习通常依赖人工特征工程,而深度学习能自动提取特征;深度学习更适合大规模数据和复杂问题,传统机器学习在小数据集上可能更稳健。
深度学习
深度学习是机器学习的一个子集,它基于人工神经网络的概念,特别是深层神经网络。深度学习模型通过模仿人脑的工作方式来处理数据,通过多层(或'深度')的神经网络来学习复杂的模式。
主要特点:
- 多层结构:深度学习模型包含多个隐藏层,这使得它们能够学习数据中的复杂和抽象的表示。
- 自动特征提取:深度学习模型能够自动从原始数据中提取特征,减少了手动特征工程的需求。
- 大数据需求:深度学习模型通常需要大量的数据来训练,以便它们能够学习到有效的模式。
- 计算密集型:深度学习模型需要大量的计算资源,尤其是 GPU,来训练复杂的模型。
应用领域:
- 语音识别(如语音助手)
- 图像识别和分类(如面部识别)
- 自动驾驶汽车
- 自然语言理解(如机器翻译)
- 游戏和模拟(如 AlphaGo)
神经网络
在神经网络中,我们通常涉及以下符号与概念:
- y:通常是预测的输出或者目标变量。
- f():是一个函数,通常在神经网络中指的是激活函数(如 ReLU、sigmoid、tanh 等),它引入非线性,使得模型能够学习复杂的模式。
- W:是权重矩阵,包含了网络中的参数,这些参数在训练过程中会被优化。
- x:是输入数据矩阵,每一行代表一个样本,每一列代表一个特征。
- θ:是偏置项,也是一个参数,它允许模型在没有输入或者所有输入都是零的情况下也能产生非零的输出。


