作为 AI 产品经理,核心竞争力除了深度理解业务场景和专业的产品能力外,掌握必要的 AI 算法知识是 AI 产研沟通的'共同语言基础'。对于非相关专业的从业者,如何快速入门 AI 算法?本文以问答形式总结了 AI 算法领域的核心内容。
Q:机器学习、深度学习、强化学习定义及经典算法归类
机器学习 (Machine Learning) 是一种利用算法让计算机从数据中学习并改进的技术。它通过对大量数据进行训练,使计算机能够自动发现数据中的规律和模式,并用这些规律预测新数据或做出决策。
归因算法:线性回归、逻辑回归等。线性回归通过找到最佳拟合直线来预测连续数值输出;逻辑回归用于二分类问题,通过对输入特征进行逻辑函数变换来预测样本属于某一类别的概率。
分类算法:决策树、朴素贝叶斯、支持向量机等。决策树基于树形结构递归划分数据集;朴素贝叶斯基于贝叶斯定理假设特征独立;支持向量机通过寻找最优超平面将不同类别样本分开。
深度学习 (Deep Learning) 是机器学习的分支,使用深度神经网络模拟人脑学习过程。深度神经网络具有多层非线性变换,能自动提取输入数据特征并逐层抽象出高级别表示。
神经网络:包括前馈神经网络、卷积神经网络 (CNN)、循环神经网络 (RNN) 等。前馈网络实现输入到输出的映射;CNN 专门处理图像数据,通过卷积层和池化层提取特征;RNN 处理序列数据,通过记忆单元捕捉时序信息。
强化学习 (Reinforcement Learning) 是让智能体通过与环境交互来学习策略的技术。智能体感知环境状态并采取行动获得奖励或惩罚,根据反馈调整策略以最大化累积奖励。
值迭代算法:Q-Learning、SARSA 等。通过估计每个状态 - 动作对的价值找到最优策略。Q-Learning 是离策略算法,使用最大预期奖励更新 Q 值;SARSA 是在策略算法,使用实际采取的行动更新 Q 值。
策略梯度算法:REINFORCE、Actor-Critic 等。直接对策略参数化并通过梯度上升最大化期望奖励。REINFORCE 基于蒙特卡罗采样;Actor-Critic 结合值函数和策略梯度。
Q:算法、算子和模型的定义和区别
1. 定义
- 算法:一组明确规定的计算步骤,用于解决特定类型的问题或执行特定类型的计算。通常独立于编程语言,但可用任何语言实现。
- 算子:在深度学习中,指一种特殊的函数或操作,用于对张量(多维数组)执行某种计算。这些计算可以是线性的、非线性的或其他数学运算。
- 模型:在机器学习和深度学习中,是从学习过程中从数据得出的表示。可以是数学方程、决策树、神经网络等形式,用于对新数据进行预测或分类。
2. 用途
- 算法:指导计算机如何解决问题或执行计算。不存储数据,但对输入数据操作产生输出。
- 算子:构建神经网络层和执行各种数学运算,以便从输入数据中学习有用的表示。
- 模型:从数据中学习得出,用于对新数据进行预测或分类。可看作'知识'的表示,捕获了从训练数据中学习到的模式和关系。
3. 灵活性
- 算法:通常是固定的,但可通过调整参数或选择不同算法优化性能。
- 算子:可通过组合不同的算子和层创建各种复杂的神经网络结构。
- 模型:结构和参数可在训练过程中调整,以便更好地拟合数据。
总之,算法提供计算步骤;算子执行数学运算和构建网络;模型则是学习得出的表示。
Q:自然语言处理、大数据决策领域常见的算子
自然语言处理 (NLP) 领域
- 文本清洗算子:去除无关字符、停用词、特殊符号,净化文本数据。
- 分词算子:将文本切分成独立词语或标记,是许多 NLP 任务的基础。
- :为每个词语赋予词性标签(名词、动词等),有助于理解句子作用。


