AI 产品经理面试高频 100 题及核心解析
第一章:机器学习和深度学习的关系
机器学习是人工智能的一个子集,侧重于通过数据训练模型以进行预测或决策。深度学习则是机器学习的一个分支,利用多层神经网络模拟人脑结构来处理复杂数据(如图像、语音)。
第二章:机器学习 7 大经典算法
算法一:K 近邻算法 (KNN)
- 原理:基于实例的学习。对于新样本,计算其与训练集中所有样本的距离,选取距离最近的 K 个邻居,根据多数投票决定类别。
- 场景:用户分类、推荐系统、信用评分。
- 优缺点:简单直观,无需训练;但计算量大,对高维数据敏感,需特征标准化。
算法二:线性回归
- 原理:假设因变量与自变量之间存在线性关系,通过最小化误差平方和拟合直线。
- 场景:房价预测、销售额预估、广告投放效果分析。
- 优缺点:解释性强,计算快;无法处理非线性关系,对异常值敏感。
算法三:逻辑回归
- 原理:使用 Sigmoid 函数将线性回归的输出映射到 (0,1) 区间,用于二分类问题。
- 场景:点击率预测、欺诈检测、用户流失预测。
- 优缺点:输出概率值,便于阈值调整;本质仍是线性模型,难以捕捉复杂特征交互。
算法四:朴素贝叶斯
- 原理:基于贝叶斯定理,假设特征之间相互独立,计算后验概率进行分类。
- 场景:垃圾邮件过滤、情感分析、保险购买意向预测。
- 优缺点:对小规模数据表现好,训练速度快;特征独立性假设在现实中往往不成立。
算法五:决策树与随机森林
- 原理:决策树通过特征分裂构建树状结构;随机森林集成多棵决策树,通过投票降低方差。
- 场景:客户违约预测、医疗诊断、用户分层。
- 优缺点:可解释性强,能处理数值和类别数据;单棵树易过拟合,随机森林计算成本较高。
算法六:支持向量机 (SVM)
- 原理:寻找一个超平面,使不同类别的样本间隔最大化,支持核技巧处理非线性问题。
- 场景:文本分类、图像识别、股票涨跌预测。
- 优缺点:在高维空间表现优异,泛化能力强;大数据集训练慢,参数调优复杂。
算法七:K-means 聚类
- 原理:迭代将样本划分为 K 个簇,使簇内距离最小化。
- 场景:用户分群、市场细分、图像压缩。
- 优缺点:简单高效;需预设 K 值,对初始中心敏感,不适合非凸形状分布。
第三章:深度学习 3 大经典模型
1. 神经网络
基础单元为神经元,通过多层连接提取特征,包含输入层、隐藏层和输出层。
2. CNN (卷积神经网络)
- 原理:利用卷积核提取局部特征,池化层降维,适合处理网格数据。
- 场景:图像分类、目标检测、医学影像分析。


