AIGC 产品经理面试高频 100 题及核心模型解析
一、机器学习和深度学习的关系
机器学习是人工智能的一个子集,旨在让计算机通过数据学习规律。深度学习则是机器学习的一个分支,利用多层神经网络来模拟人脑结构,特别擅长处理非结构化数据(如图像、文本)。
二、机器学习经典算法详解
1. K 近邻算法 (KNN)
- 实现原理:基于实例的学习,计算待分类样本与训练集中所有样本的距离,选取距离最近的 K 个邻居,根据多数投票决定类别。
- 应用场景:用户画像分类、推荐系统初步筛选。
- 优缺点:简单直观,无需训练;但计算量大,对高维数据效果差。
2. 线性回归
- 实现原理:建立自变量与因变量之间的线性关系模型,最小化预测值与真实值的误差平方和。
- 应用场景:广告投放预算预估、房价预测。
- 优缺点:解释性强,计算快;无法处理非线性关系。
3. 逻辑回归
- 实现原理:使用 Sigmoid 函数将线性回归结果映射到 (0,1) 区间,用于二分类问题。
- 应用场景:点击率预估、信用评分。
- 优缺点:输出概率值,可解释性好;特征工程要求高。
4. 朴素贝叶斯
- 实现原理:基于贝叶斯定理,假设特征之间相互独立,计算后验概率。
- 应用场景:垃圾邮件过滤、情感分析。
- 优缺点:对小规模数据有效,收敛快;特征独立性假设在现实中往往不成立。
5. 决策树与随机森林
- 实现原理:决策树通过特征分割构建树状结构;随机森林集成多棵决策树,通过投票或平均提升稳定性。
- 应用场景:用户违约预测、客户流失预警。
- 优缺点:可解释性强,能处理混合数据;容易过拟合(单棵树),随机森林计算成本较高。
6. 支持向量机 (SVM)
- 实现原理:寻找一个超平面,使得不同类别的样本间隔最大化。
- 应用场景:文本分类、股票趋势预测。
- 优缺点:适合小样本、高维数据;大规模数据训练慢,参数敏感。
7. K-means 聚类
- 实现原理:迭代更新聚类中心,将样本划分为 K 个簇,使簇内距离最小化。
- 应用场景:用户分层、市场细分。
- 优缺点:简单高效;需预先指定 K 值,对初始值敏感,难以处理非凸形状数据。
三、深度学习经典模型
1. 卷积神经网络 (CNN)
- 原理:利用卷积层提取局部特征,池化层降维,全连接层分类。
- 应用:图像识别、目标检测。
- 缺点:参数量大,需要大量标注数据。
2. 循环神经网络 (RNN)
- 原理:引入记忆单元处理序列数据,捕捉时间依赖。


