华为 AI 岗位机考真题及编程题解析

华为 AI 岗机考 20250903

华为自 26 届秋招（2025 年起）对 AI 岗位机考进行了改革，考试题型调整为20 道选择题（15 道单选 (6 分)+5 道不定项选择 (12 分)）+2 道编程题 (150+300)。

题目核心围绕人工智能技术（如 Transformer 架构、EM 算法、PCA 降维、激活函数等）与数学基础（如线性变换、概率分布、数值迭代、插值计算等）展开，相较于以往题型，知识覆盖面与考查深度均有显著变化。

一、选择题

（一）单项选择题（共 15 题）

在文本生成中，以下哪种模型最适合用于生成连续文本？（） A. LSTM B. 最大熵模型 C. 隐马尔可夫模型（HMM） D. 决策树
线性变换 $T: \mathbb{R}^{2} \to \mathbb{R}^{2}$ 将向量 $e_{1}=\begin{bmatrix}1\0\end{bmatrix}$ 映为 $\begin{bmatrix}3\1\end{bmatrix}$，将 $e_{2}=\begin{bmatrix}0\1\end{bmatrix}$ 映为 $\begin{bmatrix}-1\2\end{bmatrix}$，则向量 $v=\begin{bmatrix}4\3\end{bmatrix}$ 在 $T$ 下的像为？（） A. $\begin{bmatrix}5\7\end{bmatrix}$ B. $\begin{bmatrix}8\11\end{bmatrix}$ C. $\begin{bmatrix}12\-2\end{bmatrix}$ D. $\begin{bmatrix}9\10\end{bmatrix}$
已知 $u=\begin{bmatrix}2\-1\3\end{bmatrix}$，$v=\begin{bmatrix}4\0\-2\end{bmatrix}$，且 $A = uv^{\top}$，则 $A$ 的第 2 行第 3 列元素是（行列号从 1 开始计数）？（） A. 2 B. -4 C. 0 D. 6
在计算某天线的安装角度时，需要求解如下非线性方程 $x = \cos x$，工程师小王打算使用迭代公式 $x_{k + 1}=\cos(x_{k})$ 进行数值计算。以下有关该迭代收敛性的说法中，哪一项是正确的？（） A. 当算法收敛时，速度是二次的 B. 对任意初始值，该算法都能收敛到其唯一实根 C. 该算法是不稳定的，因为余弦函数有界，而线性函数无界 D. 该方程有两个实根，算法收敛到哪一个取决于初始值
你正在使用一个机器学习模型来解决一个分类问题，在训练集上得到了非常高的准确率，但是在测试集上的准确率却相对较低。这种情况最有可能是以下哪种现象？（） A. 过拟合 B. 欠拟合 C. 无法判断 D. 正好拟合
桥梁应力监测中，传感器测得：$t = [0,1,2]$ 秒时 $\sigma = [100,120,150]\text{MPa}$。用二次插值 $P_{2}(t)=100 + 20t + 5t(t - 1)$ 预测 $t = 1.5$ 秒应力。已知真实应力函数为 $\sigma(t)=100 + 20t + 5t^{2}$，则应力预测值的绝对误差是？（） A. 2.5MPa B. 5.0MPa C. 0.0MPa D. 7.5MPa
在进行特征工程时，我们经常会对特征进行标准化处理。假设有一个特征 $X$，其期望 $E[X]=10$，方差 $Var(X)=4$。现在我们对其进行线性变换得到新特征 $Y = 3X - 5$。那么新特征 $Y$ 的方差 $Var(Y)$ 是多少？（） A. 31 B. 36 C. 12 D. 7
向量组 $\alpha_{1}$，$\alpha_{2}$，$\alpha_{3}$ 线性无关，已知 $\beta_{1}=k_{1}\alpha_{1}+\alpha_{2}+k_{1}\alpha_{3}$，$\beta_{2}=\alpha_{1}+k_{2}\alpha_{2}+(k_{2}+1)\alpha_{3}$，$\beta_{3}=\alpha_{1}+\alpha_{2}+\alpha_{3}$，若 $\beta_{1}$，$\beta_{2}$，$\beta_{3}$ 线性相关，则 $k_{1}$，$k_{2}$ 的值为（） A. $k_{1}=1$ 且 $k_{2}=0$ B. $k_{1}=1$ 或 $k_{2}=1$ C. $k_{1}=1$ 且 $k_{2}=1$ D. $k_{1}=1$ 或 $k_{2}=0$
设随机变量 $X$ 的概率密度函数为 $f(x)=\frac{1}{b - a}(a\leq x\leq b)$，其他情况为 0。该分布是：（） A. 泊松分布 B. 指数分布 C. 正态分布 D. 均匀分布
关于线性变换 $T: \mathbb{R}^{n} \to \mathbb{R}^{m}$，以下说法正确的是？（） A. $T(u + v)=T(u)+T(v)$ 仅当 $u\perp v$ 时成立 B. 零向量映射不一定为零向量 C. 线性变换不能改变向量的维度 D. $T(cu)=cT(u)$ 对所有标量 $c$ 和向量 $u$ 成立
关于 Transformer 解码器的描述错误的是？（） A. 解码器额外使用编码器 - 解码器交叉注意力层（Cross-Attention） B. 第二个 Multi-Head Attention 层的 K、V 矩阵使用 Encoder 的编码信息矩阵进行计算 C. 解码器的第二个 Multi-Head Attention 采用了 Masked 掩码操作 D. 解码器包含掩码自注意力层（Masked Self-Attention）

import numpy as np def preprocess_data(data, train_stats=None, is_train=True): """ 数据预处理：处理缺失值和异常值，训练数据计算统计量，预测数据使用训练统计量 data: 输入数据（二维列表，每行对应一条数据，列：[写入次数，读取次数，平均写入延迟，平均读取延迟，设备使用年限]） train_stats: 训练数据的统计量（均值、中位数、标准差），is_train=False 时需传入 is_train: 是否为训练数据（True/False） return: 预处理后的数据，训练数据时额外返回统计量 """ data = np.array(data, dtype=np.float64) n_features = data.shape[1] stats = {} # 存储训练数据的统计量：mean（均值）、median（中位数）、std（标准差） if is_train: # 计算训练数据各字段的均值、中位数、标准差（忽略 NaN） for i in range(n_features): valid = data[~np.isnan(data[:, i]), i] stats[f'mean_{i}'] = np.mean(valid) stats[f'median_{i}'] = np.median(valid) stats[f'std_{i}'] = np.std(valid) if len(valid) > 1 else 1.0 else: # 预测数据使用训练数据的统计量 stats = train_stats # 处理缺失值（用均值填充） for i in range(n_features): data[np.isnan(data[:, i]), i] = stats[f'mean_{i}'] # 处理异常值（用中位数填充） # 特征 0：写入次数，特征 1：读取次数（异常值<0） for i in [0, 1]: data[data[:, i] < 0, i] = stats[f'median_{i}'] # 特征 2：平均写入延迟，特征 3：平均读取延迟（异常值<0 或>1000） for i in [2, 3]: mask = (data[:, i] < 0) | (data[:, i] > 1000) data[mask, i] = stats[f'median_{i}'] # 特征 4：设备使用年限（异常值<0 或>20） mask = (data[:, 4] < 0) | (data[:, 4] > 20) data[mask, 4] = stats[f'median_4'] # 训练数据标准化（预测数据后续用训练统计量标准化） if is_train: normalized_data = (data - np.array([stats[f'mean_{i}'] for i in range(n_features)])) / \ np.array([stats[f'std_{i}'] for i in range(n_features)]) return normalized_data, stats else: return data def sigmoid(z): """sigmoid 激活函数，避免数值溢出""" return np.where(z >= 0, 1/(1+ np.exp(-z)), np.exp(z)/(1+ np.exp(z))) def train_logistic_regression(X, y, epochs=100, alpha=0.01): """ 批量梯度下降训练逻辑回归模型 X: 标准化后的训练特征（n_samples × n_features） y: 训练标签（n_samples × 1） epochs: 迭代次数 alpha: 学习率 return: 训练好的权重 w """ n_samples, n_features = X.shape # 初始化权重（含偏置项，故特征维度 +1，先给 X 添加偏置列） X_with_bias = np.hstack([np.ones((n_samples, 1)), X]) # (n_samples, n_features+1) w = np.zeros((n_features + 1, 1)) # 初始权重全 0 for _ in range(epochs): # 计算预测概率 y_pred_prob = sigmoid(np.dot(X_with_bias, w)) # 计算梯度（批量梯度，使用全部样本） gradient = (1/ n_samples) * np.dot(X_with_bias.T, (y_pred_prob - y.reshape(-1, 1))) # 更新权重 w -= alpha * gradient return w def predict(w, X_test, train_stats): """ 模型预测 w: 训练好的权重 X_test: 预处理后的预测特征（未标准化） train_stats: 训练数据的统计量（用于标准化） return: 预测结果（0/1） """ n_features = X_test.shape[1] # 用训练数据的均值和标准差标准化预测特征 X_test_norm = (X_test - np.array([train_stats[f'mean_{i}'] for i in range(n_features)])) / \ np.array([train_stats[f'std_{i}'] for i in range(n_features)]) # 添加偏置列 X_test_with_bias = np.hstack([np.ones((X_test_norm.shape[0], 1)), X_test_norm]) # 计算预测概率并转为标签（≥0.5 为 1，否则为 0） y_pred_prob = sigmoid(np.dot(X_test_with_bias, w)) y_pred = (y_pred_prob >= 0.5).astype(int).flatten() return y_pred def main(): # 读取输入（注意：实际考试中需从标准输入读取，此处模拟输入格式） import sys input_lines = [line.strip() for line in sys.stdin if line.strip()] ptr = 0 # 读取训练数据 N = int(input_lines[ptr]) ptr += 1 train_data = [] train_labels = [] for _ in range(N): parts = input_lines[ptr].split() ptr += 1 # 提取特征（索引 1-5：写入次数、读取次数、平均写入延迟、平均读取延迟、设备使用年限） features = [float(p) if p != 'NaN' else np.nan for p in parts[1:6]] # 提取标签（索引 6：设备状态） label = int(parts[6]) train_data.append(features) train_labels.append(label) # 读取预测数据 M = int(input_lines[ptr]) ptr += 1 test_data = [] for _ in range(M): parts = input_lines[ptr].split() ptr += 1 # 提取特征（同训练数据，状态字段无意义） features = [float(p) if p != 'NaN' else np.nan for p in parts[1:6]] test_data.append(features) # 1. 预处理训练数据 X_train_norm, train_stats = preprocess_data(train_data, is_train=True) y_train = np.array(train_labels) # 2. 训练逻辑回归模型 w = train_logistic_regression(X_train_norm, y_train, epochs=100, alpha=0.01) # 3. 预处理预测数据并预测 X_test_processed = preprocess_data(test_data, train_stats=train_stats, is_train=False) y_pred = predict(w, X_test_processed, train_stats) # 4. 输出预测结果 for pred in y_pred: print(pred) if __name__ == "__main__": main()

def main(): import sys # 读取输入（第一行：n, m, p, k；第二行：n 个专家概率） input_lines = [line.strip() for line in sys.stdin if line.strip()] if len(input_lines) < 2: print("error") return # 解析第一行参数（专家数 n、NPU 数 m、目标 NPU 数 p、目标专家数 k） try: n, m, p, k = map(int, input_lines[0].split()) # 校验参数范围（题目规定区间 [1,10000]） if not (1 <= n <= 10000 and 1 <= m <= 10000 and 1 <= p <= 10000 and 1 <= k <= 10000): print("error") return except ValueError: print("error") return # 解析第二行专家概率（n 个浮点数，区间 (0,1)） try: probs = list(map(float, input_lines[1].split())) if len(probs) != n: print("error") return # 校验概率范围（题目规定 (0,1)，此处允许微小精度误差） for prob in probs: if not (0 < prob < 1): print("error") return except ValueError: print("error") return # 第一步：校验专家能否平均分配到 NPU（n 必须被 m 整除） if n % m != 0: print("error") return group_size = n // m # 每个 NPU 对应的专家数量（每组专家数） # 第二步：构建专家组（按 NPU 分组，记录每组的专家编号、概率及组最大概率） groups = [] # 元素格式：(组最大概率，组内专家列表)，组内专家格式：(专家编号，专家概率) for group_idx in range(m): # 计算当前组专家的编号范围（连续编号） start_idx = group_idx * group_size end_idx = start_idx + group_size group_experts = [] max_prob_in_group = 0.0 # 遍历组内专家，收集编号、概率并找组内最大概率 for expert_idx in range(start_idx, end_idx): prob = probs[expert_idx] group_experts.append((expert_idx, prob)) if prob > max_prob_in_group: max_prob_in_group = prob groups.append((max_prob_in_group, group_experts)) # 第三步：筛选概率最大的 p 个组（目标 NPU 对应的组） # 按组最大概率降序排序，取前 p 个组 groups_sorted = sorted(groups, key=lambda x: x[0], reverse=True) target_groups = groups_sorted[:p] # 第四步：收集目标组内的所有专家，形成待选专家池 candidate_experts = [] for _, experts in target_groups: candidate_experts.extend(experts) # 校验待选专家数是否足够 k 个（不足则输出 error） if len(candidate_experts) < k: print("error") return # 第五步：按专家概率降序排序，选择前 k 个专家，再按编号升序排列 # 先按概率降序，概率相同则按编号升序（避免概率一致时排序混乱） candidate_experts_sorted = sorted(candidate_experts, key=lambda x: (-x[1], x[0])) selected_experts = candidate_experts_sorted[:k] # 按专家编号升序排列输出 selected_ids = sorted([expert[0] for expert in selected_experts]) # 第六步：格式化输出（空格分隔，行尾无空格） print(' '.join(map(str, selected_ids))) if __name__ == "__main__": main()

华为 AI 岗位机考真题及编程题解析

华为 AI 岗机考 20250903

一、选择题

（一）单项选择题（共 15 题）

更多推荐文章

相关免费在线工具

（二）不定项选择题（共 5 题）

二、编程题（共 2 题）

21. 云存储设备故障预测

1. 数据清洗规则

2. 逻辑回归模型训练要求

3. 预测输出要求

输入格式

输出格式

22. 大模型训练 MOE 场景路由优化算法

输入格式

输出格式

参考答案

单项选择题（共 15 题）

不定项选择题（共 5 题）

编程 21

一、解题思路

1. 数据读取与预处理

2. 逻辑回归模型训练（批量梯度下降）

3. 预测与输出

二、Python 代码实现

编程 22

一、解题思路

1. 输入校验与初始化

2. 专家分组（按 NPU 划分）

3. 筛选目标 NPU

4. 筛选目标专家与输出

二、Python 代码实现

更多推荐文章

相关免费在线工具

华为 AI 岗位机考真题及编程题解析

华为 AI 岗机考 20250903

一、选择题

（一）单项选择题（共 15 题）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

（二）不定项选择题（共 5 题）

二、编程题（共 2 题）

21. 云存储设备故障预测

1. 数据清洗规则

2. 逻辑回归模型训练要求

3. 预测输出要求

输入格式

输出格式

22. 大模型训练 MOE 场景路由优化算法

输入格式

输出格式

参考答案

单项选择题（共 15 题）

不定项选择题（共 5 题）

编程 21

一、解题思路

1. 数据读取与预处理

2. 逻辑回归模型训练（批量梯度下降）

3. 预测与输出

二、Python 代码实现

编程 22

一、解题思路

1. 输入校验与初始化

2. 专家分组（按 NPU 划分）

3. 筛选目标 NPU

4. 筛选目标专家与输出

二、Python 代码实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具