大模型基础面试知识全解析:架构、训练与微调策略 | 极客日志