大模型 LLM 合成训练样本的数据分布问题 | 极客日志