Decoder-only 架构的 LLM 为何仍需位置编码 | 极客日志