大语言模型逻辑一致性研究:测量、评估与提升 | 极客日志