NLP 基础:BERT 模型原理、训练与压缩技术详解 | 极客日志