TRE: 基于信任区域的熵正则化探索方法 | 极客日志