大模型心理理论能力评估:TMBENCH 基准测试 | 极客日志