国产主流大模型深度评测:智谱 GLM-4 与通义千问数学推理能力对比 | 极客日志