大模型实时对战《街霸》:GPT-3.5 胜 GPT-4,新型基准测试引发关注 | 极客日志