Xinference 多模型并发推理实测:Llama3、Qwen2-VL 与 Whisper 协同 | 极客日志